Лента новостей
|
08.04.2026 [23:43], Владимир Мироненко
Supermicro начала внутреннее расследование обстоятельств контрабанды подсанкционного ИИ-оборудования в КитайSupermicro заявила о проведении независимого расследование в связи с предъявлением в марте обвинений в контрабанде её оборудования в Китай трём лицам, связанным с компанией — соучредителю Supermicro И-Шьян Лиау (Yih-Shyan Liaw) и внешнему подрядчику Тин-Вэй Суню (Ting-Wei Sun), которые не признали вину, и генеральному директору тайваньского офиса Supermicro Руэй-Цанг Чанг (Ruei-Tsang Chang), которого правоохранительные органы не могут найти. 19 марта 2026 года Supermicro была проинформирована об обвинениях в связи с предполагаемым сговором с целью нарушения правил экспортного контроля США. Компания отметила, что незамедлительно приняла меры, и эти лица больше не имеют с ней никаких связей, добавив, что сама она не фигурирует в обвинительном заключении и не обвиняется в каких-либо правонарушениях. Сроки проведения расследования пока не установлены. Компания предоставит обновлённую информацию после завершения расследования и не намерена давать дальнейшие комментарии до этого времени. Расследованием занимаются два независимых члена совета директоров компании: Скотт Энджел (Scott Angel), ведущий независимый директор, и Талли Лю (Tally Liu), председатель аудиторского комитета. По данным Supermicro, Скотт Энджел почти четыре десятилетия проработал в Deloitte, а Талли Лю имеет 25-летний стаж работы в качестве сертифицированного бухгалтера и ранее занимал руководящие должности в сфере внутреннего аудита. Для помощи привлекли юридическую фирму Munger, Tolles & Olson LLP (MTO) и консалтинговую компанию AlixPartners, которые будут работать в тесной координации с аудитором Supermicro, компанией BDO USA. Параллельно Supermicro начала внутреннюю проверку выполнения своей «Глобальной программы соблюдения торговых правил». Внутреннюю проверку возглавляет Итай Ху (Yitai Hu), главный юрисконсульт и старший вице-президент. ДеАнна Луна (DeAnna Luna), недавно назначенная исполняющей обязанности главного специалиста по соблюдению нормативных требований, теперь подчиняется главному юрисконсульту. Сообщается, что результаты проверки будут доведены до совета директоров. «Supermicro стремится защищать передовые американские технологии и интеллектуальную собственность, — заявил Чарльз Лян (Charles Liang), президент и генеральный директор Supermicro. — Наша внутренняя проверка и расследование независимых директоров проводятся в соответствии с нашим обязательством обеспечивать обращение с нашими технологиями на самом высоком уровне этического и правового контроля». Между тем, как сообщает The Register, группа американских законодателей хочет ввести дополнительные ограничения на экспорт оборудования для производства чипов, чтобы ограничить возможности Китая в сфере ИИ. Предлагаемый Закон о многостороннем согласовании контроля за технологиями в сфере аппаратного обеспечения (The Multilateral Alignment of Technology Controls on Hardware Act, MATCH) направлен на «укрепление национальной безопасности США путём устранения критических пробелов в экспортном контроле за оборудованием для производства полупроводников», к которому отнесены, например, DUV-литографы и установки криогенного травления.
08.04.2026 [22:38], Владимир Мироненко
Alibaba и China Telecom запустили ИИ-кластер на базе 10 тыс. ИИ-ускорителей ZhenwuAlibaba объявила о развёртывании в сотрудничестве с мобильным оператором China Telecom вычислительного ИИ-кластера из 10 тыс. ИИ-ускорителей Zhenwu, разработанных подразделением Alibaba T-Head. По словам Alibaba Cloud, передовые вычислительные мощности Китая «переходят от высокопроизводительных прорывов к крупномасштабному промышленному внедрению». ИИ-кластер размещён в дата-центре оператора China Telecom в Шаогуане (Shaoguan, провинция Гуандун). Как отметило облачное подразделение Alibaba, этот «полностью отечественный» кластер стал первым проектом такого масштаба на базе чипов Zhenwu в районе Большого залива (Greater Bay Area, GBA) — одном из ключевых стратегических регионов в планах национального развития Китая. По данным Alibaba Cloud, новый кластер обеспечивает сверхнизкую задержку в 4 мс и позволяет 10 тыс. чипам работать как единая система, способная обучать ИИ-модели с сотнями миллиардов параметров. China Telecom и Alibaba заявили, что вычислительный ИИ-кластер может использоваться в различных отраслях, от здравоохранения до разработки передовых материалов. Также сообщается, что в дальнейшем он будет расширен до 100 тыс. чипов. Запуск ИИ-кластера на базе чипов Zhenwu является ещё одним свидетельством того, что Китай удваивает усилия по развитию собственной инфраструктуры для ускорения быстро развивающихся ИИ-технологий и удовлетворения растущего спроса на фоне обострения конкуренции в области ИИ с американскими соперниками, включая Meta✴, Microsoft и xAI, пишет South China Morning Post. Объявление Alibaba о создании ИИ-кластера последовало за запуском в конце прошлого месяца первого в стране интеллектуального вычислительного кластера на базе 10 тыс. чипов Huawei Ascend 910C общей ИИ-производительностью 11 Эфлопс в Шэньчжэне (Shenzhen, провинция Гуандун). В прошлом году компания запустила ИИ-кластер с производительностью 3 Эфлопс. По данным Shenzhen Special Zone Daily, почти 50 организаций подписали рамочные соглашения на использование вычислительных мощностей нового кластера, в результате чего общий уровень бронирования по обоим кластерам достиг 92 %.
08.04.2026 [17:29], Владимир Мироненко
Интерконнект UALink дорос до версии 2.0, хотя до сих пор не воплотился в «железе» — до NVLink ещё далекоКонсорциум UALink, созданный в 2024 году для разработки открытого интерконнекта для масштабируемого ИИ следующего поколения, который может стать альтернативой NVLink и NVSwitch от NVIDIA, объявил о ратификации следующей версии спецификации UALink 2.0, которая включает три основных дополнения — внутрисетевые вычисления (In-Network Compute), определение чиплетов (Chiplet Definition) и управляемость (Manageability). Как указано в пресс-релизе, «новые спецификации поддерживают развёртывание решений UALink в средах с несколькими рабочими нагрузками, одновременно способствуя повышению эффективности технологии UALink, производительности для рабочих нагрузок ИИ и упрощению внедрения». Базовая скорость обмена данными (200G на линию) не изменилась. Более того, до сих пор нет и оборудования стандарта UALink 1.0, представленного год назад. «Усовершенствования технологии UALink, представленные в этом релизе, позволят отрасли быстро и эффективно интегрировать решения UALink в свои архитектуры. Консорциум UALink по-прежнему привержен развитию инфраструктуры ИИ посредством открытых отраслевых стандартов, которые облегчают вывод на рынок приложений ИИ следующего поколения», — заявил Куртис Боуман (Kurtis Bowman), председатель совета директоров консорциума UALink. Консорциумом были представлены:
Боуман сообщил The Register, что чипы для спецификации 1.0 поступят в лаборатории во II половине 2026 года и появятся в продаже в 2027 году. К тому времени UALink выпустит спецификации версии 3.0 — задолго до дебюта чипов версии 2.0. Боуман признал, что версии 1.0 и 2.0 не будут полноценными конкурентами интерконнекту NVIDIA, но к версии 3.0, которая появится примерно через год, UALink достигнет паритета по производительности и темпам выпуска стандартов. Консорциум UALink стремится создать альтернативу интерконнекту NVIDIA, которая будет работать с любым ускорителем и соответствовать его уровню производительности. Консорциум считает, что развивающиеся неооблачные платформы, специализирующиеся на размещении ИИ-систем, оценят возможность создания единого интерконнекта с поддержкой любых используемых ими GPU, отметил The Register. Между тем NVIDIA не стоит на месте. В прошлом году она представила технологию NVIDIA NVLink Fusion, которая расширяет доступ к NVLink сторонним чипам. Компания уже заключила соглашения с Arm, AWS, Fujitsu, Intel, Marvell, MediaTek и SiFive. AMD же делает ставку на UALink.
08.04.2026 [17:04], Владимир Мироненко
ВТБ заменит ИИ-ускорители NVIDIA на китайские решенияБанк ВТБ будет использовать GPU китайских производителей вместо ИИ-ускорителей NVIDIA для работы внутрибанковских сервисов на основе ИИ, сообщил «Ведомостям» зампред правления ВТБ Вадим Кулик. По его словам, GPU будут использоваться для работы с компьютерным зрением, обработки, анализа текста и распознаванием речи, а также для моделей генеративного ИИ банка. Топ-менеджер отметил, что в ходе тестирования китайские чипы показали стабильную производительную работу с существующими IT-системами банка. «Внедрение китайских GPU проходит без существенных доработок и с высокой производительностью. Это ускорит развитие ИИ-технологий, включая цифровых помощников и ИИ-агентов», — сообщил он. Замена ускорителей NVIDIA на китайские GPU проводится в рамках совместной работы в центре компетенций ВТБ по ИИ в Китае. Центр представляет собой площадку для прикладных совместных исследований российских и китайских специалистов и быстрого тестирования устройств с ИИ без необходимости их поставки в Россию. Здесь и проходило тестирование GPU из КНР в марте. Зампред отметил, что Китай богат на технологии, но существуют сложности с их поиском, апробацией и доставкой в Россию в промышленных масштабах. «Центр создан для того, чтобы помочь компаниям из России и Китая совместно внедрять новейшие технологии. Сейчас мы сконцентрированы на поиске партнёров, заинтересованных в применении ИИ-технологий», — рассказал он. Согласно исследованию IT-холдинга Т1, совокупный рынок российских GPU в 2025 году вырос на 21 % до около 63 млрд руб. Доля NVIDIA на мировом рынке оценивается в исследовании в 80 %. По его оценкам, с учётом дополнительных затрат на серверные платформы, сетевое оборудование, ПО и обслуживание, капитальные вложения на замещение чипов NVIDIA могут составить порядка 2–5 млрд руб. Ранее «Ведомости» сообщали, что китайские серверы тестируют «Сбер» и Т-банк, а Альфа-банк тоже рассматривает возможность их использования. Среди поставщиков ИИ-ускорителей в Китае есть Huawei, Alibaba, MetaX, Moore Threads, Cambricon, Iluvatar, Biren, Sophgo и др. Собеседник «Ведомостей» в одном из топ-20 банков России считает, что реальных альтернатив чипам NVIDIA для банковской сферы всё же нет, ни сейчас, ни в обозримом будущем. Даже самые сильные китайские GPU пока уступают решениям американской компании не только по «железу», но и по зрелости программной среды, под которую уже разработано множество банковских решений. Переход на альтернативные GPU потребует серьезных вложений в адаптацию и переработку программных продуктов, а проведенные испытания показывают, что такие решения пока заметно проигрывают по скорости обработки запросов и обучению классических ML-моделей, отметил собеседник издания.
08.04.2026 [16:02], Руслан Авдеев
TikTok инвестирует ещё €1 млрд в ЦОД в Финляндии для хранения и обработки данных европейских пользователей
bytedance
hardware
tiktok
евросоюз
инвестиции
информационная безопасность
конфиденциальность
финансы
финляндия
цод
Детище китайской ByteDance — социальная сеть TikTok объявила об инвестициях €1 млрд в дата-центр в Лахти (Lahti, Финляндия) в рамках программы расширения защищённой европейской инфраструктуры. В 2025 году компания уже анонсировала миллиардные инвестиции в ЦОД в Коуволе (Kouvola). После того, как заработает ЦОД в Лахти, расширятся возможности по хранению данных европейских пользователей непосредственно в Европе, со строгим контролем доступа и использованием передовых систем мониторинга. Оба вливания средств в финскую инфраструктуру ЦОД — часть евроепйской инициативы Project Clover стоимостью €12 млрд, предполагающей обеспечение региону суверенитета данных. Инициатива призвана обеспечить лучшую отраслевую защиту более 200 млн европейских пользователей TikTok. В рамках Project Clover создан специальный анклав данных с усиленными гарантиями — в техническом, операционном и управленческом аспектах. В рамках Project Clover налажены партнёрские отношения с британской NCC Group, обеспечивающей независимый контроль, проверку и подтверждение эффективности средств защиты информации. Также компания занимается мониторингом потоков данных и уведомляет о любых аномалиях. Независимый контроль касается всей европейской инфраструктуры социальной сети. TikTok заявляет, что Финляндия обеспечивает уникальное сочетание квалифицированной рабочей силы, доступа к «чистой» энергии и развитой цифровой инфраструктуре. Именно поэтому она стала площадкой для расширения европейских мощностей компании, укрепления защиты и хранения данных на региональном уровне.
Источник изображения: Joonas T/unsplash.com Кампус построят в одном из районов Лахти. Утверждается, что проект обеспечит вклад в региональную экономику, создаст рабочие места и будет способствовать развитию местной цифровой экосистемы. Новый этап развития инфраструктуры в Финляндии последовал за ранее анонсированным строительством объекта в Коуволе, работы уже ведутся в соответствии с ранее утверждённым планом. Как заявляет TikTok, вместе объекты укрепляют долгосрочную ориентацию на Финляндию в качестве ключевого региона для развития инфрастрпуктуры данных социальной сети в Европе. В рамках Project Clover TikTok уже получила в своё распоряжение норвежский кампус Green Mountain OSL2-Hamar. Планы обнародовали в марте 2023 года, первый ЦОД закончили строить в декабре того же года, а ввод его в эксплуатацию был намечен на II квартале 2024 года. Правда, переносить европейские данные в новый кампус компания начала только в октябре. Также компания с 2023 года располагает дата-центром в Ирландии. Дополнительно компания рассматривает строительство дата-центра в Бразилии и пообещала потратить $8,8 млрд на цифровую инфраструктуру в Таиланде. В США же бизнес компании продан группе местных инвесторов под давлением американских властей — работу Project Texas не удовлетворила местные власти. Параллельно американская частная инвестиционная компания Bain Capital продала 100 % долю в китайском операторе ЦОД ChinData, ключевым клиентом которого является ByteDance.
08.04.2026 [14:57], Руслан Авдеев
«Нет дата-центрам»: в Индианаполисе обстреляли дом чиновника, одобрившего строительство ЦОДПротесты против строительства дата-центров приобретают в США опасный характер. У дома одного из членов городского совета Индианаполиса, поддержавшего создание ЦОД в округе, прогремели выстрелы, причём инцидент не был случайностью, сообщает The Register. По словам одного из представителей города Рона Гибсона (Ron Gibson), утром в понедельник он проснулся от выстрелов. Выяснилось, что в его дверь выстрелили 13 раз, а на пороге оставили записку «Нет дата-центрам» (No data centers). Как рассказал Гибсон в социальных сетях, пули легли в считанных шагах от того места, где накануне играл с конструктором его восьмилетний сын. Чиновник назвал происшествие «глубоко тревожащим» и подчеркнул, что деятельность властей может вызывать сильные разногласия, но насилие не является решением, особенно в случаях, когда опасности подвергается семья. Ранее Гибсон публично поддержал перезонирование земель, что позволит построить кампус ЦОД за $500 млн на участке площадью более 5,5 га. 1 апреля городские власти утвердили изменение зонирования земли для реализации проекта. Сообщается, что в два крупных объекта на 75 МВт готова инвестировать компания Metrobloks. Она же предлагает покрыть необходимые расходы для модернизации сетей передачи данных и энергетической инфраструктуры для этих объектов. По данным СМИ, против проекта выступили около 100 человек, утверждающих, что ЦОД не создаст новых рабочих мест и не принесёт никакой пользы району Мартиндэйл-Брайтвуд (Martindale-Brightwood). Инцидент со стрельбой произошёл на фоне растущего в обществе недовольства многочисленными проектами ЦОД в США и других странах и сопутствующего строительного бума, связанного с ростом спроса на вычислительные мощности. СМИ сообщали о беспорядках в Вирджинии, Пенсильвании, Северной Каролине и других штатах, результатом которых стал срыв запланированных проектов. По некоторым данным, в Висконсине один из городов пытался сместить мэра после одобрения строительства ЦОД. Отдельно сообщалось, что во II половине 2025 года объём строительства мощностей ЦОД на ключевых рынках США сократился — всё чаще население препятствовало бизнесу в получении разрешений на строительство. Когда проблему озвучили на федеральном уровне, президент США начал требовать от техногигантов гарантий того, что развитие их проектов не повлияет на коммунальные счета рядовых потребителей и не приведёт к истощению водных ресурсов на местах. Протесты в США, связанные со строительством ЦОД, действительно происходят довольно часто. Так, в прошлом августе сообщалось, что проект одного из крупнейших в мире ЦОД Project Sale в Джорджии оказался под угрозой срыва из-за противодействия местных жителей. По этой же причине Energy Storage Solutions не удалось вовремя получить разрешение на строительство крупного объекта, а Applied Digital и вовсе умышленно скрывает местоположение будущих ЦОД.
08.04.2026 [14:36], Сергей Карасёв
Дебютировала машина баз данных Tantor XData Gen3 на платформе AMDКомпания «Тантор Лабс», входящая в «Группу Астра», анонсировала машину баз данных Tantor XData третьего поколения (Gen3). Решение, как сообщается, ориентировано на крупных корпоративных заказчиков, которые ранее не могли перейти на отечественные продукты из-за архитектурных ограничений классического PostgreSQL. «Тантор Лабс» отмечает, что крупный бизнес работает с объёмными и разнородными нагрузками, и при переходе на решения на базе PostgreSQL могут возникать различные сложности. Среди них названы отсутствие нативного горизонтального масштабирования, ухудшение производительности при большом количестве соединений и трудности при работе со смешанными транзакционными и аналитическими операциями. В результате, крупные компании продолжают эксплуатировать платформы Oracle, SAP и IBM, откладывая переход на российские альтернативы. В машине Tantor XData Gen3, как утверждается, описанные ограничения устранены. В частности, не требуется привязка к одному серверу. Базы данных могут расширяться без «архитектурного потолка». При этом происходит линейное масштабирование платформы: то есть подсистемы вычислений и хранения масштабируются независимо друг от друга в соответствии с конкретной нагрузкой. Кроме того, реализовано общее хранилище с высоким показателем IOPS: оно обеспечивает на уровне кластера производительность, сопоставимую с локальными накопителями. Приложение обращается к одной базе, а система самостоятельно балансирует нагрузку и отрабатывает сбои. В основу Tantor XData Gen3 положены процессоры AMD EPYC. Задействована проприетарная распределённая файловая система Tantor PFS, которая работает поверх высокоскоростной сети RDMA (InfiniBand или RoCEv2) и протокола NVMe-oF. Всем узлам кластера доступно единое блочное устройство с задержками, сопоставимыми с использованием локальных SSD. За отказоустойчивость и балансировку отвечает технология Tantor RAC (Real Application Clusters) с одним пишущим и несколькими читающими узлами с автопереключением на реплику с минимальным временем простоя, умным прокси и согласованностью на уровне сессий. Упомянуты конвейерная запись WAL, возможность параллельной обработки запросов на всех узлах кластера, механизм CSN (commit sequence number) для повышения производительности и устранения узких мест при высокой конкуренции транзакций, инструменты балансировки нагрузки и управления соединениями. В целом, как утверждается, машина Tantor XData Gen3 предлагает крупным бизнес-пользователям возможность полноценной одновременной обработки транзакционных и аналитических запросов (HTAP). Решение позиционируется в качестве российской альтернативы Oracle Exadata, SAP HANA и IBM Netezza.
08.04.2026 [12:40], Руслан Авдеев
Иран угрожал США уничтожением ИИ ЦОД OpenAI Stargate в ОАЭВ ответ на ультиматум США, пригрозивших Ирану уничтожением электростанций и мостов, представители иранских властей пообещали сравнять с землёй один из флагманских кампусов ЦОД проекта Stargate в Абу-Даби (ОАЭ), сообщает eWeek. В соцсети X опубликовано заявление с видео скрытого на картах Google кампуса.
Источник изображения: Malik Shibly/unsplash.com Незадолго до этого КСИР назвал 18 американских компаний, включая Apple, Microsoft, NVIDIA и Tesla законными военными целями. При этом конкретные объекты не назывались, кампус Stargate стал первым, о котором упомянули официально. При этом кампус G42, где размещаются мощности Stargate — не просто один из множества, это один из крупнейших кампусов Stargate в мире. Объект стоимостью $30 млрд по плану получит 5 ГВт мощностей и 500 тыс. ИИ-ускорителей NVIDIA. Предполагается, что кампус станет сердцем проекта за пределами США. Облачная и ИИ-инфраструктура, связанная с американскими бизнесами, уже пострадала от иранских ударов. Это коснулось мощностей AWS в ОАЭ и Бахрейне. Как сообщает Datacenter Dynamics, в начале апреля КСИР заявил об атаках на кампус Oracle, также названной в числе «законных целей». По некоторым данным, пострадало здание компании в технопарке Dubai Internet City. Впрочем, официального подтверждения Oracle пока так и не поступало.
08.04.2026 [12:19], Сергей Карасёв
Плата iBase MBB1002 с поддержкой AMD EPYC Embedded 8004 рассчитана на периферийные ИИ-системыКомпания iBase Technology анонсировала материнскую плату MBB1002 типоразмера eATX, предназначенную для построения периферийных систем с функциями ИИ. Новинка выполнена на платформе AMD EPYC Embedded 8004 (Siena), которая дебютировала в конце 2024 года. Плата допускает установку процессора в исполнении AMD SP6 (LGA 4844). Доступны шесть слотов RDIMM для модулей оперативной памяти DDR5-3600/4000/4400/4800 суммарным объёмом до 576 Гбайт с поддержкой ECC (в конфигурации 6 × 96 Гбайт). Предусмотрены четыре порта SATA-3 для накопителей, разъём М.2 2280 для SSD с интерфейсом PCIe 5.0 и два коннектора MCIO (Mini Cool Edge IO) x4. Новинка располагает пятью слотами PCIe 5.0 x16 для карт расширения. Реализованы два сетевых порта 10GbE (контроллер Intel XC710-AT2). За безопасность отвечает чип TPM 2.0. Есть четыре 4-контактных разъёма для подключения вентиляторов охлаждения (один для CPU и три системных). Размеры материнской платы составляют 304 × 244 мм. Интерфейсный блок содержит два порта USB 3.0, два гнезда RJ45 для сетевых кабелей и последовательный порт (RS232 на базе коннектора RJ45). Через внутренние разъёмы могут быть задействованы два порта USB 2.0. Диапазон рабочих температур простирается от 0 до +60 °C. Модель iBase MBB1002 подходит для решения задач в области автоматизации, интеллектуального производства, промышленного интернета вещей, вычислений на периферии, аналитики данных в реальном времени и пр.
08.04.2026 [09:22], Владимир Мироненко
Стране нужен FP64: AMD пообещала повысить HPC-производительность ускорителей Instinct MI430XПосле анализа ограничений эмуляции FP64-вычислений с использованием схемы Озаки разработчики AMD пришли к выводу, что в настоящее время нет замены «сырой» производительности FP64. Как сообщил научный сотрудник AMD Николас Малайя (Nicholas Malaya) ресурсу HPCwire, чтобы обеспечить точность традиционных задач моделирования и симуляции, компания намерена нарастить нативную FP64-производительность ускорителя Instinct MI430X. Ускоритель станет основой суперкомпьютера Discovery, который будет установлен в Национальной лаборатории Ок-Ридж (ORNL) в 2028 году. Как отметил Кацухиса Озаки (Katsuhisa Ozaki) и два других японских исследователя, схема Ozaki — это многообещающая новая техника эмуляции, призванная позволить учёным выполнять высокоточные умножения матриц на оборудовании с поддержкой INT8/FP8, к которому относятся современные ИИ-ускорители, путём многократных вычислений с более низкой точностью. Текущие реализации Ozaki-I и Ozaki-II имеют ограничения, которые исключают их использование в реальных условиях, сообщил Малайя. Он указал на две основные проблемы. Во-первых, ПО не соответствует стандарту IEEE и не даёт того же результата, что и запуск кода на реальном оборудовании с поддержкой FP64. «В некоторых случаях это нормально, — сказал он. — Но во многих распространённых матрицах, которые мы наблюдали, влияние на точность довольно существенно.». Во-вторых, схема Озаки нацелена на квадратные матрицы. Если таковые в расчётах не используется, то итоговая производительность оказывается ниже, чем у нативного FP64-исполнения, говорит Малайя. Кроме того, HPC-приложения традиционно опираются на векторные вычисления, а не на тензорные или матричные, которые характерны для ИИ-нагрузок. Фактически ситуация ещё хуже — менее 10 % реальных HPC-приложений внесли изменения в DGEMM-коды, которые позволяют воспользоваться преимуществами Ozaki. «Насколько мне известно, с Ozaki-I, Ozaki-II или любой другой существующий метод нельзя применить к векторным инструкциям, — говорит Малайя. — Это ключевой нюанс, который, как мне кажется, упускается». На DGEMM действительно уходит много вычислительных ресурсов, что позволяет использовать схему Ozaki, «но она не решает 90 % HPC-задач». AMD собирается поддерживать эмуляцию Ozaki на своих чипах, сообщил Малайя. «Нет причин этого не делать. Это ПО. <…> И у вас могут быть библиотеки, которые позволяют динамически переключаться между нативными расчётами и Ozaki и, вероятно, оценивать его», — сказал он, добавив, что программную эмуляцию можно иметь в виду в качестве резервного варианта для FP64-вычислений. Но в конечном итоге Ozaki не является работоспособной альтернативой «железу» с FP64, сказал Малайя, уточнив, что не он один так считает. В настоящее время компания разрабатывает MI430X, специализированную версию ускорителя следующего поколения MI450, который будет обладать значительной FP64-производительностью. По словам Малайи, она будет значительно больше, чем у ускорителя MI355X, который обеспечивает 78,6 Тфлопс. По факту, это меньше, чем у предыдущей модели MI325X, которая обеспечивала 81,7 Тфлопс — в обоих случаях речь и про векторные, и про матричные FP64-вычисления. В любом случае, у всех этих чипов — от MI325 до MI430 — производительность больше, чем у чипов NVIDIA. И Hopper (34 Тфлопс), и Blackwell (40 Тфлопс) уже были медленнее в векторных FP64-вычислениях, но у Hopper хотя бы были нативные 67 Тфлопс в матричных расчётах, тогда как Blackwell в этом случае уже перешёл к схеме Озаки с «ненативными» 150 Тфлопс. Про Blackwell Ultra, где FP64-производительность упала до 1,3 Тфлопс, NVIDIA в данном контексте вообще не вспоминает, но обещает, что у Rubin будет 33 Тфлопс в векторных FP64-расчётах и 200 Тфлопс в матричных (тоже с Озаки). NVIDIA обосновывает отказ от развития аппаратных FP64-блоков тем, что увеличение собственно вычислительной мощности FP64 на самом деле не ускорит научные приложения, поскольку на практике они упрутся в возможности регистров, кешей и HBM. Rubin обеспечит пропускную способность HBM до 22 Тбайт/с, что в 2,8 раза больше, чем у Blackwell. Instinct MI325X предлагает 6 Тбайт/с, MI355X — 8 Тбайт/с, а у MI430X будет уже 19,6 Тбайт/с, сообщил Малайя. По словам Малайи, лучше всего синхронно «вкладываться» и в HBM, и в количество операций с плавающей запятой. «На самом деле важен коэффициент байт/флопс. С нашей точки зрения, необходимо поддерживать гораздо более близкое соотношение к тому, что мы видим в современных продуктах, — сказал он. — Необходимо значительно приблизиться к этому соотношению с точки зрения увеличения производительности FP64, чтобы сохранить тот же уровень, как это называют, арифметической интенсивности». Поскольку AMD обеспечит 2,5-кратное увеличение ПСП HBM от MI355 до MI430X, аналогичное 2,5-кратное увеличение производительности FP64 также будет оправдано. Таким образом можно примерно прикинуть, что MI430X может обеспечить производительность FP64 от 192 до 204 Тфлопс в зависимости от того, какой из них будет базовым: более новый MI355 или более быстрый MI325, сообщил HPCwire, добавив, что это всего лишь предположение, поскольку компания пока не сообщила точные характеристики будущих чипов. Кроме того, не до конца ясно, будет ли FP64-производительность одинакова для векторных и матричных расчётов. FP64-вычисления «очень важны» для «Миссии Генезис» (Genesis Mission), заявил ранее заместитель министра энергетики США (DoE) по науке и инновациям Дарио Гил (Darío Gil). Он отметил, что и глава AMD Лиза Су (Lisa Su), и глава NVIDIA Дженсен Хуанг (Jensen Huang), выразили твёрдую приверженность FP64, подтвердив, что поддержка формата будет продолжаться. «FP64 имеет решающее значение для поддержки рабочих нагрузок моделирования и симуляции, не только для дальнейшего развития традиционных научных исследований, но и для предоставления исходных данных для обучения новых ИИ-моделей», — добавил Гил. «Всегда существует баланс между тем, сколько требуется FP64- и FP16-вычислений», — сказал Малайя. «AMD утверждает, что нам необходимо поддерживать широкий спектр типов данных в зависимости от их потребностей. Не получится, чтобы всем были нужны FP64, которых хватит для всего.», — отметил он. Малайя сообщил, что всегда бывают исключения. Например, ИИ-симуляции сворачивания белков, такие как AlphaFold и Openfold, используют FP32. Да и некоторым традиционным HPC-задачам, таким как молекулярная динамика, не требуется FP64-точность. Тем не менее, сейчас существует значительный неудовлетворенный спрос на FP64, утверждает учёный. «Что касается высокопроизводительных вычислений, мы считаем, что им по-прежнему потребуется много FP64, — сказал он. — Будут использоваться некоторые коды, которые полностью ограничены пропускной способностью памяти, и им не нужно так много. Но есть, например, коды вычислительной химии и некоторые другие, которые действительно имеют высокую арифметическую интенсивность, и они будут использовать FP64». |
|
