Материалы по тегу: nvidia
|
02.07.2026 [00:20], Владимир Мироненко
На Тайване арестовали трёх человек в рамках расследования контрабанды ИИ-серверов Supermicro в КитайНа Тайване продолжается расследование фактов контрабанды ИИ-серверов Supermicro с подсанкционными чипами NVIDIA. В начале недели газета The Financial Times сообщила об обысках, проведенных прокуратурой округа Килунг (Keelung) в офисе Supermicro, а также у её местного дистрибьютора Albatron Technology и оператора ЦОД Chief Telecom. Кроме того, обыски прошли по месту жительства шести человек и ещё на трёх объектах, связанных с деятельностью Supermicro. По данным Bloomberg, после проведённых рейдов окружной суд Килунга одобрил задержание прокуратурой двух сотрудников Supermicro, в то время как двое других были освобождены под залог с запретом покидать Тайвань. Также был задержан менеджер компании Albatron Technology, о чём компания сообщила в среду в своём заявлении. Ранее на этой неделе был допрошен сотрудник компании Chief Telecom. В свою очередь, Supermicro заявила, что продолжает сотрудничать с правоохранительными органами и государственными чиновниками на Тайване и в других юрисдикциях. После появления публикаций о проведённых обысках акции компании упали в понедельник на 8 %, отыграв часть падения во вторник. Ранее акционеры уже подали на компанию в суд в связи с данным инцидентом. В марте этого года Министерство юстиции США обвинило трёх лиц, включая соучредителя и члена совета директоров Supermicro И-Шьяна Лиау (Yih-Shyan Liaw), в контрабанде ИИ-серверов Supermicro с подсанкционными чипами NVIDIA на сумму $2,5 млрд китайским клиентам. После этого Лиау вывели из совета директоров компании. Он и ещё один обвиняемый, подрядчик компании, не признали себя виновными по предъявленным обвинениям в федеральном суде Нью-Йорка. А третий из обвиняемых, сотрудник Supermicro, работающий на Тайване, до сих скрывается от правосудия.
30.06.2026 [13:27], Сергей Карасёв
NVIDIA Jetson поможет в ИИ-обработке данных на орбите ЛуныВ конце 2026 года американская частная аэрокосмическая компания Firefly Aerospace намерена осуществить запуск лунных аппаратов в рамках проекта Blue Ghost Mission 2. Орбитальный модуль, проектируемый по этой программе, будет использовать вычислительную платформу NVIDIA Jetson для обработки изображений Луны с использованием ИИ-алгоритмов. В марте 2025-го космический аппарат Blue Ghost Mission 1 компании Firefly Aerospace совершил посадку на Луну: он передал на Землю почти 120 Гбайт необработанных данных, включая изображения и видео, полученные бортовыми камерами. Эта информация до сих пор обрабатывается и изучается в лабораториях. В случае Blue Ghost Mission 2 данные будут обрабатываться непосредственно на лунной орбите, что избавит от необходимости их длительной трансляции на Землю. ИИ-алгоритмы, запущенные на базе Jetson, позволят извлекать только необходимые сведения: это значительно сократит задержку. Таким образом, повысится эффективность работы системы Firefly Ocula — первого коммерческого сервиса для получения высокодетализированных изображений и карт лунной поверхности. Проект Blue Ghost Mission 2 предполагает запуск посадочного модуля с набором научных приборов, который должен опуститься на обратную сторону Луны. Ещё одним элементом программы станет орбитальный блок Elytra, оснащённый вычислительным узлом NVIDIA Jetson. Датчики системы Ocula будут получать изображения Луны в ультрафиолетовом и видимом диапазонах. Затем эти данные поступят на обработку в бортовой вычислительный узел на базе Jetson, использующий алгоритмы ИИ. После извлечения необходимые сведения будут передаваться на Землю. Аппарат Elytra рассчитан на эксплуатацию в течение пяти лет. Установленная на нём электроника будет получать питание от солнечных панелей. Отмечается, что сервис Ocula, реализованный на основе Elytra, поможет в решении ряда важных задач, среди которых — выбор оптимальных зон посадки для будущих пилотируемых и роботизированных лунных миссий, определение минерального состава пород и пр.
28.06.2026 [22:32], Владимир Мироненко
Платформа HPE Supercomputing Programming Software упростит работу с мультивендорными системами ИИ и HPC
amd
hpc
hpe
intel
nvidia
open source
software
ии
контейнеризация
конфиденциальность
разработка
утилизация
Компания HPE представила новую унифицированную программную платформу HPE Supercomputing Programming Software, предназначенную для того, чтобы помочь клиентам справляться с растущей сложностью работы с HPC-средами мультивендорных систем, обеспечивая согласованность между системами HPE. HPE отметила, что разработка приложений для работы на HPC-платформах, таких как кластеры HPE Cray GX5000, требует от разработчиков использования языков программирования и фреймворков, специфичных для конкретной архитектуры чипа. Клиенты используют пакеты, предлагаемые AMD, Intel или NVIDIA, и т.д., и задача клиента — убедиться, что они совместимы с её платформой Cray. HPE будет сотрудничать с производителями чипов для объединения их инструментов разработки в рамках новой платформы, заявил Джим Лухан (Jim Lujan), вице-президент по системной инженерии HPE в интервью HPCwire. По его словам, с помощью HPE Supercomputing Programming Software компания предоставит, по сути, контейнеры с поддержкой их экосистем. HPE берёт на себя обеспечение первой линии поддержки, когда у клиентов возникают проблемы — вместо того, чтобы просто переправлять сообщения производителям чипов, сказал Лухан. Он также отметил, что HPE всё больше переходит на open source, дополняя проприетарные компоненты софтом из открытой экосистемы, что расширяет возможности клиентов. Нынешнее обновление поддерживает Kubernetes, а также открытые инструменты разработки AMD и NVIDIA. HPE Supercomputing Programming Software предлагает простой подход к многовендорным средам и процессу интеграции, помогая ускорить циклы развёртывания и минимизировать риск нестабильности системы. Платформа поддерживает серверы HPE ProLiant, включая модели HPE ProLiant DL и XD, оптимизированные для различных задач обучения, настройки и ИИ-инференса, что обеспечивает согласованный и упрощённый опыт работы на разных платформах для крупных предприятий. Новый программный стек также обеспечивает больше возможностей для разработки клиентами приложений ИИ и HPC с многопользовательским режимом, важность которого возросла в основном из-за требований суверенитета, предъявляемых компаниями, организациями и государственными учреждениями, находящимися за пределами США. HPE добавила многопользовательский режим в инструмент Smart Update Manager (SUM), чтобы клиенты могли изолировать свои данные, а также его поддержку в уже поставленных потребителям коммутаторах Slingshot 400 и СХД Cray E2000. «В последнее время наблюдается большой спрос на многопользовательский режим и его поддержку, — сообщил Лухан. — Мы всегда поддерживали множество пользователей, но теперь есть желание добиться большей изоляции данных и их разделения для некоторых наших клиентов». HPE также расширила свою программу вывода из эксплуатации систем, включив в нее серверы с воздушным охлаждением для ИИ и HPC. Согласно данным компании, в в 2025 году 85 % серверов, прошедших через центры обновления, были переработаны и возвращены в активное использование, а 1,7 Эбайт данных были надёжно удалены.
24.06.2026 [12:00], Сергей Карасёв
Dell представила сервер PowerEdge XE8812 на базе NVIDIA Vera Rubin NVL4Компания Dell Technologies анонсировала сервер PowerEdge XE8812 для ресурсоёмких нагрузок ИИ и HPC. Устройство, относящееся к семейству Dell AI Factory with NVIDIA, ориентировано на использование в составе стоечной платформы Dell PowerRack 9100, основанной на стандартах OCP. Модель PowerEdge XE8812 выполнена на архитектуре NVIDIA Vera Rubin NVL4, которая включает четыре ускорителя Rubin. Таким образом, в составе стойки могут быть задействованы в общей сложности до 144 GPU, что обеспечивает высочайшую плотность вычислений. Сама стойка Dell PowerRack 9100 соответствует стандарту ORv3. Она поддерживает работу с оборудованием суммарной мощностью более 300 кВт. Реализовано прямое жидкостное охлаждение, которое охватывает как CPU, так и GPU. Интегрированный контроллер удалённого доступа Dell (iDRAC) позволяет настраивать, обновлять и контролировать серверы PowerEdge дистанционно из любой точки с подключением к сети. В целом, как отмечает Dell, переход на платформу Vera Rubin обеспечивает 50-% прирост объёма памяти в расчёте на сокет и GPU по сравнению с решениями NVIDIA предыдущего поколения. В сочетании с библиотеками NVIDIA CUDA-X это даёт предприятиям возможность запускать крупные ИИ-модели и симуляции полностью в оперативной памяти. Сервер предназначен для решения сложных задач, таких как, например, молекулярное моделирование. Поставки PowerEdge XE8812 планируется организовать в начале следующего года.
24.06.2026 [01:23], Владимир Мироненко
Европа получит 35 суперкомпьютеров на чипах NVIDIANVIDIA объявила о разработке по всей Европе 35 суперкомпьютеров на базе её чипов, которые позволят более 3 млн исследователей ускорить проведение научных исследований и внедрение промышленных инноваций в сфере ИИ. Это крупнейшее за год расширение в Европе сети суперкомпьютеров, охватывающее национальные суперкомпьютерные центры, ИИ-фабрики и академические исследовательские институты. Эти системы будут поддерживать исследования в области климатологии, здравоохранения, декарбонизации чистой энергетики, квантовых вычислений и фундаментальной науки. Работу большей части европейских ИИ-фабрик обеспечивают платформы Blackwell и Hopper, при этом с прошлого года было развернуто или анонсировано 800 Эфлопс вычислительных мощностей для ИИ. Эти суперкомпьютеры, включая обновлённый EuroHPC MareNostrum5 AI Барселонского суперкомпьютерного центра (BSC-CNS), Blue Swan (BavariaAI), IT4LIA, HammerHAI Центра высокопроизводительных вычислений в Штутгарте (HLRS) и ИИ-фабрика Mimer Национальной академической суперкомпьютерной инфраструктуры Швеции (NAISS), основаны на передовой ИИ-инфраструктуре NVIDIA, говорит компания. Так, суперкомпьютер MareNostrum 5 будет дооснащён системами GB300 NVL72 и GB200 NVL4, объединённых интерконнектом NVIDIA Quantum-X800 InfiniBand. Система, обеспечивающая производительность до 20 Эфлопс при обучении ИИ и 33 Эфлопс при ИИ-инференсе, позволит ускорить работу генеративного ИИ, климатическое моделирование, исследования в области здравоохранения и биотехнологий, устойчивого сельского хозяйства, энергетических систем и госсервисов. Система Blue Swan (BavariaAI) добавит 1 тыс. ускорителей (GB200 NVL4 и Quantum-2 InfiniBand) суперкомпьютерным центрам FAU Erlangen и LRZ. Платформа обеспечит производительность до 11 Эфлопс при обучении ИИ и 22 Эфлопс при ИИ-инференсе. Она будет поддерживать инициативу Баварии по созданию базовых моделей, продвигая открытые мультимодальные модели для науки, государственного управления, исследований в области здравоохранения, робототехники и т.д. HammerHAI (HLRS) представляет собой первую в Германии ИИ-фабрику с более чем 850 GPU на базе GB200 NVL4 с Quantum-X800 InfiniBand. Суперкомпьютер HammerHAI, обеспечивающий производительность до 8 Эфлопс при обучении ИИ и 15 Эфлопс при ИИ-инференсе, обеспечит исследователям и промышленным пользователям безопасную ИИ-инфраструктуру для инженерного моделирования, инференса и научных исследования. Суперкомпьютер Mimer EuroHPC AI Factory (NAISS), размещённый в Линчёпингском университете (LiU, Швеция), будет использовать 100 систем GB200 NVL4 и сеть ConnectX-8. Обеспечивая производительность до 4 Эфлопс при обучении ИИ и около 7 Эфлопс при ИИ-инференсе, Mimer AI Factory будет способствовать развитию шведской ИИ-экосистемы в таких областях, как биологические науки, материаловедение, автономные системы, доверенный ИИ и т.д. Наконец, ИИ-фабрика IT4LIA с более чем 8 тыс. GPU на базе GB200 NVL4 с Quantum-X800 InfiniBand и ПО NVIDIA AI Enterprise обеспечивает производительность в размере 82 Эфлопс при обучении ИИ и 164 Эфлопс при ИИ-инференсе.
23.06.2026 [11:33], Сергей Карасёв
В Японии появился гибридный квантово-классический суперкомпьютер Roquo производительностью 19,8 ПфлопсВ Центре вычислительных наук японского Института физико-химических исследований (R-CCS) введён в строй гибридный квантово-классический суперкомпьютер Roquo, названный в честь горы Рокко к северу от города Кобе. В создании НРС-системы приняли участие DTS, NVIDIA, Giga Computing, DDN и ScaleWorX. Roquo состоит из 135 вычислительных узлов на базе NVIDIA GB200 NVL4. В общей сложности задействованы 540 чипов Blackwell и 270 чипов NVIDIA Grace. Применяется интерконнект NVIDIA Quantum-X800 InfiniBand с общей пропускной способностью до 3,2 Тбит/с (установлены коммутаторы Q3400, поддерживающие скорость передачи данных 800 Гбит/с на порт). Реализовано жидкостное охлаждение. Заявленная производительность на операциях FP64 составляет 19,8 Пфлопс, а теоретическое пиковое быстродействие на операциях FP8 превышает 5 Эфлопс. Суперкомпьютер использует интерфейс SQC, что позволяет формировать гибридные среды с поддержкой традиционных и квантовых вычислений. В рамках проекта по созданию Roquo корпорация DTS осуществляла общую разработку платформы в соответствии с требованиями R-CCS. В свою очередь, NVIDIA предоставила базовые вычислительные и сетевые компоненты, тогда как Giga Computing отвечала за проектирование и производство серверов. DDN предоставила высокоскоростное файловое хранилище. Наконец, специалисты ScaleWorX осуществили общую системную интеграцию. Суперкомпьютер Roquo, как ожидается, поможет ускорить разработку и оценку эффективности новых квантовых алгоритмов. Кроме того, система будет использоваться для решения сложных задач, с которыми не в состоянии справиться классические НРС-комплексы.
21.06.2026 [14:58], Владимир Мироненко
Франция развивает ИИ-инфраструктуру в сотрудничестве с NVIDIAПлатформа AI Factory France (AI2F) под руководством Национального управления высокопроизводительных вычислений (GENCI) Франции объявила о запуске в партнёрстве с NVIDIA программы по ускорению инноваций в области ИИ в стране. Программа обеспечит компаниям упрощённый доступ к передовой вычислительной инфраструктуре и специализированным ИИ-сервисам. Она объединяет глобальную экосистему NVIDIA с национальными и европейскими ресурсами ИИ Франции. Сотрудничество между AI Factory France (AI2F) и программами NVIDIA Inception, NVIDIA Connect, позволяет стартапам получить доступ к национальным суперкомпьютерным ресурсам, включая Jean Zay. Первые участники, включая Pleias, Nebula и Ryax Technologies, уже используют эту возможность для создания приложений. Представленные в рамках GTC Paris мероприятия уже реализуются с использованием технологий NVIDIA. Так, Mistral строит новый ЦОД мощностью 44 МВт на севере Франции. Первый дата-центр Mistral, анонсированный в 2025 году, уже получил 18 тыс. систем NVIDIA GB200 в рамках плана по созданию 200 МВт вычислительных мощностей по всей Европе к 2027 году. В сотрудничестве с французским государственным инвестиционным банком Bpifrance, инвестиционной компанией MGX и NVIDIA компания работает над расширением Campus AI, сети предприятий в сфере ИИ, планируя построить ЦОД на 1,4 ГВт, что сделает её одним из крупнейших ИИ-платформ в Европе. Облачный провайдер Scaleway получил NVIDIA B300. Bull и Foxconn намерены производить в Европе NVIDIA Vera Rubin NVL72. Системы будут производиться и первоначально тестироваться на заводах Foxconn в Чехии, после чего их будут собирать, интегрировать и полностью проверять на заводе Bull в Анжере (Angers). Консорциум из восьми ведущих французских компаний подал заявку на размещение европейской гигафабрики ИИ во Франции для укрепления европейской ИИ инфраструктуры и ускорения внедрения ИИ. В свою очередь Schneider Electric объединилась с NVIDIA для разработки проектов гигаваттных ИИ-фабрик для компаний, развивающих ИИ-инфраструктуры. Аналогичные инициативы внедряются по всей Европе, включая сотрудничество между NVIDIA и Барселонским суперкомпьютерным центром (BSC), в рамках которого создаётся сеть, соединяющая местную инфраструктуру со стартапами и учреждениями государственного сектора. Компания TotalEnergies построит Pangea 5, суперкомпьютер следующего поколения, разработанный совместно с Dell и NVIDIA, который будет использоваться для сейсмической съёмки, передового моделирования и исследований в области ИИ в энергетическом секторе.
20.06.2026 [15:45], Сергей Карасёв
В Словении запущена НРС-система FRIDA с ускорителями NVIDIA BlackwellЛюблянский университет в Словении (University of Ljubljana), по сообщению DataCenter Dynamics, запустил высокопроизводительную систему FRIDA, ориентированную на задачи ИИ и машинного обучения. Это не классический суперкомпьютер, а модульный контейнерный дата-центр, размещённый на крыше здания Факультета компьютерных и информационных наук (FRI) в Любляне. Известно, что в составе FRIDA задействованы 104 ускорителя на основе GPU. В частности, применяются изделия NVIDIA Blackwell B200 и B300. Суммарный объём GPU-памяти составляет 16,8 Тбайт. Комплекс оборудован гибридной воздушно-жидкостной системой охлаждения. Все вычислительные узлы связаны интерконнектом с высокой пропускной способностью. Отмечается, что производительность FRIDA при вычислениях с низкой точностью достигает 708 Пфлопс. Пиковое быстродействие при операциях с разреженными матрицами низкой точности заявлено на уровне 1,42 Эфлопс. FRIDA дополнит словенскую НРС-систему Vega, которая была введена в строй в 2021 году в рамках проекта Европейского совместного предприятия по развитию высокопроизводительных вычислений (EuroHPC JU). Эта машина, основанная на процессорах AMD и ускорителях NVIDIA, демонстрирует FP64-производительность на уровне 6,9 Пфлопс.
Источник изображения: linkedin.com Vega задумывалась как универсальная платформа для сложных вычислений: она может применяться для решения задач в самых разных областях, включая биоинженерию и разработку новых лекарств, изучение климата и прогнозирование погоды, персонализированную медицину, создание новых материалов и пр. В свою очередь, система FRIDA ориентирована прежде всего на нагрузки, связанные с ИИ.
18.06.2026 [09:22], Руслан Авдеев
Глава NVIDIA лично поучаствовал в закладке нового производства оптических компонентов CoherentКомпания Coherent, выпускающая лазеры, оптические компоненты, полупроводники для ИИ-систем и 6″ пластины из фосфида индия (InP), начала строительство расширенного производственного корпуса в Шермане (Sherman, Техас). В церемонии открытия принял участие глава NVIDIA Дженсен Хуанг (Jensen Huang) и генеральный директор Coherent Джим Андерсон (Jim Anderson). Хуанг назвал Coherent жизненно важной компанией для будущего США. Новая фабрика позволит нарастить производство пластин из фосфида индия — ключевого компонента систем передачи данных между чипами, серверами и ЦОД, формирующего современный оптический «каркас» ИИ-инфраструктуры. Coherent заявила, что полученный в рамках CHIPS Act грант поможет профинансирвоать расширение производства. Ранее $17 млн было выделено в рамках техасской программы CHIPS и от локального фонда Sherman Economic Development Corporation. Импульс придаёт и обязательство NVIDIA организовать создание ИИ-инфраструктуры в США на сумму до $500 млрд. Полупроводники на основе фосфида индия или арсенида галлия лежат в основе высокоскоростных сетей, необходимых для современных ИИ-систем, таких как NVIDIA Vera Rubin Ultra NVL576. InP-лазеры используются в оптических модулях Coherent, устанавливаемых в сетевые коммутаторы NVIDIA. Те же модули применяются в коммутаторах NVIDIA Spectrum-X и Quantum-X с интегрированной оптикой (CPO), для которых Coherent поставляет внешние лазерные модули.
Источник изображения: NVIDIA NVIDIA и Coherent сотрудничают почти 20 лет. В марте они заключили многолетнее стратегическое соглашение, в рамках которого NVIDIA инвестирует $2 млрд в Coherent для поддержки разработок и исследований, а также организации производства на территории США. Кроме того, NVIDIA обязалась закупать у Cohere передовые лазерные и оптические сетевые продукты. Ранее она также заключила крупное соглашение с поставщиком оптоволокна Corning, который тоже расширит производство на территории США. Завод в Шермане занимается выпуском не одного конкретного продукта, а производством всевозможных лазеров, трансиверов, подключаемых оптических модулей и др., обеспечивающих передачу данных в экосистеме NVIDIA. Переход на современные 6″ пластины из фосфида индия позволит приблизительно вчетверо увеличить выход продукции. Большинство других поставщиков до сих пор использует только 3″–4″ пластины.
18.06.2026 [01:45], Владимир Мироненко
NVIDIA стала лидером во всех тестах MLPerf Training 6.0Консорциум MLCommons опубликовал результаты тестирования различных аппаратных решений в бенчмарке MLPerf Training 6.0. В нём появилось два новых теста — DeepSeek V3 и GPT-OSS 20B, что подчёркивает общеотраслевой переход к разреженным вычислениям, примером которого является архитектура MoE (Mixture-of-Experts). DeepSeek V3 — крупномасштабная MoE-модель c 671 млрд параметров, из которых 37 млрд активируются для генерации отдельного токена. Она предоставляет стандартизированную платформу для оценки эффективности обучения ведущей модели MoE с открытыми весами. GPT-OSS 20B — MoE-модель c 21 млрд параметров, из которых 3,6 млрд активируются для генерации одного токена. Она позволяет организациям оценивать сложную логику маршрутизации и шаблоны разреженных вычислений, характерные для архитектуры MoE, на аппаратных конфигурациях размером всего в один узел с восемью ускорителями. Версия MLPerf Training 6.0 установила новые рекорды по разнообразию представленных систем. Участники выложили результаты 95 уникальных систем, использующих тринадцать различных аппаратных ускорителей, 19 различных хост-процессоров и несколько различных программных фреймворков. 60 % систем были многоузловыми. При этом количество представленных облачных систем более чем вдвое больше, чем в раунде 5.1. В раунде MLPerf Training v6.0 представлены заявки от 24 организаций: AMD, ASUSTeK, Azure, Cisco, CoreWeave, Dell, Fujitsu, GigaComputing, Google, HPE, Inventec, Krai, Lambda, MITAC, Nebius, Netweb Technologies India, NVIDIA, Oracle, Quanta Cloud Technologies, SCITIX, Supermicro, tinycorp, TTA и Vultr. «Мы особенно рады приветствовать участников, впервые представляющих свои результаты в MLPerf Training: Inventec, Netweb Technologies India, TTA и Vultr», — сообщил Дэвид Кантер (David Kanter), руководитель MLPerf в MLCommons. NVIDIA вновь стала лидером в новом раунде MLPerf Training, причём во всех тестах, в очередной раз став единственной платформой, которая предоставила результаты по всем тестам. Также NVIDIA была единственной платформой, представившей результаты по новым тестам, при этом система NVIDIA GB300 NVL72 «установила планку производительности благодаря оптимизированным программным стекам NVIDIA и конструкции, объединяющей 72 GPU Blackwell Ultra и 36 CPU Grace с использованием NVLink и NVLink Switch». В нескольких случаях партнёры NVIDIA масштабировали систему до 8192 ускорителей Blackwell, работающих согласованно в различных ЦОД. Эти результаты подтвердили реальную надёжность платформы Blackwell в масштабируемых кластерных средах, говорит NVIDIA. Для достижения максимальной производительности таких моделей, как DeepSeek-V3, NVIDIA в этом раунде MLPerf Training применила несколько программных оптимизаций, включая использование итерационных графов CUDA для MoE без удаления токенов, применение CuTe DSL для продвинутых операций слияния ядер, алгоритм внимания MXFP8 для повышения производительности без ущерба для качества модели, оптимизацию маршрутизатора и оптимизацию схемы коммуникации 1F1B all-to-all overlap. Также NVIDIA оптимизировала компоновку и баланс параллельных этапов конвейера, минимизируя структурное простаивание. Для обработки DeepSeek-V3 671B компания NVIDIA использовала до 8192 GPU в системах GB200 NVL72, что стало самым масштабным результатом на основе Blackwell в MLPerf Training на сегодняшний день. NVIDIA также представила результаты на 5120 GPU с системами NVIDIA GB200 NVL72 в Llama 3.1 405B, одной из самых крупных LLM плотной архитектуры в этом бенчмарке. Результаты этого раунда также отражают тесное сотрудничество NVIDIA с компаниями-партнёрами в области системной архитектуры, сетей и ПО. Например, Microsoft Azure масштабировала обучение Llama 3.1 405B до 8192 GPU, используя системы GB200 NVL72, и достигла целевого эталонного значения за 7,07 мин., что является самым быстрым временем обучения для этого бенчмарка. А CoreWeave показала самое быстрое время обучения для DeepSeek-V3 671B, достигнув целевого качества за 2,02 мин. на 8192 GPU в составе GB300 NVL72, объединённых Spectrum-X Ethernet. |
|
