Материалы по тегу: intel

22.09.2025 [13:02], Сергей Карасёв

ASRock представила видеокарты Intel Arc Pro B60 для рабочих станций с ИИ

Компания ASRock анонсировала видеокарты Intel Arc Pro B60 Passive 24GB и Intel Arc Pro B60 Creator 24GB для профессиональных рабочих станций, ориентированных на задачи ИИ, большие языковые модели (LLM), дизайн, 3D-моделирование и пр. Новинки выполнены на архитектуре Intel Xe2-HPG и оснащены 24 Гбайт памяти GDDR6 со 192-битной шиной (19 Гбит/с).

Модель Intel Arc Pro B60 Passive 24GB, наделённая пассивным охлаждением, имеет однослотовое исполнение. Карта будет доступна исключительно бизнес-заказчикам. В свою очередь, Intel Arc Pro B60 Creator 24GB получила активный кулер (с бесшумным режимом 0dB Silent Cooling) и двухслотовое исполнение. Обе новинки могут использоваться в конфигурациях с несколькими GPU в Linux-средах, что делает их подходящими для серверных развёртываний в рамках масштабных ИИ-платформ.

 Источник изображений: ASRock

Источник изображений: ASRock

Видеокарты располагают 20 ядрами Xe2-HPG и 160 матричными движками (XMX). Частота ядра составляет 2400 МГц. Задействован интерфейс PCIe 5.0. Дополнительное питание подаётся через 8-контактный коннектор. Говорится о поддержке Microsoft DirectX 12 Ultimate.

Доступны четыре интерфейса DisplayPort 2.1 — основной с поддержкой UHBR13.5 и три дополнительных с поддержкой UHBR10. Видеокарта Intel Arc Pro B60 Passive 24GB имеет размеры 190 × 112 × 19 мм и весит 566 г. Габариты Intel Arc Pro B60 Creator 24GB составляют 271 × 112 × 39 мм, масса — 1118 г.

Некоторые ретейлеры уже начали приём предварительных заказов на эти решения. Так, на сайте американского магазина Central Computers версия Intel Arc Pro B60 Creator 24GB предлагается по ориентировочной цене $600.

Постоянный URL: http://servernews.ru/1129630
19.09.2025 [11:42], Сергей Карасёв

AAEON представила компактную ИИ-систему Intelli i14 Edge с ускорителем NVIDIA RTX

Компания AAEON анонсировала компьютер небольшого форм-фактора Intelli i14 Edge, рассчитанный на использование в коммерческой и индустриальной сферах. Устройство подходит для решения задач промышленной автоматизации, машинного зрения, предиктивного обслуживания, проектирования робототехники и пр.

В основу новинки положена аппаратная платформа Intel Raptor Lake. Применён процессор Core i9-14900T, который объединяет 24 вычислительных ядра (8Р + 16Е; 32 потока). Максимальная тактовая частота — 5,5 ГГц. В состав чипа входит графический блок Intel UHD Graphics 770. Объём оперативной памяти DDR5-4800 может достигать 32 Гбайт в виде двух модулей SO-DIMM с поддержкой ЕСС.

Компьютер несёт на борту ускоритель NVIDIA RTX A2000 или RTX A4500 (MXM), благодаря чему обеспечивается возможность локальной обработки ИИ-моделей. Есть два коннектора M.2 2280 M-Key для NVMe SSD и разъём M.2 2230 E-Key для адаптера Wi-Fi / Bluetooth. Реализованы два интерфейса DisplayPort для вывода изображения.

 Источник изображений: AAEON

Источник изображений: AAEON

Благодаря наличию сетевых портов 2.5GbE (Intel I226-IT) и 1GbE (Intel I219-LM), а также пяти разъёмов USB 3.2 Gen1 Type-A, как отмечает AAEON, обеспечивается бесшовная интеграция с камерами, лидарами, инерциальными измерительными блоками (IMU) и промышленными концентраторами ввода-вывода. Предусмотрен также один порт USB 3.2 Gen2 Type-C.

Устройство имеет размеры 205 × 190 × 70 мм и весит около 3 кг. Диапазон рабочих температур — от 0 до +50 °C. Решение протестировано на устойчивость к вибрации в соответствии со стандартом IEC EN60068-2-64, что делает его пригодным для использования в автомобильных системах помощи водителю при движении (ADAS), оборонных комплексах, робототехнических платформах и других системах, которые эксплуатируются в неблагоприятных условиях. Говорится о совместимости с Windows 10 IoT.

Постоянный URL: http://servernews.ru/1129520
19.09.2025 [11:10], Сергей Карасёв

Одноплатный ПК 2-в-1 LattePanda IOTA получил чип Intel Twin Lake и микроконтроллер Raspberry Pi RP2040

Как сообщает ресурс CNX Software, вышло изделие LattePanda IOTA, выполненное на аппаратной платформе Intel Twin Lake. На устройстве могут применяться ОС Windows 10/11 и Ubuntu 22.04/24.04.

В оснащение входит чип Intel Processor N150, который содержит четыре ядра с частотой до 3,6 ГГц и ускоритель Intel UHD Graphics. Дополнительно задействован микроконтроллер Raspberry Pi RP2040 (два ядра Cortex-M0+), отвечающий за IO-функции и управление питанием. Объём оперативной памяти LPDDR5-4800 может составлять 8 или 16 Гбайт.

Новинка несёт на борту флеш-модуль eMMC 5.1 вместимостью 64 или 128 Гбайт с возможностью расширения посредством карты microSD. Есть сетевой адаптер 1GbE и коннектор M.2 E-Key 2230, к которому подключается опциональный контроллер Wi-Fi / Bluetooth. Кроме того, может быть добавлена плата расширения LTE Expansion Board (DFR1249) с поддержкой сотовой связи 4G.

 Источник изображения: CNX Software

Источник изображения: CNX Software

Устройство имеет размеры 88 × 77 × 19 мм. Присутствуют три порта USB 3.2 Gen2 Type-A (10 Гбит/с), разъём HDMI 2.1 с поддержкой разрешения до 4096 × 2160 (60 Гц), гнездо RJ45 для сетевого кабеля, аудиоразъём на 3,5 мм, 36-контактная колодка GPIO (3 × ADC, 16 × DI/DO, UART, USB 2.0 и пр.), коннектор eDP 1.4b (две линии), 16-контактный разъём FPC PCIe 3.0. Питание может подаваться через дополнительный порт USB Type-C PD или через 4-контактный коннектор.

Для одноплатного компьютера доступны различные модули расширения, включая плату PoE, а также M.2 M Key для SSD или ускорителя ИИ. Возможно использование пассивного или активного охлаждения. Решение LattePanda IOTA доступно для заказа по ориентировочной цене от $130.

Постоянный URL: http://servernews.ru/1129513
18.09.2025 [16:09], Владимир Мироненко

Intel разработает для NVIDIA кастомные CPU для серверов и ПК, а NVIDIA вложит в Intel $5 млрд

NVIDIA и корпорация Intel заключили соглашение о сотрудничестве с целью совместной разработки специализированных чипов для ЦОД и ПК для использования гиперскейлерами, а также другими клиентами на корпоративном и потребительском рынках.

Согласно пресс-релизу, компании намерены обеспечить бесшовное объединение архитектур NVIDIA и Intel с использованием NVIDIA NVLink, реализуя преимущества NVIDIA в области ИИ и ускоренных вычислений совместно с ведущими технологиями процессоров Intel и экосистемой x86 для предоставления передовых решений для клиентов. Ранее NVIDIA представила интерконнект NVLink Fusion, который как раз и позволяет объединять решения компании с чиплетами других вендоров. Одним из первых продуктов стал чип GB10, включающий GPU Blackwell и Arm-процессор MediaTek.

В рамках партнёрства Intel разработает кастомные серверные x86-процессоры для ИИ-платформ NVIDIA. Для персональных компьютеров Intel разработает SoC с архитектурой x86 и GPU-чиплетами NVIDIA RTX. Новые SoC RTX на базе x86 будут использоваться в широком спектре ПК. У Intel уже был опыт интеграции GPU AMD в свои SoC, но не слишком удачный — Kaby Lake-G были заброшены через пару лет после выхода.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

В рамках соглашения о сотрудничестве NVIDIA инвестирует в Intel $5 млрд путём приобретения на эту сумму обыкновенных акций Intel по цене $23,28 за единицу. После этого объявления акции Intel подскочили на премаркете на 33 % до примерно $33 за единицу, сообщил ресурс CNBC. Ранее SoftBank потратила $2 млрд на покупку акций Intel по $23/шт. В конце августа власти США приобрели 9,9 % долю в Intel за $8,9 млрд, получив акции по $20,47 за бумагу.

«Это историческое сотрудничество тесно связывает ИИ-технологии и ускоренные вычисления NVIDIA с CPU Intel и обширной экосистемой x86 — слиянием двух платформ мирового класса. Вместе мы расширим наши экосистемы и заложим основу для следующей эры вычислений», — отметил генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang). Как полагают аналитики CNBC, сотрудничество, по всей видимости, не включают производство чипов NVIDIA на производственных мощностях Intel.

Постоянный URL: http://servernews.ru/1129481
18.09.2025 [15:25], Сергей Карасёв

Giga Computing представила флагманский ИИ-сервер на базе NVIDIA HGX B300

Компания Giga Computing, подразделение Gigabyte, анонсировала сервер G894-SD3-AAX7 — флагманскую систему, предназначенную для решения сложных HPC-задач, обучения больших языковых моделей (LLM), инференса и других ресурсоёмких ИИ-нагрузок. В основу новинки положены процессорры Intel Xeon Granite Rapids и ускорители NVIDIA Blackwell Ultra.

 Источник изображений: Giga Computing

Источник изображений: Giga Computing

Сервер выполнен в форм-факторе 8U. Возможна установка двух процессоров Xeon 6500P/6700P с показателем TDP до 350 Вт. Доступны 32 слота для модулей оперативной памяти DDR5 RDIMM-6400 или MRDIMM-8000. Во фронтальной части расположены восемь посадочных мест для SFF-накопителей с интерфейсом PCIe 5.0 (NVMe) и поддержкой горячей замены. Кроме того, есть два внутренних коннектора для SSD типоразмера M.2 2280/22110 (PCIe 5.0 x4 и PCIe 5.0 x2).

Система, построенная на платформе NVIDIA HGX B300, имеет восемь SXM-ускорителей Blackwell Ultra. Могут быть реализованы восемь портов 800G OSFP InfiniBand или 16 портов 400GbE посредством адаптеров NVIDIA ConnectX-8 SuperNIC. Говорится о поддержке DPU NVIDIA BlueField-3 и о наличии четырёх слотов PCIe 5.0 x16 для карт FHHL.

Сервер оснащён двумя портами 10GbE на базе Intel X710-AT2, выделенным сетевым портом управления 1GbE, контроллером ASPEED AST2600, двумя портами USB 3.2 Gen1 Type-A и интерфейсом D-Sub. Применяется воздушное охлаждение. За питание отвечают 12 блоков мощностью 3000 Вт с сертификатом 80 PLUS Titanium. Диапазон рабочих температур — от +10 до +30 °C.

Постоянный URL: http://servernews.ru/1129478
18.09.2025 [10:52], Сергей Карасёв

Dell представила ИИ-сервер PowerEdge XE7740 с ускорителями Intel Gaudi 3

Компания Dell полностью раскрыла характеристики стоечного сервера PowerEdge XE7740, о подготовке которого впервые стало известно в ноябре 2024 года. Новинка ориентирована на решение ресурсоёмких задач в области ИИ, включая тонкую настройку больших языковых моделей (LLM), инференс, распознавание изображений и речи, выявление мошенничества в сфере финансовых услуг и пр.

Сервер, выполненный в форм-факторе 4U, рассчитан на установку двух процессоров Intel Xeon 6 поколения Granite Rapids-SP, которые могут насчитывать до 86 вычислительных ядер. Доступны 32 слота для модулей DDR5-6400 суммарным объёмом до 4 Тбайт. Во фронтальной части расположены восемь отсеков для NVMe SSD стандарта E3.S вместимостью до 122,88 Тбайт. Кроме того, доступны два внутренних коннектора M.2 для загрузочных NVMe-накопителей.

 Источник изображений: Dell

Источник изображений: Dell

Машина может нести на борту до восьми ИИ-ускорителей Intel Gaudi 3. В зависимости от конфигурации возможна установка восьми карт FHFL двойной ширины (до 600 Вт) с интерфейсом PCIe 5.0 x16 или 16 карт FHFL одинарной ширины (75 Вт). Кроме того, есть слот OCP NIC 3.0.

Сервер оборудован системой воздушного охлаждения. За питание отвечают блоки мощностью 3200 Вт с сертификатом 80 PLUS Titanium. На лицевую панель выведены по одному порту USB 2.0 Type-A (iDRAC/BMC Direct), USB 2.0 Type-A (опционально) и Mini-DisplayPort. Сзади расположены два порта USB 3.1 Type-A, коннектор D-Sub и выделенный Ethernet-порт (iDRAC). Габариты составляют 899,56 × 482,0 × 174,3 мм, масса — 71,35 кг. Заявлена совместимость с Ubuntu Server LTS, Red Hat Enterprise Linux, SUSE Linux Enterprise Server и VMWare ESXi.

Постоянный URL: http://servernews.ru/1129441
17.09.2025 [18:34], Сергей Карасёв

OnLogic представила компактные защищённые компьютеры Karbon 520 на базе Intel Meteor Lake

Компания OnLogic анонсировала индустриальные компьютеры небольшого форм-фактора семейства Karbon 520, предназначенные для эксплуатации в неблагоприятных условиях. Устройства могут применяться для решения задач в сфере промышленной автоматизации, робототехники, периферийных ИИ-вычислений и пр.

Новинки выполнены в корпусе повышенной прочности в соответствии со стандартом MIL-STD-810H, что означает защиту от вибрации, ударов и пр. Диапазон рабочих температур простирается от -40 до +70 °C. В зависимости от модификации применяется пассивное или активное охлаждение. При этом ребристая верхняя часть выполняет функции радиатора для рассеяния тепла.

Задействована аппаратная платформа Intel Meteor Lake. Может быть установлен процессор Core Ultra 5 125H (4P+8E+2LPE; 18 потоков; до 4,5 ГГц), Core Ultra 5 135H (4P+8E+2LPE; 18 потоков; до 4,6 ГГц) или Core Ultra 7 165H (6P+8E+2LPE; 22 потока; до 5,0 ГГц). В состав чипов входят графический ускоритель Intel Arc и нейропроцессорный ИИ-блок Intel AI Boost. Доступны два слота для модулей оперативной памяти DDR5-5600 суммарным объёмом до 96 Гбайт.

 Источник изображений: OnLogic

Источник изображений: OnLogic

В семейство вошли пять моделей: Karbon 521, Karbon 522, Karbon 523, Karbon 524 и Karbon 525. Все они оборудованы шестью портами USB 3.2 Gen2 Type-A, двумя портами Thunderbolt 4 (USB Type-C), четырьмя сетевыми портами 2.5GbE (RJ45), двумя интерфейсами DisplayPort и четырьмя последовательными портами (RS-232/422/485). Допускается вывод изображения одновременно на четыре дисплея. Возможен монтаж посредством крепления VESA.

Karbon 521 располагает разъёмами M.2 2230 E-key (PCIe x1 / USB 2.0), M.2 2280 M-key (PCIe 4.0 x4), M.2 B-Key (PCIe 4.0 x2 / USB 2.0, PCIe 4.0 x1 / USB 3.2 Gen1) и 3FF-SIM. Вариант Karbon 522 имеет аналогичную конфигурацию, но дополнительно предоставляет два посадочных места для SFF-накопителей с интерфейсом SATA. Модификация Karbon 523 получила два слота расширения ModBay, а модель Karbon 524 — слот PCIe 5.0 x16 для карты FHHL. Версия Karbon 525 допускает установку GPU NVIDIA в форм-факторе MXM.

Постоянный URL: http://servernews.ru/1129385
17.09.2025 [17:50], Сергей Карасёв

Мини-ПК MeLE Cyber X1 на базе Intel Twin Lake получил пластиковый корпус-радиатор

Компания MeLE, по сообщению CNX Software, выпустила компьютер небольшого форм-фактора Cyber X1, подходящий для использования в коммерческой и индустриальной сферах. Новинка выполнена на аппаратной платформе Intel Twin Lake с процессором N150 (четыре ядра; до 3,6 ГГц; 6 Вт).

Устройство довольствуется пассивным охлаждением. Оно заключено в необычный корпус, верхняя часть которого усеяна шипами из специального пластика с высокой теплопроводностью, которые выполняют функцию радиатора для рассеяния тепла. При этом площадь охлаждающей поверхности, как утверждается, увеличивается в 6,4 раза по сравнению с обычной плоской панелью. Однако при интенсивной нагрузке температура этой зоны может достигать 55–70 °C.

Компьютер несёт на борту 16 Гбайт LPDDR5-4800 и NVMe SSD формата M.2 2280 вместимостью 512 Гбайт со скоростью передачи данных до 3940 Мбайт/с. Кроме того, предусмотрен слот для карты microSD. В оснащение входят адаптеры Wi-Fi 5 (802.11ac; частотные диапазоны 2,4/5 ГГц) и Bluetooth 5.1, сетевой контроллер 1GbE. Возможен вывод изображения одновременно на три монитора через два интерфейса HDMI 2.0 и разъём DisplayPort (через USB Type-C): во всех случаях поддерживается разрешение до 4K (60 Гц).

 Источник изображения: CNX Software

Источник изображения: CNX Software

Устройство располагает портами USB 3.2 Gen2 Type-A (10 Гбит/с), USB 3.0 Type-A (5 Гбит/с), USB 2.0 Type-A, USB 3.2 Gen2 Type-C (DisplayPort Alt Mode и USB PD 3.0), гнездом RJ45 для сетевого кабеля, 3,5-мм аудиоразъёмом. Питание (12 В / 5 A) подаётся через дополнительный порт USB Type-C. Габариты составляют 131 × 81 × 24 мм, масса — 288 г. Возможен монтаж при помощи крепления VESA. По имеющейся информации MeLE Cyber X1 поставляется с Windows 11. Ориентировочная цена — $230.

Постоянный URL: http://servernews.ru/1129412
16.09.2025 [11:53], Сергей Карасёв

Silver Lake закрыла сделку по покупке контролирующей доли в бизнесе Altera

Частная инвестиционная компания Silver Lake завершила сделку по приобретению контролирующей 51 % доли в структуре Altera — разработчика FPGA. Продавцом выступила корпорация Intel, которая сохранила за собой оставшиеся 49 %. Стоимость реализованного актива оценивается в $3,3 млрд.

Intel купила Altera в 2015 году за $16,7 млрд, создав на её основе подразделение Programmable Solutions Group (PSG) по разработке FPGA и сопутствующего ПО. О договоре с Silver Lake по продаже контролирующей доли в бизнесе Altera было объявлено в апреле нынешнего года.

Как отмечается, завершение сделки с Silver Lake превращает Altera в крупнейшего в мире независимого поставщика решений на базе FPGA. Ожидается, что благодаря операционной независимости и поддержке Silver Lake компания Altera сможет повысить гибкость деятельности, а также получит дополнительные ресурсы для ускорения разработки передовых FPGA-решений и предоставления расширенной поддержки клиентам и партнёрам по всему миру. Altera при участии Silver Lake рассчитывает укрепить позиции в ключевых секторах, включая промышленную автоматизацию, робототехнику, аэрокосмическую отрасль, оборонный сегмент, дата-центры, телекоммуникационное оборудование и периферийные ИИ-системы.

 Источник изображения: Altera

Источник изображения: Altera

В 2024 финансовом году Altera получила $1,54 млрд выручки, тогда как в I половине 2025-го этот показатель составил $816 млн. В период с января по июнь включительно компания понесла операционные расходы в размере $356 млн.

Продажа активов Altera происходит на фоне значительных структурных изменений в Intel и растущего финансового давления. Корпорация оказалась в сложном положении, уступив NVIDIA на рынке ИИ-ускорителей. В конце августа Intel объявила о достижении «исторического соглашения» с администрацией президента США Дональда Трампа (Donald Trump): американские власти приобретут 9,9 % долю в корпорации, а стоимость сделки составит $8,9 млрд. Это поможет Intel в расширении производства микросхем на территории США.

Постоянный URL: http://servernews.ru/1129304
12.09.2025 [23:07], Владимир Мироненко

Intel Arc Pro впервые поучаствовали в бенчмарках MLPerf Inference, но в лидерах предсказуемо осталась NVIDIA

MLCommons объявил результаты набора бенчмарков MLPerf Inference v5.1. Последний раунд демонстрирует, насколько быстро развивается инференс и соответствующие бенчмарки, пишет ресурс HPCwire. В этом раунде было рекордное количество заявок — 27. Представлены результаты сразу пяти новых ускорителей: AMD Instinct MI355X, Intel Arc Pro B60 48GB Turbo, NVIDIA GB300, NVIDIA RTX 4000 Ada 20GB, NVIDIA RTX Pro 6000 Blackwell Server Edition. Всего же количество результатов MLPerf перевалило за 90 тыс. результатов.

В текущем раунде были представлены три новых бенчмарка: тест рассуждений на основе модели DeepSeek-R1, тест преобразования речи в текст на основе Whisper Large v3 и небольшой тест LLM на основе Llama 3.1 8B. Как отметил ресурс IEEE Spectrum, бенчмарк на основе модели Deepseek R1 671B (671 млрд параметров), более чем в 1,5 раза превышает самый крупный бенчмарк предыдущего раунда на основе Llama 3.1 405B. В модели Deepseek R1, ориентированной на рассуждения, большая часть вычислений выполняется во время инференса, что делает этот бенчмарк ещё более сложным.

Что касается самого маленького бенчмарка, основанного на Llama 3.1 8B, то, как поясняют в MLCommons, в отрасли растёт спрос на рассуждения с малой задержкой и высокой точностью. SLM отвечают этим требованиям и являются отличным выбором для таких задач, как реферирование текста или периферийные приложения. В свою очередь бенчмарк преобразования голоса в текст, основанный на Whisper Large v3, был разработан в ответ на растущее количество голосовых приложений, будь то смарт-устройства или голосовые ИИ-интерфейсы.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

NVIDIA вновь возглавила рейтинг MLPerf Inference, на этот раз с архитектурой Blackwell Ultra, представленной платформой NVIDIA GB300 NVL72, которая установила рекорд, увеличив пропускную способность DeepSeek-R1 на 45 % по сравнению с предыдущими системами GB200 NVL72 (Blackwell).

NVIDIA также продемонстрировала высокие результаты в бенчмарке Llama 3.1 405B, который имеет более жёсткие ограничения по задержке. NVIDIA применила дезагрегацию, разделив фазы работы с контекстом и собственно генерацию между разными ускорителями. Этот подход, поддерживаемый фреймворком Dynamo, обеспечил увеличение в 1,5 раза пропускной способности на один ускоритель по сравнению с традиционным обслуживанием на системах Blackwell и более чем в 5 раз по сравнению с системами на базе Hopper.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

NVIDIA назвала «дезагрегированное обслуживание» одним из ключевых факторов успеха, помимо аппаратных улучшений при переходе к Blackwell Ultra. Также свою роль сыграло использованием фирменного 4-бит формата NVFP4. «Мы можем обеспечить точность, сопоставимую с BF16», — сообщила компания, добавив, что при этом потребляется значительно меньше вычислительной мощности. Для работы с контекстом NVIDIA готовит соускоритель Rubin CPX.

В более компактных бенчмарках решения NVIDIA также продемонстрировали рекордную пропускную способность. Компания сообщила о более чем 18 тыс. токенов/с на один ускоритель в бенчмарке Llama 3.1 8B в автономном режиме и 5667 токенов/с на один ускоритель в Whisper. Результаты были представлены в офлайн-, серверных и интерактивных сценариях, при этом NVIDIA сохранила лидерство в расчете на GPU во всех категориях.

 Источник изображения: NVIDIA/TechPowerUp

Источник изображения: NVIDIA/TechPowerUp

AMD представила результаты AMD Instinct MI355X только в «открытой» категории, где разрешены программные модификации модели. Ускоритель MI355X превзошёл в бенчмарке Llama 2 70B ускоритель MI325X в 2,7 раза по количеству токенов/с. В этом раунде AMD также впервые обнародовала результаты нескольких новых рабочих нагрузок, включая Llama 2 70B Interactive, MoE-модель Mixtral-8x7B и генератор изображений Stable Diffusion XL.

 Источник изображения: AMD/ServeTheHome

Источник изображения: AMD/ServeTheHome

В число «закрытых» заявок AMD входили системы на базе ускорителей AMD MI300X и MI325X. Более продвинутый MI325X показал результаты, схожие с показателями систем на базе NVIDIA H200 на Llama 2 70b, в комбинированном тесте MoE и тестах генерации изображений. Кроме того, компанией была представлена первая гибридная заявка, в которой ускорители AMD MI300X и MI325X использовались для одной и той же задачи инференса — бенчмарка на базе Llama 2 70b. Возможность распределения нагрузки между различными типами ускорителей — важный шаг, отметил IEEE Spectrum.

В этом раунде впервые был представлен и ускоритель Intel Arc Pro. Для бенчмарков использовалась видеокарта MaxSun Intel Arc Pro B60 Dual 48G Turbo, состоящая из двух GPU с 48 Гбайт памяти, в составе платформы Project Battlematrix, которая может включать до восьми таких ускорителей. Система показала результаты на уровне NVIDIA L40S в небольшом тесте LLM и уступила ему в тесте Llama 2 70b.

 Источник изображения: Intel

Источник изображения: Intel

Следует также отметить, что в этом раунде, как и в предыдущем, участвовала Nebius (ранее Yandex N.V.). Компания отметила, что результаты, полученные на односерверных инсталляциях, подтверждают, что Nebius AI Cloud обеспечивает «высочайшие» показатели производительности для инференса базовых моделей, таких как Llama 2 70B и Llama 3.1 405B.

В частности, Nebius AI Cloud установила новый рекорд производительности для NVIDIA GB200 NVL72. По сравнению с лучшими результатами предыдущего раунда, её однохостовая инсталляция показала прирост производительности на 6,7 % и 14,2 % при работе с Llama 3.1 405B в автономном и серверном режимах соответственно. «Эти два показателя также обеспечивают Nebius первое место среди других разработчиков MLPerf Inference v5.1 для этой модели в системах GB200», — сообщила компания.

Постоянный URL: http://servernews.ru/1129155