Материалы по тегу: instinct

16.11.2020 [20:44], Алексей Степин

Подробности об архитектуре AMD CDNA ускорителей Instinct MI100

Лидером в области использования графических архитектур для вычислений долгое время была NVIDIA, однако давний соперник в лице AMD вовсе не собирается сдавать свои позиции. В ответ на анонс архитектуры Ampere и ускорителей нового поколения A100 на её основе компания AMD сегодня ответила своим анонсом первого в мире ускорителя на основе архитектуры CDNA — сверхмощного процессора Instinct MI100.

Достаточно долго подход к проектированию графических чипов оставался унифицированным, однако быстро выяснилось, что то, что хорошо для игр, далеко не всегда хорошо для вычислений, а некоторые возможности для областей применения, не связанных с рендерингом 3D-графики, попросту избыточны. Примером могут служить модули растровых операций (RBE/ROP) или наложения текстур. Произошло то, что должно было произойти: слившиеся на какое-то время воедино ветви эволюции «графических» и «вычислительных» процессоров вновь начали расходиться. И новый процессор AMD Instinct MI100 относится к чисто вычислительной ветви развития подобного рода чипов.

Теперь AMD имеет в своём распоряжении две основных архитектуры, RDNA и CDNA, которые и представляют собой вышеупомянутые ветви развития GPU. Естественно, новый процессор Instinct MI100 унаследовал у своих собратьев по эволюции многое — в частности, блоки исполнения скалярных и векторных инструкций: в конце концов, всё равно, работают ли они для расчёта графики или для вычисления чего-либо иного. Однако новинка содержит и ряд отличий, позволяющих ей претендовать на звание самого мощного и универсального в мире ускорителя на базе GPU.

Схема эволюции графических процессоров: налицо дивергенция признаков

Схема эволюции графических процессоров: налицо дивергенция признаков

AMD в последние годы существенно укрепила свои позиции, и это отражается в создании собственной единой IP-инфраструктуры: новый чип выполнен с использованием 7-нм техпроцесса и все системы интерконнекта, как внутренние, так и внешние, в MI100 базируются на шине AMD Infinity второго поколения. Внешние каналы имеют ширину 16 бит и оперируют на скорости 23 Гт/с, однако если в предыдущих моделях Instinct их было максимум два, то теперь количество каналов Infinity Fabric увеличено до трёх. Это позволяет легко организовывать системы на базе четырёх MI100 с организацией межпроцессорного общения по схеме «все со всеми», что минимизирует задержки.

Ускорители Instinct MI100 получили третий канал Infinity Fabric

Ускорители Instinct MI100 получили третий канал Infinity Fabric

Общую организацию внутренней архитектуры процессор MI100 унаследовал ещё от архитектуры GCN; его основу составляют 120 вычислительных блоков (compute units, CU). При принятой AMD схеме «64 шейдерных блока на 1 CU» это позволяет говорить о 7680 процессорах. Однако на уровне вычислительного блока архитектура существенно переработана, чтобы лучше отвечать требованиям, предъявляемым современному вычислительному ускорителю.

В дополнение к стандартным блокам исполнения скалярных и векторных инструкций добавился новый модуль матричной математики, так называемый Matrix Core Engine, но из кремния MI100 удалены все блоки фиксированных функций: растеризации, тесселяции, графических кешей и, конечно, дисплейного вывода. Универсальный движок кодирования-декодирования видеоформатов, однако, сохранён — он достаточно часто используется в вычислительных нагрузках, связанных с обработкой мультимедийных данных.

Структурная схема вычислительных модулей в MI100

Каждый CU содержит в себе по одному блоку скалярных инструкций со своим регистровым файлом и кешем данных, и по четыре блока векторных инструкций, оптимизированных для вычислений в формате FP32 саналогичными блоками. Векторные модули имеют ширину 16 потоков и обрабатывают 64 потока (т.н. wavefront в терминологии AMD) за четыре такта. Но самое главное в архитектуре нового процессора — это новые блоки матричных операций.

Наличие Matrix Core Engines позволяет MI100 работать с новым типом инструкций — MFMA (Matrix Fused Multiply-Add). Операции над матрицами размера KxN могут содержать смешанные типы входных данных: поддерживаются режимы INT4, INT8, FP16, FP32, а также новый тип Bfloat16 (bf16); результат, однако, выводится только в форматах INT32 или FP32. Поддержка столь многих типов данных введена для универсальности и MI100 сможет показать высокую эффективность в вычислительных сценариях разного рода.

Использование Infinity Fabric 2.0 позволило ещё более увеличить производительность MI100

Использование Infinity Fabric 2.0 позволило ещё более увеличить производительность MI100

Каждый блок CU имеет свой планировщик, блок ветвления, 16 модулей load-store, а также кеши L1 и Data Share объёмами 16 и 64 Кбайт соответственно. А вот кеш второго уровня общий для всего чипа, он имеет ассоциативность 16 и объём 8 Мбайт. Совокупная пропускная способность L2-кеша достигает 6 Тбайт/с.

Более серьёзные объёмы данных уже ложатся на подсистему внешней памяти. В MI100 это HBM2 — новый процессор поддерживает установку четырёх или восьми сборок HBM2, работающих на скорости 2,4 Гт/с. Общая пропускная способность подсистемы памяти может достигать 1,23 Тбайт/с, что на 20% быстрее, нежели у предыдущих вычислительных ускорителей AMD. Память имеет объём 32 Гбайт и поддерживает коррекцию ошибок.

Общая блок-схема Instinct MI100

«Мозг» чипа Instinct MI100 составляют четыре командных процессора (ACE на блок-схеме). Их задача — принять поток команд от API и распределить рабочие задания по отдельным вычислительным модулям. Для подключения к хост-процессору системы в составе MI100 имеется контроллер PCI Express 4.0, что даёт пропускную способность на уровне 32 Гбайт/с в каждом направлении. Таким образом, «уютнее всего» ускоритель Instinct MI100 будет чувствовать себя совместно с ЦП AMD EPYC второго поколения, либо в системах на базе IBM POWER9/10.

Избавление от лишних архитектурных блоков и оптимизация архитектуры под вычисления в как можно более широком числе форматов позволяют Instinct MI100 претендовать на универсальность. Ускорители с подобными возможностями, как справедливо считает AMD, станут важным строительным блоком в экосистеме HPC-машин нового поколения, относящихся к экзафлопсному классу. AMD заявляет о том, что это первый ускоритель, способный развить более 10 Тфлопс в режиме двойной точности FP64 — пиковый показатель составляет 11,5 Тфлопс.

Удельные и пиковые показатели производительности MI100

Удельные и пиковые показатели производительности MI100

В менее точных форматах новинка пропорционально быстрее, и особенно хорошо ей даются именно матричные вычисления: для FP32 производительность достигает 46,1 Тфлопс, а в новом, оптимизированном под задачи машинного обучения bf16 — и вовсе 92,3 Тфлопс, причём, ускорители Instinct предыдущего поколения таких вычислений выполнять вообще не могут. В зависимости от типов данных, превосходство MI100 перед MI50 варьируется от 1,74х до 6,97x. Впрочем, NVIDIA A100 в этих задача всё равно заметно быстрее, а вот в FP64/FP32 проигрывают.

Постоянный URL: http://servernews.ru/1025502
16.11.2020 [17:00], Игорь Осколков

SC20: AMD Instinct MI100 — самый быстрый PCIe-ускоритель на базе новой архитектуры CDNA

AMD Instinct MI100 — первый ускоритель на базе 7-нм архитектуры CDNA, которая в отличие от RDNA ориентирована на вычисления, а не на графику, хотя и сохраняет некоторые компоненты для рендеринга. Тем не менее, пути RDNA и CDNA окончательно разошлись, и новый ускоритель предназначен исключительно для высокопроизводительных вычислений и ИИ.

Первенец серии MI100 имеет 120 CU, которые содержат новые блоки для матричных операций, которые важны в ИИ-нагрузках. Но работают они не в ущерб «классическим» вычислениям — пиковая FP64-производительность составляет 11,5 Тфлопс, а для FP32 ровно в два раза больше, 23 Тфлопс. Эти показатели выше, чем у NVIDIA A100, и AMD настаивает, что именно такой прирост производительности нужен для запланированного достижения заветной производительности в один экзафлопс.

AMD Instinct MI100

AMD Instinct MI100

Впрочем, на другом конце спектра, в bfloat16-вычислениях, новинка от AMD проигрывает — 92,3 Тфлопс против 312 Тфлопс на Tensor Core. Прочие приведённые значения производительности для других показателей точности вычислений варьируются. Кроме того, PCIe-версия A100 в силу более низкого энергопотребления на реальных задачах может быть несколько медленнее, чем SXM-версия. А Instinct MI100, пока во всяком случае, доступна только в форм-факторе полноразмерной PCIe-карты с потреблением на уровне 300 Вт.

Карта оснащена 32 Гбайт HBM2-памяти c пропускной способностью 1,23 Тбайт/с, что несколько меньше, чем у PCIe-версии NVIDIA A100: 40 Гбайт HBM2e и 1,555 Тбайт/с соответственно. У обеих карт есть основной интерфейс PCIe 4.0 x16 (64 Гбайт/с) и дополнительная шина для прямого обмена данными между ускорителями. В случае NVIDIA это NVLink (600 Гбайт/с), который для PCIe-версии ограничен только двумя картами, а в случае AMD — это Infinity Fabric (IF).

У MI100 есть три IF-интерфейса с пропускной способностью 92 Гбайт/c (суммарно 276 Гбайт/с), что даёт возможность объединить до четырёх ускорителей, которые могут общаться друг с другом по схеме каждый-с-каждым. Причём оно не зависит от того, по какому интерфейсу, PCIe 3.0 или 4.0, сами ускорители подключены к хосту. Естественно, наиболее оптимальным вариантом для системы в целом будет связка из AMD EPYC и новых MI100.

Основной же козырь AMD, как это зачастую бывало и ранее — это стоимость новинок. Точные цены компания не приводит, но говорит о том, что по показателю производительность на доллар они 1,8-2,1 раза лучше, чем NVIDIA A100. Среди первых систем, для которых сделана валидация новых ускорителей есть Dell PowerEdge R7525, Gigabyte G482-Z54, HPE Apollo 6500 Gen10 Plus, Supermicro AS-4124GS-TNR. Избранные партнёры уже получили новые ускорители и системы на их основе для оценки производительности и адаптации ПО.

Вместе с выходом Instinct MI100 AMD представила и новый мажорный релиз ROCm 4.0, открытой программной платформы для HPC и ИИ. AMD особо отмечает рост производительности, простоту использования и готовность множества программных решений к работе с новым релизом и новым же «железом». И главное — простоту портирования кода на новую платформу, в первую очередь с NVIDIA CUDA. У некоторых разработчиков на это ушло буквально от нескольких часов до одного дня, или до нескольких недель в более сложных случаях.

Новая программно-аппаратная платформа на базе AMD EPYC, Instinct M100 и ROCm 4.0 ляжет в основу грядущих суперкомпьютеров Frontier и Pawsey. А вот будут ли новые машины с MI100 в свежем рейтинге TOP500, мы узнаем уже завтра. Конкуренцию новинкам составят новые же ускорители NVIDIA A100 с удвоенным объёмом памяти HBM2e.

Постоянный URL: http://servernews.ru/1025425
06.03.2020 [12:57], Константин Ходаковский

AMD представила вычислительные графические архитектуры CDNA и CDNA2

Компания AMD на мероприятии Financial Analyst Day 2020 представила свою будущую архитектуру ускорителей вычислений — CDNA. Она дополнит графически-ориентированную архитектуру RDNA. В то время как RDNA создаётся для графических ускорителей Radeon Pro и Radeon RX, CDNA будет обеспечивать работу вычислительных ускорителей вроде Radeon Instinct.

AMD объясняет необходимость разделения RDNA и CDNA рыночной дифференциацией продуктов.

Центры обработки данных и HPC, использующие ускорители Radeon Instinct, не используют многие возможности графического рендеринга графического процессора. Таким образом, на уровне кремния AMD удалит растровые графические блоки, механизмы отображения и мультимедиа, а также другие связанные компоненты, которые занимают значительные площади кристалла. Вместо этого AMD добавит аппаратные блоки для тензорных вычислений, аналогичное тензорным ядрам в современных ускорителях NVIDIA.

AMD также упомянула использование в своих вычислительных ускорителях интерфейсов памяти HBM2e, межкомпонентное соединение Infinity Fabric в дополнение к PCIe и так далее. Компания подробно изложила краткий план развития CDNA на 2021-22 годы. Вычислительные ускорители текущего поколения компании основаны на устаревшей архитектуре Vega и представляют собой существенно переконфигурированные графические процессоры Vega 20, в которых отсутствует тензорное оборудование.

Позже в этом году компания представит свой первый ускоритель на базе 7-нм архитектуры CDNA, основанный на 7-нм техпроцессе с вычислительными блоками RDNA и тензорными ядрами для ускорения создания и обучения нейросетей. Где-то между 2021 и 2022 годами AMD представит свою обновлённую архитектуру CDNA2, основанную на «продвинутом техпроцессе» (либо 7-нм ULV, либо уже 5 нм).

Помимо увеличения показателя IPC, количества вычислительных блоков и прочего, основное внимание при разработке CDNA2 будет уделено гипермасштабируемости (способности масштабировать ГП в огромных пулах памяти, охватывающих тысячи узлов). Для этого AMD будет использовать Infinity Fabric 3-го поколения и унифицированную память с когерентным кешем.

Подобно Intel Compute eXpress Link (CXL) и PCI-Express 5.0, Infinity Fabric 3.0 будет поддерживать пулы разделяемой памяти между ЦП и ГП, обеспечивая масштабируемость, необходимую для огромных суперкомпьютеров вроде грядущих El Capitan и Frontier. Унифицированная память с когерентным кешем уменьшает ненужные передачи данных между связанной с ЦП памятью DRAM и связанной с ГП памятью HBM. Ядра ЦП смогут напрямую обрабатывать различные этапы последовательных вычислений операций на ГП, напрямую обращаясь к HBM и не загружая данные в свою основную память. Это значительно снизит нагрузку ввода-вывода.

El Capitan — это суперкомпьютер на базе чипов AMD, пиковая производительность которого после завершения строительства составит 2 экзафплопса (то есть 2000 петафлопс или 2 миллиона терафлопс). Он объединит процессоры AMD EPYC Genoa на основе архитектуры Zen 4 с ускорителями на базе CDNA2 и Infinity Fabric 3.0. El Capitan будет запущен в 2023 году, а вот Frontier мощностью 1,5 Эфлопс заработает уже в следующем.

Постоянный URL: http://servernews.ru/1005336
14.01.2020 [20:15], Алексей Степин

Компилятор AOMP для GPU AMD неожиданно получил сборки для IBM POWER

AMD внесла неожиданный вклад в развитие открытого программного обеспечения, продемонстрировав интерес к архитектурам, отличным от x86-64. 

Теперь компилятор AOMP, являющийся частью инициативы AMD Radeon Open Compute 3.0, доступен и для 64-бит процессоров IBM PowerPC. 

AOMP базируется на LLVM Clang, в котором поддержка PowerPC реализована уже давно, но всё же это заметный вклад с учётом того, какие надежды энтузиасты данной платформы возлагают на процессоры IBM POWER9, POWER10 и другие чипы, разрабатываемые на базе набора инструкций Power ISA.

Пока ускорение вычислений на этой платформе практически полностью принадлежит NVIDIA с её ускорителями Tesla V100 и T4, но появление AOMP прокладывает путь и для ускорителей AMD.

AOMP обеспечивает поддержку API OpenMP, открытого стандарта для распараллеливания программ на различных языках, таких, как C, C++ и Fortran. Стоит отметить, что в версии 0.7-6 реализована поддержка MI100. Это новый ускоритель семейства Radeon Instinct, который должен будет увидеть свет в этом году. Его основой станет новый процессор Arcturus, наследник Vega в сегменте профессиональных ускорителей AMD Radeon.

Что может означать столь явный интерес AMD к платформе POWER? Возможно, один из планируемых к запуску новых суперкомпьютеров будет базироваться именно на этой архитектуре и компания заранее стремится обеспечить себе возможность конкуренции с ускорителями NVIDIA. Но пока это лишь предположение.

Постоянный URL: http://servernews.ru/1001415
21.11.2019 [13:30], Андрей Созинов

SC19: экосистема AMD EPYC Rome и PCIe 4.0 растёт

На конференции SC19 было представлено довольно много различных продуктов на базе процессоров и ускорителей вычислений от AMD. Здесь оказались как совершенно новые системы, так и уже присутствующие на рынке.

Компания Penguin Computing представила новый вычислительный узел Altus XE2242, состоящий из четырёх систем, каждая из которых включает по два процессора EPYC Rome. Получается, что при высоте всего в 2U, данная система предлагает восемь процессоров EPYC второго поколения.

Также Penguin Computing показала систему Altus XE4218GT, созданную согласно концепции «AMD+AMD». Это означает, что вместе с процессорами EPYC Rome, здесь используются ускорители вычислений Radeon Instinct MI50. Система объединяет пару центральных процессоров и до восьми ускорителей. Кстати, подобное решение под названием G482-Z51 представила и компания Gigabyte. Данные системы нацелены на работу с ИИ, HPC и большими объёмами данных.

Оба описанных абзацем выше решения явно были вдохновлены эталонной системой AMD с ускорителями вычислений Radeon Instinct MI50. Она также включает два процессора EPYC Rome и восемь ускорителей вычислений Radeon Instinct MI50. Интересно, что ускорители собраны в группы по четыре штуки, каждая из которых подключена к одному из центральных процессоров. А между собой в группах GPU соединены фирменным интерконнектом AMD InfinityFabric с пропускной способностью 386 Гбайт/с в оба направления.

Компания HPE представила новые серверы ProLiant DL325 Gen10 Plus и DL385 Gen10 Plus на базе процессоров AMD EPYC второго поколения (Rome). Новинки обладают не только более высокой производительностью, но и лучшей пропускной способностью памяти, и поддерживают более ёмкие и скоростные накопители данных. По словам производителя, новые серверы наилучшим образом подходят для таких рабочих нагрузок, как виртуализация, высокопроизводительные вычисления и анализ больших объёмов данных.

Ещё в рамках SC19 компания AtoS продемонстрировала свой вычислительный узел BullSequana XH2000, который уже используется в ряде суперкомпьютеров, а также на данных узлах строится самый производительный в мире суперкомпьютер.

Наконец AMD отметила, что постепенно на рынке появляется всё больше продуктов, использующих скоростной интерфейс PCIe 4.0, который поддерживают её процессоры EPYC Rome. Были отмечены скоростные твердотельные накопители NVMe от Samsung и Kioxia, ускорители вычислений на основе FPGA от Xilinx и сетевые адаптеры Broadcom Thor 200G Ethernet и Mellanox ConnectX-6 HDR 200G InfiniBand.

Постоянный URL: http://servernews.ru/998115
12.11.2019 [19:13], Алексей Разин

Ускорители Radeon Instinct MI60 окончательно пропали с радаров AMD

В середине лета многие средства массовой информации активно обсуждали прекращение поставок видеокарт Radeon VII, которые формально считались первым серийно выпускаемым по 7-нм технологии продуктом AMD в потребительском секторе.

Сородичи в лице серверных ускорителей вычислений семейства Radeon Instinct появились год назад, и вплоть до третьего квартала компания рассказывала об успехах продуктов этого класса на фоне неоднозначной ситуации с игровыми видеокартами AMD.

Источник изображения: AMD

Источник изображения: AMD

 

Как мы могли убедиться, в игровом сегменте AMD до сих пор считает флагманом видеокарту Radeon VII, поставки которой начались в феврале, но завершились уже к лету. Это не мешает компании упоминать данный «скоропортящийся продукт» в каждой профильной презентации. По информации близких к AMD источников, поставки видеокарт Radeon VII давно прекращены, и в продаже встречаются только остатки старых запасов.

А что же происходит с серверным аналогом по имени Radeon Instinct MI60? Ещё месяц назад коллеги с сайта Tom’s Hardware обратили внимание на исчезновение этого ускорителя с сайта AMD в некоторых доменных зонах. На российском зеркале корпоративного портала компании он на тот момент присутствовал.

Представители AMD поясняли зарубежным коллегам, что Radeon Instinct MI60 продолжает поставляться, но по просьбам клиентов в ассортимент ускорителей вычислений добавлена версия Radeon Instinct MI50 с увеличенным до 32 Гбайт объёмом памяти типа HBM2.

В недавней презентации для инвесторов этот продукт полностью вытеснил Radeon Instinct MI60. По сути, актуальный ассортимент ускорителей вычислений сократился с пяти наименований до четырёх, и на российском сайте AMD упоминания о прошлогоднем флагмане также отсутствуют, зато есть информация о новой версии Radeon Instinct MI50. Ничего не поделать — цыплят по осени считают.

Постоянный URL: http://servernews.ru/997508
07.11.2018 [16:35], Андрей Созинов

В 2020 году AMD представит процессоры EPYC «Milan» на Zen 3 и новые ускорители Radeon Instinct

Помимо анонса нового 7-нм графического процессора Vega и 7-нм серверных процессоров EPYC «Rome», компания AMD также поделилась своими планами на будущее. Были опубликованы «дорожные карты», демонстрирующие планы компании по развитию серверных процессоров, процессорных архитектур и ускорителей вычислений на базе GPU.

Итак, компания AMD сообщила, что уже в 2020 году на смену представленным вчера EPYC «Rome» придёт новое поколение серверных процессоров EPYC «Milan». Эти процессоры будут построены на ядрах с новой архитектурой Zen 3 и будут производиться по улучшенному 7-нм техпроцессу (7nm+). Какие именно улучшения можно ожидать от новинок, пока что не уточняется.

Кроме того, AMD пообещала, что новые процессоры EPYC «Rome» будут совместимы и с материнскими платами для процессоров EPYC первого поколения (7000-я серия), и с новыми платами, созданными специально для них, и даже с будущими платами для процессоров EPYC «Milan». Это означает, что будущие процессоры AMD будут выполнены в том же корпусе Socket SP3, что и актуальные модели.

Что касается будущих процессорных архитектур AMD, то как и было указано выше, на смену только представленной Zen 2 уже в 2020 году придёт архитектура Zen 3. Компания заверяет, что на данный момент ведётся активная работа над этой архитектурой. Кроме того, AMD объявила, что и последующая архитектура Zen 4 уже находится на стадии разработки дизайна. К сожалению, какие-либо даты, касательно этой архитектуры, пока что не уточняются.

А что касается будущих ускорителей вычислений AMD, то в опубликованной «дорожной карте» следующее поколение ускорителей упоминается под названием «MI-Next». Эти ускорители должны быть представлены только к середине 2020 года. Они предложат повышенную производительность, улучшения по части интерфейсов, а также лучшую совместимость с различным программным обеспечением.

Судя по всему, разработка нового поколения ускорителей Radeon Instinct идёт согласно плану. На каком именно графическом процессоре будут построены новинки, пока что не уточняется. Скорее всего, это будет старший GPU поколения Navi. Хотя, возможно, AMD сможет нас удивить чем-то другим.

Постоянный URL: http://servernews.ru/977852
21.06.2017 [17:36], Иван Грудцын

Фото и подробные характеристики ускорителя AMD Radeon Instinct MI25

Параллельно с официальным анонсом процессоров EPYC компания AMD поведала подробности об ускорителях для систем глубинного обучения Radeon Instinct. Особый интерес представляет модель MI25, основанная на графическом процессоре Vega. Впервые об адаптере калифорнийский разработчик заговорил в декабре прошлого года, сообщив лишь отдельные его параметры. Утверждалось, что производительность Radeon Instinct MI25 составляет 12,5 Тфлопс в вычислениях одинарной точности (FP32) и 25 Тфлопс в вычислениях половинной точности (FP16), а энергопотребление — в пределах 300 Вт.

Впоследствии спецификация MI25 была изменена и уточнена. Оценка «чистой» производительности была немного уменьшена — до 12,3 Тфлопс FP32 и 24,6 Тфлопс FP16. Кроме того, паспортное энергопотребление утверждено на уровне 300 Вт, а не «до 300 Вт». Как и предполагалось, Radeon Instinct MI25 получил 64 мультипроцессорных кластера по 64 потоковых процессора в каждом (всего 4096 шт.) и 16 Гбайт буферной памяти HBM2 с поддержкой алгоритма контроля ошибок. Пропускная способность подсистемы VRAM равна 484 Гбайт/с, что соответствует частоте около 470 (1880) МГц при 2048-битной шине памяти. Частота ядра составляет приблизительно 1500 МГц, тогда как тот же чип у Radeon Vega Frontier Edition тактуется на 1600 МГц.

Ускоритель MI25 оснащён интерфейсом подключения PCI Express 3.0 x16, занимает два слота расширения в высоту и 267 мм в длину. Охлаждение у карты пассивное, поскольку предполагается, что её радиатор будут продувать высокооборотистые серверные вентиляторы. Согласно AMD, ускоритель может работать в среде 64-разрядных ОС семейства Linux с приложениями, написанными на ISO C++, OpenCL, CUDA и Python. Срок гарантии на Radeon Instinct MI25 составляет три года.

По оценке AMD, соотношение производительности и энергопотребления у MI25 значительно лучше, чем у старших моделей NVIDIA Tesla семейства Pascal.

На выставке-конференции ISC 2017 во Франкфурте нашему корреспонденту удалось запечатлеть Radeon Instinct MI25 крупным планом. Как видно на фото, для стабильной работы карта требует подключения 6- и 8-контактного кабелей PCI-E Power. Её чёрный кожух имеет рельефную поверхность. Видеовыходы не предусмотрены — ими располагает родственный MI25 ускоритель Radeon Vega Frontier Edition.

Постоянный URL: http://servernews.ru/954311
Система Orphus