Материалы по тегу: radeon instinct

06.03.2020 [12:57], Константин Ходаковский

AMD представила вычислительные графические архитектуры CDNA и CDNA2

Компания AMD на мероприятии Financial Analyst Day 2020 представила свою будущую архитектуру ускорителей вычислений — CDNA. Она дополнит графически-ориентированную архитектуру RDNA. В то время как RDNA создаётся для графических ускорителей Radeon Pro и Radeon RX, CDNA будет обеспечивать работу вычислительных ускорителей вроде Radeon Instinct.

AMD объясняет необходимость разделения RDNA и CDNA рыночной дифференциацией продуктов.

Центры обработки данных и HPC, использующие ускорители Radeon Instinct, не используют многие возможности графического рендеринга графического процессора. Таким образом, на уровне кремния AMD удалит растровые графические блоки, механизмы отображения и мультимедиа, а также другие связанные компоненты, которые занимают значительные площади кристалла. Вместо этого AMD добавит аппаратные блоки для тензорных вычислений, аналогичное тензорным ядрам в современных ускорителях NVIDIA.

AMD также упомянула использование в своих вычислительных ускорителях интерфейсов памяти HBM2e, межкомпонентное соединение Infinity Fabric в дополнение к PCIe и так далее. Компания подробно изложила краткий план развития CDNA на 2021-22 годы. Вычислительные ускорители текущего поколения компании основаны на устаревшей архитектуре Vega и представляют собой существенно переконфигурированные графические процессоры Vega 20, в которых отсутствует тензорное оборудование.

Позже в этом году компания представит свой первый ускоритель на базе 7-нм архитектуры CDNA, основанный на 7-нм техпроцессе с вычислительными блоками RDNA и тензорными ядрами для ускорения создания и обучения нейросетей. Где-то между 2021 и 2022 годами AMD представит свою обновлённую архитектуру CDNA2, основанную на «продвинутом техпроцессе» (либо 7-нм ULV, либо уже 5 нм).

Помимо увеличения показателя IPC, количества вычислительных блоков и прочего, основное внимание при разработке CDNA2 будет уделено гипермасштабируемости (способности масштабировать ГП в огромных пулах памяти, охватывающих тысячи узлов). Для этого AMD будет использовать Infinity Fabric 3-го поколения и унифицированную память с когерентным кешем.

Подобно Intel Compute eXpress Link (CXL) и PCI-Express 5.0, Infinity Fabric 3.0 будет поддерживать пулы разделяемой памяти между ЦП и ГП, обеспечивая масштабируемость, необходимую для огромных суперкомпьютеров вроде грядущих El Capitan и Frontier. Унифицированная память с когерентным кешем уменьшает ненужные передачи данных между связанной с ЦП памятью DRAM и связанной с ГП памятью HBM. Ядра ЦП смогут напрямую обрабатывать различные этапы последовательных вычислений операций на ГП, напрямую обращаясь к HBM и не загружая данные в свою основную память. Это значительно снизит нагрузку ввода-вывода.

El Capitan — это суперкомпьютер на базе чипов AMD, пиковая производительность которого после завершения строительства составит 2 экзафплопса (то есть 2000 петафлопс или 2 миллиона терафлопс). Он объединит процессоры AMD EPYC Genoa на основе архитектуры Zen 4 с ускорителями на базе CDNA2 и Infinity Fabric 3.0. El Capitan будет запущен в 2023 году, а вот Frontier мощностью 1,5 Эфлопс заработает уже в следующем.

Постоянный URL: http://servernews.ru/1005336
14.01.2020 [20:15], Алексей Степин

Компилятор AOMP для GPU AMD неожиданно получил сборки для IBM POWER

AMD внесла неожиданный вклад в развитие открытого программного обеспечения, продемонстрировав интерес к архитектурам, отличным от x86-64. 

Теперь компилятор AOMP, являющийся частью инициативы AMD Radeon Open Compute 3.0, доступен и для 64-бит процессоров IBM PowerPC. 

AOMP базируется на LLVM Clang, в котором поддержка PowerPC реализована уже давно, но всё же это заметный вклад с учётом того, какие надежды энтузиасты данной платформы возлагают на процессоры IBM POWER9, POWER10 и другие чипы, разрабатываемые на базе набора инструкций Power ISA.

Пока ускорение вычислений на этой платформе практически полностью принадлежит NVIDIA с её ускорителями Tesla V100 и T4, но появление AOMP прокладывает путь и для ускорителей AMD.

AOMP обеспечивает поддержку API OpenMP, открытого стандарта для распараллеливания программ на различных языках, таких, как C, C++ и Fortran. Стоит отметить, что в версии 0.7-6 реализована поддержка MI100. Это новый ускоритель семейства Radeon Instinct, который должен будет увидеть свет в этом году. Его основой станет новый процессор Arcturus, наследник Vega в сегменте профессиональных ускорителей AMD Radeon.

Что может означать столь явный интерес AMD к платформе POWER? Возможно, один из планируемых к запуску новых суперкомпьютеров будет базироваться именно на этой архитектуре и компания заранее стремится обеспечить себе возможность конкуренции с ускорителями NVIDIA. Но пока это лишь предположение.

Постоянный URL: http://servernews.ru/1001415
21.11.2019 [13:30], Андрей Созинов

SC19: экосистема AMD EPYC Rome и PCIe 4.0 растёт

На конференции SC19 было представлено довольно много различных продуктов на базе процессоров и ускорителей вычислений от AMD. Здесь оказались как совершенно новые системы, так и уже присутствующие на рынке.

Компания Penguin Computing представила новый вычислительный узел Altus XE2242, состоящий из четырёх систем, каждая из которых включает по два процессора EPYC Rome. Получается, что при высоте всего в 2U, данная система предлагает восемь процессоров EPYC второго поколения.

Также Penguin Computing показала систему Altus XE4218GT, созданную согласно концепции «AMD+AMD». Это означает, что вместе с процессорами EPYC Rome, здесь используются ускорители вычислений Radeon Instinct MI50. Система объединяет пару центральных процессоров и до восьми ускорителей. Кстати, подобное решение под названием G482-Z51 представила и компания Gigabyte. Данные системы нацелены на работу с ИИ, HPC и большими объёмами данных.

Оба описанных абзацем выше решения явно были вдохновлены эталонной системой AMD с ускорителями вычислений Radeon Instinct MI50. Она также включает два процессора EPYC Rome и восемь ускорителей вычислений Radeon Instinct MI50. Интересно, что ускорители собраны в группы по четыре штуки, каждая из которых подключена к одному из центральных процессоров. А между собой в группах GPU соединены фирменным интерконнектом AMD InfinityFabric с пропускной способностью 386 Гбайт/с в оба направления.

Компания HPE представила новые серверы ProLiant DL325 Gen10 Plus и DL385 Gen10 Plus на базе процессоров AMD EPYC второго поколения (Rome). Новинки обладают не только более высокой производительностью, но и лучшей пропускной способностью памяти, и поддерживают более ёмкие и скоростные накопители данных. По словам производителя, новые серверы наилучшим образом подходят для таких рабочих нагрузок, как виртуализация, высокопроизводительные вычисления и анализ больших объёмов данных.

Ещё в рамках SC19 компания AtoS продемонстрировала свой вычислительный узел BullSequana XH2000, который уже используется в ряде суперкомпьютеров, а также на данных узлах строится самый производительный в мире суперкомпьютер.

Наконец AMD отметила, что постепенно на рынке появляется всё больше продуктов, использующих скоростной интерфейс PCIe 4.0, который поддерживают её процессоры EPYC Rome. Были отмечены скоростные твердотельные накопители NVMe от Samsung и Kioxia, ускорители вычислений на основе FPGA от Xilinx и сетевые адаптеры Broadcom Thor 200G Ethernet и Mellanox ConnectX-6 HDR 200G InfiniBand.

Постоянный URL: http://servernews.ru/998115
12.11.2019 [19:13], Алексей Разин

Ускорители Radeon Instinct MI60 окончательно пропали с радаров AMD

В середине лета многие средства массовой информации активно обсуждали прекращение поставок видеокарт Radeon VII, которые формально считались первым серийно выпускаемым по 7-нм технологии продуктом AMD в потребительском секторе.

Сородичи в лице серверных ускорителей вычислений семейства Radeon Instinct появились год назад, и вплоть до третьего квартала компания рассказывала об успехах продуктов этого класса на фоне неоднозначной ситуации с игровыми видеокартами AMD.

Источник изображения: AMD

Источник изображения: AMD

 

Как мы могли убедиться, в игровом сегменте AMD до сих пор считает флагманом видеокарту Radeon VII, поставки которой начались в феврале, но завершились уже к лету. Это не мешает компании упоминать данный «скоропортящийся продукт» в каждой профильной презентации. По информации близких к AMD источников, поставки видеокарт Radeon VII давно прекращены, и в продаже встречаются только остатки старых запасов.

А что же происходит с серверным аналогом по имени Radeon Instinct MI60? Ещё месяц назад коллеги с сайта Tom’s Hardware обратили внимание на исчезновение этого ускорителя с сайта AMD в некоторых доменных зонах. На российском зеркале корпоративного портала компании он на тот момент присутствовал.

Представители AMD поясняли зарубежным коллегам, что Radeon Instinct MI60 продолжает поставляться, но по просьбам клиентов в ассортимент ускорителей вычислений добавлена версия Radeon Instinct MI50 с увеличенным до 32 Гбайт объёмом памяти типа HBM2.

В недавней презентации для инвесторов этот продукт полностью вытеснил Radeon Instinct MI60. По сути, актуальный ассортимент ускорителей вычислений сократился с пяти наименований до четырёх, и на российском сайте AMD упоминания о прошлогоднем флагмане также отсутствуют, зато есть информация о новой версии Radeon Instinct MI50. Ничего не поделать — цыплят по осени считают.

Постоянный URL: http://servernews.ru/997508
07.11.2018 [16:35], Андрей Созинов

В 2020 году AMD представит процессоры EPYC «Milan» на Zen 3 и новые ускорители Radeon Instinct

Помимо анонса нового 7-нм графического процессора Vega и 7-нм серверных процессоров EPYC «Rome», компания AMD также поделилась своими планами на будущее. Были опубликованы «дорожные карты», демонстрирующие планы компании по развитию серверных процессоров, процессорных архитектур и ускорителей вычислений на базе GPU.

Итак, компания AMD сообщила, что уже в 2020 году на смену представленным вчера EPYC «Rome» придёт новое поколение серверных процессоров EPYC «Milan». Эти процессоры будут построены на ядрах с новой архитектурой Zen 3 и будут производиться по улучшенному 7-нм техпроцессу (7nm+). Какие именно улучшения можно ожидать от новинок, пока что не уточняется.

Кроме того, AMD пообещала, что новые процессоры EPYC «Rome» будут совместимы и с материнскими платами для процессоров EPYC первого поколения (7000-я серия), и с новыми платами, созданными специально для них, и даже с будущими платами для процессоров EPYC «Milan». Это означает, что будущие процессоры AMD будут выполнены в том же корпусе Socket SP3, что и актуальные модели.

Что касается будущих процессорных архитектур AMD, то как и было указано выше, на смену только представленной Zen 2 уже в 2020 году придёт архитектура Zen 3. Компания заверяет, что на данный момент ведётся активная работа над этой архитектурой. Кроме того, AMD объявила, что и последующая архитектура Zen 4 уже находится на стадии разработки дизайна. К сожалению, какие-либо даты, касательно этой архитектуры, пока что не уточняются.

А что касается будущих ускорителей вычислений AMD, то в опубликованной «дорожной карте» следующее поколение ускорителей упоминается под названием «MI-Next». Эти ускорители должны быть представлены только к середине 2020 года. Они предложат повышенную производительность, улучшения по части интерфейсов, а также лучшую совместимость с различным программным обеспечением.

Судя по всему, разработка нового поколения ускорителей Radeon Instinct идёт согласно плану. На каком именно графическом процессоре будут построены новинки, пока что не уточняется. Скорее всего, это будет старший GPU поколения Navi. Хотя, возможно, AMD сможет нас удивить чем-то другим.

Постоянный URL: http://servernews.ru/977852
21.06.2017 [17:36], Иван Грудцын

Фото и подробные характеристики ускорителя AMD Radeon Instinct MI25

Параллельно с официальным анонсом процессоров EPYC компания AMD поведала подробности об ускорителях для систем глубинного обучения Radeon Instinct. Особый интерес представляет модель MI25, основанная на графическом процессоре Vega. Впервые об адаптере калифорнийский разработчик заговорил в декабре прошлого года, сообщив лишь отдельные его параметры. Утверждалось, что производительность Radeon Instinct MI25 составляет 12,5 Тфлопс в вычислениях одинарной точности (FP32) и 25 Тфлопс в вычислениях половинной точности (FP16), а энергопотребление — в пределах 300 Вт.

Впоследствии спецификация MI25 была изменена и уточнена. Оценка «чистой» производительности была немного уменьшена — до 12,3 Тфлопс FP32 и 24,6 Тфлопс FP16. Кроме того, паспортное энергопотребление утверждено на уровне 300 Вт, а не «до 300 Вт». Как и предполагалось, Radeon Instinct MI25 получил 64 мультипроцессорных кластера по 64 потоковых процессора в каждом (всего 4096 шт.) и 16 Гбайт буферной памяти HBM2 с поддержкой алгоритма контроля ошибок. Пропускная способность подсистемы VRAM равна 484 Гбайт/с, что соответствует частоте около 470 (1880) МГц при 2048-битной шине памяти. Частота ядра составляет приблизительно 1500 МГц, тогда как тот же чип у Radeon Vega Frontier Edition тактуется на 1600 МГц.

Ускоритель MI25 оснащён интерфейсом подключения PCI Express 3.0 x16, занимает два слота расширения в высоту и 267 мм в длину. Охлаждение у карты пассивное, поскольку предполагается, что её радиатор будут продувать высокооборотистые серверные вентиляторы. Согласно AMD, ускоритель может работать в среде 64-разрядных ОС семейства Linux с приложениями, написанными на ISO C++, OpenCL, CUDA и Python. Срок гарантии на Radeon Instinct MI25 составляет три года.

По оценке AMD, соотношение производительности и энергопотребления у MI25 значительно лучше, чем у старших моделей NVIDIA Tesla семейства Pascal.

На выставке-конференции ISC 2017 во Франкфурте нашему корреспонденту удалось запечатлеть Radeon Instinct MI25 крупным планом. Как видно на фото, для стабильной работы карта требует подключения 6- и 8-контактного кабелей PCI-E Power. Её чёрный кожух имеет рельефную поверхность. Видеовыходы не предусмотрены — ими располагает родственный MI25 ускоритель Radeon Vega Frontier Edition.

Постоянный URL: http://servernews.ru/954311
Система Orphus