Материалы по тегу: infinity fabric

06.03.2020 [12:57], Константин Ходаковский

AMD представила вычислительные графические архитектуры CDNA и CDNA2

Компания AMD на мероприятии Financial Analyst Day 2020 представила свою будущую архитектуру ускорителей вычислений — CDNA. Она дополнит графически-ориентированную архитектуру RDNA. В то время как RDNA создаётся для графических ускорителей Radeon Pro и Radeon RX, CDNA будет обеспечивать работу вычислительных ускорителей вроде Radeon Instinct.

AMD объясняет необходимость разделения RDNA и CDNA рыночной дифференциацией продуктов.

Центры обработки данных и HPC, использующие ускорители Radeon Instinct, не используют многие возможности графического рендеринга графического процессора. Таким образом, на уровне кремния AMD удалит растровые графические блоки, механизмы отображения и мультимедиа, а также другие связанные компоненты, которые занимают значительные площади кристалла. Вместо этого AMD добавит аппаратные блоки для тензорных вычислений, аналогичное тензорным ядрам в современных ускорителях NVIDIA.

AMD также упомянула использование в своих вычислительных ускорителях интерфейсов памяти HBM2e, межкомпонентное соединение Infinity Fabric в дополнение к PCIe и так далее. Компания подробно изложила краткий план развития CDNA на 2021-22 годы. Вычислительные ускорители текущего поколения компании основаны на устаревшей архитектуре Vega и представляют собой существенно переконфигурированные графические процессоры Vega 20, в которых отсутствует тензорное оборудование.

Позже в этом году компания представит свой первый ускоритель на базе 7-нм архитектуры CDNA, основанный на 7-нм техпроцессе с вычислительными блоками RDNA и тензорными ядрами для ускорения создания и обучения нейросетей. Где-то между 2021 и 2022 годами AMD представит свою обновлённую архитектуру CDNA2, основанную на «продвинутом техпроцессе» (либо 7-нм ULV, либо уже 5 нм).

Помимо увеличения показателя IPC, количества вычислительных блоков и прочего, основное внимание при разработке CDNA2 будет уделено гипермасштабируемости (способности масштабировать ГП в огромных пулах памяти, охватывающих тысячи узлов). Для этого AMD будет использовать Infinity Fabric 3-го поколения и унифицированную память с когерентным кешем.

Подобно Intel Compute eXpress Link (CXL) и PCI-Express 5.0, Infinity Fabric 3.0 будет поддерживать пулы разделяемой памяти между ЦП и ГП, обеспечивая масштабируемость, необходимую для огромных суперкомпьютеров вроде грядущих El Capitan и Frontier. Унифицированная память с когерентным кешем уменьшает ненужные передачи данных между связанной с ЦП памятью DRAM и связанной с ГП памятью HBM. Ядра ЦП смогут напрямую обрабатывать различные этапы последовательных вычислений операций на ГП, напрямую обращаясь к HBM и не загружая данные в свою основную память. Это значительно снизит нагрузку ввода-вывода.

El Capitan — это суперкомпьютер на базе чипов AMD, пиковая производительность которого после завершения строительства составит 2 экзафплопса (то есть 2000 петафлопс или 2 миллиона терафлопс). Он объединит процессоры AMD EPYC Genoa на основе архитектуры Zen 4 с ускорителями на базе CDNA2 и Infinity Fabric 3.0. El Capitan будет запущен в 2023 году, а вот Frontier мощностью 1,5 Эфлопс заработает уже в следующем.

Постоянный URL: http://servernews.ru/1005336
22.02.2018 [11:00], Иван Грудцын

AMD анонсировала CPU EPYC и APU Ryzen для встраиваемых систем

Компания AMD продолжает трудиться над расширением ассортимента процессоров с архитектурой Zen. После анонсов CPU и APU для настольных ПК, рабочий станций, серверов, ноутбуков и «2-в-1» чипмейкер решил уделить внимание рынку встраиваемых систем, разнообразие которых обуславливает потребность в процессорах с совершенно разной «начинкой». Таковыми и являются модели EPYC Embedded 3000, ранее упоминавшиеся как Snowy Owl, а также APU Ryzen Embedded V1000 с кодовым названием Great Horned Owl.

Интерес к дебютным чипам EPYC Embedded и Ryzen Embedded будет исходить прежде всего со стороны корпоративных заказчиков, нуждающихся в апгрейде ИТ-инфраструктуры и внедрении новых технологических решений. Старшие процессоры войдут в состав оборудования, обрабатывающего большие объёмы сетевого трафика. Задача APU Ryzen Embedded значительно скромнее, и заключается она в том, чтобы «оживить» разнообразные мультимедийные системы — от игровых до промышленных, медицинских и авиационных.

По сравнению с серверными AMD EPYC 7000, новые CPU/SoC EPYC Embedded 3000 слабее по «чистой» производительности. Более того, в обычных приложениях, пожалуй, им не по зубам даже модели Ryzen Threadripper с соответствующим количеством ядер (из-за более низких частот представителей «3000-й» серии). С другой стороны, дебютанты потребляют меньше энергии, оснащены интерфейсом 10-Гбит Ethernet (до 8 каналов), могут работать максимум с 16-ю высокоскоростными SSD-накопителями и поддерживают продвинутые аппаратные технологии защиты данных SME (шифрование оперативной памяти) и SEV (шифрование виртуальных машин).

Первая волна EPYC Embedded 3000 включает восемь процессоров с количеством физических ядер от 4 до 16 шт. и количеством потоков обработки данных от 4 до 32 шт. Только половина моделей наделены поддержкой технологии Simultaneous Multithreading (SMT) — аналогом Intel Hyper-Threading. В остальных CPU/SoC она не активирована, но зато EPYC Embedded 3401, 3301, 3201 и 3101 характеризуются пониженным тепловыделением. Рабочие частоты x86-ядер варьируются от 1,5 до 2,7 ГГц в номинальном режиме и от 2,15 до 3,1 ГГц в boost-режиме. В старших 12- и 16-ядерных процессорах реализована двухступенчатая технология динамического разгона, кроме того, они выделяются значительно бóльшим, чем у 4- и 8-ядерных чипов, объёмом разделяемой кеш-памяти третьего уровня, а также количеством каналов встроенного контроллера памяти DDR4 и количеством линий PCI Express 3.0. Широкий диапазон TDP — от 35 до 100 Вт — обеспечивает гибкость в подборе систем охлаждения, материнских плат и корпусов для новых CPU/SoC.

AMD противопоставляет EPYC Embedded 3000 выпущенным год назад процессорам Intel Xeon D-1500 (Broadwell-DE), на подмогу которым, кстати, недавно прибыли Xeon D-2100 (Skylake-D/DE). В бенчмарке SPECint_rate_base2017 новые встраиваемые процессоры AMD не оставляют и камня на камне от Xeon D-1500, правда, конкретные цифры не приводятся.

APU Ryzen Embedded V1000 в BGA-конструктиве FP5 родственны настольным и мобильным процессорам Raven Ridge для потребительского рынка. В V1000 с помощью интерфейса Infinity Fabric объединены в одном кристалле x86-ядра Zen, графическая подсистема Vega, контроллер памяти DDR4 и «чипсетная» составляющая — в том числе два канала проводной сети 10-Гбит Ethernet (у младшего V1202B дело ограничивается 1-Гбит Ethernet).

В спецификациях новых встраиваемых APU/SoC указаны такие их особенности, как поддержка технологий SME/SEV и возможность одновременной работы с четырьмя 4K-мониторами. Диапазон cTDP (настраиваемого TDP) довольно широк — от 12–25 до 35–54 Вт, в то время как уровень тепловыделения по умолчанию составляет 15 либо 45 Вт.

Моделей Ryzen Embedded V1000 вдвое меньше, чем EPYC Embedded 3000. Вероятно, AMD не очень-то и рассчитывает на бойкие продажи этих чипов, хотя после «строительной техники» (Bulldozer–Excavator) APU/SoC V1000, как и другие процессоры с архитектурой Zen, выглядят очень хорошо. Компанию четырёхъядерным Ryzen Embedded V1807B, V1756B и V1605B составляет двухъядерный/четырёхпоточный V1202B. Он ограничивается 1 Мбайт кеш-памяти второго уровня, частотным соотношением 2,3/3,2 ГГц, контроллером оперативной памяти DDR4-2400 и графическим блоком Radeon RX Vega 3 (192 потоковых процессора с частотой в пределах 1 ГГц). Флагман семейства — Ryzen Embedded V1807B — оперирует вдвое бóльшим количеством x86-ядер (4 шт.), 2 Мбайт кеша L2, контроллером оперативной памяти DDR4-3200 и довольно «шустрой» интегрированной графикой Radeon RX Vega 11, в состав которой входят 704 потоковых процессора GCN 5-го поколения с частотой до 1,3 ГГц.

По тестам в Cinebench и 3DMark 11 (предустановка Performance) Ryzen Embedded V1000 без труда опережают соперников из числа 14-нм мобильных процессоров Intel Core 7-го и 8-го поколений.

Постоянный URL: http://servernews.ru/965995
Система Orphus