Материалы по тегу: amd
20.10.2023 [16:00], Сергей Карасёв
AMD представила процессоры Ryzen Threadripper Pro 7000 WX для мощных рабочих станцийКомпания AMD официально анонсировала процессоры Ryzen Threadripper Pro 7000 WX и Ryzen Threadripper 7000 на архитектуре Zen 4 (Genoa). Первые предназначены для построения мощных рабочих станций, а вторые найдут применение в высокопроизводительных настольных ПК (HEDT). В семейство Ryzen Threadripper Pro 7000 WX вошли шесть моделей, насчитывающих от 12 до 96 вычислительных ядер с возможностью одновременной обработки от 24 до 192 потоков инструкций. Базовая тактовая частота варьируется от 2,5 до 4,7 ГГц, максимальная частота — от 5,1 до 5,3 ГГц. Чипы несут на борту от 48 до 384 Мбайт кеш-памяти L3, а суммарный объём кеша варьируется от 76 до 480 Мбайт. Показатель TDP у всех изделий одинаков — 350 Вт. Процессоры рассчитаны на работу с материнскими платами на наборе логики WRX90. Доступны восемь каналов для модулей памяти DDR5-5200, максимальный объём которой может достигать 2 Тбайт. Реализована поддержка 148 линий PCIe, из которых доступны 144, а до 128 из них соответствуют стандарту PCIe 5.0. Говорится о поддержке инструкций AVX-512. ![]() Источник изображений: AMD Чипы Ryzen Threadripper Pro 7000 WX поддерживают технологии AMD Pro и предлагают функции безопасности и управления корпоративного уровня. Процессоры предназначены для выполнения сложного моделирования, рендеринга и других ресурсоёмких задач. Утверждается, что новые решения обеспечивают двукратное повышение производительности по сравнению с изделиями предыдущего поколения в таких инструментах, как Хаос V-Ray. Рабочие станции на данной платформе предложат Dell Technologies, HP, Lenovo и др. Флагман нового семейства Ryzen Threadripper Pro 7995WX (96 ядер; 192 потока; 2,5–5,1 ГГц) установил новый мировой рекорд в бенчмарке Cinebench R23, показав результат в 100 291 балл. Более того, при разгоне всех 96 ядер до 4,4 ГГц показатель достиг 148 719 баллов. При этом использовалось охлаждение с жидким азотом, а энергопотребление процессора составило 620 Вт. Предыдущий рекорд в 147 668 баллов принадлежал связке из двух чипов EPYC 9654 Genoa. Что касается процессоров Ryzen Threadripper 7000, то в эту серию вошли три модели с 24, 32 и 64 ядрами с поддержкой многопоточности. Базовая тактовая частота — от 4,0 до 3,2 ГГц, максимальная частота — от 5,1 до 5,3 ГГц. Чипы комплектуются 128/256 Мбайт кеш-памяти L3, а общий размер кеша — от 152 до 320 Мбайт. Процессоры ориентированы на работу в паре с чипсетом TRX50. Обеспечивается поддержка четырёх каналов DDR5-5200 (до 1 Тбайт), 92 линий PCIe (доступны 88 линий, в том числе до 48 линий PCIe 5.0). Показатель TDP у всех процессоров равен 350 Вт. Цена варьируется от $1499 до $4999.
20.10.2023 [14:46], Сергей Карасёв
Три поколения EPYC, A100, L40 и немного Xeon: HPE создала для Франции ИИ-суперкомпьютер Austral на базе Cray XD2000Компания Hewlett Packard Enterprise (HPE) объявила о вводе в эксплуатацию нового ИИ-суперкомпьютера под названием Austral, разработанного в интересах Регионального центра информатики и цифровых приложений Нормандии (CRIANN) во Франции. В основу вычислительного комплекса положена платформа Cray XD2000. Задействованы 11 двухпроцессорных узлов на базе AMD EPYC 7543 Milan (32 ядра на сокет; 2,8 ГГц; 512 Гбайт оперативной памяти DDR4-3200). Каждый из этих узлов использует восемь ускорителей NVIDIA A100 с 80 Гбайт памяти. Кроме того, в состав суперкомпьютера входят 124 двухпроцессорных узла с чипами AMD EPYC 9654 Genoa (96 ядер на сокет; 2,4 ГГц; 768 Гбайт оперативной памяти DDR5-4800). Есть и один специализированный узел с процессором AMD EPYC 7313P Rome (16 ядер; 3,0 ГГц; 96 Гбайт оперативной памяти DDR4-3200). Плюс к этому установлены пять двухсокетных узлов визуализации на основе AMD EPYC 9654 — каждый с двумя ускорителями NVIDIA L40 с 48 Гбайт памяти и 768 Гбайт ОЗУ DDR5-4800. Наконец, предусмотрен один узел HPE Superdome Flex 280 с восемью чипами Intel Xeon 8376H (28 ядер; 2,6 ГГц) и 6 Тбайт оперативной памяти DDR4-3200. Применяется 200G-интерконнект HPE Slingshot. Ёмкость хранилища достигает 2 Пбайт. Программная платформа основана на решениях Red Hat. ![]() Источник изображения: HPE Заявленная пиковая FP64-производительность составляет 966 Тфлопс для CPU-части DP и 1034 Тфлопс — для GPU-блока. Применять суперкомпьютер планируется для проведения моделирования и анализа в таких областях, как изменения климата, биотехнологии, здравоохранение и материаловедение.
13.10.2023 [23:30], Алексей Степин
AMD EPYC Siena так же быстры, как Intel Xeon Sapphire Rapids, но более экономичныНе столь давно AMD придала семейству процессоров EPYC законченный вид, анонсировав вариант для периферийных вычислений под кодовым названием Siena. А на днях исследователи с сайта Phoronix опубликовали результаты сводного тестирования EPYC 8324P/PN, сравнив производительность новых процессоров с Intel Xeon Gold 6421N. Как известно, AMD EPYC Siena — упрощённая и удешевлённая версия Bergamo, использующая те же ядра Zen4c и оптимизированные по количеству транзисторов площади кристалла, но имеющая лишь шестиканальную подсистему памяти, а также не поддерживающая конфигурации с двумя процессорами. ![]() Исследователи выбрали для сравнительного анализа 32-ядерные версии процессоров как AMD, так и Intel. Со стороны «красных» выступили EPYC 8324P (2,65–3,0 ГГц) и EPYC 8324PN (2,05–3,0 ГГц), а честь «синих» был призван отстаивать Xeon Gold 6421N (1,8–3,6 ГГц) поколения Sapphire Rapids. ![]() Тестирование показало весьма любопытные результаты. Хотя архитектура Intel Golden Cove явно сложнее AMD Zen 4c и предусматривает полноценную поддержку AVX-512 и AMX, в большинстве тестов это не стало преимуществом для решения Intel. Процессоры AMD практически везде показали сопоставимый уровень производительности при существенно меньшем уровне энергопотребления. ![]() Источник изображений здесь и далее: Phoronix С настройками теплопакета по умолчанию EPYC 8324P опередил Xeon Gold 6421N на 2,7 %, в режиме максимальной производительности отрыв составил 5 %, а при ограничении TDP до уровня 155 Вт отставание составило всего 2,5 %. Имеющий более скромную частотную формулу EPYC 8324PN отстал от Xeon на 11,8 %, но перевод процессора в режим производительности позволил вырваться вперед на 4,8 %. По части энергопотребления в среднем показатель решений AMD оставался на уровне 89 или 94 Вт (в зависимости от режима), в то время как для Intel Xeon аналогичный параметр составил 139 Вт. Таким образом, процессоры Siena доказали не только свою способность тягаться на равных с Sapphire Rapids, но и подтвердили свою ориентацию на сектор энергоэффективных, но достаточно производительных систем, например, платформ периферийных вычислений и RAN-оборудования. Впрочем, по части программной поддержки в последнем случае пока лидирует Intel.
04.10.2023 [12:17], Сергей Карасёв
ECS Industrial готовит новые промышленные решенияКомпания ECS Industrial Computer (ECSIPC) рассказала о новинках, которые будут представлены на технологической выставке GITEX Global 2023. Одна из новинок — компьютер Liva Z5F Plus для широкого спектра коммерческих и промышленных применений, таких как торговля, периферийные вычисления и пр. Устройство несёт на борту процессор Intel Core 13-го (TDP составляет 15 Вт), до 64 Гбайт оперативной памяти, адаптер Wi-Fi 6 и двухпортовый контроллер 1GbE. Есть два порта DisplayPort (один через USB Type-C), два интерфейса HDMI, четыре последовательных порта, порты USB4 (20 Гбит/с) и USB 3.2 Gen2. Кроме того, ECS покажет встраиваемую систему iM6501WT. Она комплектуется чипом Intel Core 11-го поколения, максимум 64 Гбайт ОЗУ, SSD формата M.2 с интерфейсом PCIe 4.0 (NVMe), сотовым модемом M.2 4G/5G, адаптером Wi-Fi 6, контроллерами 1GbE и 2.5GbE, портами COM, DIO и USB. Питание подаётся через DC-разъём (12–24 В). ![]() Источник изображений: ECS Ещё одна новинка — одноплатный компьютер RK3568-IS1 на базе процессора Rockchip с четырьмя ядрами Arm Cortex-A55 и блоком ИИ с производительность 0,8 TOPS. Решение может быть укомплектовано накопителем M.2 (PCIe), модулями Wi-Fi и 4G/5G. Есть интерфейсы MIPI-CSI, I2C, USB, COM, двухпортовый контроллер Ethernet. Говорится о поддержке Android и Ubuntu. ![]() Будет также представлена материнская плата A620AM5-M9 для коммерческого использования. Она рассчитана на чипы AMD Ryzen 7000 с TDP до 65 Вт. Поддерживается до 64 Гбайт памяти DDR5. Упомянуты слот PCI Express 4.0 х16, коннектор M.2 (PCIe 4.0; NVMe), четыре SATA-порта, разъём M.2 для Wi-Fi/Bluetooth и порт 1GbE. Есть шесть портов USB (Type-A и Type-C), а также порты COM и LTP.
02.10.2023 [15:57], Сергей Карасёв
AMD представила ускоритель Alveo UL3524 для брокерских и биржевых приложенийКомпания AMD анонсировала специализированный ускоритель Alveo UL3524 на базе FPGA, ориентированный на финтех-сферу. Решение, как утверждается, позволяет трейдерам, хедж-фондам, брокерским конторам и биржам совершать операции с задержками наносекундного уровня. В основу новинки положен чип FPGA Virtex UltraScale+, выполненный по 16-нм технологии. Конфигурация включает 64 трансивера с ультранизкой задержкой, 780 тыс. LUT и 1680 DSP. Отмечается, что Alveo UL3524 обеспечивает в семь раз меньшую задержку по сравнению с FPGA предыдущего поколения. В частности, инновационная архитектура трансиверов с оптимизированными сетевыми ядрами позволяет добиться показателя менее 3 нс. ![]() Источник изображения: AMD Ускоритель может использоваться в комплексе с платформой разработки Vivado Design Suite. AMD также предоставляет разработчикам среду FINN с открытым исходным кодом, что позволяет внедрять в высокопроизводительные трейдинговые системы модели ИИ с низкими задержками. Ускоритель выполнен в виде однослотовой карты расширения с интерфейсом PCIe 4.0 x16. Задействован система пассивного охлаждения, а показатель TDP заявлен на отметке 125 Вт. Предусмотрены четыре сетевых порта QSFP-DD. Карта несёт на борту 16 Гбайт памяти DDR4-2666 и 72 Мбайт памяти QDR II+. Весит ускоритель 832 г.
01.10.2023 [20:56], Сергей Карасёв
Микросервер Palmshell NeXT H2 оснащён чипом AMD Ryzen Embedded и двумя портами 10GbEДля заказа, по сообщению ресурса CNX-Software, доступно устройство Palmshell NeXT H2: это микросервер на платформе AMD, который также предлагается в виде одноплатного компьютера для разработчиков. Цена начинается приблизительно с $200. В основу положен процессор Ryzen Embedded R1505G (два ядра; четыре потока; 2,4–3,3 ГГц; 25 Вт). Для модулей оперативной памяти DDR4-2400 предусмотрены два слота SO-DIMM: опционально предлагаются модификации с 8 и 16 Гбайт ОЗУ. ![]() Источник изображений: CNX-Software Система может быть укомплектована SSD типоразмера M.2 2280 с интерфейсом PCIe 3.0 (NVMe) вместимостью 256 или 512 Гбайт. Есть два порта SATA-3 и слот для карты microSD. В арсенале новинки — два сетевых порта 10GbE SFP+ и порт 2.5GbE RJ45, а также коннектор M.2 B-key 3042 для модема 4G/5G. Дополнительно может быть добавлен комбинированный адаптер Intel AX210NGW (Wi-Fi 6E / Bluetooth 5.2) в виде модуля M.2 E-Key 2230. ![]() Предусмотрены два разъёма HDMI с поддержкой видео 4Kp60, интерфейс eDP (только у одноплатного компьютера), по два порта USB 3.1 Gen2 и USB 2.0. Система охлаждения включает медный радиатор и PWM-вентилятор со скоростью вращения до 3000 об/мин. Питание подаётся через DC-разъём (12–19 В). В тыльной части сервера предусмотрены гнёзда для шести внешних антенн. Говорится о совместимости с широким набором ОС, включая Ubuntu, Arch Linux, Fedora, Debian, OpenWrt, Windows, pfSense и ROS.
29.09.2023 [23:55], Алексей Степин
Без CUDA никуда? ИИ-стартап Lamini полагается исключительно на ускорители AMD InstinctКогда речь заходит о больших языковых моделях (LLM), то чаще всего подразумевается их обучение, дообучение и запуск на аппаратном обеспечении NVIDIA, как наиболее широко распространённом и лучше всего освоенном разработчиками. Но эта тенденция понемногу меняется — появляются либо специфические решения, могущие поспорить в эффективности с ускорителями NVIDIA, либо разработчики осваивают другое «железо». К числу последних принадлежит ИИ-стартап Lamini, сделавший ставку на решения AMD: ускорители Instinct и стек ROCm. Главным продуктом Lamini должна стать программно-аппаратная платформа Superstation, позволяющая создавать и развёртывать проекты на базе генеративного ИИ, дообучая базовые модели на данных клиента. Напомним, ROCm представляет собой своего рода аналог NVIDIA CUDA, но упор в решении AMD сделан на более широкую поддержку аппаратного обеспечения, куда входят не только ускорители и GPU, но также CPU и FPGA — всё в рамках инициативы Unified AI Stack. К тому же в этом году у ROCm появилась интеграция с популярнейшим фреймворком PyTorch, который в версии 2.0 получил поддержку ускорителей AMD Instinct. Что же касается Lamini и её проекта, то, по словам основателей, он привлёк внимание уже более 5 тыс. потенциальных клиентов. Интерес к платформе проявили, например, Amazon, Walmart, eBay, GitLab и Adobe. В настоящее время платформа Lamini уже более года работает на кластере, включающем в себя более 100 ускорителей AMD Instinct MI250, и обслуживает клиентов. При этом заявляется возможность масштабирования до «тысяч таких ускорителей». Более того, AMD сама активно пользуется услугами Lamini. На данный момент это единственная LLM-платформа, целиком работающая на аппаратном обеспечении AMD, при этом стоимость запуска на ней ИИ-модели Meta✴ Llama 2 с 70 млрд параметров, как сообщается, на порядок дешевле, нежели в облаке AWS. Солидный объём набортной памяти (128 Гбайт) у MI250 позволяет разработчикам запускать более сложные модели, чем на A100. Согласно тестам, проведённым Lamini для менее мощного ускорителя AMD Instinct MI210, аппаратное обеспечение «красных» способно демонстрировать в реальных условиях до 89 % от теоретически возможного в тесте GEMM и до 70% от теоретической пропускной способности функции ROCm hipMemcpy. Выбор Lamini несомненно принесёт AMD пользу в продвижении своих решений на рынке ИИ. К тому же в настоящее время они более доступны, чем от NVIDIA H10. Сама AMD объявила на мероприятии AI Hardware Summit, что развитие платформы ROCm в настоящее время является приоритетным для компании.
19.09.2023 [16:59], Сергей Карасёв
ASUS выпустила материнскую плату S14NA-U12 для серверов на AMD EPYC SienaКомпания ASUS анонсировала материнскую плату S14NA-U12 типоразмера CEB, предназначенную для построения серверов на процессорах AMD EPYC 8004 Siena. Допускается установка одного чипа в исполнении Socket SP6 (LGA 4844) с показателем TDP до 225 Вт. Новинка располагает 12 слотами для модулей оперативной памяти DDR5-4800/4000/3600 RDIMM/3DS RDIMM суммарным объёмом до 3 Тбайт. Есть два разъёма PCIe 5.0 x16 и один слот PCIe 5.0 x8. Доступны два коннектора M.2 с поддержкой модулей формата 2280/22110 с интерфейсом PCIe 5.0 x4 или SATA-3. Кроме того, предусмотрены пять разъёмов MCIO с поддержкой PCIe 5.0 x8. В оснащение входит двухпортовый сетевой контроллер Broadcom BCM57414B1KFSBG стандарта 25GbE. Интерфейсный блок содержит два порта USB 3.2 Gen1, два коннектора SFP28, аналоговый разъём D-Sub, а также сетевой порт управления с гнездом RJ-45. Через разъёмы на самой плате можно задействовать дополнительные порты USB 3.2 Gen1 и последовательный порт. Диапазон рабочих температур простирается от +10 до +35 °C. Габариты материнской платы составляют 305 × 267мм.
19.09.2023 [15:07], Сергей Карасёв
Исследовательская лаборатория ВВС США получила суперкомпьютер Raider мощностью 12 ПфлопсВысокопроизводительный вычислительный комплекс для Исследовательской лаборатории ВВС США (AFRL), по сообщению ресурса Datacenter Dynamics, прибыл на базу Райт-Паттерсон в Огайо. Суперкомпьютер, построенный Penguin Computing, получил название Raider. ![]() Изображения: AFRL Новая НРС-система имеет производительность приблизительно 12 Пфлопс. Raider является частью более широкой программы модернизации высокопроизводительных вычислений Министерства обороны и будет доступен ВВС, армии и флоту США. Суперкомпьютер примерно в четыре раза мощнее своего предшественника — комплекса Thunder, запущенного в 2015 году: у этой системы производительность составляет 3,1 Пфлопс. Использовать Raider планируется прежде всего для решения сложных задач в области моделирования различных процессов. В опубликованных в прошлом году документах говорится, что Raider должен был получить 189 тыс. вычислительных ядер. Предполагалось, что система будет включать 356 узлов различного назначения и конфигурации и получит процессоры AMD EPYC 7713 (Milan), 44 Тбайт RAM, 152 ускорителя NVIDIA A100, 200G-интерконнект InfiniBand HDR и 20-Пбайт хранилище. Однако заявленная производительность этой системы составляла 6,11 Пфлопс, так что характеристики суперкомпьютера явно скорректировали. В дополнение к Raider Исследовательская лаборатория ВВС США заказала два других суперкомпьютера — TI-23 Flyer и TI-Raven, которые, как ожидается, будут обеспечивать производительность на уровне 14 Пфлопс. Ввод этих систем в эксплуатацию запланирован на 2024 год.
19.09.2023 [10:54], Сергей Карасёв
ASRock Rack представила серверные платы для процессоров AMD EPYC SienaКомпания ASRock Rack анонсировала материнские платы с поддержкой новейших процессоров AMD EPYC 8004 Siena в исполнении Socket SP6 (LGA 4844). Дебютировали модели SIENAD8-2L2T, SIENAD8UD-2L2Q и SIENAD10HM3, предназначенные для построения односокетных серверов. Версия SIENAD8-2L2T выполнена в формате АТХ. Она снабжена восемью слотами для модулей оперативной памяти DDR5-4800, четырьмя разъёмами PCIe 5.0 x16 (в том числе с поддержкой CXL1.1) и разъёмом PCIe 5.0 x8. Есть два коннектора M.2 22110/2280 (PCIe 5.0 x4), по два сетевых порта 10GbE и 1GbE с коннекторами RJ45, а также сетевой порт управления. Плюс к этому доступны два порта USB 3.2 Gen1 Type-A и аналоговый разъём D-Sub. ![]() Источник изображений: ASRock Rack Плата SIENAD8UD-2L2Q, в свою очередь, соответствует типоразмеру Deep Micro-ATX. Предусмотрены восемь слотов DDR5-4800, два разъёма PCIe5.0 / CXL1.1 x16, слот PCIe5.0 / CXL1.1 x8, два коннектора M.2 22110/2280 (PCIe 5.0 x4), два коннектора MCIO (PCIe 5.0 x8 или 8 × SATA-3), три разъёма MCIO (PCIe 5.0 x8) и коннектор OCuLink (PCIe 3.0 x4). Есть по два порта 1GbE RJ45 и 25GbE SFP28, выделенный сетевой порт управления, два порта USB 3.2 Gen1 Type-A и разъём D-Sub. ![]() Модель SIENAD10HM3 половинной ширины получила 10 разъёмов DDR5-4800, два слота Slim Cool Edge PCIe 5.0 x16, два коннектора M.2 22110/2280 (PCIe 5.0 x4 или SATA-3), по одному разъёму MCIO (PCIe 5.0 / CXL1.1 x8 или 8 × SATA-3) и OCuLink (PCIe 3.0 x4). Имеются контроллеры ASPEED AST2600 и Realtek RTL8211F (выделенный сетевой порт управления). ![]() |
|