Материалы по тегу: gpu
19.10.2022 [23:41], Сергей Карасёв
Meta* представила Grand Teton — ИИ-систему нового поколенияКомпания Meta* в ходе саммита OCP (Open Compute Project) анонсировала систему Grand Teton — аппаратную ИИ-платформу второго поколения, оптимизированную для интенсивной работы с памятью и вычислений. В основу решения положены ускорители NVIDIA H100, которые были представлены в марте 2022 года. Система Grand Teton превосходит платформу Meta* предыдущего поколения (Zion EX) в плане объёма памяти, вычислительных ресурсов и ёмкости сети. Так, пропускная способность шины между CPU и ускорителями выросла вчетверо, а пропускная способность сети — вдвое. Кроме того, шасси теперь может обеспечить вдвое более мощные с точки зрения энергопотребления компоненты. В то время как архитектура Zion EX предусматривает применения ряда связанных подсистем (узел CPU, модуль ускорителей и коммутаторная система), Grand Teton объединяет все компоненты на базе единого шасси в высокоинтегрированную систему. Такая конструкция позволяет улучшить производительность, повысить надёжность, ускорить развёртывание и упростить масштабирование. ![]() Источник изображения: Meta* Отметим, что свою нынешнюю самую мощную ИИ-систему — суперкомпьютер RSC (Research SuperCluster), включающий порядка 16 тыс. ускорителей — Meta* не стала строить самостоятельно, как это было прежде, а заказала у NVIDIA узлы DGX A100, дополнив их многоуровневым All-Flash хранилищем от Pure Storage. * Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».
04.10.2022 [13:30], Алексей Степин
Intel позволит применять видеокарты Arc A770 в серверах, но с ограничениямиНа мероприятии Innovation 2022 компания Intel продемонстрировала графический ускоритель Arc A770, предназначенный для рынка настольных платформ — игровых ПК и рабочих станций. Кроме того, новинку получится использовать и в серверах, но с рядом ограничений. Напомним, что A770 — это видеокарта среднего уровня на базе графического процессора ACM-G10 с 32 ядрами Xe (4096 блоков FP32, 32 блока трассировки лучей и 512 блоков матричных вычислений XMX). GPU способен работать на частоте 2,1 ГГц, он будет дополнен 8 или 16 Гбайт памяти GDDR6, в последнем случае используется 256-битная шина с ПСП около 560 Гбайт/с. Стоимость эталонной Intel Arc A770 Limited Edition составит $329. ![]() Источник изображений: Serve The Home Эталонный дизайн компактен по нынешним меркам: карта занимает всего два слота в высоту и охлаждается парой сравнительно небольших вентиляторов. Питание организовано по схеме 6+8 pin. Одна маленькая деталь свидетельствует о том, что Arc A770 будет устанавливаться не только в игровые ПК, но и в рабочие станции — это отверстия для крепления фиксатора в задней части карты. Пластина фиксатора входит в специальную стойку с прорезями в передней части корпуса и не даёт длинным платам провисать и перегружать механически слот PCI Express. В игровых ПК это решение не применяется, но часто встречается в серверах и рабочих станциях. ![]() Хорошо видны отверстия для крепления поддерживающего плату фиксатора Intel отметила, что не планирует ограничить сферу применения Arc A770 игровыми ПК или рабочими станциями. Ускорители можно будет использовать и в серверах, однако здесь обнаружился нюанс: в выступлении было отмечено, что новые ускорители не получат полноценной поддержки SR-IOV. Напомним, что SR-IOV — неотъемлемая часть любого адаптера, который должен будет работать в средах с виртуализацией, поскольку именно эта технология обеспечивает быстрый доступ виртуальных машин к аппаратным ресурсам устройства. Таким образом, применение ускорителей Intel Arc в серверах, похоже, будет ограниченным.
21.09.2022 [19:32], Алексей Степин
NVIDIA представила ускорители L40 и новую Omniverse-платформу OVX на их основеНа конференции GTC 2022 NVIDIA анонсировала второе поколение систем для симуляции и запуска «цифровых двойников» OVX. Это вовсе не развлечение: использование точных моделей реальных физических объектов, пространств и устройств потенциально весьма выгодно, поскольку симуляция городского квартала для обучения автопилотов или фабрики для оценки взаимодействия роботов с живыми работниками априори будет стоить намного меньше, нежели проведение натурных испытаний. Зачастую такие симуляции используют тензорные и матричные вычисления, поэтому основой новой платформы OVX стали новые ускорители NVIDIA L40 с архитектурой Ada Lovelace, располагающие ядрами трассировки лучей третьего поколения и тензорными ядрами четвёртого поколения. Они поддерживают как классический трассировку лучей (ray tracing), так и трассировку путей (path tracing), что важно для корректной симуляции поведения различных материалов. ![]() NVIDIA L40. Здесь и далее источник изображений: NVIDIA Физически L40 представляют собой двухслотовую FHFL-плату расширения PCIe с пассивным охлаждением — теплопакет новинки ограничен рамками 300 Вт. Объём оперативной памяти GDDR6 составляет 48 Гбайт, вдвое больше, нежели у игровых GeForce RTX 4090, и, в отличие от последних, поддерживается совместная работа двух карт в режиме NVLink, что может оказаться полезным в симуляциях с большим объёмом данных. Для вывода изображения служат четыре порта DP 1.4a. ![]() NVIDIA OVX Server Каждый сервер NVIDIA OVX будет содержать 8 ускорителей L40 и три сетевых адаптера ConnectX-7 с портами класса 200GbE и поддержкой шифрования сетевого трафика на лету. От 4 до 16 таких серверов составят OVX POD, а 32 или более —кластер SuperPOD. Такие кластеры станут домом для новой облачной платформы NVIDIA Omniverse Cloud, услуги которой компания планирует предоставлять робототехникам, создателям автономных транспортных средств, «умной инфраструктуры» и вообще всем, кому нужна точная симуляция сложных объектов и систем с качественной визуализацией результатов.
14.09.2022 [14:28], Сергей Карасёв
Supermicro представила GPU-сервер для ресурсоёмких ИИ-задач: 8U-шасси для восьми ускорителей NVIDIAКомпания Supermicro анонсировала GPU-сервер в форм-факторе 8U на базе акселераторов NVIDIA H100. Новинка предназначена для выполнения разнообразных задач, требующих высокой вычислительной мощности: это могут быть приложения на базе искусственного интеллекта (ИИ), системы машинного обучения и пр. Сервер (пока доступна только модель SuperServer SYS-820GP-TNAO) построен на платформе Universal GPU с возможностью использования нынешних и будущих процессоров AMD и Intel. Могут применяться CPU с показателем TDP до 400 Вт. В текущем варианте доступны два чипа Intel Xeon Ice Lake-SP. Допускается установка HGX-платы с восемью SXM-ускорителями NVIDIA A100/H100 с NVLink (NVSwitch). ![]() Источник изображений: Supermicro Доступны 32 слота для модулей DDR4-3200/2933/2666 (L)RDIMM ECC и Optane PMem, а максимально поддерживаемый объём памяти составляет 8 Тбайт. Есть шесть отсеков для SFF-накопителей NVMe/SATA/SAS с возможностью «горячей» замены и два коннектора для твердотельных модулей М.2 (NVMe / SATA). Реализована поддержка AIOM/OCP 3.0, но опционально можно установить два двухпортовых 10GbE-адаптера Intel X550-AT2. Предусмотрены десять слотов PCIe 4.0 x16 для низкопрофильных карт расширения. ![]() Разработчик выделяет усовершенствованную конструкцию шасси с оптимизацией воздушных потоков. Это позволяет уменьшить скорость вращения вентиляторов, что обеспечивает снижение уровня шума, а также сокращение энергопотребления и совокупной стоимости владения при сохранении высокого уровня производительности. В системе охлаждения задействованы четыре вентилятора. Питание обеспечивает один БП мощностью 6000 Вт (ввод +12 В DC), причём система может быть интегрирована как в традиционную инфраструктуру с AC-питанием, так и в OCP-стойки. Диапазон рабочих температур — от +10 до +35 °C. Габариты составляют 351 × 449 × 800 мм, вес — 75,3 кг.
17.08.2022 [21:50], Алексей Степин
EKWB представила GPU-сервер X7000-RM с жидкостным охлаждениемБренд EKWB хорошо известен энтузиастам жидкостного охлаждения — компания ведёт свою историю с 2003 года и предлагает как отдельные компоненты, так и законченные СЖО практически для любых платформ. В 2020 году у неё появилось подразделение EK Fluid Works, разрабатывающее серверные системы и рабочие станции с жидкостным охлаждением. Сегодня EK Fluid Works анонсировала HPC-сервер Compute Series X7000-RM, предназначенный для систем машинного обучения, рендер-ферм, научных платформ-симуляторов физических процессов и т.д. Таких решений на рынке немало, но X7000-RM всё же отличается от них. ![]() Источник: EK Fluid Works Новинка использует наработки EK в области СЖО, позволяющие разместить вплотную друг к другу до семи ускорителей NVIDIA A100 (PCIe 4.0 x16), обслуживаемых хост-системой на базе процессора AMD EPYC Milan(-X). Объём системной памяти DDR4-3200 ECC может достигать 2 Тбайт. Компания не стала ограничиваться однопроцессорными вариантами на базе AMD EPYC: вскоре станут доступны также версии с одним или двумя Intel Xeon Scalable, однако в последнем случае количество плат ускорителей сокращается до пяти. Конструкция сервера модульная: каждый процессор и ускоритель оснащаются фирменными водоблоками, подключаемыми к распределителю посредством разъёмов CPC с защитой от утечки. Система изначально спроектирована так, чтобы упростить обслуживание — все компоненты, включая помпы, легко заменяются. За сброс тепла отвечают три 360-мм радиатора, дополненных шестью вентиляторами 120×38 мм. Весь контур СЖО управляется «умным» контроллером, поддерживающим оптимальное соотношение тишины и эффективности и способным предсказывать возможные отказы. Питают сервер четыре (3+1) БП мощностью 3240 Вт каждый (80+ Gold). ![]() Источник: EK Fluid Works Все варианты используют шасси высотой 5U. Правда, установка высокоскоростных сетевых адаптеров по умолчанию не предусмотрена, так что придётся довольствоваться двумя набортными портами 10GbE, которые предлагается использовать для подключения к внешней СХД. И это может стать узким местом. В сам же сервер можно установить до четырёх M.2 NVMe SSD (PCIe 4.0 x4) и до восьми SFF SATA SSD. Серверы EK Fluid Works Compute Series X7000-RM доступны для заказа уже сейчас. Любопытно, что опция ускорителей не ограничена A100 — доступны также варианты с NVIDIA RTX A5000/6000 и даже игровыми картами GeForce RTX 3090. Базовая конфигурация c EPYC 7502P, 128 Гбайт RAM и одной RTX 3090 стоит примерно $18,5 тыс.
29.07.2022 [18:01], Сергей Карасёв
Supermicro представила первые серверы с ускорителями Intel Arctic Sound-MКомпания Supermicro сообщила о том, что её серверы будут комплектоваться новейшими ускорителями Intel Arctic Sound-M (ATS-M) на архитектуре Intel Xe. Напомним, что в серии ATS-M представлены полноразмерный вариант с 32 ядрами Xe и теплопакетом 150 Вт и компактный низкопрофильный, несущий на борту 16 ядер Xe, но с теплопакетом 75 Вт. Новые ускорители, в частности, доступны в составе 4U-системы SuperServer SYS-420GP-TNR с поддержкой двух чипов Intel Xeon Scalable третьего поколения (Ice Lake-SP). Возможна установка до десяти GPU, до 32 модулей оперативной памяти суммарным объёмом до 8 Тбайт и до 24 SFF-накопителей. Система рассчитана на транскодирование медиаматериалов. ![]() Источник изображений: Supermicro Для доставки медиаконтента подойдёт сервер SYS-220BT-HNTR с четырьмя узлами (2U4N), каждый из которых может нести на борту два чипа Intel Xeon Ice Lake-SP и два ускорителя ATS-M. Есть 20 слотов для модулей ОЗУ и шесть посадочных мест для накопителей SFF. ![]() Система для облачных игр SYS-210GP-DNR в 2U-шасси включает два узла, каждый из которых содержи один процессор Intel Xeon Scalable третьего поколения, три ускорителя ATS-M, восемь модулей оперативной памяти и два накопителя SFF. Для сферы ИИ подойдёт сервер SYS-620C-TN12R с поддержкой двух чипов Intel Xeon Ice Lake-SP, шести акселераторов ATS-M, 16 модулей ОЗУ и 12 накопителей формата SFF/LFF.
28.07.2022 [13:26], Сергей Карасёв
Gigabyte представила GPU-серверы G242-P35/P36 на базе 128-ядерных Arm-чипов Ampere AltraКомпания Gigabyte Technology анонсировала GPU-серверы G242-P35 и G242-P36, предназначенные для применения в крупных центрах обработки данных и в составе облачных платформ. Новинки рассчитаны на установку одного процессора Ampere Altra или Altra Max, который может насчитывать до 128 вычислительных ядер. Устройства ориентированы на монтаж в стойку: они выполнены в форм-факторе 2U с габаритами 438 × 87,5 × 820 мм. Доступны 16 слотов для модулей оперативной памяти DDR4-3200 ёмкостью до 256 Гбайт каждый: максимально допустимый объём ОЗУ составляет 4 Тбайт. ![]() Источник изображений: Gigabyte Серверы оснащены двухпортовым сетевым контроллером 1GbE (Intel I350-AM2) и выделенным сетевым портом управления. Во фронтальной части расположены четыре отсека для накопителей NVMe U.2 с возможностью «горячей» замены. Есть также два коннектора для твердотельных модулей М.2. ![]() Модель G242-P35 предоставляет четыре слота PCIe 4.0 x16 для акселераторов и два слота PCIe 4.0 x8 для низкопрофильных карт расширения. Версия G242-P36 имеет по два слота PCIe 4.0 x16 для ускорителей и DPU BlueField-2, а также два слота PCIe 4.0 x8 для низкопрофильных карт расширения. ![]() На переднюю панель выведен порт USB 3.2 Gen1. Сзади, помимо гнёзд для сетевых кабелей, есть три порта USB 3.2 Gen2, интерфейс D-Sub и порт для отладки. Новинки несут на борту два блока питания 80 PLUS Platinum мощностью 1600 Вт. Применено воздушное охлаждение с пятью вентиляторами диаметром 80 мм.
27.07.2022 [13:27], Алексей Степин
Начались поставки серверных ускорителей Intel Arctic Sound-MАрхитектура Intel Xe интересна не только тем, что с ней компания пытается войти на рынок, где десятилетиями идёт война между «красными» и «зелёными». Они также служат основой для серверных ускорителей Arctic Sound-M (ATS-M), которые оптимизированы для обеспечения низкой совокупной стоимости владения (TCO). Анонсированы эти ускорители были ещё зимой этого года именно как решение для ускорения обработки видео, организации виртуальных рабочих мест, облачного гейминга и систем машинной аналитики, в чём им должна была помогать открытость платформы. Наконец, вчера Intel официально сообщила о начале поставок плат Arctic Sound-M. В мае компания анонсировала две модификации ATS-M: полноразмерный вариант с 32 ядрами Xe (150 Вт) и компактный низкопрофильный, несущий на борту 16 ядер Xe (75 Вт). Теплопакеты достаточно скромные, поэтому разработчикам удалось сделать решение на его основе однослотовым и обойтись пассивным охлаждением. Обе модификации имеют интерфейс PCIe 4.0 x16 и снабжаются GDDR6-памятью. Ускорители отличаются наличием высокоэффективного аппаратного (де-)кодера AV1 и блоков ускорения трассировки лучей, что как раз и делает их идеальными для облачного гейминга. Впрочем, как уже было сказано, это не единственная сфера применения Arctic Sound-M: один такой ускоритель может обслуживать десятки VDI-сессий с полноценным десктопным окружением, а также развивает неплохие 150 Топс в инференс-задачах (INT8).
22.06.2022 [12:50], Сергей Карасёв
В облачных и выделенных серверах Selectel появились новые GPUSelectel, ведущий провайдер облачной инфраструктуры и услуг дата-центров, объявил о том, что клиентам теперь доступны сервисы на базе новых графических процессоров (GPU) и ускорителей NVIDIA. Речь идёт о предоставлении как выделенных серверов, так и облачных инстансов. Отмечается, что задействованные акселераторы позволят эффективнее решать такие задачи, как машинное обучение и искусственный интеллект (ИИ), транскодирование видео, обработка графики и рендеринг видео, организация виртуальных рабочих мест, научное моделирование и CUDA-вычисления. В облаке появились конфигурации с видеокартами А5000, А2000, А30 и A2. Ускоритель A2000 — это энергоэффективный GPU для компактных рабочих станций: он подойдёт для ИИ, графики и рендеринга видео. Пропускная способность памяти достигает 288 Гбайт/с. В свою очередь, A5000 — универсальный GPU, который подходит для любых задач в рамках своей производительности. Пропускная способность памяти составляет до 768 Гбайт/с, поддерживается vGPU. Модель A30 подходит для ИИ-инференса, мейнстрим-вычислений, обработки языка, разговорного искусственного интеллекта, рекомендательных систем. Поддерживает vGPU, до четырёх изолированных GPU-инстансов (Multi-Instance GPU), а пропускная способность памяти достигает 933 Гбайт/с. Модель A2 — GPU начального уровня, который подходит для простого инференса, видео и графики, периферийных вычислений (ИИ, обработка видео), мобильного облачного гейминга. Среди преимуществ облачных серверов названы: оплата по факту потребления, совместимость с различными фреймворками (TensorFlow, PyTorch, Keras, MXNet, Caffe) и со всеми типами нейросетей (GAN, CNN, RNN, SSNN и пр.), простота масштабирования. Рассчитать стоимость облачного инстанса с нужным типом ускорителя можно на соответствующей странице. В случае выделенных серверов теперь доступны сборки с ускорителями А2, A2000, A4000, A5000 и A100. Версия A4000 предлагает 16 Гбайт памяти GDDR6, 6144 ядра CUDA и 192 тензорных ядра. Акселератор A100 (40 Гбайт) обладает максимальной производительностью для ИИ, HPC и обработки данных. Модель подходит для глубокого обучения, научных исследований и аналитики данных. Говорится, что при выборе ускорителей Selectel уделяла внимание количеству ядер CUDA, тензорных ядер, а также ядер для трассировки лучей. Кроме того, учитывались объём и пропускная способность памяти, поддержка виртуальных GPU VDI. Изучить и заказать выделенные серверы с GPU можно здесь.
11.05.2022 [01:34], Алексей Степин
Представлены серверные ускорители Arctic Sound-M на базе архитектуры Intel XeНа мероприятии Intel Vision компания Intel представила серверные ускорители на базе архитектуры Xe под кодовым названием Arctic Sound-M (ATS-M). Это довольно универсальные GPU, которые подходят для облачных игровых платформ, поставщиков медиаконтента, виртуальных рабочих мест, инференс-систем и видеоаналитики. Ускорители оптимизированы для обеспечения низкой совокупной стоимости владения (TCO). Ждать появления новинок на рынке можно уже в III квартале 2022 года. На момент анонса в новой серии представлено два ускорителя: полноразмерный вариант с 32 ядрами Xe и теплопакетом 150 Вт и компактный низкопрофильный, несущий на борту 16 ядер Xe, зато с теплопакетом всего 75 Вт. Обе карты имеют интерфейс PCIe 4.0 x16. Каждый из вариантов имеет на борту по четыре фирменных видеодвижка Xe, впервые в индустрии поддерживающих аппаратное кодирование видеопотока в формат AV1. Дополнительно новые ускорители имеют блоки ускорения трассировки лучей и блоки матричных вычислений Intel XMX. В качестве набортной памяти используется GDDR6. Один ускоритель ATS-M может следующее:
Отдельного упоминания заслуживает аппаратный AV1-кодер — новый стандарт при сохранении уровня качества изображения позволяет почти на треть снизить битрейт по сравнению с H.264, а значит, либо снизить требования к ширине канала, либо уместить в нём больше видеопотоков. При этом Intel ориентируется на открытые стандарты. В рамках проекта oneAPI/oneVPL будут поддерживаться все современные форматы сжатия видео (AV1, AVC, HEVC и VP9) и популярные фреймворки FFmpeg и GStreamer. Есть и open source наборы Open Visual Cloud. Что касается организации виртуальных рабочих сред (VDI/DaaS), то и здесь ATS-M предлагает гибкое управление распределением ресурсов между множеством vGPU, причём с высоким уровнем гранулярности. Компания также отдельно отмечает, что использование аппаратных возможностей SR-IOV бесплатно и не требует дополнительного лицензирование — этот камень, похоже, направлен в огород NVIDIA. ![]() Для инференс-систем новые ускорители тоже подходят, в особенности для ИИ-видеоаналитки, поскольку благодаря новым видеодвижкам узким местом стадия обработки входящего видеопотока не станет. Для работы с ускорителем Intel предлагает наборы openVINO и oneDNN, совместимые с TensorFlow и PyTorch. |
|