Материалы по тегу: gpu
17.08.2022 [21:50], Алексей Степин
EKWB представила GPU-сервер X7000-RM с жидкостным охлаждениемБренд EKWB хорошо известен энтузиастам жидкостного охлаждения — компания ведёт свою историю с 2003 года и предлагает как отдельные компоненты, так и законченные СЖО практически для любых платформ. В 2020 году у неё появилось подразделение EK Fluid Works, разрабатывающее серверные системы и рабочие станции с жидкостным охлаждением. Сегодня EK Fluid Works анонсировала HPC-сервер Compute Series X7000-RM, предназначенный для систем машинного обучения, рендер-ферм, научных платформ-симуляторов физических процессов и т.д. Таких решений на рынке немало, но X7000-RM всё же отличается от них. ![]() Источник: EK Fluid Works Новинка использует наработки EK в области СЖО, позволяющие разместить вплотную друг к другу до семи ускорителей NVIDIA A100 (PCIe 4.0 x16), обслуживаемых хост-системой на базе процессора AMD EPYC Milan(-X). Объём системной памяти DDR4-3200 ECC может достигать 2 Тбайт. Компания не стала ограничиваться однопроцессорными вариантами на базе AMD EPYC: вскоре станут доступны также версии с одним или двумя Intel Xeon Scalable, однако в последнем случае количество плат ускорителей сокращается до пяти. Конструкция сервера модульная: каждый процессор и ускоритель оснащаются фирменными водоблоками, подключаемыми к распределителю посредством разъёмов CPC с защитой от утечки. Система изначально спроектирована так, чтобы упростить обслуживание — все компоненты, включая помпы, легко заменяются. За сброс тепла отвечают три 360-мм радиатора, дополненных шестью вентиляторами 120×38 мм. Весь контур СЖО управляется «умным» контроллером, поддерживающим оптимальное соотношение тишины и эффективности и способным предсказывать возможные отказы. Питают сервер четыре (3+1) БП мощностью 3240 Вт каждый (80+ Gold). ![]() Источник: EK Fluid Works Все варианты используют шасси высотой 5U. Правда, установка высокоскоростных сетевых адаптеров по умолчанию не предусмотрена, так что придётся довольствоваться двумя набортными портами 10GbE, которые предлагается использовать для подключения к внешней СХД. И это может стать узким местом. В сам же сервер можно установить до четырёх M.2 NVMe SSD (PCIe 4.0 x4) и до восьми SFF SATA SSD. Серверы EK Fluid Works Compute Series X7000-RM доступны для заказа уже сейчас. Любопытно, что опция ускорителей не ограничена A100 — доступны также варианты с NVIDIA RTX A5000/6000 и даже игровыми картами GeForce RTX 3090. Базовая конфигурация c EPYC 7502P, 128 Гбайт RAM и одной RTX 3090 стоит примерно $18,5 тыс.
29.07.2022 [18:01], Сергей Карасёв
Supermicro представила первые серверы с ускорителями Intel Arctic Sound-MКомпания Supermicro сообщила о том, что её серверы будут комплектоваться новейшими ускорителями Intel Arctic Sound-M (ATS-M) на архитектуре Intel Xe. Напомним, что в серии ATS-M представлены полноразмерный вариант с 32 ядрами Xe и теплопакетом 150 Вт и компактный низкопрофильный, несущий на борту 16 ядер Xe, но с теплопакетом 75 Вт. Новые ускорители, в частности, доступны в составе 4U-системы SuperServer SYS-420GP-TNR с поддержкой двух чипов Intel Xeon Scalable третьего поколения (Ice Lake-SP). Возможна установка до десяти GPU, до 32 модулей оперативной памяти суммарным объёмом до 8 Тбайт и до 24 SFF-накопителей. Система рассчитана на транскодирование медиаматериалов. ![]() Источник изображений: Supermicro Для доставки медиаконтента подойдёт сервер SYS-220BT-HNTR с четырьмя узлами (2U4N), каждый из которых может нести на борту два чипа Intel Xeon Ice Lake-SP и два ускорителя ATS-M. Есть 20 слотов для модулей ОЗУ и шесть посадочных мест для накопителей SFF. ![]() Система для облачных игр SYS-210GP-DNR в 2U-шасси включает два узла, каждый из которых содержи один процессор Intel Xeon Scalable третьего поколения, три ускорителя ATS-M, восемь модулей оперативной памяти и два накопителя SFF. Для сферы ИИ подойдёт сервер SYS-620C-TN12R с поддержкой двух чипов Intel Xeon Ice Lake-SP, шести акселераторов ATS-M, 16 модулей ОЗУ и 12 накопителей формата SFF/LFF.
28.07.2022 [13:26], Сергей Карасёв
Gigabyte представила GPU-серверы G242-P35/P36 на базе 128-ядерных Arm-чипов Ampere AltraКомпания Gigabyte Technology анонсировала GPU-серверы G242-P35 и G242-P36, предназначенные для применения в крупных центрах обработки данных и в составе облачных платформ. Новинки рассчитаны на установку одного процессора Ampere Altra или Altra Max, который может насчитывать до 128 вычислительных ядер. Устройства ориентированы на монтаж в стойку: они выполнены в форм-факторе 2U с габаритами 438 × 87,5 × 820 мм. Доступны 16 слотов для модулей оперативной памяти DDR4-3200 ёмкостью до 256 Гбайт каждый: максимально допустимый объём ОЗУ составляет 4 Тбайт. ![]() Источник изображений: Gigabyte Серверы оснащены двухпортовым сетевым контроллером 1GbE (Intel I350-AM2) и выделенным сетевым портом управления. Во фронтальной части расположены четыре отсека для накопителей NVMe U.2 с возможностью «горячей» замены. Есть также два коннектора для твердотельных модулей М.2. ![]() Модель G242-P35 предоставляет четыре слота PCIe 4.0 x16 для акселераторов и два слота PCIe 4.0 x8 для низкопрофильных карт расширения. Версия G242-P36 имеет по два слота PCIe 4.0 x16 для ускорителей и DPU BlueField-2, а также два слота PCIe 4.0 x8 для низкопрофильных карт расширения. ![]() На переднюю панель выведен порт USB 3.2 Gen1. Сзади, помимо гнёзд для сетевых кабелей, есть три порта USB 3.2 Gen2, интерфейс D-Sub и порт для отладки. Новинки несут на борту два блока питания 80 PLUS Platinum мощностью 1600 Вт. Применено воздушное охлаждение с пятью вентиляторами диаметром 80 мм.
27.07.2022 [13:27], Алексей Степин
Начались поставки серверных ускорителей Intel Arctic Sound-MАрхитектура Intel Xe интересна не только тем, что с ней компания пытается войти на рынок, где десятилетиями идёт война между «красными» и «зелёными». Они также служат основой для серверных ускорителей Arctic Sound-M (ATS-M), которые оптимизированы для обеспечения низкой совокупной стоимости владения (TCO). Анонсированы эти ускорители были ещё зимой этого года именно как решение для ускорения обработки видео, организации виртуальных рабочих мест, облачного гейминга и систем машинной аналитики, в чём им должна была помогать открытость платформы. Наконец, вчера Intel официально сообщила о начале поставок плат Arctic Sound-M. В мае компания анонсировала две модификации ATS-M: полноразмерный вариант с 32 ядрами Xe (150 Вт) и компактный низкопрофильный, несущий на борту 16 ядер Xe (75 Вт). Теплопакеты достаточно скромные, поэтому разработчикам удалось сделать решение на его основе однослотовым и обойтись пассивным охлаждением. Обе модификации имеют интерфейс PCIe 4.0 x16 и снабжаются GDDR6-памятью. Ускорители отличаются наличием высокоэффективного аппаратного (де-)кодера AV1 и блоков ускорения трассировки лучей, что как раз и делает их идеальными для облачного гейминга. Впрочем, как уже было сказано, это не единственная сфера применения Arctic Sound-M: один такой ускоритель может обслуживать десятки VDI-сессий с полноценным десктопным окружением, а также развивает неплохие 150 Топс в инференс-задачах (INT8).
22.06.2022 [12:50], Сергей Карасёв
В облачных и выделенных серверах Selectel появились новые GPUSelectel, ведущий провайдер облачной инфраструктуры и услуг дата-центров, объявил о том, что клиентам теперь доступны сервисы на базе новых графических процессоров (GPU) и ускорителей NVIDIA. Речь идёт о предоставлении как выделенных серверов, так и облачных инстансов. Отмечается, что задействованные акселераторы позволят эффективнее решать такие задачи, как машинное обучение и искусственный интеллект (ИИ), транскодирование видео, обработка графики и рендеринг видео, организация виртуальных рабочих мест, научное моделирование и CUDA-вычисления. В облаке появились конфигурации с видеокартами А5000, А2000, А30 и A2. Ускоритель A2000 — это энергоэффективный GPU для компактных рабочих станций: он подойдёт для ИИ, графики и рендеринга видео. Пропускная способность памяти достигает 288 Гбайт/с. В свою очередь, A5000 — универсальный GPU, который подходит для любых задач в рамках своей производительности. Пропускная способность памяти составляет до 768 Гбайт/с, поддерживается vGPU. Модель A30 подходит для ИИ-инференса, мейнстрим-вычислений, обработки языка, разговорного искусственного интеллекта, рекомендательных систем. Поддерживает vGPU, до четырёх изолированных GPU-инстансов (Multi-Instance GPU), а пропускная способность памяти достигает 933 Гбайт/с. Модель A2 — GPU начального уровня, который подходит для простого инференса, видео и графики, периферийных вычислений (ИИ, обработка видео), мобильного облачного гейминга. Среди преимуществ облачных серверов названы: оплата по факту потребления, совместимость с различными фреймворками (TensorFlow, PyTorch, Keras, MXNet, Caffe) и со всеми типами нейросетей (GAN, CNN, RNN, SSNN и пр.), простота масштабирования. Рассчитать стоимость облачного инстанса с нужным типом ускорителя можно на соответствующей странице. В случае выделенных серверов теперь доступны сборки с ускорителями А2, A2000, A4000, A5000 и A100. Версия A4000 предлагает 16 Гбайт памяти GDDR6, 6144 ядра CUDA и 192 тензорных ядра. Акселератор A100 (40 Гбайт) обладает максимальной производительностью для ИИ, HPC и обработки данных. Модель подходит для глубокого обучения, научных исследований и аналитики данных. Говорится, что при выборе ускорителей Selectel уделяла внимание количеству ядер CUDA, тензорных ядер, а также ядер для трассировки лучей. Кроме того, учитывались объём и пропускная способность памяти, поддержка виртуальных GPU VDI. Изучить и заказать выделенные серверы с GPU можно здесь.
11.05.2022 [01:34], Алексей Степин
Представлены серверные ускорители Arctic Sound-M на базе архитектуры Intel XeНа мероприятии Intel Vision компания Intel представила серверные ускорители на базе архитектуры Xe под кодовым названием Arctic Sound-M (ATS-M). Это довольно универсальные GPU, которые подходят для облачных игровых платформ, поставщиков медиаконтента, виртуальных рабочих мест, инференс-систем и видеоаналитики. Ускорители оптимизированы для обеспечения низкой совокупной стоимости владения (TCO). Ждать появления новинок на рынке можно уже в III квартале 2022 года. На момент анонса в новой серии представлено два ускорителя: полноразмерный вариант с 32 ядрами Xe и теплопакетом 150 Вт и компактный низкопрофильный, несущий на борту 16 ядер Xe, зато с теплопакетом всего 75 Вт. Обе карты имеют интерфейс PCIe 4.0 x16. Каждый из вариантов имеет на борту по четыре фирменных видеодвижка Xe, впервые в индустрии поддерживающих аппаратное кодирование видеопотока в формат AV1. Дополнительно новые ускорители имеют блоки ускорения трассировки лучей и блоки матричных вычислений Intel XMX. В качестве набортной памяти используется GDDR6. Один ускоритель ATS-M может следующее:
Отдельного упоминания заслуживает аппаратный AV1-кодер — новый стандарт при сохранении уровня качества изображения позволяет почти на треть снизить битрейт по сравнению с H.264, а значит, либо снизить требования к ширине канала, либо уместить в нём больше видеопотоков. При этом Intel ориентируется на открытые стандарты. В рамках проекта oneAPI/oneVPL будут поддерживаться все современные форматы сжатия видео (AV1, AVC, HEVC и VP9) и популярные фреймворки FFmpeg и GStreamer. Есть и open source наборы Open Visual Cloud. Что касается организации виртуальных рабочих сред (VDI/DaaS), то и здесь ATS-M предлагает гибкое управление распределением ресурсов между множеством vGPU, причём с высоким уровнем гранулярности. Компания также отдельно отмечает, что использование аппаратных возможностей SR-IOV бесплатно и не требует дополнительного лицензирование — этот камень, похоже, направлен в огород NVIDIA. ![]() Для инференс-систем новые ускорители тоже подходят, в особенности для ИИ-видеоаналитки, поскольку благодаря новым видеодвижкам узким местом стадия обработки входящего видеопотока не станет. Для работы с ускорителем Intel предлагает наборы openVINO и oneDNN, совместимые с TensorFlow и PyTorch.
25.04.2022 [15:47], Владимир Мироненко
Провайдер «КРОК Облачные сервисы» анонсировал новые инстансы с ускорителями NVIDIAОблачный провайдер «КРОК Облачные сервисы» (подразделение КРОК), объявил о пополнении своего портфолио решениями на базе ускорителей NVIDIA, в том числе A100. Провайдер ожидает, что на фоне трудностей с поставками оборудования использование современных ускорителей в облаке будет актуально для очень широкого круга заказчиков. «КРОК Облачные сервисы» будет предлагать новые инстансы с помесячной оплатой. Новые инстансы помогут заказчикам быстрее выполнять анализ данных, прогнозировать спрос, оптимизировать логистику и другие производственные и бизнес-задачи без приобретения дорогостоящего оборудования. Предполагается, что новинки заинтересуют компании, которые используют системы на базе машинного обучения и ИИ, которые становятся всё более популярными среди банков и ретейлеров. Пригодятся они и для видеоаналитики. ![]() Источник изображения: КРОК Другой важный сегмент — работа с 3D-графикой и проектирование в AutoCad, AutoDesk и других подобных приложений. Эти решения становятся всё более востребованными в промышленности, особенно в добывающей отрасли и машиностроении, так как без них фактически уже нельзя добиться высокой скорости и качества конструкторской и изыскательской работы. И для их работы также требуются современные GPU.
07.04.2022 [22:54], Алексей Степин
Fungible анонсировала платформу FGC, объединяющую DPU и GPUDPU Fungible уже успели отметиться рекордами в области СХД — система смогла «выжать» 10 млн IOPS с использованием NVMe/TCP. Но сопроцессоры Fungible универсальны и, как считают разработчики, их сфера применения не должна ограничиваться системами хранения данных (СХД), так что на днях компания анонсировала новое решение под названием Fungible GPU-Connect (FGC). GPU-Connect объединяет DPU и пул графических или вычислительных ускорителей, ресурсы которого можно гибко конфигурировать и предоставлять для использования удалёнными пользователями. Физически Fungible GPU-Connect представляет собой 4U-шасси FX-108, в котором есть одного до четырёх DPU Fungible FC200 (это старшая модель) и до восьми ускорителей. ![]() Изображение: StorageReview Формально ограничений на тип ускорителей нет, но на данный момент Fungible сертифицировала только решения NVIDIA: A2, A10, A16, A30, A40, A100 (40 и 80 Гбайт). Для плат с разъёмом NVLink поддерживается установка соответствующих мостиков. Такой сервер позволяет вывести дезагрегацию на новый уровень, сгруппировав все мощные ускорители в одной стойке и предоставляя их по необходимости пользователям. Между конечными хостами (тоже с FC200) и FGC формируются виртуальные PCIe-каналы, которые фактически 100GbE-фабрики. С точки зрения пользователей, такое подключение ничем не отличается от локально установленного в систему GPU-ускорителя. Шасси FGC также имеет 24 корзины для накопителей. Вся система функционирует под управлением фирменного ПО Fungible Composer. Новая система Fungible GPU-Connect нацелена, в первую очередь, на рынок машинного обучения, но с учётом тенденций к дезагрегации аппаратных ресурсов и размещению их в компактных пулах, её можно считать универсальной. Любопытно, что Fungible решила сертифицировать свои решения с NVIDIA, у которой уже есть собственные DPU. Два других стартапа, занимающихся дезагрегацией ресурсов — Liqid и GigaIO — используют для связи физические подключения PCIe.
24.03.2022 [14:41], Сергей Карасёв
Серверы ASUS теперь могут комплектоваться ускорителями AMD Instinct MI210Компания ASUS сообщила о том, что её серверы отныне могут комплектоваться новейшим ускорителем AMD Instinct MI210, дебютировавшим на этой неделе. Такие системы могут применяться для ИИ-приложений, виртуализации, рендеринга материалов высокого качества и других ресурсоёмких задач. В частности, установка акселераторов Instinct MI210 доступна для серверов ASUS ESC8000A-E11 и ESC4000A-E11, выполненных в формате 4U и 2U соответственно. Первая модель рассчитана на два процессора AMD EPYC третьего поколения в исполнении Socket SP3 (LGA 4094), вторая — на один. ![]() Источник изображений: ASUS Сервер ESC8000A-E11 может быть оборудован восемью ускорителями. Доступны 32 слота для модулей оперативной памяти DDR4-3200 суммарным объёмом до 8 Тбайт. Поддерживается монтаж восьми накопителей LFF или SFF, а также двух твердотельных модулей M.2. ![]() Вариант ESC4000A-E11 рассчитан на четыре акселератора. Объём оперативной памяти DDR4-3200 может составлять до 2 Тбайт (восемь разъёмов). Могут быть задействованы восемь накопителей LFF или SFF и один модуль M.2. Серверы наделены воздушным охлаждением.
16.12.2021 [17:00], Владимир Агапов
Решаем проблему удалённой работы в ресурсоёмких приложениях с помощью MoonlightМассовый (и часто вынужденный) перевод проектов на «удалёнку», организация распределённых команд и продуктивной работы из любой точки мира — болезненная задача для всех использующих производительное оборудование и ресурсоёмкий софт. Домой их по ряду причин не перенесёшь, а вот организовать качественный удалённый доступ из любого места без лишних затрат всё-таки можно. Рассказываем о первом проверенном нами способе комфортной «удалёнки» практически с любого устройства. ![]() Изображения: Hostkey В чём проблема, док?Рядовому сотруднику достаточно подключения к удалённому рабочему столу по протоколу RDP или доступа к корпоративным ресурсам с собственного ноутбука, и здесь у айтишников возникают только сложности с обеспечением безопасности. Если специалисту нужны использующие 3D-ускорение ресурсоёмкие приложения, это проблема совершенно другого уровня. Информационное моделирование зданий (BIM), разные виды проектирования (CAD, CAM и т. д.), геологическое моделирование, связанные с рендерингом задачи, работа с нейросетями и даже создание приложений — серьёзные расчеты невозможны без графических процессоров, а для доступа к производительной рабочей станции или серверу обычного Remote Desktop зачастую не хватает. Установить оборудование на дому, как правило, невозможно: слишком много препятствий, вроде отсутствия в помещении необходимой инженерной инфраструктуры или недостаточно высокой пропускной способности каналов передачи данных (информация для обработки обычно хранится внутри корпоративной инфраструктуры). При этом в офисах под такие задачи часто используют рабочие станции с игровыми картами NVIDIA, что не позволяет задействовать для «удалёнки» популярные корпоративные решения. Недостатки коммерческих решенийЗадача обеспечить работу из дома на производительной станции обычно решается с помощью специальных продуктов (Citrix, Horizon) и аппаратных средств, вроде карт и ПО Teradici. Такие варианты подходят далеко не всем по причине:
Как мы уже говорили, в офисах более популярны машины с игровыми картами NVIDIA. Ориентируясь на них, мы проверили более удобный и доступный вариант. О нём и расскажем. Бесплатная альтернативаСвязанные с удалённым использованием графического процессора задачи решает Moonlight. Этот бесплатный программный продукт с открытым исходным кодом использует протокол NVIDIA GameStream. Он связывает сервер и клиентское устройство и обеспечивает мгновенное удалённое взаимодействие сотрудников с офисными настольными компьютерами и рабочими станциями из любого места. Попробовать Moonlight для удалённой работы стоит, если вы заняты:
Два основных достоинства Moonlight:
Другие преимущества Moonlight:
Особенности установки MoonlightПодробно процесс инсталляции описан в репозитории разработчика на GitHub, а мы остановимся на его ключевых и неочевидных моментах. Чтобы развернуть ПО, нужно пройти несколько больших этапов на клиенте (локальном устройстве пользователя) и сервере или рабочей станции (хосте). Но для начала стоит разобраться с архитектурой Moonlight: Теперь обратим внимание на важные моментыПервый: на хосте обязательно должны быть установлены видеокарта NVIDIA с поддержкой панели управления NVIDIA (начиная с GeForce GTX 650 и старше), Moonlight Internet Hosting Tool и приложение панели управления NVIDIA. На клиентском устройстве нужно только приложение Moonlight. Второй момент: в панели следует настроить работу NVIDIA Shield. Для этого достаточно перейти в параметры приложения, выставить переключатель в положение «включено» (зеленый) и добавить путь к утилите mstsc.exe: «C:windowssystem32mstsc.exe». Эта настройка предоставляет удалённый доступ к рабочему столу через Moonlight. При первом подключении к серверу необходимо ввести пароль для панели управления NVIDIA (он высветится в клиенте Moonlight). Пароль будет запомнен для IP-адреса сервера. Moonlight использует следующие порты:
Третий момент: для удаленного управления сервером не следует использовать протокол RDP, так как он не позволяет настраивать NVIDIA Shield. Для доступа к рабочему столу вам потребуется другой клиент: Стабильность и комфорт работы с Moonlight зависит от качества интернет-соединения. Разработчики рекомендуют использовать программу при скорости исходящего потока от клиентского устройства пользователя к серверу не менее 5 Мбит/с. Обычно для этого клиенту требуется кабельное подключение к Интернету. При этом на рекомендуемой скорости, как показали тесты, стабильное изображение можно получить только в разрешении 800 × 600. А на модеме с DOCSIS/DSL 6M удалось увидеть нормальную картинку в 3D с разрешением 1024 × 768. На практике выяснилось, что для HD и 4К нужно Интернет-подключение со скоростью не ниже 100 Мбит/с и аналогичное же подключение со стороны сервера/рабочей станции. Moonlight позволяет проводить гибкую настройку качества передачи изображения с хоста на локальное устройство пользователя: Четвёртый важный момент: по умолчанию битрейт устанавливается в зависимости от скорости интернет-соединения. Чем оно лучше, тем выше качество изображения и меньше задержка. Для выбора необходимого битрейта можно использовать следующую таблицу:
И пятый: на качество работы с Moonlight также влияет задержка самого интернет-соединения. Она может определяться расстоянием между сервером и клиентом, топологией сети, уровнем загрузки каналов, сбоями в работе оборудования и иными причинами. В процессе нашего тестирования задержка не превышала 80 мс, что соответствует необходимому для комфортного гейминга и работы с ресурсоемким ПО показателю. Для корректной работы Moonlight на сервере к GPU должен быть подключен монитор или вставлена HDMI/DisplayPort-заглушка, иначе разрешение не поднимется выше базовых 800 × 600. Проверили на практике: примеры работы MoonlightДля иллюстрации работы программного обеспечения мы провели несколько тестов:
Мы решили воспроизвести рабочую ситуацию и в офисе HOSTKEY запустили тесты на машине со следующими характеристиками:
При запуске Moonlight на клиенте была получена стабильная трансляция с разрешением 3840 × 2160 и 60 FPS при битрейте в 80 Мбит/с. Отклик приложений был плавным и практически не отличался от управления непосредственно на том устройстве, на котором установлено программное обеспечение. Здесь можно посмотреть записи трансляций: Итак, проблема дистанционной работы с ресурсоёмкими приложениями оказалась решаемой, причём Moonlight — это далеко не единственный способ обеспечить себе комфортный рабочий процесс вдали от офиса. В следующих постах мы расскажем о других вариантах полноценного удалённого доступа к ПО и оборудованию для рендеринга, проектирования и обучения нейросетей. Изучите подробную инструкцию по использованию Moonlight на серверах HOSTKEY и арендуйте готовый GPU-сервер с моментальным развёртыванием или сервер индивидуальной конфигурации с профессиональными картами NVIDIA RTX 4000/5000/A6000. Эти решения идеальны для удалённого доступа к высоконагруженным приложениям из любой точки мира. |
|