Новый GPU-сервер ASUS ESC4000A-E10 поддерживает ускорители NVIDIA A100

 
На правах рекламы

Гетерогенные вычисления применяются в современном мире очень активно несмотря на то, что программировать такие системы достаточно сложно. Не столь давно NVIDIA представила новую архитектуру Ampere и ускорители A100 на её основе.

Компания ASUS одной из первых освоила новинку и уже предлагает новый сервер высокопроизводительных вычислений ESC4000A-E10, изначально рассчитанный на использование именно NVIDIA A100. Эта HPC-система подходит для широкого круга задач, от виртуализации до комплексов машинного интеллекта.

Сервер ESC4000A-E10 выполнен в стоечном корпусе высотой 2U, центральную часть занимает узкая системная плата с одним процессорным разъёмом AMD SP3, окружённым восемью слотами DDR4 DIMM (до 2 Тбайт на систему). Ускорители в форм-факторе PCI Express устанавливаются с обеих сторон платы с помощью райзеров. Их количество может быть различным: в случае с полноразмерными A100 поддерживается установка четырёх плат, но однослотовых плат расширения можно установить целых восемь.

Для наиболее полного раскрытия потенциала новой системы ASUS взяла за основу для ESC4000A-E10 процессоры AMD EPYC второго поколения, благо в этой серии имеются и модели с 64 ядрами, например, EPYC 7702P, 7742 или 7H12. Поддерживаются все теплопакеты до 280 Ватт включительно. Столь мощный процессор и набор ускорителей A100 вкупе могут выделять около 1300 Ватт тепла (280+250×4), что требует мощной системы охлаждения. За продувку ESC4000A-E10 отвечает семь высокопроизводительных вентиляторов, все они установлены в специальных корзинах и могут заменяться «на горячую», что упрощает обслуживание системы и снижает время её простоя.

Также в ESC4000A-E10 предусмотрены отдельные слоты PCIe x8, они служат для установки контроллера RAID или высокоскоростного сетевого адаптера в форм-факторе OCP 3.0. Изначально сетевые возможности ESC4000A-E10 достаточно скромны и представлены двумя портами Gigabit Ethernet и выделенным портом Ethernet для удалённого управления. За последнее отвечает популярный базовый контроллер Aspeed AST2500, имеющий также отдельный VGA-выход для локальной настройки сервера. За счёт фирменного модуля KVM-over-IP ASMB9-iKVM и программного обеспечения ASUS Control Center сервер очень удобен в настройке и эксплуатации.

В общей сложности ESC4000A-E10 располагает 11 слотами PCI Express 4.0, что делает его весьма гибким в конфигурировании и позволяет использовать наиболее скоростные на сегодняшний момент платы расширения, будь то вычислительные ускорители или сетевые адаптеры класса 200 или 400G без ущерба для производительности. В передней части сервера имеется восемь стандартных дисковых корзин «горячей замены», совместимых с накопителями формата 2,5″/3,5″, причём четыре из восьми мест могут занимать накопители с интерфейсом NVMe. За питание отвечает пара блоков «горячей замены» мощностью 1600 Ватт каждый. Они имеют сертификацию 80 Plus Platinum.

Почему тем, кто ищет новый вычислительный сервер, стоит обратить внимание именно на ASUS ESC4000A-E10? Во-первых, повторимся, из-за его универсальности, ведь он поддерживает не только ускорители A100, но может комплектоваться и платами Tesla T4 или графическими картами Quadro, причём конфигурация может быть и смешанной, в зависимости от задач, которые ставит заказчик. Имеется сертификация NGC-Ready, подтверждающая полноценную возможность запуска NGC-контейнеров на уровне «чистого железа» (bare metal).

Во-вторых, серверы ASUS славятся своей повышенной энергоэффективностью, и это подтверждено их рейтингом в тестах SPECpower. За счёт технологии Thermal Radar 2.0 управление системами охлаждения сервера выполняется более гибко, вентиляторы всегда работают на минимально достаточной скорости. Это может давать 36% экономию энергии, затрачиваемой на охлаждение в сравнении с менее интеллектуальными решениями.

Технология ASUS Power Balancer следит за энергопотреблением процессоров и управляет им в реальном времени, а для того, чтобы справляться с пиковыми нагрузками, ASUS внедрила технологию Performance Boost. Последняя использует несколько подходов одновременно, от автоматического удержания режима турбо на всех ядрах до тонкого тюнинга, позволяющего безопасно выйти за пределы формальных значений TDP. Иными словами, платформа полностью соответствует девизу компании «В поисках невероятного» — в ней реализованы все средства достижения максимальной производительности при минимально возможных энергозатратах. 

Среди упомянутых в анонсе задач, для которых подходит ESC4000A-E10, упомянута виртуализация — и вовсе не зря. Процессоры NVIDIA A100 интересны тем, что могут работать как в обычном режиме, так и разделяться на несколько (до семи) полностью изолированных и функционирующих независимо друг от друга блоков. Это даёт 28 разделов на полностью укомплектованную систему с четырьмя A100, а значит, она может полноценно обслужить столько же рабочих мест с графическим окружением и поддержкой 3D-ускорения.

Сам процессор A100 изначально создавался NVIDIA с прицелом на мир HPC. Архитектура Ampere вышла удачной настолько, что разработчики говорят о 40-кратном превосходстве над V100 в задачах обучения нейросетей. Поддерживаются все форматы вычислений, от INT4 до традиционного FP64, в последнем случае производительность достигает почти 10 Тфлопс, но при этом A100 благодаря использованию 7-нм техпроцесса имеет теплопакет всего 250 ватт против 400 у предшественника.

Производительность комплексов на базе A100 выше в версии с NVLink за счёт более эффективной системы межсоединений, но такие системы не обладают универсальностью ASUS ESC4000A-E10, в который можно устанавливать любые PCIe-совместимые ускорители. Потери невелики, сама NVIDIA указывает на 90% эффективности от NVLink-варианта A100 в формате SXM4. Потеря не слишком большая и легко окупающаяся за счет универсальности платформы ESC4000A-E10.

Компания ASUS присутствует на рынке серверного оборудования давно и её решения успели завоевать ряд наград, как качественные, надёжные и при этом экономичные системы. Все эти преимущества унаследовал и созданный в рамках партнёрской программы NVIDIA сервер ASUS ESC4000A-E10, став системой компактной, экономичной и универсальной, но вместе с тем, весьма производительной и полностью отвечающей современной концепции высокопроизводительных вычислений.

Новые системы ASUS ESC4000A-E10 уже доступны для приобретения по всему миру, в том числе, и на территории Российской Федерации. Более подробную информацию, в том числе, о стоимости новинки, можно получить в региональном представительстве ASUS.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Постоянный URL: https://servernews.ru/1014591
Поделиться:  
Система Orphus