Материалы по тегу: компьютер

02.12.2021 [21:22], Алексей Степин

Суперкомпьютер NREL Kestrel получит неанонсированные ускорители NVIDIA A100NEXT

Заметная часть недавно анонсированных проектов HPC-систем c заявленной производительностью от десятков петафлопс базируется на использовании процессоров AMD EPYC и ускорителей Instinct, однако NREL остановила свой выбор на Intel Xeon Sapphire Rapids и грядущих ускорителях NVIDIA A100NEXT. Последние ещё не анонсированы, но и 44-Пфлопс машина под названием Kestrel должна вступить в строй лишь в 2023 году.

Вероятнее всего, новые ускорители будут представлены NVIDIA в следующем году, что неплохо согласуется с планами компании по выпуску новых решений каждые два года. К сожалению, точных технических данных, относящихся к NVIDIA A100NEXT пока нет. Можно лишь осторожно предположить, что следующая итерация ускорителей получит более тонкий техпроцесс 5-нм класса, и удвоит число вычислительных блоков благодаря переходу на чиплетную компоновку, например, из четырёх кристаллов по 25 млрд транзисторов.

Cуперкомпьютер Eagle. Фото: NREL

Cуперкомпьютер Eagle. Фото: NREL

Причины, по которым NREL решила использовать процессоры Sapphire Rapids не совсем ясны. И хотя это заведение исторически тяготело к CPU Intel — текущий суперкомпьютер Eagle производительностью 8 Пфлопс построен на базе Intel Xeon Skylake-SP и почти лишён ускорителей, — у NVIDIA будут собственные процессоры Grace, выход которых намечен на 2023 год. Возможно, такое решение принято, чтобы избежать проблем с поставками CPU NVIDIA. К тому же процессоры Intel поддерживают AVX-512, причём в Sapphire Rapids есть поддержка новых форматов (AVX-512 FP16) и расширения для матричных вычислений Intel AMX.

Основой же новой системы Kestrel станет платформа HPE Cray EX с интерконнектом HPE Slingshot и СХД Cray ClusterStor E1000 общей ёмкостью более 75 Пбайт. Что касается охлаждения, то Kestrel, как и его предшественники, будет использовать СЖО с «горячим» теплоносителем. Это позволит достигнуть высокой энергоэффективности — средний коэффициент PUE нового суперкомпьютера составит примерно 1,036. Для организации, занимающейся поиском эффективных и чистых источников энергии такой подход выглядит более чем обоснованно.

Постоянный URL: http://servernews.ru/1055055
25.11.2021 [13:56], Владимир Мироненко

Суперкомпьютер на полчаса — YellowDog развернула на двух континентах AWS-кластер с 3,2 млн vCPU

Британская компания YellowDog, разработчик решений для управления облачными рабочими нагрузками и ресурсами, объявила о создании распределённого суперкомпьютера на базе мощностей Amazon Web Services. По поручению биотехнологической компании OMass Therapeutics компания объединила 3,2 млн vCPU для анализа и проверки 337 млн соединений.

Для запуска использовались обычные и спотовые инстансы EC2 восьми различных конфигураций. В результате было выделено 3,2 млн vCPU с коэффициентом использования более 95 %. Все вычисления были распределены по нескольким облачным регионам в дата-центрах в Северной Америке и Европе. На развёртывание первых 1 млн vCPU ушло 7 мин., а отметка в 2 млн была достигнута через 11 мин. после старта.

AWS

AWS

«На этих этапах более 95 % vCPU обрабатывали данные с полной загрузкой. В течение 33 минут 3,2 млн vCPU трудились над нагрузкой, равномерно распределённой между EC2-группами», — сообщил Колин Бриджер (Colin Bridger), главный специалист YellowDog по HPC GTM. Это позволило OMass Therapeutics завершить анализ за семь часов, тогда как выполнение той же задачи на их собственном локальном суперкомпьютере заняло бы два месяца.

Постоянный URL: http://servernews.ru/1054498
18.11.2021 [14:33], Алексей Степин

Atos и CEA построили EXA1, самый мощный европейский суперкомпьютер для военных

Atos и военный отдел Комиссариата по атомной и альтернативным видам энергии (CEA/DAM) объявили о вводе в строй системы EXA1, первой очереди суперкомпьютера CEA-HF. В свежем рейтинге TOP500 она заняла 14 место, и это лучший результат среди всех новых европейских систем ноябрьского списка. Также это самый энергоэффективный в Европе суперкомпьютер с гомогенной архитектурой на процессорах общего назначения и самый крупный суперкомпьютер такого типа в мире.

Здесь и ниже изображения CEA/Atos

Здесь и ниже изображения CEA/Atos

Система класса EXA-1 по понятным причинам востребована военным отделом CEA, поскольку любые современные исследования в этой области требуют огромных объёмов вычислений при сохранении высокого уровня энергоэффективности. Atos и CEA/DAM сотрудничают с 2004 года и EXA1 — уже четвёртый суперкомпьютер, разработанный этим альянсом.

Кристалл сетевого сопроцессора BXI v2

Кристалл сетевого сопроцессора BXI v2

В основе EXA1 лежит платформа Atos BullSequana XH2000. Машина включает 12960 процессоров AMD EPYC 7763 (64C/128T, 2,45 ГГц). На данный момент система имеет производительность 23,2 пфлопс, потребляя при этом 4,96 МВт. EXA1 использует жидкостное охлаждение тёплой водой с фирменной технологией Atos Direct Liquid Cooling, благодаря чему его энергоэффективность (PUE) приближается к единице — это одна из самых эффективных систем такого класса на рынке.

Программная архитектура сетевой подсистемы Atos BullSequana XH2000

Интересной особенностью машины является фирменный интерконнект BXI (BullSequana eXascale Interconnect) второго поколения. Формально это не первая система с BXI V2 — летом в TOP500 попала «тренировочная» машина CEA-HFi, которая имеет те же узлы, что и EXA-1, но их примерно на порядок меньше. Однако именно EXA-1 показала зрелость данного решения.

BXI V2 имеет интерфейс PCIe 3.0 x16 и предлагает порты 100 Гбит/c, высокую скорость обмена сообщениями, низкие задержки, а также полную разгрузку CPU от обслуживания сетевой подсистемы, что увеличивает эффективность использования вычислительных ресурсов. Естественно, есть поддержка RDMA, NVMe-oF и виртуализации.

Постоянный URL: http://servernews.ru/1053975
18.11.2021 [00:33], Игорь Осколков

Французский суперкомпьютер Adastra с AMD EPYC Genoa и Instinct MI250X станет одним из самых мощных в Европе

Французские национальное агентство по высокопроизводительным вычислениям (GENCI) и Национальный вычислительный центр высшего образования (CINES), а также Национальный центр научных исследований (CNRS) объявили о постройке нового суперкомпьютера Adastra (от лат. «Через тернии к звёздам») и расширении возможностей самого производительного академического суперкомпьютера страны Jean Zay. В обоих случаях подрядчиком станет HPE.

Система Adastra производительностью 70 Пфлопс будет в 20 раз быстрее той, что сейчас имеется в распоряжении учёны и исследователей CINES — это машина Occigen мощностью 3,5 Пфлопс, впервые попавшая в TOP500 ещё в 2014 году. Основой же новой системы станет платформа HPE Cray EX, которая будет развёрнута в два этапа.

Весной 2022 года планируется получить первый блок, состоящий из гибридных узлов c «оптимизированными процессорами AMD EPYC 7003» (не уточняется, будут ли это Milan-X), 256 Гбайт DDR4 и четырьмя OAM-ускорителями Instinct MI250X. Постройка второго блока Adastra должна закончиться к концу следующего года. Он будет состоять из узлов с процессорами AMD EPYC Genoa и 768 Гбайт DDR5. Интерконнектом для всех узлов будет Slingshot 11 (200 Гбит/с): по четыре штуки для гибридных узлов (т.е. в соотношении 1:1 с ускорителями) и по одному для каждого узла второго блока.

Дополнит суперкомпьютер гибридная СХД Cray ClusterStor E1000 c ФС Lustre. Для «горячих» данных будет доступно all-flash хранилище ёмкостью 2 Пбайт с пропускной способностью 1,3 Тбайт/с, а для «холодных» — СХД с быстрыми HDD общей ёмкостью 25 Пбайт и скоростью обмена данными 250 Гбайт/с. Максимально устоявшееся потребление всего комплекса составит 1,59 МВт. Благодаря охлаждению горячей водой коэффициент PUE будет равен 1,10.

Суперкомпьютер Jean Zay (Фото: Cyril Fresillon/IDRIS/CNRS Photothèque)

Суперкомпьютер Jean Zay (Фото: Cyril Fresillon/IDRIS/CNRS Photothèque)

Adastra будет использоваться для научных исследований. В первую очередь в области возобновляемой энергетики, что должно помочь в снижении углеродного следа. Также он поможет в разработке материалов для аккумуляторных технологий следующего поколения, в создании новых лекарственных препаратов и в изучении новых методов лечения.

Суперкомпьютер Jean Zay (платформа HPE SGI 8600) с заявленной пиковой производительностью 28 Пфлопс (в TOP500 это не отражено) в начале 2022 года получит уже второй существенный апгрейд. Машину дополнят 52 узла HPE Apollo 6500 Gen10, каждый из которых содержит восемь ускорителей NVIDIA A100 (80 Гбайт). «Мусорное» тепло от кластера будет направлено в систему отопления Университета Париж-Сакле.

Постоянный URL: http://servernews.ru/1053977
16.11.2021 [03:33], Игорь Осколков

TOP500: уж ноябрь на дворе, а экзафлопса не видать

Последняя версия публичного рейтинга самых производительных в мире суперкомпьютеров TOP500 так и осталась без экзафлопсных машин. Китай не захотел включать в него две системы такого класса и пошёл обходным путём, номинировав работы своих учёных на премию Гордона Белла — в соответствующих научных работах даны неполные характеристики машин и показатели их производительности.

Поэтому лидером списка остаётся обновлённая японская система Fugaku, 7,6 млн ядер которой выдают 442 Пфлопс. И она всё ещё втрое быстрее своего ближайшего конкурента Summit. Первые результаты сборки Frontier в список попасть не успели. Всего в ноябрьском рейтинге есть порядка 70 новых систем, но, как и прежде, больше половины из них — однотипные системы Lenovo, массово устанавливаемые в Китае. На Китай вообще приходится более трети (34,6%) систем в списке. На втором месте находятся США (29,8%), а на третьем — Япония (6,4%).

По суммарной производительности Топ-3 тот же, но порядок иной: США (32,5%), Япония (20,7%), Китай (17,5%). В число лидеров также входят Германия, Франция, Нидерланды, Канада, Великобритания, Южная Корея и Россия. У РФ теперь есть сразу семь машин в списке с суммарной производительностью 73,715 Пфлопс. Для сравнения — Perlmutter (5 место) после апгрейда выдаёт 70,87 Пфлопс, а у Южной Кореи тоже есть семь машин, но с чуть более высокой суммарной производительностью в 82,177 Пфлопс.

Суперкомпьютер Chervonenkis (Фото: Яндекс)

Суперкомпьютер Chervonenkis (Фото: Яндекс)

К уже имевшимся в TOP500 российским системам MTS GROM (294 место), Lomonosov-2 (Ломоносов-2, 241 место) и Christofari (Кристофари, 72 место) добавились Christofari Neo (Кристофари Нео, 43 место), а также сразу три системы Яндекса: Ляпунов (Lyapunov, 40 место), Галушкин (Galushkin, 36 место) и Червоненкис (Chervonenkis, 19 место). Примечательно, что все российские системы этого года используют AMD EPYC Rome и NVIDIA A100, а также интерконнект Infininiband.

Машины для МТС и Сбера сделала сама NVIDIA (это всё DGX), а вот у Яндекса путь особый. Ляпунов (12,81 Пфлопс) создан китайским Национальным университетом оборонных технологий (National University of Defense Technology, NUDT) и Inspur на базе серверов NF5488A5 (AMD EPYC 7662@2 ГГц + A100 40 Гбайт). Червоненкис (21,53 Пфлопс) и Галушкин (16,02 Пфлопс) разработаны IPE, NVIDIA и Tyan. В этих системах используются EPYC 7702 (тоже 64-ядерные с базовой частотой 2 ГГц) и более новые A100 (80 Гбайт).

Среди прочих новых систем TOP500 особо выделяется Voyager-EUS2, которая замыкает Топ-10. Это ещё система на базе обновлённых инстансов Microsoft Azure ND A100 v4 с 80-Гбайт версией A100. Однако ещё одной облачной машиной уже никого не удивить, в отличие от совершенно неожиданного возврата японской PEZY, пропавшей с радаров после скандала 2017 года. Новая ZettaScaler3.0 занимает 453 место и базируется на AMD  EPYC 7702P и фирменных ускорителях PEZY-SC3.

Изображение: OGAWA, Tadashi (twitter.com/ogawa_tter)

Изображение: OGAWA, Tadashi (twitter.com/ogawa_tter)

В целом, последний год был удачным и для AMD, и для NVIDIA. Первая почти втрое нарастила число систем на базе EPYC — их теперь в списке 74 (или почти треть новых участников списка), если учитывать Naples/Hygon (таких систем 3). Если же смотреть более детально именно на CPU, то тут лидером всё равно остаётся Intel, хотя она и потеряла несколько процентных пунктов за последние полгода — всего 408 машин используют её процессоры. Правда, новейших Ice Lake-SP среди них всего 10, тогда как у EPYC Milan уже 17.

Без акселераторов обходятся 350 суперкомпьютеров списка, зато из 150 оставшихся 143 используют различные поколения ускорителей NVIDIA. Удивительно, но ни одной системы с ускорителями AMD Instinct в ноябрьском рейтинге нет. Остальные акселераторы представлены в единичном экземпляре. И это либо устаревшие системы, либо экзотика из Китая и Японии. Последняя в лице MN-3 всё ещё лидирует по энергоэффективности в Green500.

Систем с Infiniband в списке 178, с Ethernet — 242. Как обычно, по производительности систем лидирует именно IB — 44,5% против 22,4% у Ethernet. Это, к слову, несколько отличается от показателей HPC-индустрии в целом, где в количественном выражении у них практически равные доли. На Omni-Path пришлось 40 систем в TOP500, и столько же на проприетарные интерконнекты. Тут интересно разве что появление второй машины с Atos BXI V2.

Среди производителей по количеству машин лидируют Lenovo (180 шт., это в основном уже упомянутые типовые развёртывания в Китае), HPE (84 шт., сюда же входит наследие Cray и SGI) и Inspur (50 шт.). По производительности картина иная, в Топ-3 входят HPE, Fujitsu (во многом благодаря Fugaku) и Lenovo. По HPC-рынку в целом, согласно данным Hyperion Research, в денежном выражении тройка лидеров включает HPE, Dell и Fujitsu (да, опять «виноват» Fugaku).

Постоянный URL: http://servernews.ru/1053797
12.11.2021 [18:26], Сергей Карасёв

SambaNova Systems создаст самый мощный в Европе ИИ-суперкомпьютер

Венгерская группа OTP Group, работающая в сферах финансового, страхового, инвестиционного и банковского бизнеса, заключила соглашение с компанией SambaNova Systems. Последняя, по условиям договора, займётся созданием самого высокопроизводительного в Европе суперкомпьютера для ИИ-вычислений. Флагманским продуктом компании является Dataflow-as-a-Service (DaaS), расширяемая платформа ИИ-сервисов по подписке.

Соглашение между OTP Group и SambaNova Systems имеет многолетний характер. Стороны намерены сообща развернуть платформу высокопроизводительных вычислений с использованием Dataflow-as-a-Service для работы GPT-моделями. Кроме того, мощности суперкомпьютера будут доступны публичному сектору, частным предприятиям и высшим учебным заведениям в рамках сотрудничества с Министерством инноваций и технологий Венгрии.

Источник изображения: pixabay.com / geralt

Источник изображения: pixabay.com / geralt

Показатели быстродействия будущего суперкомпьютера пока не раскрываются. Но отмечается, что он сможет обрабатывать огромные массивы текстовой информации и данных за короткое время. Система, в частности, позволит предоставлять более персонализированные финансовые сервисы на базе ИИ миллионам клиентов OTP Group.

Постоянный URL: http://servernews.ru/1053614
12.11.2021 [17:00], Владимир Мироненко

NVIDIA построит ИИ-суперкомпьютер Earth-2 для моделирования изменений климата на цифровом двойнике Земли

Глава NVIDIA Дженсен Хуанг (Jensen Huang) объявил о планах по созданию цифрового двойника Земли с помощью платформы Omniverse. Компания строит суперкомпьютер Earth-2 (Земля-2). Он станет аналогом Cambridge-1, самого мощного в мире ИИ-суперкомпьютера для медицинских исследований, но только в сфере моделирования изменения климата.

На Earth-2 будет работать фреймворк Modulus AI, позволяющий создавать ИИ-модели для симуляции различных физических процессов. Благодаря замене традиционных итеративных расчётов на ИИ-модели итоговая производительность системы повышается на порядки.

По словам Хуанга, ещё недавно такое было попросту невозможно. И лучшего и наиболее важного применения технологий NVIDIA не найти — чтобы разработать долгосрочные стратегии смягчения последствий деятельности человека и адаптации к новым условиям, необходимы модели, которые могут предсказывать климат в различных регионах земного шара на десятилетия вперёд.

Источник изображений: NVIDIA

Источник изображений: NVIDIA

В отличие от прогнозирования погоды, которое в первую очередь моделирует физику атмосферы, климатические модели представляют собой рассчитанные на длительный период симуляции, которые моделируют физику, химию и биологию атмосферы, воды, льда, земли и деятельности человека.

Климатические симуляции сегодня настраиваются с разрешением от 10 до 100 км. Но для моделирования изменений в глобальном круговороте воды — движения воды из океана, морского льда, поверхности суши и грунтовых вод через атмосферу и облака — необходимо гораздо более высокое разрешение. Изменения в этой системе приводят к усилению и штормов, и засух.

Для моделирования облаков, отражающих солнечный свет обратно в космос, уже необходимо разрешение метрового порядка. По оценкам учёных, при традиционном подходе для такой точности расчётов нужно от миллионов до миллиардов раз больше вычислительных мощностей, чем доступно сегодня. При нынешнем темпе прироста производительности (10x каждые 5 лет) на это уйдут десятилетия.

По словам Хуанга, у человечества впервые в истории появляется технология для точного моделирования климата со сверхвысоким разрешением и быстрого прогнозирования экстремальных погодных условиях на десятилетия вперёд. Страны, города и посёлки смогут получать ранние предупреждения для адаптации и повышения устойчивости инфраструктуры.

Постоянный URL: http://servernews.ru/1053603
11.11.2021 [16:32], Руслан Авдеев

Норвежская НКО Sigma2 построит суперкомпьютеры и облачные хранилища в подземном дата-центре Lefdal Mine

Некоммерческая организация Sigma2 AS, управляющая всей инфраструктурой высокопроизводительных вычислений Норвегии, заявила о намерении строить все будущие суперкомпьютеры в дата-центре у города Молёй (Måløy). Строительство будет проводиться на площадке Lefdal Mine Datacenter, открытой в 2017 году в бывшей шахте.

Sigma2 владеет национальными суперкомпьютерами и облачными хранилищами страны и сотрудничает с университетами Осло, Тромсё, Бергена и Норвежским национально-техническим университетом (NTNU). Однако национальная HPC-инфраструктура продолжает расти, и в университетах уже не хватает места для масштабных вычислительных проектов.

Источник изображения: lefdalmine.com

Источник изображения: lefdalmine.com

За право выступить базой для строительства новых суперкомпьютеров конкурировали семь дата-центров, но Lefdal получил тендер благодаря наилучшим социальным, экологическим и техническим показателям и, конечно, стоимости реализации. Lefdal даже пришлось привлечь от сторонних инвесторов порядка $58 млн для увеличения мощности — сейчас в наличии есть только 20 МВт.

В первой половине 2022 года начнёт строиться национальная система NIRD (National Infrastructure for Research Data). Ожидается, что первый суперкомпьютер будет установлен в дата-центре в 2023 году. Sigma2 станет крупнейшим партнёром центра, хотя у оператора местной площадки имеются и другие крупные клиенты, включая криптомайнинговые компании. В прошлом году мажоритарный пакет акций дата-центра приобрёл фонд Columbia Threadneedle European Sustainable Infrastructure Fund (ESIF).

Постоянный URL: http://servernews.ru/1053512
11.11.2021 [13:30], Сергей Карасёв

«Сбер» запустил самый мощный в России суперкомпьютер Christofari Neo производительностью 12 Пфлопс

SberCloud, российский облачный провайдер, представил новый комплекс высокопроизводительных вычислений — систему под названием Christofari Neo (Кристофари Нео). Ожидается, что суперкомпьютер позволит «Сберу» вывести скорость обучения моделей на новый уровень. С 1 декабря система будет доступна и пользователям ML Space.

В основу нового вычислительного комплекса положены системы NVIDIA DGX A100 на базе 80-Гбайт версии ускорителя, объединённые интерконнектом InfiniBand HDR (200 Гбайт/с) и дополненные СХД со скоростью 2 Тбайт/с. Суммарное количество ускорителей превышает 700. Заявленная производительность достигает 11,95 Пфлопс. Для сравнения: быстродействие системы первого поколения — Christofari — составляет около 6,67 Пфлопс. Этот вычислительный комплекс оперирует более чем 1000 ускорителей Tesla v100.

Источник: SberCloud

Источник: SberCloud

«Текущие и новые клиенты SberCloud получат доступ к мощностям сразу двух суперкомпьютеров. Важно, что осталось неизменным — это лёгкость в использовании нового суперкомпьютера, потому что Christofari Neo работает в тесной интеграции с платформой ML Space и Christofari. Это значит, что клиенты получат доступ к нужной мощности так же быстро и просто, как прежде», — заявляет SberCloud. Применять Christofari Neo планируется для решения сложных задач, связанных с обучением современных ИИ-моделей. Доступ к суперкомпьютеру уже получили SberDevices и Sber AI.

Постоянный URL: http://servernews.ru/1053494
05.11.2021 [14:29], Сергей Карасёв

В Великобритании заработал 1,8-Пфлопс суперкомпьютер Sulis

Уорикский университет в Ковентри (графство Уэст-Мидлендс, Великобритания) получил новый комплекс высокопроизводительных вычислений. Суперкомпьютер получил имя Sulis в честь кельтской богини, целительницы и покровительницы священных вод. Пиковая производительность системы достигает 1,8 Пфлопс.

В состав комплекса включены 167 узлов Dell PowerEdge R6525, каждый из которых оборудован двумя процессорами AMD Epyc 7742 и 512 Гбайт оперативной памяти DDR4. Плюс к этому задействованы 30 узлов Dell PowerEdge R7525 с акселераторами NVIDIA A100 (40 Гбайт). Суперкомпьютер использует интерконнект Mellanox Infiniband HDR100.

Источник изображений: University of Warwick

Источник изображений: University of Warwick

Применено хранилище IBM Spectrum Scale вместимостью 2 Пбайт: из них 200 Тбайт приходится на твердотельные накопители и 1,8 Пбайт — на жёсткие диски Система размещена в новом энергетически эффективном центре обработки данных на территории Уорикского университета. Коэффициент PUE составляет 1,12. Создание системы обошлось в £3 млн.

Комплекс Sulis спроектирован с прицелом на высокий уровень параллелизма. Ему предстоит решать задачи, связанные с обработкой относительно небольших индивидуальных нагрузок, которые повторяются многие тысячи раз с различными входными данными. В этом случае важнее скорость обмена данными, а не только «голая» производительность. Это первая система подобного класса в Великобритании.

Постоянный URL: http://servernews.ru/1053015
Система Orphus