Материалы по тегу: ids

12.05.2022 [15:46], Владимир Мироненко

На заре двух экзафлопс: в Аргоннской национальной лаборатории начали монтаж суперкомпьютера Aurora

Рик Стивенс (Rick Stevens), заместитель директора Аргоннской национальной лаборатории (ANL), сообщил на прошедшей на этой неделе в Далласе (штат Техас) конференции Intel Vision 2022 о старте монтажа суперкомпьютера Aurora, который после окончательно ввода в эксплуатацию будет иметь пиковую производительность более 2 Эфлопс. Aurora объединит более 10 000 блейд-серверов с СЖО в составе платформы HPE Cray EX (Shasta).

Каждый узел будет оснащён двумя процессорам Intel Xeon Sapphire Rapids с HBM-памятью и шестью ускорителями Intel Xe Ponte Vecchio. Узлы объединит интерконнект Cray Slingshot. Специалисты лаборатории уже развернули хранилище Intel DAOS, узлы управления и инфраструктуру охлаждения, а также внедрили тестовые кластеры для отладки и проверки совместимости ПО с новыми процессорами и ускорителями. Лаборатория будет использовать Intel oneAPI в качестве новой, единой модели разработки ПО. Стивенс пояснил, что унификация позволит использовать одну кодовую базу для всех вычислительных блоков любого типа.

 Изображение: Intel

Изображение: Intel

Стивенс также объявил, что Аргоннская национальная лаборатория начала приём заказов на выполнение вычислений на суперкомпьютере для научных проектов. «Вы можете сделать заказ на экономические и промышленные исследования, если вы заинтересованы в совершении прорывов в науке и технике, — заявил учёный. — Мы принимаем заказы, настраиваем учётные записи разработчиков и привлекаем команды на ранних системах для создания программного обеспечения, чтобы, в первый день, когда Aurora заработает, у нас уже были запущены приложения».

 Фото: ALCF

Фото: ALCF

Aurora — одна из трёх экзафлопсных систем, призванных обеспечить лидерство США в области суперкомпьютеров. С момента анонса в 2015 году проект претерпел ряд кардинальных изменений. В частности, его пиковую производительность повысили до двух Эфлопс, а запуск в итоге перенесли на 2022 год. Две другие американские эксафлопсные системы, находящиеся в разработке — Frontier (1,5 Эфлопс, Национальная лаборатория Оук-Ридж, 2022 год) и El Capitan (2+ Эфлопс, Ливерморская национальная лаборатория им. Э. Лоуренса, 2023 год). Впрочем, в экзафлопсной гонке, похоже, лидирует пока Китай.

Постоянный URL: http://servernews.ru/1065786
11.05.2022 [19:05], Алексей Степин

Фото дня: чипы Intel Xeon Sapphire Rapids с HBM-памятью

Корпорация Intel продолжает активно готовить к выпуску новую серверную платформу Sapphire Rapids, и на мероприятии Intel Vision новые процессоры демонстрируются во всех видах, включая корпуса со снятой теплораспределительной крышкой и даже кремниевые пластины с кристаллами. Ресурс ServeTheHome сделал несколько фото новинок.

В четвёртом поколении Xeon Scalable компания Intel, всегда отдававшая предпочтение монолитным дизайнам своих процессоров, наконец, перешла на чиплетную компоновку. Sapphire Rapids получит четыре таких чиплета, соединённых посредством интерфейса EMIB и фабрики Multi-Die Fabric IO.

Изображение: ServeTheHome

Компания показала прототипы Sapphire Rapids, оснащённые сборками памяти HBM2e. Этот вариант отличается иным корпусом с характерными выступами. Такие процессоры составят основу суперкомпьютера Aurora. Назначение маленького кристалла, расположенного на правом текстолитовом выступе не уточняется. Он присутствует и в обычной версии Sapphire Rapids, но расположен иначе. Более подробно ознакомиться с новинками можно на ServeTheHome, где представлены фото обычной и HBM-версии новинок.

Постоянный URL: http://servernews.ru/1065718
29.03.2022 [12:48], Сергей Карасёв

Intel представила чипсет C741 для систем на процессорах Xeon Sapphire Rapids

Корпорация Intel анонсировала микросхему системной логики C741 с кодовым именем Emmitsburg для будущих серверных процессоров Sapphire Rapids. Этот чипсет приходит на смену решениям Lewisburg (Skylake-SP и Cascade Lake-SP) и Lewisburg Refresh (Cooper Lake-SP и Ice Lake-SP). Чипсеты пока что всё ещё необходимы для работы процессоров Intel Xeon, хотя компания вслед за AMD и Arm постепенно снижает зависимость от них.

Чипсет обеспечивает поддержку 20 линий PCIe 3.0, 14 портов USB (из них десять — USB 3.0) и до 20 портов SATA-3. Упомянута поддержка LAN и HD Audio, а также фирменных технологий VT-d, RSTe, Node Manger и TXT. Показатель TDP составляет 11 Вт. Размеры изделия — 22 × 23 мм. Дополнительную информацию о наборе логики Intel C741 можно найти на этой странице Рекомендованная цена составляет $61.

Примечательно, что чипсет полностью лишился функциональности Intel QuickAssist (QAT), отдельного движка для ускорения операций (де-)шифрования и (де-)компрессии на лету. В Intel Xeon Ice Lake-SP набор AVX-512 пополнился инструкциями как раз для таких операций, а семейство чипсетов сократилось и вовсе до 3 шт. Со времён первых Intel Xeon Scalable (Skylake-SP) чипсеты также лишились встроенных 40GbE-интерфейсов.

Постоянный URL: http://servernews.ru/1062962
02.03.2022 [21:48], Алексей Степин

Intel Xeon Sapphire Rapids получили средства аппаратной самодиагностики «кремния»

Внезапный сбой серверного процессора может доставить немало неприятностей, даже если он в системе не один и останавливать машину не придётся. И хотя часто сбои связаны с проблемами с памятью, сбоить может и определённая часть самого процессора, например, кеш или иные блоки. Такие ошибки сложно предсказать и выявить заранее, но в Intel Xeon Sapphire Rapids появился механизм для их детектирования.

Когда речь идёт о новых Xeon на базе данной архитектуры, обычно приводится масса технических данных, но вот о наличии блока детектора аппаратных сбоев в «кремнии» Sapphire Rapids стало известно впервые. Технология носит название In-Field Scan (IFS) и её существование было раскрыто с появлением открытого драйвера IFS для Linux, на что обратил внимание Phoronix. Сам драйвер в настоящее время находится на рассмотрении и содержит примерно 1,5 тысячи строк кода.

 Вычислительный узел суперкомпьютера Crossroads с двумя Xeon Sapphire Rapids

Вычислительный узел суперкомпьютера Crossroads с двумя Xeon Sapphire Rapids

Технология IFS подразумевает возможность поядерной проверки процессора на работоспособность и полнофункциональность «кремния». Она, как заявляет Intel, способна выявлять аппаратные проблемы, не обнаруженные стандартными методами вроде контроля чётности или ECC.

Как именно работает IFS, пока не говорится, т.к. драйвер лишь обеспечивает поддержку со стороны программной инфраструктуры (ОС и гипервизоров) — в Linux он попросту предоставляет интерфейсы sysfs. Тесты будут подгружаться процессором примерно так же, как и микрокоды. Бинарные файлы тестов IFS специфичны для семейства, модели и степпинга каждого Xeon Sapphire Rapids и загружаются в защищённую область памяти, предварительно пройдя аутентификацию.

Интерфейсы, обеспечиваемые драйвером IFS, позволят ОЕМ-поставщикам оборудования или владельцам ЦОД производить массовое тестирование процессоров, будь то развёртывание инфраструктуры с новыми серверами или плановая проверка уже запущенной системы на аппаратные сбои. Для гиперскейлеров подобная функциональность настолько важна, что они и сами разрабатывают подобные решения для проверки работы ядер, хотя пока исключительно программные.

Постоянный URL: http://servernews.ru/1061234
26.02.2022 [23:02], Владимир Мироненко

Intel Xeon Sapphire Rapids получили инструкции для ускорения обработки 5G-сигнала

Intel сделала ряд анонсов в ходе виртуального выступления на открытии выставки MWC 2022. Отметив, что почти все коммерческие развёртывания vRAN операторами по всему миру используют решения Intel, компания пообещала удвоить свои усилия по дальнейшему развитию экосистемы vRAN, повышению производительности и удовлетворению ключевых требований операторов.

На днях Intel уже представила новые высокоинтегрированные чипы Xeon D-1700 и D-2700, сочетающие в одной SoC ядра Ice Lake-SP, акселератор QAT, 100GbE-адаптер и т.д. Новинки, по словам компании, отлично подходят для периферийных вычислений и создания шлюзов безопасности, маршрутизаторов и коммутаторов, хранилищ, базовых станций, инференс-систем и т.д. Компанию им составят SmartNIC-решения вроде Silicom N6010/6011 (платформа Arrow Creek на базе FPGA Agilex ) или Wistron NeWeb WSN-2200 (в составе сервера WSS-3000).

 Изображение: Wistron NeWeb

Изображение: Wistron NeWeb

Решения на базе новых Xeon D разрабатывают, например, Cisco, Juniper Networks и Rakuten Symphony. Последняя уже находится в процессе развёртывания виртуализированной облачной инфраструктуры для своей 5G-сети в Японии. Она же, наряду с Ericsson и Samsung, разрабатывает и новые решения на базе Intel Xeon Sapphire Rapids. На MWC 2022 Intel впервые раскрыла ещё одну особенность этих чипов — наличие оптимизаций для обработки 5G-трафика.

В частности, Sapphire Rapids получили новый набор специализированных инструкций для обработки сигналов, специфичных для 5G RAN, что в рамках платформы Intel FlexRAN обеспечит двукратный прирост ёмкости vRAN по сравнению с Ice Lake-SP, а также позволит развёртывать высокоплотные сети с 64T64R Massive MIMO. Кроме того, новые CPU получит и возможности ускорения выполнения рабочих нагрузок vRAN. Впрочем, пока Intel детали не раскрывает.

Intel анонсировала и апдейты ПО, заранее оптимизированного для новых аппаратных платформ компании. В частности, она выпустила крупнейшее обновление для OpenVINO за более чем три года. Версия 2022.1 включает:

  • Обновлённый и упрощённый набор API для более лёгкого импорта моделей TensorFlow и значительного улучшения переносимости кода.
  • Расширенный охват моделей с улучшенной поддержкой обработки естественного языка, а также моделей с двойной точностью и расширенного компьютерного зрения.
  • Автоматическое обнаружение всех вычислительных ресурсов и ускорителей в заданной системе с последующей динамической балансировкой нагрузки, а также распараллеливание с учётом объёма памяти и вычислительных мощностей.

Наконец, Intel также анонсировала новые программные модули в портфолио Smart Edge для ускорения обработки UPF-нагрузок (User Plane Function) 5G на границе сети, что позволяет добиться требуемого уровня задержки и пропускной способности. Модули абстрагированы от аппаратного обеспечения, что упрощает процесс разработки с использованием возможностей обработки пакетов в процессорах Intel.

Постоянный URL: http://servernews.ru/1061010
24.02.2022 [00:37], Алексей Степин

Такие разные чиплеты: AMD и Intel рассказали некоторые подробности об устройстве Milan-X и Sapphire Rapids

Век полностью монолитных процессоров постепенно подходит к концу, поскольку к пределу подошли и возможности кремниевой технологии создавать столь гигантские кристаллы. На конференции International Solid-State Circuits (ISSCC 2022) и AMD, и Intel поведали некоторые подробности о внутреннем устройстве своих новых серверных процессоров: Milan-X и Sapphire Rapids. А немецкий портал Hardwareluxx рассказал о докладах и про первый, и про второй.

И если AMD перешла к чиплетной компоновке уже давно, то для Intel такой подход новый и, в целом, вынужденный — Sapphire Rapids в классической реализации потребовали бы немыслимого по размерам монолитного кристалла, что резко бы снизило выход годных продуктов. Однако новые Xeon состоят уже из четырёх базовых кристаллов площадью около 400 мм2.

 Изображение: Twitter/Locuza

Изображение: Twitter/Locuza_

Они производятся с использованием процесса Intel 7 (вариация 10 нм), который в первую очередь позволил повысить плотность размещения интерконнекта, что критически важно для достижения минимальной латентности между блоками в сборке. Отголоски с проблемами техпроцессов всё же дают о себе знать: хотя базовый кристалл Sapphire Rapids относительно невелик, Intel решила подстраховаться и повысить степень избыточности для некоторых блоков.

 Изображение: Twitter/Olrak29_

Изображение: Twitter/Olrak29_

Фактически компания производит два зеркальных по компоновке кристалла, которые объединяются десятью интерфейсами EMIB — либо парами (по вертикали), либо тройками (по горизонтали) подключений к фабрике Multi-Die Fabric IO. Минимальное потребление у этой технологии составляет всего 0,5 Дж/байт, а частота фабрики может динамически варьироваться в пределах от 800 до 2500 МГц. Совокупная пропускная способность составляет 10 Тбайт/с (20 × 500 Гбайт/с), латентность не превышает 10 нс.

 Изображения: Hardwareluxx

Изображения: Hardwareluxx

AMD же не просто отказалась от монолитных кристаллов, но и со второго поколения вообще перешла на асимметричную чиплетную компоновку, в которой кристалл ввода-вывода не просто отделён от кристаллов с ядрами, но и производится с использованием иного техпроцесса (14 нм против 7 нм). А в Zen 3 было произведено ещё и уплотнение кешей — 32 Мбайт L3 на восемь ядер. Ядра и кеш объединяет двунаправленная кольцевая шина с пропускной способностью 2 Тбайт/с.

А сами кеши перешли на использование более компактных ячеек и обзавелись двумя рядами TSV-подключений для установки по технологии TSMC SoIC ещё одного SRAM-чипа площадью 41 мм2, то есть того самого 3D V-Cache, который позволяет нарастить ёмкость L3 с 32 до 96 Мбайт. Интересно, что связь с нижним чипом осуществляется исключительно за счёт адгезии медных столбиков-проводников, пайки не требуется. По сути, уже готовый кристалл CCD просто полируется до обнажения проводников TSV, после чего на него укладывается верхний кристалл SRAM.

При этом сами по себе CCD также получили целый ряд оптимизаций «кремния» и некоторые преобразования в структуре. Они стали тоньше и там, где дополнительная SRAM не требуется, теперь используются прокладки для выравнивания высоты. А те же TSV-проводники используются и для питания внешнего SRAM-чипа. Итоговая пропускная способность подключения у 3D V-Cache составляет те же 2 Тбайт/с, а внутри он организован блоками 512 × 128 Кбайт. Но главное, что «штраф» за доступ к расширенной кеш-памяти не должен превышать четырёх тактов.

Обе компании ищут оригинальные решения при создании новых процессоров. Но если Intel отказывается от монолитности с некоторым трудом и в Sapphire Rapids явно прослеживается желание сохранить как можно более высокий уровень связности внутри CPU, то AMD словно играет в LEGO. Благодаря доступу к продвинутым техпроцессам TSMC «красные» имеют возможность перебирать комбинации «кубиков» в поисках конструкции, наиболее полно отвечающей представлению компании об идеальном процессоре.

Постоянный URL: http://servernews.ru/1060821
18.02.2022 [01:45], Игорь Осколков

И P, и E: анонсированы процессоры Intel Xeon Emerald Rapids, Granite Rapids и Sierra Forest

Intel ожидает, что объём рынка серверных решений удвоится в период с 2021 по 2026 год, поскольку объёмы генерируемых, хранимых и обрабатываемых данных непрерывно растут. Одними из ключевых направлений развития в этой области для неё станут ИИ и безопасность. Компания полагает, что в скором времени ИИ-решения будут сопутствовать практически любым нагрузкам.

Иными словами, Intel продолжает считать, что CPU должны быть как можно более универсальными, и поэтому будет и далее развивать ИИ-возможности Xeon. В частности, в задачах обучения Sapphire Rapids будут в 30 раз быстрее Ice Lake-SP, а в инференсе — в 6 раз. При этом компания обращает внимание не только на общую производительность процессоров, но и на скорость работы в реальных задачах, тех же ИИ-нагрузках или, допустим, в работе СУБД.

 Изображения: Intel

Изображения: Intel

Важна не только производительность на ядро, но и энергоэффективность и масштабируемость, на которые обращают особое внимание гиперскейлеры. Исходя из массы запросов и собранных метрик Intel и проектирует будущие CPU. И вот тут начинается самое интересное. Как известно, Sapphire Rapids базируются на P-ядрах (Golden Cove) и производятся с использованием техпроцесса Intel 7 (10 нм Enhanced SuperFIN). P-ядра оптимизированы с точки зрения производительности, как и все предыдущие поколения Xeon.

P-ядра станут основой и для процессоров Emerald Rapids, тоже на базе Intel 7, которые выйдут уже в 2023 году. Эти CPU можно назвать Refresh’ом для Sapphire Rapids. Платформа у них будет одинаковая — Eagle Stream. Основные улучшения в новинках коснутся подсистемы памяти и функций безопасности. Хотя Intel прямо об этом не говорит, можно предположить, что они получат поддержку следующего поколения памяти Optane. Для Sapphire Rapids, напомним, ожидается появление Intel Optane PMem 300 (Crow Pass).

В 2024-ом им на смену придут Granite Rapids — на базе техпроцесса Intel 3 (оптимизированные 7 нм), а не Intel 4, как говорилось ранее — и новая платформа для них. Подробности о них Intel пока раскрыть не готова. Но тогда же, на том же техпроцессе и для той же платформы появятся процессоры Sierra Forest, о которых компания публично говорит впервые. Эти CPU будут использовать E-ядра следующего поколения, но те же IO-блоки (память, PCIe и т.д.), что и Granite Rapids. Возможно, к этому моменту Intel перейдёт на полностью чиплетную компоновку.

Sierra Forest будут оптимизированы с точки зрения производительности на Ватт и плотности размещения, что должно понравиться гиперскейлерам, а единая платформа позволит выбирать CPU между ними и Granite Rapids в зависимости от планируемых задач. AMD со своими 5-нм EPYC Bergamo и модифицированными ядрами Zen4c целится в этот же сегмент, но выпустит их уже в 2023 году. Впрочем, всё это вряд ли остановит самых крупных игроков от попыток создания собственных CPU, как уже сделала Amazon, и не ослабит интерес к Arm вообще.

Грубо говоря, Granite Rapids и будущие поколения на P-ядрах, будут масштабироваться вертикально, наращивая в рамках заданного теплопакета производительность в более узких задачах (ИИ, HPC, СУБД), а Sierra Forest и прочие E-решения — горизонтально, увеличивая число ядер, снижая задержки и повышая параллелизм (важно для веб-сервисов или аналитики). Время единой и универсальной серверной архитектуры, видимо, постепенно проходит, и гибридное (с P- и E-ядрами одновременно) решение Intel делать не планирует.

Что же касается дел насущных, то Intel сообщила об отгрузке более 1 млн Xeon Ice Lake-SP в IV квартале, суммарно почти 2 млн к концу прошлого года. Более того, в декабре Intel поставила больше Intel Xeon, чем любой из её конкурентов за весь 2021 год. Поставки Sapphire Rapids компания обещает начать уже в этом квартале. И, по словам Intel, это наиболее богатый по возможностям серверный процессор, когда-либо созданный ею. Видимо, именно обилие функций побудило Intel сделать часть из них опциональными и активируемыми за отдельную плату.

Ранее компания показала первые сравнения производительности процессоров Sapphire Rapids и ускорителей Ponte Vecchio с актуальными решениями конкурентов, а также анонсировала ускорители Arctic Sound-M на базе Xe-HPG и гибридные чипы Falcon Shores. Несмотря на попытки добавить как можно больше ИИ-функций в процессоры, Intel отмечает, что ускорители, конечно, никуда не денутся и будут использоваться в более узких задачах обучения и инференса — рынок ИИ-железа будет расти на 20-25% ежегодно.

Компания ожидает, что продажи её ИИ-решений достигнут объёма $40 млрд в 2026 году, а серверного направления в целом, куда помимо ускорителей и CPU входят также FPGA и IPU — более $65 млрд. Intel, как и обещала ранее, будет уделять особое внимание развитию не только аппаратных, но и программных решений (у неё в штате уже более 19 тыс. разработчиков), и станет ещё более активно вкладываться в open source. Кроме того, компания в очередной раз подчеркнула важность стратегии IDM 2.0.

Постоянный URL: http://servernews.ru/1060473
17.02.2022 [18:37], Игорь Осколков

Intel сравнила производительность Sapphire Rapids с Milan-X, анонсировала серверные ускорители Arctic Sound-M и гибридную архитектуру Falcon Shores

В рамках мероприятия для инвесторов Intel в очередной раз напомнила, что 85 % суперкомпьютеров используют процессоры Xeon, так что этот сегмент для компании является важным и она намерена развивать его и далее. Подразделение AXG (Accelerated Computing Systems and Graphics Group) намерено получить выручку более $1 млрд в 2022 году и увеличить её до $10 млрд к 2026 году. И суперкомпьютеры сыграют в этом не последнюю роль.

На текущий момент компания ожидает появления порядка 35 платформ для высокопроизводительных вычислений (HPC) и ИИ-нагрузок от различных производителей. Более того, AXG намерена к 2027 году создать системы зеттафлопного класса. Впрочем, пока что компания напомнила про скорый выход процессоров Intel Xeon Sapphire Rapids, которые получат модификации с набортной HBM-памятью. HBM позволит получить вчетверо более высокую пропускную способность памяти, а в целом новые CPU будут в 2,8 раз быстрее Ice Lake-SP.

 Изображения: Intel

Изображения: Intel

Ровно на эту величину они будут быстрее по сравнению с конкурирующими решения в одном из приложений для вычислительной гидродинамики — OpenFOAM. Любопытно, что, по данным Intel, производительность AMD EPYC Milan на данной нагрузке равна производительности Ice Lake-SP, а вот Milan-X, который получит расширенный кеш, всего в 1,3 раз быстрее обоих CPU нынешнего поколения. Более того, даже «обычный» Sapphire Rapids в этой задаче в 1,6 раз быстрее актуальных процессоров. Правда, OpenFOAM использует AVX-512.

Что касается ускорителей Ponte Vecchio, то Intel всё так же обещает поставить их для суперкомпьютера Aurora позже в этом году. Про них компания говорит, что они в 2,6 раз быстрее неназванного (впрочем, цвет намекает на то, что речь идёт о NVIDIA) конкурирующего решения в комплексных задачах финансовой аналитики. Компанию Ponte Vecchio составят серверные ускорители попроще — Arctic Sound-M на базе Xe-HPG.

 Источник: Anandtech

Источник: Anandtech

По словам Intel, это первое в индустрии решение с аппаратным (де-)кодером AV1, который на 30% повышает скорость обработки видео, и единственное — с открытой (open source) платформой. Эти ускорители помогут повысить качество при транскодировании, увеличить количество одновременно поддерживаемых потоков стриминга и в целом улучшат облачный гейминг. Также они пригодятся для VDI и задач инференса. Образцы новинок уже поставляются заказчикам, а выпуск из намечен на середину этого года.

 Источник: Anandtech

Источник: Anandtech

Наконец, Intel анонсировала ещё один необычный продукт — гибридную серверную архитектуру Falcon Shores, которая совместит на одном чипе ядра x86 (CPU) и Xe (GPU). Раньше 2024 года её ждать не стоит, но компания уже сейчас заявляет о пятикратном повышении производительности Ватт, плотности размещения вычислительных мощностей, объёма памяти и пропускной способности.

Постоянный URL: http://servernews.ru/1060453
13.02.2022 [21:49], Алексей Степин

Только Intel Xeon, только Sapphire Rapids — первые узлы суперкомпьютера Crossroads проходят тестирование

Как известно, новый суперкомпьютер Национального управления по ядерной безопасности (NNSA) Министерства энергетики США под названием Crossroads, будет построен на базе платформы c Intel Xeon Sapphire Rapids, созданной HPE. Совсем недавно Лос-Аламосская лаборатория, где устанавливается новая система, уже начала предварительные тесты первых вычислительных узлов Cray EX на базе новых процессоров Intel.

 Модуль системы тестирования Darwin (в левой части видны процессорные блоки)

Модуль системы тестирования Darwin (Изображения: Los Alamos National Lab via The Next Platform)

В них используется ранняя версия новых чипов Xeon, но она уже позволяет разработчиком из группы тестирования ASC Integrated Code оценить их производительность. Данные такого тестирования дадут инженерам Intel произвести последние оптимизиации для Sapphire Rapids. Несмотря на то, что в финальной версии в новых Xeon для этой машины ожидается использование памяти типа HBM, в предварительной версии используется обычная DDR5.

Новые узлы уже установлены в тестовую платформу ASC Darwin, которая позволяет использовать одновременно разные вычислительные архитектуры для лучшей сравнительной оценки и оптимизации кода. Каждый тестовый узел Crossroads несёт на борту по два 56-ядерных процессора Sapphire Rapids в окружении восьми модулей DDR5. В правой части видна пара сетевых модулей Cassini, это фирменный интерконнект HPE/Cray Slingshot 11. Охлаждение процессоров воздушное, хотя в финальной версии будет применено жидкостное охлаждение с технологией прямого контакта.

 Процессорный блок изнутри: воздушное охлаждение Sapphire Rapids и 8 модулей DDR5 на процессор

Процессорный блок изнутри: воздушное охлаждение Sapphire Rapids и 8 модулей DDR5 на процессор

Источники сообщают, что ввод в строй суперкомпьютера Crossroads будет происходить в два этапа, как это было и в своё время с системой Trinity на базе Xeon и Xeon Phi, поскольку в нужный Лос-Аламосским лабораториям момент компания не смогла обеспечить поставки новых на тот момент ускорителей Knights Landing. Таким образом, в Crossroads будут в какой-то момент времени одновременно трудиться вычислительные узлы, оснащённые памятью DDR5 и более новые, использующие HBM2e.

Предположительно, в тестовых версиях используются пулы памяти общим объёмом 256 Гбайт, поскольку стоимость модулей DDR5 ёмкостью 32 Гбайт существенно ниже версий с большими ёмкостями. В финальной версии объём памяти HBM2e составит по 64 Гбайт на процессорный разъём. Если пропускная способность первого варианта оценивается в 260 Гбайт/с, то вариант с HBM2e, уступая в ёмкости, сможет предоставить серьёзный выигрыш в скорости — от 1 до 1,8 Тбайт/с.

 Вычислительный узел Cray EX Shasta на базе Sapphire Rapids: 8 процессоров с СЖО «прямого контакта»

Вычислительный узел Cray EX Shasta на базе Sapphire Rapids: 8 процессоров с СЖО «прямого контакта»

Согласно расчётам The Next Platform, можно говорить о четырёхкратном преимуществе Crossroads над Trinity с точки зрения производительности, а в финансовом выражении это означает падение стоимости одного терафлопса с $4482 до $632. Для сравнения — в не столь уж от нас далёком 2008 году стоимость 1 Тфлопс составляла свыше $70 тыс.

Отметим, что HPE ответственна за постройку сразу нескольких крупных машин в США: Aurora (Intel Xeon + Xe), El Capitan (AMD EPYC + Instinct), Frontier и Crush (AMD EPYC + Instinct), Kestrel (Intel Xeon + NVIDIA A100NEXT), Perlmutter (AMD EPYC + NVIDIA A100) и Polaris (AMD EPYC + NVIDIA A100).

Постоянный URL: http://servernews.ru/1060102
02.12.2021 [21:22], Алексей Степин

Суперкомпьютер NREL Kestrel получит неанонсированные ускорители NVIDIA A100NEXT

Заметная часть недавно анонсированных проектов HPC-систем c заявленной производительностью от десятков петафлопс базируется на использовании процессоров AMD EPYC и ускорителей Instinct, однако NREL остановила свой выбор на Intel Xeon Sapphire Rapids и грядущих ускорителях NVIDIA A100NEXT. Последние ещё не анонсированы, но и 44-Пфлопс машина под названием Kestrel должна вступить в строй лишь в 2023 году.

Вероятнее всего, новые ускорители будут представлены NVIDIA в следующем году, что неплохо согласуется с планами компании по выпуску новых решений каждые два года. К сожалению, точных технических данных, относящихся к NVIDIA A100NEXT пока нет. Можно лишь осторожно предположить, что следующая итерация ускорителей получит более тонкий техпроцесс 5-нм класса, и удвоит число вычислительных блоков благодаря переходу на чиплетную компоновку, например, из четырёх кристаллов по 25 млрд транзисторов.

 Cуперкомпьютер Eagle. Фото: NREL

Cуперкомпьютер Eagle. Фото: NREL

Причины, по которым NREL решила использовать процессоры Sapphire Rapids не совсем ясны. И хотя это заведение исторически тяготело к CPU Intel — текущий суперкомпьютер Eagle производительностью 8 Пфлопс построен на базе Intel Xeon Skylake-SP и почти лишён ускорителей, — у NVIDIA будут собственные процессоры Grace, выход которых намечен на 2023 год. Возможно, такое решение принято, чтобы избежать проблем с поставками CPU NVIDIA. К тому же процессоры Intel поддерживают AVX-512, причём в Sapphire Rapids есть поддержка новых форматов (AVX-512 FP16) и расширения для матричных вычислений Intel AMX.

Основой же новой системы Kestrel станет платформа HPE Cray EX с интерконнектом HPE Slingshot и СХД Cray ClusterStor E1000 общей ёмкостью более 75 Пбайт. Что касается охлаждения, то Kestrel, как и его предшественники, будет использовать СЖО с «горячим» теплоносителем. Это позволит достигнуть высокой энергоэффективности — средний коэффициент PUE нового суперкомпьютера составит примерно 1,036. Для организации, занимающейся поиском эффективных и чистых источников энергии такой подход выглядит более чем обоснованно.

Постоянный URL: http://servernews.ru/1055055
Система Orphus