Материалы по тегу: hpc

24.05.2023 [14:54], Владимир Мироненко

Intersect360 Research: рынок HPC-AI возвращается к допандемийным темпам роста

В 2022 году объём мирового рынка высокопроизводительных вычислений (HPC) составил $38,1 млрд, что на 8,1 % больше, чем в 2021 году. Расширенный рынок HPC-AI увеличился ещё больше — на 11,3 %, достигнув $44,4 млрд, указано в исследовании аналитической компании Intersect360 Research «Общий объём мирового рынка высокопроизводительных вычислений и искусственного интеллекта в 2022 году и прогноз на 2023–2027 годы: продукты и услуги».

В исследовании сообщается, что бюджет рынка ИИ составил $6,3 млрд, он является частью расширенного рынка HPC-AI. В указанную сумму не вошли $17,9 млрд, израсходованных гиперскейлерами в 2022 году на инфраструктуру ИИ и HPC. Гендиректор Intersect360 Research Эддисон Снелл (Addison Snell) отметил, что после экономических потрясений из-за пандемии рынок возвращается к устойчивому росту.

 Источник: Intersect360 Research

Источник: Intersect360 Research

Согласно прогнозу Intersect360 Research, рынок HPC будет расти с 2022 по 2027 гг. со среднегодовым темпом роста 6,1 % (CAGR) и достигнет $51,2 млрд в 2027 году. Расширенный рынок HPC-AI будет расти в этом же периоде со среднегодовым темпом роста 6,3 % и достигнет $60,4 млрд в 2027 году, что говорит об относительно более быстром росте бюджетов на ИИ за пределами сегмента HPC.

 Источник: Intersect360 Research

Источник: Intersect360 Research

Согласно исследованию, после восьми лет непрерывного двузначного роста для облачных вычислений вскоре этот тренд изменится. По прогнозу Intersect360 Research, в течение следующих пяти лет доля облачных вычислений в расходах на HPC-системы приблизится к максимальному уровню, при этом новые облачные развёртывания HPC будут уравновешиваться увеличением использования локальных ресурсов (on-premise).

Постоянный URL: http://servernews.ru/1087240
24.05.2023 [14:14], Сергей Карасёв

AMD рассказала об архитектуре гигантского APU Instinct MI300: 24 ядра EPYC Genoa, ускоритель CDNA 3 и 128 Гбайт HBM3

Компания AMD на суперкомпьютерной конференции ISC 2023, по сообщению ресурса Tom's Hardware, раскрыла дополнительную информацию о гибридном изделии Instinct MI300. Новый APU найдёт применение в HPC-системах, а также в высокопроизводительных серверах для дата-центров.

Как говорилось ранее, MI300 — это самый крупный и сложный чип, когда-либо созданный специалистами AMD. Он содержит в общей сложности около 146 млрд транзисторов. Конструкция включает ядра CPU (Zen 4) и GPU (CDNA 3), вспомогательную логику, I/O-контроллер, а также память HBM3. В общей сложности задействованы 13 чиплетов, четыре из которых изготавливаются по 6-нм технологии, а ещё девять — по 5-нм.

По сравнению с Instinct MI250 новинка получила ряд архитектурных изменений. В частности, узел с Instinct MI250 (как у Frontier) имеет отдельные блоки CPU и GPU, дополненные единственным процессором EPYC для координации рабочих нагрузок. В свою очередь, узел Instinct MI300 содержит интегрированный 24-ядерный чип EPYC Genoa, а поэтому необходимость во внешнем CPU отпадает.

 Источник изображений: AMD

Источник изображений: AMD

Вместе с тем сохранена топология, позволяющая каждому из блоков обмениваться данными со всеми другими. Причём в случае Instinct MI300 снижается задержка и повышается общая производительность. Компоненты чипа объединены посредством Infinity Fabric четвёртого поколения. В оснащение ходят 128 Гбайт общей для CPU и GPU памяти HBM3. Похожий подход реализован в чипах NVIDIA Grace Hopper, а вот Intel от гибридности в ускорителях Falcon Shores пока отказалась.

Постоянный URL: http://servernews.ru/1087241
23.05.2023 [19:24], Владимир Мироненко

Низкая энергоэффективность оборудования тормозит развитие HPC и ИИ

В апреле 2023 года Hyperion Research при поддержке Dell, Intel и NVIDIA провела опрос относительно экологической устойчивости высокопроизводительных вычислений (HPC). В опросе приняли участие менеджеры и руководители ЦОД HPC и провайдеров облачных услуг (CSP), а также учёные, исследователи и инженеры.

По словам Жаклин Лудема (Jaclyn Ludema), ведущего аналитика по устойчивому развитию Hyperion Research, исследование свидетельствует о значительном повышении важности показателей экоустойчивости и энергоэффективности в списках приоритетов для многих планов закупок, уступающих лишь показателю производительности, и обладающих даже более высоким приоритетом, чем цена.

Согласно опросу, 57 % респондентов нацелены на то, чтобы выполнить больше работ с меньшими затратами энергии. По мере роста числа рабочих нагрузок, связанных с искусственным интеллектом (ИИ), машинным обучением (ML) и высокопроизводительным анализом данных (HPDA) стремление к расширению вычислительных возможностей сталкивается с увеличением затрат на энергию. 55 % респондентов, включая промышленный сектор, госучреждения и научные организации, отметили, что затраты на электроэнергию влияют на уровень инвестиций в новые системы HPC.

 Источник изображения: Hyperion Research

Источник изображения: Hyperion Research

О непомерно высоких затратах на электроэнергию сообщили 33 % участников опроса. Вместем с тем 48 % респондентов назвали экологические, социальные и управленческие цели (ESG) важными именно в контексте экологически устойчивого развития, а не только в контексте затрат. Впрочем, госрегулирование также является мотиватором устойчивого развития.

Отвечая на вопрос по поводу влияния расходов на электроэнергию на работу ЦОД HPC, 58 % респондентов указали несколько последствий воздействия этого фактора. В том числе:

  • 60 % сообщили, что рост затрат на электроэнергию отсрочит покупку новых систем;
  • 43 % считает, что это ограничит возможности существующих систем;
  • 34 % указали, что из-за этого сократят время работы своих систем.

Исследователи отметили, что рост использования облачных сервисов HPC обусловлен целым рядом факторов, в том числе возможностью передать на аутсорсинг операционные вопросы, такие как затраты на электроэнергию и ресурсы. Также сообщается, что всё больше предприятий обращаются к провайдерам облачных услуг для удовлетворения новых требований к энергоэффективности.

Респонденты распределили главные приоритеты при решении задач устойчивого развития следующим образом:

  • 52 % отдают предпочтение эффективной конфигурации оборудования (более высокая производительность на Ватт);
  • 42 % — оптимизации охлаждению и распределению энергии;
  • 34% — оптимизации рабочих нагрузок (выявление эффективных нагрузок для работы локально и в облаке).

Исследователи ожидают, что закупка более экологичного оборудования будет частью регулярных планов закупок для 48 % площадок. Также отмечено, что использование интеллектуального управления питанием (телеметрии) находится на подъёме. В течение следующих 18 месяцев количество объектов, внедряющих телеметрию, увеличится до 40 % с нынешних 27 %.

Почти половина (49 %) руководителей ЦОД, участвовавших в опросе, сообщили, что в настоящее время они имеют возможность измерять углеродный след, потребление энергии или воздействие на окружающую среду, что повышает вероятность успеха в реализации планов по обеспечению устойчивого развития.

Согласно исследованию Hyperion Research, для создания энергоэффективного ЦОД требуются:

  • Возобновляемые источники энергии;
  • Эффективная конфигурация оборудования;
  • Оптимизированная технология охлаждения;
  • Интеллектуальное управление платформой;
  • Управление питанием центра обработки данных;
  • Оптимизированные рабочие нагрузки;
  • Ответственный вывод оборудования из эксплуатации.
Постоянный URL: http://servernews.ru/1087146
23.05.2023 [15:26], Сергей Карасёв

Intel рассказала о суперкомпьютере Aurora производительностью более 2 Эфлопс

Корпорация Intel в ходе конференции ISC 2023, как сообщает AnandTech, поделилась информацией о проекте Aurora по созданию суперкомпьютера с производительностью экзафлопсного уровня. Эта система создаётся для Аргоннской национальной лаборатории Министерства энергетики США.

Изначально анонс HPC-комплекса Aurora состоялся ещё в 2015 году с предполагаемым запуском в 2018-м: ожидалось, что машина обеспечит быстродействие на уровне 180 Пфлопс. Однако реализация проекта значительно затянулась, а технические параметры платформы неоднократно менялись. Пока что развёрнуты тестовый кластер Sunspot.

Как теперь сообщается, в конечной конфигурации Aurora объединит 10 624 узла, каждый из которых будет включать два процессора Xeon Max и шесть ускорителей Ponte Vecchio. Таким образом, общее количество CPU будет достигать 21 248, число GPU — 63 744. Быстродействие FP64, как и было заявлено ранее, превысит 2 Эфлопс.

 Источник изображений: Intel (via AnandTech)

Источник изображений: Intel (via AnandTech)

Каждый процессор оперирует 64 Гбайт памяти HBM, ускоритель — 128 Гбайт. В сумме это даёт соответственно 1,36 Пбайт и 8,16 Пбайт памяти HBM с пиковой пропускной способностью 30,5 Пбайт/с и 208,9 Пбайт/с. В дополнение система сможет использовать 10,9 Пбайт памяти DDR5 с пропускной способностью до 5,95 Пбайт/с. Вместимость подсистемы хранения данных составит 230 Пбайт со скоростью работы до 31 Тбайт/с.

На сегодняшний день Intel поставила более 10 тыс. «лезвий» для Aurora, а это означает, что практически все узлы готовы к окончательному монтажу. Ввод суперкомпьютера в эксплуатацию намечен на текущий год. Для НРС-платформы готовится специализированная научная модель генеративного ИИ — Generative AI for Science, насчитывающая около 1 трлн параметров. Применять Aurora планируется для решения наиболее ресурсоёмких задач в различных областях.

Постоянный URL: http://servernews.ru/1087170
23.05.2023 [14:47], Сергей Карасёв

Ускорители Intel Falcon Shores не получат гибридную конфигурацию CPU + GPU

Корпорация Intel на суперкомпьютерной конференции ISC 2023, как сообщает AnandTech, рассказала о планах по выводу на рынок ускорителей семейства Falcon Shores, рассчитанных на применения в НРС-системах, а также в составе ИИ-платформ. В конструкцию новинок будут внесены изменения, а их анонс снова откладывается.

Изначально предполагалось, что изделия Falcon Shores появятся после выхода ускорителей серии Rialto Bridge, которые должны были прийти на смену Ponte Vecchio. Однако в марте нынешнего года Intel отменила выпуск Rialto Bridge, попутно сообщив о задержках с разработкой Falcon Shores.

 Источник изображений: Intel

Источник изображений: Intel

Ранее предполагалось, что ускорители Falcon Shores будут иметь гибридную архитектуру XPU в виде связки CPU + GPU. Однако теперь Intel заявляет, что эти решения получат исключительно GPU-составляющую. В корпорации пришли к выводу, что вывод на коммерческий рынок XPU-изделий является преждевременным, а поэтому планы в отношении Falcon Shores пришлось пересмотреть.

Известно, что изделия Falcon Shores получат модульную структуру на основе так называемых «плиток» — это чиплетная конструкция. Предусмотрено наличие памяти до 288 Гбайт HBM3 (ПСП до 9,8 Тбайт/с) и специализированного IO-блока «для масштабирования». Упомянуты единый интерфейс программирования, поддержка Ethernet-коммутации и CXL.

Сообщается, что выпуск Falcon Shores сдвигается до 2025 года. Это означает, что как минимум до середины текущего десятилетия Ponte Vecchio останутся наиболее технологичными НРС-ускорителями Intel. Корпорация также отмечает, что полностью отказываться от выпуска XPU-решений не планируется. Но сроки появления таких продуктов не уточняются.

Постоянный URL: http://servernews.ru/1087172
22.05.2023 [10:10], Сергей Карасёв

Рейтинг «зелёных» суперкомпьютеров Green500 возглавила система Henri, которая в TOP500 находится лишь на 255 месте

Представлена очередная редакция рейтинга Green500 — списка мощнейших вычислительных систем мира, имеющих наиболее высокую энергетическую эффективность. Лидером в данном сегменте, как и полгода назад, является комплекс Henri, установленный в Научно-исследовательском институте Флэтайрон (Flatiron Institute) в США.

В состав Henri входят узлы Lenovo ThinkSystem SR670 V2 с процессорами Intel Xeon Platinum 8362 Ice Lake-SP (32 ядра; 64 потока; 2,8–3,6 ГГц; 265 Вт). Задействованы ускорители NVIDIA H100 (80 Гбайт; PCIe) и интерконнект Infiniband HDR. Быстродействие Henri составляет 2,88 Пфлопс. При этом энергетическая эффективность достигает 65,396 Гфлопс/Вт. Система применяется для решения сложных задач в областях вычислительной астрофизики, биологии, математики, неврологии и квантовой физики. Любопытно, что в рейтинге мощнейших суперкомпьютеров мира TOP500 система Henri занимает только 255-ю строку.

 Источник изображения: Lenovo

Источник изображения: Lenovo

На втором месте в Green500 располагается машина Frontier TDS (32-я позиция в рейтинге TOP500). Этот суперкомпьютер на базе узлов HPE Cray EX235a с чипами AMD EPYC и ускорителями AMD Instinct MI250X обладает общим быстродействием до 19,2 Пфлопс. Энергоэффективность равна 62,68 Гфлопс/Вт. Отмечается, что лидер рейтинга TOP500 — комплекс Frontier — оказался на шестой строке списка Green500: 1,194 Эфлопс и 52,59 Гфлопс/Вт. Замыкает тройку система Adastra (12-я строка в TOP500) с аналогичной аппаратной составляющей: до 46,1 Пфлопс при показателе энергоэффективности на уровне 58,02 Гфлопс/Вт.

Постоянный URL: http://servernews.ru/1087084
22.05.2023 [10:00], Сергей Карасёв

В свежем рейтинге TOP500 по-прежнему лидирует суперкомпьютер Frontier с выросшей до 1,194 Эфлопс производительностью

Обнародован очередной рейтинг 500 наиболее производительных вычислительных комплексов мира TOP500. Лидирующую позицию сохранил суперкомпьютер Frontier, установленный в Национальной лаборатории Окриджа (ORNL) Министерства энергетики США. Причём его быстродействие поднялось до 1,194 Эфлопс с 1,102 Эфлопс в ноябре 2022 года.

На втором месте в списке находится система Fugaku, расположенная в японском Институте физико-химических исследований (RIKEN): она обеспечивает производительность на уровне 442,01 Пфлопс. Замыкает тройку лидеров комплекс LUMI, смонтированный в Каяани (Финляндия): его результат — 309,10 Пфлопс.

 Источник изображения: ORNL

Источник изображения: ORNL

Приблизительно 72,0 % суперкомпьютеров в свежем списке TOP500 оснащены процессорами Intel — против 75,8 % шестью месяцами ранее. Доля систем с чипами AMD за полгода поднялась с 20,2 % до 24,2 %. Минимальный порог для входа в рейтинг увеличился до 1,87 Пфлопс против 1,73 Пфлопс в ноябре прошлого года. Суммарная производительность всех машин TOP500 теперь составляет 5,24 Эфлопс, тогда как полгода назад она равнялась 4,86 Эфлопса.

 Источник: TOP500

Источник: TOP500

В новом рейтинге 185 суперкомпьютеров используют различные ускорители/сопроцессоры (полгода назад показатель составлял 179 систем). Из них в 76 машинах применяются решения с архитектурой NVIDIA Volta, в 74 — NVIDIA Ampere, в 16 — AMD Instinct. Наиболее распространены ускорители NVIDIA Tesla V100 — они задействованы в 61 HPC-комплексе.

 Источник: TOP500

Источник: TOP500

Наибольшее количество суперкомпьютеров располагается в США — здесь функционируют 150 машин из нового рейтинга, или 30,0 %. На втором месте с географической точки зрениях находится Китай: 134 НРС-комплекса, или 26,8 %. Третья позиция досталось Германии, которая оперирует 36 машинами (7,2 %). Россия находится на 12-й строке: в нашей стране работают семь суперкомпьютеров (1,4 %), попавших в свежий список ТОР500. Если говорить о целых континентах, то в Азии построены 192 машины из списка, в Северной Америке — 160 систем, а в Европе — 133 суперкомпьютера.

 Источник изображения: RIKEN

Источник изображения: RIKEN

Ведущим поставщиком суперкомпьютерных узлов является Lenovo, на чьих решениях основаны 168 систем из списка, или примерно 33,6 %. На втором месте располагается HPE — 100 суперкомпьютеров и 20 %. Третью позицию занимает Inspur с 43 системами и 8,6 %.

Наиболее распространённая технология интерконнекта — Ethernet, которая применяется в 227 машина из списка: это около 45,4 %. В 200 суперкомпьютерах (40 %) задействована технология Infiniband, ещё в 35 (7 %) — Omnipath. Наиболее распространены процессоры Intel Cascade Lake-SP, установленные в 142 машинах (28,4 %). На втором месте по популярности значатся изделия Intel Skylake-SP, применяющиеся в 125 системах (25 %). Бронза досталась чипам AMD Zen-2 (Rome) — 63 комплекса НРС и 12,6 %. 

Постоянный URL: http://servernews.ru/1087083
22.05.2023 [09:09], Сергей Карасёв

NVIDIA поможет в создании передовой лаборатории квантовых вычислений

Компания NVIDIA анонсировала проект по созданию передовой лаборатории квантовых вычислений. В инициативе участвуют Юлихский суперкомпьютерный центр (Германия) и немецкая компания ParTec AG. Новая структура станет частью Унифицированной инфраструктуры квантовых вычислений Юлиха (Jülich UNified Infrastructure for Quantum Computing, JUNIQ),

Речь идёт об использовании концепции гибридных квантово-классических вычислений. Напомним, летом 2022 года NVIDIA представила платформу разработки QODA, объединяющую миры обычных и квантовых вычислений. А в марте нынешнего года дебютировала система NVIDIA DGX Quantum, в которой совмещены средства ускоренных вычислений на базе Grace Hopper, открытой модели программирования CUDA Quantum и квантовая управляющая платформа Quantum Machines OPX+.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Новая лаборатория станет площадкой для выполнения ресурсоёмких задач в рамках концепции квантово-классических вычислений с небольшой задержкой. В дополнение к CUDA Quantum планируется задействовать инструментарий NVIDIA cuQuantum SDK. Ресурсы лаборатории будут интегрированы в модульную суперкомпьютерную архитектуру Юлихского суперкомпьютерного центра.

Ожидается, что концепция гибридных квантово-классических вычислений приблизит квантовые вычисления к реальности. Подход может быть эффективен при решении сложных задач, с которыми не справляются одни лишь классические компьютеры. Исследователи, в частности, рассчитывают добиться беспрецедентных успехов в области химии и материаловедения.

Постоянный URL: http://servernews.ru/1087093
22.05.2023 [09:00], Сергей Карасёв

NVIDIA анонсировала суперкомпьютер Isambard 3 на базе собственных Arm-процессоров Grace

Компания NVIDIA анонсировала проект Isambard 3 — это система высокопроизводительных вычислений, которая расположится в Научном парке Бристоля и Бата в Великобритании. Комплекс будет применяться при решении сложных задач в области ИИ, медицины, астрофизики, биотехнологий и пр.

Инициативу возглавляет Бристольский университет в составе исследовательского консорциума GW4 Alliance. Кроме того, в проекте принимают участие Университеты Бата, Кардиффа и Эксетера. Строительством суперкомпьютера займётся компания HPE.

В основу Isambard 3 лягут 384 суперпроцессора NVIDIA Grace с ядрами Arm Neoverse. Утверждается, что по производительности и энергетической эффективности система в шесть раз превзойдёт своего предшественника — комплекс Isambard 2. В частности пиковое быстродействие FP64 составит 2,7 Пфлопс при энергопотреблении менее 270 кВт. Это позволит комплексу войти в число трёх наиболее энергоэффективных суперкомпьютеров мира, в которых не используются ускорители.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Isambard 3 поможет в создании подробных моделей исключительно сложных структур, объектов и установок, таких как ветряные электростанции и термоядерные реакторы. Новая система также продолжит выполнение задач, которыми ранее занималась машина Isambard 2: это исследование на молекулярном уровне, связанные с болезнью Паркинсона, лечением остеопороза и поиском новых препаратов от COVID-19.

Суперкомпьютер Isambard 3, как ожидается, позволит Европейскому научно-исследовательскому сообществу ускорить реализацию проектов в ряде важных областей. Ввод системы в эксплуатацию намечен на весну 2024 года.

Постоянный URL: http://servernews.ru/1087092
21.05.2023 [22:50], Сергей Карасёв

HPE создаст для Японии суперкомпьютер TSUBAME4.0 производительностью 66,8 Пфлопс

Компания HPE объявила о заключении соглашения с Глобальным научно-информационным вычислительным центром Токийского технологического института (Япония) о создании нового суперкомпьютера под названием TSUBAME4.0. Полностью ввести эту систему в эксплуатацию планируется весной 2024 года. TSUBAME4.0 будет применяться для обучения больших ИИ-моделей и запуска ресурсоёмких приложений в области аналитики данных.

В основу суперкомпьютера ляжет платформа HPE Cray XD6500, которая, как утверждается, обеспечивает высокую производительность и специализированные возможности при выполнении нагрузок, связанных с моделированием, а также ИИ. Заявленное пиковое быстродействие TSUBAME4.0 составит 66,8 Пфлопс (FP64). В случае вычислений половинной точности (FP16) показатель достигнет 952 Пфлопс — это в 20 раз больше по сравнению с мощностью суперкомпьютера предыдущего поколения TSUBAME3.0.

 Источник изображения: HPE

Источник изображения: HPE

Вычислительный комплекс TSUBAME4.0 получит 240 узлов, оснащённых двумя процессорами AMD EPYC Genoa, четырьмя ускорителями NVIDIA H100 и 768 Гбайт основной памяти. Говорится о высокой плотности размещения аппаратных компонентов, что позволит уменьшить занимаемую площадь в дата-центре. Задействован 400G-интерконнект NVIDIA Quantum-2 InfiniBand. Отмечается, что в целом архитектура TSUBAME4.0 аналогична системам TSUBAME предыдущих поколений. Благодаря этому возможно использование ранее созданных программных решений, что поможет ускорить реализацию новых НРС-проектов.

Постоянный URL: http://servernews.ru/1087087
Система Orphus