Материалы по тегу: суперкомпьютер

10.03.2025 [08:52], Руслан Авдеев

К2 НейроТех: российский рынок HPC за два года вырос на 35 %

К2 НейроТех сделала прогноз относительно основных трендов на российском рынке российских суперкомпьютеров. По оценкам компании, за последние два года рынок высокопроизводительных вычислений (HPC) в стране вырос на 35 % и достиг 15,8 млрд руб. Ключевую роль в этом играет развитие ИИ-систем. В 2025 году рынок HPC должен вырасти как минимум на 12 %.

Согласно прогнозам компании, в РФ вырастет местное производство оборудования для ИИ-систем. Рост спроса на искусственный интеллект и вычислительные мощности ведут к распространению HPC в бизнесе. Если раньше такие вычисления применялись в основном в науке и инженерных расчётах, то теперь всё чаще их активно применяют для обработки Big Data, ИИ, машинного обучения и др. В 2024 году вложения в системы хранения данных (СХД) и платформы для высоконагруженных систем выросли на 40 %. Утверждается, что выпуск СХД и ИИ-серверов вырос на 10,5 %, госзакупки таких систем увеличились вдвое, а госкомпании потратили на оборудование для ИИ более 1,7 млрд руб.

Источник изображения: Patrik Kernstock/unsplash.com

Ещё одним трендом стали модернизация и масштабирование имеющихся HPC-кластеров. Особенной популярностью стали пользоваться готовые решения «под ключ», поскольку теперь часто возникает проблема совместимости программного обеспечения и оборудования. В К2Тех заявляют, что заказчики всё чаще сталкиваются с тем, что имеющееся оборудование не способно справляться с современными задачами и масштабироваться. Ответом на это также будет развитие HPCaaS и гибридных инфраструктур, объединяющих локальные и облачные вычисления.

Наконец, К2 НейроТех предрекает переход к контейнеризированным средам как альтернативе «монолитным» приложениям. Использование Kubernetes, Singularity и Slurm даёт возможность оптимально распределять нагрузки и снижать издержки на эксплуатацию HPC-инфраструктуры.

Постоянный URL: http://servernews.ru/1119376

19.02.2025 [09:28], Руслан Авдеев

1,5 ГВт и 1,2 млн ускорителей: Sesterce потратит €52 млрд на ИИ-инфраструктуру во Франции

Французский облачный провайдер Sesterce инвестирует €450 млн ($471,85 млн) в создание ИИ ЦОД во французском Валансе (Valençay). Дата-центр разместится в бизнес-парке Rovaltain в агломерации Valence Romans Agglo. Ожидается, что проект будет использовать 40 тыс. ускорителей для обучения и эксплуатации ИИ, сообщает пресс-служба компании.

В новом ЦОД будет применяться замкнутая система водяного охлаждения, благодаря которой выделяемое оборудованием тепло можно будет использовать для отопления. Работы над проектом начнутся в сентябре 2025 года и завершатся до конца 2026 года. Размеры объекта и его мощность пока не раскрываются.

Отмечается, что €450 млн — это инвестиции лишь первого этапа, а общий бюджет проекта составит €1,8 млрд ($1,89 млрд) с учётом расходов на оборудование. Новый дата-центр — часть более масштабного €109-млрд плана Франции по достижению лидерства на рынке ИИ. Кроме того, страна готовится выделить для развития ИИ 1 ГВт от атомных станций.

Источник изображения: Sesterce

Всего Sesterce намерена потратить €52 млрд развернуть 1,5 ГВт мощностей и к 2030 году задействовать 1,2 млн ускорителей. Помимо развития нового ЦОД в Валансе, Sesterce намерена добавить 600 МВт двум дата-центрам в Гранд-Эсте (Grand Est) с 500 тыс. ускорителей к 2028 году, а к 2030 довести мощность до 1,2 ГВт и разместить более 1 млн ускорителей. Кроме того, компания намерена построить на юге Франции суперкомпьютер на 250 МВт с 200 тыс. ускорителей.

Свой первый ЦОД компания открыла в 2018 году, а в октябре 2024 года запустила HPC-кластер в Париже. Он построен на основе серверов Dell PowerEdge XE9680, оснащённых ускорителями NVIDIA H200. В декабре того же года компаняи анонсировала строительство кластера на базе H100 в ЦОД Digital Realty в Марселе. Сейчас компания управляет 1 ГВт мощностей и использует более 100 тыс. ИИ-ускорителей, отмечает DataCenter Dynamics.

Постоянный URL: http://servernews.ru/1118460

11.02.2025 [16:24], Владимир Мироненко

ИИ ЦОД за 20 недель: G42 и DataOne построят крупнейший во Франции суперкомьютер на чипах AMD Instinct

Холдинг G42 из Абу-Даби (ОАЭ) объявил о стратегических инвестициях во Франции в партнёрстве с недавно образованной DataOne, которая сама себя называет первым в Европе оператором гига-ЦОД для ИИ. Вместе компании в кратчайшие сроки построят в Гренобле ИИ ЦОД, оснащённый ускорителями AMD Instinct.

Ожидается, что объект будет полностью введён в эксплуатацию к середине 2025 года. Вычислительные возможности нового ЦОД позволят французским компаниям и учёным разрабатывать передовые модели ИИ, агентов и приложения, а также проводить различные исследования. Реализацией проекта будет заниматься компания Core42, дочернее предприятие G42, совместно с DataOne. По словам главы DataOne Шарля-Антуана Бейни (Charles-Antoine Beyney), на развёртывание крупнейшего ИИ-суперкомпьютера в Европе потребуется всего 20 недель. Для сравнения: кластер xAI Colossus был построен за 122 дня.

Как заявила Лиза Су (Lisa Su), председатель и генеральный директор AMD, стратегическое сотрудничество с G42 поможет активизировать французскую экосистему ИИ, предоставив вычислительную мощность, необходимую для поддержки местных стартапов и новаторов, занимающихся передовыми разработками, которые укрепляют французскую экономику. «Работа с G42 является ещё одним примером нашей приверженности объединению открытых экосистем с ведущими в отрасли технологиями ИИ AMD, что обеспечивает возможность государственным учреждениям и частным предприятиям использовать весь потенциал ИИ», — подчеркнула Лиза Су.

Источник изображения: AMD

Инвестиции G42 входят в пакет частных инвестиций в ИИ-инфраструктуру страны на €109 млрд, анонсированный президентом Франции Эммануэле Макроном (Emmanuel Macron) в качестве ответа на представленный в США проект Stargate. Ранее было объявлено о планах ОАЭ вложить при участии фонда MGX €30–50 млрд в проект по созданию кампуса ИИ ЦОД во Франции.

В G42 называют инвестиции в ИИ одним из главных направлений своей деятельности. Деятельность холдинга получила поддержку Microsoft, инвестировавшей в него $1,5 млрд. В прошлом году G42 договорился с Cerebras о строительстве в Техасе ИИ-суперкомпьютера со 173 млн ядер.

Постоянный URL: http://servernews.ru/1118074

11.02.2025 [13:47], Руслан Авдеев

Tesla запустила суперкомпьютер Cortex с 50 тыс. ускорителей NVIDIA H100, а общие затраты компании на ИИ уже превысили $5 млрд

Компания Tesla завершила ввод в эксплуатацию ИИ-кластера из 50 тыс. ИИ-ускорителей NVIDIA H100 в IV квартале прошлого года. В презентации для акционеров отмечалось, что кластер Cortex заработал на принадлежащем Tesla объекте Gigafactory в Остине (Техас), сообщает Datacenter Dynamics.

Информация впервые появилась в отчёте компании за IV квартал и 2024 финансовый год. Новый кластер не имеет отношения к суперкомпьютеру Dojo, предназначенному для технологий автономного вождения FSD, имеющего собственную архитектуру и оснащенного кастомными чипами D1. При этом в презентации, посвящённой отчёту, Dojo не упоминается вообще.

Хотя компания не уточняет, когда именно в IV квартале началось развёртывание системы, на конференции по финансовым вопросам в октябре 2024 года представитель Tesla заявил, что компания находится «на пути к развёртыванию 50 тыс. ускорителей в Техасе к концу текущего месяца». По имеющимся данным, проект реализован с опозданием, поскольку Илон Маск уволил руководителя строительством ещё в апреле, а также приказал передать xAI 12 тыс. ускорителей H100, изначально предназначавшихся Tesla.

Источник изображения: Tesla

В презентации сообщается, что именно Cortex уже помог в создании «автопилота» FSD V13 (Supervised). Новая версия повысила безопасность и комфорт вождения благодаря увеличению объёма данных в 4,2 раза, повышению разрешения видеопотока, а также другим усовершенствованиям. Заодно компания сообщила о продолжении работ над программной и аппаратной частями робота Optimus, в т.ч. рук нового поколения и механизмов передвижения. Также осуществлялось обучение выполнению дополнительных задач перед началом пилотного производства в 2025 году.

Что касается доходов компании в IV квартале, в конце января Илон Маск (Elon Musk) сообщил, что бизнес продолжает инвестировать в обучающую инфраструктуру за пределами штаб-квартиры в Техасе. В конце января сообщалось, что Tesla наращивает вычислительные мощности для обучения Optimus. По словам миллиардера, на обучение Optimus необходимо потратить, как минимум, в 10 раз больше ресурсов в сравнении с полноценным обучением систем автомобиля.

Капитальные затраты Tesla в 2024 году составили $10 млрд, столько же компания намерена потратить в ближайшие два года, хотя большая часть затрат придётся на инфраструктуру для электромобилей. В отчёте о доходах за IV квартал упоминалось, что общие капитальные затраты компании, связанные с ИИ, включая инфраструктуру, превысили $5 млрд.

Постоянный URL: http://servernews.ru/1118071

31.01.2025 [20:57], Руслан Авдеев

ИИ-модели OpenAI и суперкомпьютер Venado встанут на защиту национальной безопасности США

Лос-Аламосская национальная лаборатория США (LANL) заключила соглашение с OpenAI об использовании моделей серии o на ИИ-суперкомпьютере Venado. Система, оснащённая суперускорителями NVIDIA GH200, среди прочего будет использоваться для исследований в сфере национальной безопасности.

Новые модели способны решать всё более сложные научные задачи, в том числе прикладные. В лаборатории подчеркнули, что угрозы для страны становятся всё более сложными и актуальными, поэтому нужны новые подходы для обеспечения её безопасности. Модели OpenAI, в частности вариант o1, позволят более эффективно справляться с задачами и помогут решить некоторые насущные проблемы страны.

Venado включат в защищённую секретную сеть, где его ресурсами смогут воспользоваться исследователи из Лос-Аламоса, Ливерморской национальной лаборатории (LLNL) или Сандийских национальных лабораторий (SNL). Сотрудничество этих структур Министерства энергетики США (DoE) с IT-компаниями обеспечит новые возможности для научных исследований. Сообщается, что почти во всех проектах лаборатории ИИ уже используется в том или ином качестве.

Источник изображения: Markus Winkler/unsplash.com

Ранее LANL сотрудничала с OpenAI над повышением безопасности ИИ и оценкой «способности к рассуждению» модели o1. Теперь модели OpenAI регулярно используются национальными лабораториями в энергетических проектах, разработке новых материалов и создании квантовых алгоритмов. Использование моделей в секретной сети только расширит их возможности и позволит вносить более глубокий вклад в выполнение разных задач.

Новые ИИ-модели, по словам LANL, позволят США пересмотреть сами основы научных знаний и достигнуть нового уровня технического прогресса. С их использованием можно найти новые способы лечения и профилактики заболеваний, добиться лидерства в энергетической сфере благодаря раскрытию полного потенциала природных ресурсов и преобразовать энергетическую инфраструктуру страны, лучше выявлять природные и антропогенные угрозы, от биологических до кибернетических или угроз энергосистеме — ещё до их реального возникновения.

Источник изображения: LANL

Также известно о сотрудничестве LANL и OpenAI для оценки возможностей ИИ в биологических исследованиях. Так, по данным The Register, оценивались возможности ИИ для создания биологического оружия. Впрочем, нашлось им и более мирное применение — оценка снижении угрозы ядерной войны и ядерных угроз вообще.

Это не единственный из недавних примеров сотрудничества OpenAI с американским правительством. Пару дней назад компания заявила о премьере бота ChatGPT Gov — варианта корпоративной версии ChatGPT Enterprise. Предварительные испытания уже прошли в нескольких организациях для обработки «непубличных конфиденциальных данных».

Постоянный URL: http://servernews.ru/1117556

30.01.2025 [08:58], Владимир Мироненко

Суперкомпьютер Aurora стал доступен исследователям со всего мира

Аргоннская национальная лаборатория (ANL) Министерства энергетики США объявила о доступности суперкомпьютера Aurora экзафлопсного класса для исследователей по всему миру. Как указано в пресс-релизе, благодаря широким возможностям моделирования, ИИ и анализа данных, Aurora будет способствовать прорывам в целом ряде областей, включая проектирование самолётов, космологию, разработку лекарств и исследования в сфере ядерной энергетики.

Майкл Папка (Michael Papka), директор Argonne Leadership Computing Facility (ALCF), вычислительного центра Управления науки Министерства энергетики США, отметил, что уже первые проекты с использованием Aurora продемонстрировали его огромным потенциал. «С нетерпением ждём, как более широкое научное сообщество будет использовать систему для преобразования своих исследований», — заявил он.

Aurora уже зарекомендовала себя как один мировых лидеров по производительности ИИ, заняв первое место в бенчмарке HPL-MxP в ноябре 2024 года, отметила ANL. Возможности машины для выполнения ИИ-задач используются учёными для открытия новых материалов для аккумуляторов, разработки новых лекарств и ускорения исследований в области термоядерной энергии. Перед его развёртыванием команда под руководством ANL продемонстрировала потенциал Aurora, используя его для обучения моделей ИИ для моделирования белков.

Источник изображения: ANL

В числе первых проектов, реализуемых с помощь Aurora, — разработка высокоточных моделей сложных систем, таких как кровеносная система человека, ядерные реакторы и сверхновые звезды. Кроме того, способность суперкомпьютера к обработке огромных наборов данных имеет решающее значение для анализа растущих потоков данных из крупных исследовательских установок, таких как Усовершенствованный источник фотонов (APS) Аргоннской национальной лаборатории, научные объекты Управления науки Министерства энергетики США (DoE) и Большой адронный коллайдер Европейской организации ядерных исследований (CERN).

Чтобы гарантировать готовность Aurora к использованию для научных исследования с первого дня запуска, при его создании применили так называемое совместное проектирование. Используя этот подход, команда Aurora разработала в тандеме аппаратное и программное обеспечение для оптимизации производительности и удобства использования. Это потребовало многолетнего сотрудничества между ALCF, Intel, HPE и исследователями по всей стране, участвующими в проекте Exascale Computing Project (ECP) Министерства энергетики США и программе Aurora Early Science Program (ESP) центра.

Пока велись работы по монтажу Aurora, команды ECP и ESP запускали приложения для стресс-тестирования оборудования, одновременно оптимизируя свой код для максимально эффективной работы в системе. В результате десятки научных приложений, а также широкий спектр ПО и инструментов разработки были готовы ещё до того, как Aurora ввели в строй, говорится в пресс-релизе.

Постоянный URL: http://servernews.ru/1117467

19.01.2025 [22:43], Сергей Карасёв

Германия запустила «переходный» 48-Пфлопс суперкомпьютер Hunter на базе AMD Instinct MI300A

Центр высокопроизводительных вычислений HLRS при Штутгартском университете в Германии объявил о вводе в эксплуатацию НРС-системы Hunter. Этот суперкомпьютер планируется использовать для решения широко спектра задач в области инженерии, моделирования погоды и климата, биомедицинских исследований, материаловедения и пр. Кроме того, комплекс будет применяться для крупномасштабного моделирования, ИИ-приложений и анализа данных.

О создании Hunter сообщалось в конце 2023 года: соглашение на строительство системы стоимостью примерно €15 млн было заключено с HPE. Проект финансируется Федеральным министерством образования и исследований Германии и Министерством науки, исследований и искусств Баден-Вюртемберга.

Hunter базируется на той же архитектуре, что El Capitan — самый мощный в мире суперкомпьютер. Задействована платформа Cray EX4000, а каждый из узлов оснащён четырьмя адаптерами HPE Slingshot. Суперкомпьютер использует комбинацию из APU Instinct MI300A и процессоров EPYC Genoa. Как отмечает The Register, в общей сложности система объединяет 188 узлов с жидкостным охлаждением и насчитывает суммарно 752 APU и 512 чипов Epyc с 32 ядрами. Применена СХД HPE Cray Supercomputing Storage Systems E2000, специально разработанная для суперкомпьютеров HPE Cray.

Источник изображения: HLRS

HLRS оценивает пиковую теоретическую FP64-производительность Hunter в 48,1 Пфлопс на операциях двойной точности, что практически вдвое выше, чем у предшественника Hawk. В режимах BF16 и FP8 быстродействие, как ожидается, будет варьироваться от 736 Пфлопс до 1,47 Эфлопс. При этом Hunter потребляет на 80% меньше энергии, нежели Hawk.

Источник изображения: Штутгартский университет

Отмечается, что Hunter задуман как переходная система, которая подготовит почву для суперкомпьютера HLRS следующего поколения под названием Herder. Ввести этот комплекс в эксплуатацию планируется в 2027 году. Предполагается, что он обеспечит производительность «в несколько сотен петафлопс».

Постоянный URL: http://servernews.ru/1116966

18.01.2025 [22:31], Владимир Мироненко

CoreWeave поставит IBM ИИ-суперкомпьютер на базе NVIDIA GB200 NVL72 для обучения моделей Granite

CoreWeave и IBM заключили соглашение о сотрудничестве, в рамках которого стартап поставит IBM один из первых своих ИИ-суперкомпьютеров на базе NVIDIA GB200 NVL72 с интерконнектом Quantum-2 InfiniBand. В качестве хранилища будет использоваться высокопроизводительная All-Flash СХД IBM Storage Scale System. IBM будет использовать облачную платформу CoreWeave для обучения семейства больших языковых моделей (LLM) Granite.

Источник изображения: CoreWeave

Сообщается, что облачная платформа CoreWeave специально создана для обеспечения ведущей в отрасли производительности, надёжности и отказоустойчивости с безопасностью корпоративного уровня. Фирменный набор ПО и облачные сервисы предоставляют инструменты, необходимые для управления самой сложной и масштабной ИИ-инфраструктурой. В рамках соглашения о сотрудничестве клиенты CoreWeave получат доступ к платформе IBM Storage.

По словам вице-президента по ИИ в IBM Research, платформа CoreWeave позволит дополнить возможности IBM при разработке передовых, производительных и экономичных моделей для поддержки корпоративных приложений и ИИ-агентов. В свою очередь, IBM Storage Scale System расширяет возможности CoreWeave. «В рамках сотрудничества мы будем использовать этот суперкомпьютер для продвижения открытых технологий, таких как Kubernetes, которые будут поддерживать вычисления ИИ в гибридной облачной среде», — добавил представитель IBM.

Вероятно, IBM не хватает собственных вычислительных ресурсов — в ноябре появилась информация о том, что компания готова арендовать у AWS ИИ-ускорители за почти полмиллиарда долларов.

Постоянный URL: http://servernews.ru/1116957

17.01.2025 [15:17], Владимир Мироненко

NVIDIA строит в Израиле ИИ-суперкомпьютер стоимостью $500 млн

NVIDIA построит за $500 млн на севере Израиля 30-МВт научно-исследовательский суперкомпьютер на базе ускорителей Blackwell последнего поколения стоимостью около полмиллиарда долларов, сообщил The Register. Строительство кластера началось ещё в прошлом году, а закончить его планируется в I полугодии 2025 года.

Кластер будет располагаться на объекте площадью 10 тыс. м² в научно-промышленном парке Mevo Carmel недалеко от Йокнеам-Илита (Yokne'am Illit). По словам компании, он получит сотни систем Blackwell с фирменным жидкостным охлаждением, DPU BlueField-3 SuperNIC, коммутаторами Spectrum-X800 и Quantum-X800. Как полагает The Register, кластер будет использоваться NVIDIA для разработки технологий ЦОД следующего поколения.

Точное количество ускорителей не указано. У NVIDIA есть несколько эталонных систем Blackwell с жидкостным охлаждением и различным количеством ускорителей. Согласно публикациям израильских СМИ, полная конфигурация нового суперкомпьютера будет включать «несколько тысяч» GPU, что позволит ему соперничать с национальным суперкомпьютером Israel-1. Israel-1 построен на 2048 ускорителях NVIDIA H100, объединённых с помощью 80 коммутаторов Spectrum-4. Суперкомпьютер имеет пиковую FP64-производительность до 137 Пфлопс, а FP8 — до 8 Эфлопс.

Источник изображения: NVIDIA

The Register отметил, что на реализации проекта могут отразиться новые экспортные ограничения США. Согласно правилам AI Diffusion rule, Израиль относится к странам второго уровня с квотой на поставку до 50 тыс. передовых ускорителей в течение двухлетнего периода (2025–2027 гг.). Впрочем, эти правила вступят в силу через 120 дней с момента публикации, поэтому у NVIDIA в запасе достаточно времени для поставки необходимого количества ускорителей в Израиль.

С учётом прочных связей Израиля с США есть большая вероятность того, что стране будет предоставлен статус National Verified End User, что увеличит лимит импорта до 320 тыс. ускорителей в течение двухлетнего периода, отметил The Register.

Постоянный URL: http://servernews.ru/1116883

17.01.2025 [01:07], Алексей Степин

США готовятся к созданию суперкомпьютера нового поколения с 10 Пбайт RAM

Суперкомпьютеру Crossroads (ATS-3), расположенному в Лос-Аламосской национальной лаборатории (LANL) Министерства энергетики США (DoE), не так уж много лет. Система мощностью 30 Пфлопс запущена в 2023 году, но ей уже готовится замена в лице суперкомпьютера нового поколения под кодовым названием ATS-5.

Министерство энергетики совместно с Национальным управлением по ядерной безопасности (NNSA) раскрыли некоторые детали, касающиеся этого проекта. Главной задачей ATS-5 станет запуск высокоточных 3D-симуляций для оценки перспектив модернизации и поддержания в актуальном состоянии ядерного арсенала США. Симуляции со столь высокой детализацией очень сложны и относятся к классу «геройских» (hero-class). Их прогон может занимать несколько месяцев, но ATS-5 должен не только сократить это время до дней, но и обеспечить обработку нескольких таких симуляций параллельно.

Монтаж Crossroads. Источник здесь и далее LANL

NNSA не сообщает о том, будет ли ATS-5 относится к системам экзафлопсного класса, но судя по употреблению термина «post-exascale system» и сложности планируемых для запуска симуляций, новый суперкомпьютер будет достаточно мощным. Известен уровень его энергопотребления — порядка 20 МВт. Для сравнения, Frontier (1,35 Эфлопс FP64) потребляет 21 МВт, а El Capitan (1,74 Эфлопс FP64) — около 30 МВт.

По замыслу DoE, ATS-5 станет модульной системой со смешанной архитектурой, сфокусированной не только на HPC-задачах (FP64), но и на ИИ-сценариях с их упрощёнными форматами вычислений. Упор делается на размещении данных ближе к вычислительным узлам, увеличении объёмов памяти (в настоящее время заявлено 10,1 Пбайт) и ускорении её работы.

В качестве интерконнекта может быть применена смесь технологий InfiniBand и Ethernet, развивающая от 100 до 300 Гбайт/с в каждом направлении. Модульность означает возможность замены ускорителей и процессоров на протяжении всего срока эксплуатации ATS-5. Помимо ускорителей NVIDIA рассматривается возможность использования квантовых ускорителей, а также чипов Cerebras, Groq и SambaNova. ПО практически целиком должно быть open source, но и от CUDA при необходимости отказываться не будут.

Министерство энергетики США надеется разместить контракт на постройку ATS-5 в мае текущего года. Поставки оборудования должны начаться в конце 2026 или начале 2027 гг, а ввод системы в строй намечен на август-сентябрь 2027 года. Тогда же будет выведен из строя Crossroads (ATS-3).

Постоянный URL: http://servernews.ru/1116856