Материалы по тегу: hardware

24.11.2024 [09:54], Сергей Карасёв

AIC и ScaleFlux представили JBOF-массив на основе NVIDIA BlueField-3

Компании AIC и ScaleFlux анонсировали систему F2026 Inference AI для ресурсоёмких приложений ИИ с интенсивным использованием данных. Решение выполнено в форм-факторе 2U. В оснащение входят два DPU NVIDIA BlueField-3, которые могут работать на скорости до 400 Гбит/с. Эти изделия способны ускорять различные сетевые функции, а также операции, связанные с передачей и обработкой больших массивов информации.

Во фронтальной части F2026 Inference AI расположены 26 отсеков для высокопроизводительных вычислительных SSD семейства ScaleFlux CSD5000 (U.2). Накопители с интерфейсом PCIe 5.0 (NVMe 2.0b) имеют вместимость 3,84, 7,68, 15,36, 30,72, 61,44 и 122,88 Тбайт, а с учётом компрессии эффективная ёмкость может достигать приблизительно 256 Тбайт. Реализована поддержка TCG Opal 2.02 и шифрования AES-256, NVMe Thin Provisioned Namespaces Virtualization (48PF/32VF), ZNS, FDP.

Платформа F2026 Inference AI представляет собой JBOF-массив, способный на сегодняшний день хранить 1,6 Пбайт информации (эффективный объём). В следующем году показатель будет доведён до 6,6 Пбайт. Утверждается, что сочетание BlueField-3 и энергоэффективной технологии хранения ScaleFlux помогает минимизировать энергопотребление, а также повысить долговечность и надёжность.

Результаты проведённого тестирования F2026 Inference AI демонстрируют пропускную способность при чтении до 59,49 Гбайт/с, при записи — более 74,52 Гбайт/с. Благодаря объединению средств хранения, сетевых функций и инструментов безопасности в одну систему достигается снижение эксплуатационных расходов, что позволяет оптимизировать совокупную стоимость владения (TCO).

 Источник изображения: AIC

Источник изображения: AIC

Новинка является лишь одной из вариаций решений на базе F2026. Платформа, в частности, поддерживает работу других DPU, включая Kalray 200 и Chelsio T7. Также упоминается вариант шасси на 32 накопителя EDSFF E3.S/E3.L.

Постоянный URL: http://servernews.ru/1114474
23.11.2024 [15:57], Сергей Карасёв

Microsoft и Meta✴ представили дизайн ИИ-стойки с раздельными шкафами для питания и IT-оборудования

Корпорация Microsoft в сотрудничестве с Meta представила дизайн серверной стойки нового поколения для дата-центров, ориентированных на задачи ИИ. Спецификации системы, получившей название Mt. Diablo, предоставляются участникам проекта Open Compute Project (OCP).

Отмечается, что инфраструктура ЦОД постоянно эволюционирует, а наиболее значительное влияние на неё оказывает стремительное внедрение ИИ. Тогда как традиционные стойки с вычислительным оборудованием и средствами хранения данных имеют мощность максимум до 20 кВт, при размещении современных ИИ-ускорителей этот показатель исчисляется сотнями киловатт. В результате при развёртывании дата-центров могут возникать различные сложности.

Идея Mt. Diablo заключается в разделении стойки на независимые шкафы для компонентов подсистемы питания и вычислительного оборудования. То есть, речь идёт о дезагрегированной архитектуре, позволяющей гибко регулировать мощность в соответствии с меняющимися требованиями.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Одним из ключевых преимуществ нового подхода является оптимизация пространства. Утверждается, что в каждой серверной стойке можно размещать на 35 % больше ИИ-ускорителей по сравнению с традиционным дизайном. Ещё одним достоинством названа масштабируемость: конфигурацию стойки питания можно изменять в соответствии с растущими потребностями. Плюс к этому модульная конструкция позволяет реализовывать несколько проектов одновременно.

Отмечается, что в современных OCP-системах уже используется единая шина питания постоянного тока с напряжением 48 В. В случае с новым дизайном возможен переход на архитектуру 400 В DC. Это открывает путь для создания более мощных и эффективных систем ИИ. Однако для внедрения стандарта 400 В потребуется общеотраслевая стандартизация. В индивидуальных проектах — например, суперкомпьютерах — для питания узлов уже используется шина HVDC.

Постоянный URL: http://servernews.ru/1114464
23.11.2024 [15:35], Сергей Карасёв

Eviden создаст для Финляндии ИИ-суперкомпьютер Roihu производительностью 49 Пфлопс

Компания Eviden (дочерняя структура Atos) объявила о заключении соглашения с Финским научным IT-центром CSC о создании нового национального суперкомпьютера для задач ИИ. Система под названием Roihu, как ожидается, утроит вычислительную мощность существующих комплексов Puhti и Mahti.

Суперкомпьютер Puhti общего назначения, запущенный в 2019 году, построен на платформе Atos BullSequana X400 (X1000). В общей сложности используются 682 узла CPU на процессорах Intel Xeon Cascade Lake-SP с пиковой FP64-производительностью 1,8 Пфлопс. Кроме того, применены 80 узлов GPU, каждый из которых несёт на борту четыре ускорителя NVIDIA V100: быстродействие этой секции — до 2,7 Пфлопс. Основной интерконнект — InfiniBand HDR100.

В свою очередь, система Mahti (на изображении), введённая в эксплуатацию в 2020-м, основана на платформе Atos BullSequana XH2000. Суперкомпьютер насчитывает 1404 узла CPU и 24 узла GPU с теоретической пиковой FP64-производительностью 7,5 Пфлос и 2,0 Пфлопс соответственно. Все узлы содержат по два чипа AMD Rome 7H12, тогда как GPU-серверы комплектуются четырьмя ускорителями NVIDIA Ampere A100.

 Источник изображения: CSC

Источник изображения: CSC

В основу нового суперкомпьютера Roihu ляжет гибридная платформа BullSequana XH3000, которая позволяет объединять в рамках одного кластера чипы AMD, Intel и NVIDIA. Теоретическая пиковая производительность заявлена на уровне 49 Пфлопс (точность вычислений не уточняется). Прочие технические характеристики проектируемой машины пока не раскрываются.

Стоимость контакта по созданию Roihu оценивается в €60 млн. Систему планируется использовать для широкого спектра задач, включая анализ аудио- и видеозаписей, ресурсоёмкие приложения ИИ в различных областях и традиционные нагрузки, такие как гидродинамика и моделирование климата. Кроме того, мощности суперкомпьютера будут применяться в образовательных целях.

Постоянный URL: http://servernews.ru/1114459
23.11.2024 [12:26], Сергей Карасёв

«Аквариус» и «Группа Астра» представили ПАК облачной инфраструктуры Aquarius AIC

Компания «Аквариус» и «Группа Астра» объявили о разработке российского программно-аппаратного комплекса (ПАК) облачной инфраструктуры Aquarius AIC. Решение, как ожидается, заинтересует предприятия из различных отраслей, включая электроэнергетику, нефтегазовый сектор, промышленное производство и пр.

По заявлениям разработчиков, Aquarius AIC — это высокоадаптивное и безопасное облачное решение, предназначенное для создания программно-определяемого инфраструктурного слоя. Все аппаратные компоненты для платформы предоставляются «Аквариусом»: в их число входят серверы, СХД и коммутационное оборудование.

Программная часть базируется на платформе Astra Infrastructure Cloud (AIC), разработанной «Группой Астра». Она предназначена для построения защищённого частного облака с возможностью предоставления различных услуг. Среди её ключевых характеристик названы:

  • Безопасность — сертифицированные средства защиты информации Astra Linux;
  • Модульность — гибкая настройка и возможность интеграции в существующую инфраструктуру;
  • Отказоустойчивость и катастрофоустойчивость — возможность работы в нескольких ЦОД;
  • Автоматизированная установка — готовый инсталлятор для развёртывания всех компонентов;
  • Масштабируемость — быстрое расширение ресурсов облака;
  • Аттестация — построение облака для критической информационной инфраструктуры;
  • Контроль и учет потребляемых ресурсов — тарификация и биллинг на портале самообслуживания;
  • Мониторинг — контроль состояния и производительности.
 Источник изображения: «Аквариус»

Источник изображения: «Аквариус»

Отмечается, что на основе ПАК Aquarius AIC может предоставляться полный набор сервисов: аренда вычислительных ресурсов (IaaS), готовая платформа с определёнными настройками под различные задачи (PaaS), полностью готовое решение (SaaS) для обеспечения соответствия корпоративным стандартам как для крупных предприятий, так и для малого и среднего бизнеса. ПАК успешно протестирован в лаборатории Центра разработок «Аквариус» командами разработчиков, архитекторов и инженеров обеих компаний. В частности, проведены функциональные и нагрузочные испытания.

Нужно отметить, что «Аквариус» и «Группа Астра» предлагают и другие совместные решения. Ранее компании представили ПАК системы резервного копирования AQ_ServRuBackup. Кроме того, «Аквариус» и «Тантор Лабс» (входит в «Группу Астра») развивают ПАК Tantor XData, предназначенный для обслуживания СУБД Tantor.

Постоянный URL: http://servernews.ru/1114454
23.11.2024 [10:43], Сергей Карасёв

«Сбер» приобрёл долю в IT-компании «Аквариус»

Структура «СберИнвест» («Сбербанк Инвестиции»), входящая в блок корпоративно-инвестиционного бизнеса «Сбера», по сообщению РБК, заключила сделку по приобретению 12-процентной доли в компании «Аквариус» — российском разработчике и производителе компьютерной техники и IT-решений.

Как рассказали осведомленные источники, обсуждение сделки велось достаточно давно. Закрыта она была в I половине 2024 года, но известно об этом стало только сейчас. Говорится, что привлечённые средства направлены на финансирование инвестиционной программы «Аквариуса».

Участники рынка считают, что сделка выгодна обеим сторонам. В частности, для «Сбера» она является стратегической инвестицией. Благодаря участию в структуре «Аквариуса» кредитная организация сможет ускорить инициативы по импортозамещению и расширить стек отечественных технологий. У «Сбера» существует потребность в российском оборудовании для выполнения требований указа президента для владельцев критической информационной инфраструктуры (КИИ).

 Источник изображения: «Аквариус»

Источник изображения: «Аквариус»

В свою очередь, «Аквариус» получит дополнительные средства, которые могут быть направлены на установку нового производственного оборудования, закупку компонентов и пр. Кроме того, как ожидается, «Сбер» выступит одним из банков — организаторов первичного публичного размещения акций «Аквариуса» на бирже (IPO). Осуществить данную процедуру IT-производитель рассчитывает в 2025 году.

Постоянный URL: http://servernews.ru/1114460
22.11.2024 [11:55], Руслан Авдеев

Одна из структур Минпромторга закупит ИИ-серверы на 665 млн рублей

Подведомственный Минпромторгу ФГАУ «Федеральный центр прикладного развития искусственного интеллекта» (ФЦПРИИ) объявил аукцион на закупку серверного и телеком-оборудования для обучения ИИ-моделей на сумму 665 млн руб., сообщают «Ведомости». Информация опубликована 11 ноября на портале госзакупок.

Техзадание ФЦПРИИ предусматривает закупку восьми серверов на базе ИИ-ускорителей на 412,97 млн руб., двух вариантов систем хранения данных на 87,89 млн руб. и 89,06 млн руб. и классических серверов, но конкретные разработчики оборудования в документации к аукциону не указаны. В Минпромторге и ФЦПРИИ отказались от комментариев. По мнению экспертов, заказчик намерен сформировать высокопроизводительный вычислительный кластер как для обучения ИИ, так и для выполнения научно-технических вычислений большой сложности.

 Источник изображения: Astemir Almov/unsplash.com

Источник изображения: Astemir Almov/unsplash.com

Отраслевые эксперты подчёркивают, что в России ускорителей для ИИ не производят, поэтому необходимо закупать соответствующие системы на стороне. По данным одного из источников «Ведомостей», на уровне предположений речь, вероятно, идёт о покупке серверов NVIDIA HGX H200 для обучения больших языковых моделей (LLM) — о закупках такого оборудования косвенно свидетельствует цена более 50 млн руб. за штуку. При этом производителями собственно серверов могут выступать как зарубежные, так и российские компании.

Над серверами для ИИ работают многие российские компании. В апреле сообщалось, что в реестре радиоэлектронной продукции Минпромторга появился первый отечественный сервер для работы ИИ с поддержкой подключения нескольких ускорителей — Delta Sprut от ООО «Дельта компьютерс» (Delta Computers), позволяющий подключить до 16 ускорителей.

Постоянный URL: http://servernews.ru/1114417
22.11.2024 [10:15], Сергей Карасёв

Oracle объявила о доступности облачного ИИ-суперкомпьютера из 65 тыс. NVIDIA H200

Корпорация Oracle сообщила о доступности облачного суперкластера с ускорителями NVIDIA H200, предназначенного для ресурсоёмких ИИ-нагрузок, включая обучение больших языковых моделей (LLM). Арендовать мощности системы можно по цене от $10 в час в расчёте на GPU.

Кластер масштабируется до 65 536 ускорителей. В максимальной конфигурации теоретическое пиковое быстродействие достигает 260 Эфлопс на операциях FP8, что более чем в четыре раза превышает показатели систем предыдущего поколения. Утверждается, что на сегодняшний день это самый высокопроизводительный облачный ИИ-суперкомпьютер, доступный в облаке. Сейчас компания готовится к созданию облачного кластера из 131 тыс. NVIDIA B200.

Новые инстансы получили обозначение BM.GPU.H200.8. Каждая виртуальная машина типа Bare Metal (без гипервизора) содержит восемь изделий NVIDIA H200 (141 Гбайт памяти HBM3e), объединённых посредством NVIDIA NVLink. Задействованы два процессора Intel Xeon Platinum 8480+ поколения Sapphire Rapids (56C/112T; до 3,8 ГГц; 350 Вт). Объём системной памяти DDR5 составляет 3 Тбайт. В состав локального хранилища входят восемь NVMe SSD вместимостью 3,84 Тбайт каждый.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Кластер использует кастомную RoCE-сеть на базе NVIDIA ConnectX-7 с суммарной пропускной способностью 3200 Гбит/с (восемь каналов по 400 Гбит/с) на узел. Инстансы включают frontend-сеть с пропускной способностью 200 Гбит/с. По данным Oracle, каждый инстанс в суперкластере содержит на 76 % больше памяти HBM по сравнению с виртуальными машинами на основе NVIDIA H100, а пропускная способность памяти увеличена на 40 %. Таким образом, производительность инференса выросла в 1,9 раза.

Постоянный URL: http://servernews.ru/1114406
21.11.2024 [18:26], Руслан Авдеев

Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии

Японская энергокомпания Hokkaido Electric Power выразила интерес к перезапуску одного из остановленных ядерных реакторов единственной на Хоккайдо АЭС Tomari Nuclear Power Plant для удовлетворения потребностей в энергии местных ЦОД. По данным Datacenter Dynamics, подготовительные работы близки к завершению.

Об этом объявил генеральный директор Hokkaido Electric Power Сусуму Сайто (Susumu Saito). По его словам, компания завершает процедуры, необходимые для перезапуска реактора Tomari 3 мощностью 912 МВт. Обоснованием необходимости перезапуска является продвигаемый энергетиками тезис о том, что прочие источники энергии на японском рынке недостаточно хороши с точки зрения стабильнности цен и поставок. В свою очередь, по мнению Сайто, атомная энергетика стабильна и обеспечивает низкие углеродные выбросы — это наилучший вариант для энергоёмких ЦОД.

Третий реактор АЭС был выведен из эксплуатации после катастрофы на «Фукусиме» в 2011 году, случившейся после разрушительных землетрясений и цунами — Tomari 3 отключили 5 мая 2012 года. Чтобы развеять опасения экоактивистов и общественности, Hokkaido Electric Power предложила построить из бетона и укреплённого цементом грунта 19-метровую морскую дамбу для защиты реактора от вероятных стихийных бедствий. Проект оценивается в $1,16 млрд, на его реализацию уйдёт около трёх лет.

 Источник изображения: Mugu-shisai/wikipedia

Источник изображения: Mugu-shisai/wikipedia

Возвращение японских компаний к атомной энергетике — вполне в духе современных трендов на рынке электричества, в первую очередь обусловленного стремительным ростом дата-центров. Ранее сообщалось, что Япония намерена было возобновить работу некоторых реакторов, включая крупнейшую в стране АЭС Kashiwasaki Kariwa мощностью 8,2 ГВт.

Несколько американских гиперскейлеров подписали в 2024 году соглашения о поставках энергии с АЭС. К их числу относится AWS, в марте купившая кампус ЦОД при АЭС, принадлежавший Talen Energy. Microsoft подписала соглашение, предусматривающее перезапуск атомной электростанции Three Mile Island мощностью 837 МВт. Собственные атомные проекты есть у Google и Oracle.

В результате коммунальные компании в США выразили готовность возобновить генерацию энергии с помощью АЭС для удовлетворения спроса ЦОД. Например, компания Vistra объявила о переговорах с несколькими крупными операторами ЦОД для увеличения производительности своих атомных проектов. Месяцем ранее NextEra Energy объявила, что рассматривает возможность перезапуска АЭС Duane Arnold в Айове из-за большого спроса на электричество со стороны ЦОД.

Постоянный URL: http://servernews.ru/1114374
21.11.2024 [17:32], Руслан Авдеев

Meta✴ планирует построить за $5 млрд кампус ЦОД Project Sucre в Луизиане

Компания Meta намерена масштабировать свои мощности ЦОД в Луизиане. По последним данным компания планирует построить многомиллиардный дата-центр для ИИ-проектов около города Монро в Луизиане, сообщает Datacenter Dynamics со ссылкой на местные СМИ.

Представитель местных властей Фостер Кэмпбелл (Foster Campbell) подтвердил информацию журналистам USA Today Network и заявил, что компания намерена вложить в проект $5 млрд. О самом проекте пока известно не очень много. Сообщается, что планы строительства кампуса поданы местным властям через дочернюю структуру Meta — Laidley LLC. Проект получил имя Project Sucre. Цитируя официальное уведомление, портал Axiom сообщает, что Meta рассчитывает использовать более 900 га земель сельскохозяйственного назначения за автомагистралью US 183.

 Источник изображения:  Joe Lavigne/unsplash.com

Источник изображения: Joe Lavigne/unsplash.com

Как стало известно совсем недавно, именно в Луизиане компания Entergy намерена построить электростанцию на природном газе мощностью 1,5 ГВт, тоже около Холли Ридж, для некого клиента, до сих пор не названного. Предполагается, что этим клиентом и станет Meta. Ранее Meta подписала PPA с RWE на 100 МВт энергии солнечной станции в Луизиане, которая должна заработать в 2025 году.

В 2024 году компания анонсировала строительство новых объектов в Индиане, Южной Каролине, Вайоминге, Миннесоте и Алабаме. В этом году она запустила кампус в Теннеси. Также компанию связывают с проектом в Дэвенпорте (Айова), хотя об этом официально и не объявлялось.

Постоянный URL: http://servernews.ru/1114370
21.11.2024 [12:23], Руслан Авдеев

Суперкомпьютеры Eviden заняли первые места в рейтинге энергоэффективных систем Green500

Входящая в группу Atos компания Eviden объявила, что 55 её суперкомпьютеров вошли в список TOP500 наиболее производительных вычислительных машин, а два из них лидируют в рейтинге наиболее энергоэффективных суперкомпьютеров мира Green500.

За последние 10 лет экспоненциально выросла вычислительная мощность, что в том числе обусловлено достижениями в области систем искусственного интеллекта. При этом растёт и энергопотребление — его снижение стало одной из главных задач при разработке и строительстве суперкомпьютеров.

В первую десятку рейтинга Green500 вошли три машины Eviden, в каждой из которых применяется проприетарная технология прямого жидкостного охлаждения, предусматривающая охлаждение суперкомпьютера тёплой водой с температурой до +40 °C, это помогает добиться отвода более 97 % тепла.

 Источник изображения: Eviden

Источник изображения: Eviden

Первое место в рейтинге занимает модуль JEDI суперкомпьютера JUPITER — первой системы экзафлопсного класса в Европе, созданный EuroHPC. На втором месте — ROMEO 2025, построенный для Университета Реймса Шампань-Арденн (URCA). Шестое место в Green500 занимает ещё один модуль суперкомпьютера JUPITER — JETI. Другими словами, Eviden стремится предлагать клиентам не только высокопроизводительные, но и экоустойчивые, экономичные машины.

В TOP500 наиболее производительных суперкомпьютеров из построенных компанией вошли французская система Jean Zay (№ 27), новейший немецкий модуль JETI для JUPITER (№ 18) и система Gefion для Датского центра инноваций в области искусственного интеллекта (DCAI) под номером 21.

По словам представителя Eviden, системы компании лидируют в рейтинге Green500 и «укрепляют лидерство Европы» на рынке HPC. Eviden, на которую работает 41 тыс. человек, предлагает решения в области ИИ, облачных платформ и предоставляет услуги более чем в 47 странах. Годовая выручка этого подразделения Atos Group составляет около €5 млрд. Сама же Atos находится не в лучшем состоянии.

Постоянный URL: http://servernews.ru/1114352

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;