Материалы по тегу: охлаждение
|
12.12.2025 [17:21], Руслан Авдеев
Никаких закладок: NVIDIA анонсировала новое ПО для мониторинга и продления жизни ИИ-ускорителей в ЦОД
dcim
nvidia
open source
software
амортизация
ии
мониторинг
охлаждение
цод
электропитание
энергоэффективность
NVIDIA разрабатывает новое открытое ПО, благодаря которому операторы ЦОД смогут получать более подробные данные о тепловом состоянии и иных параметрах работы ИИ-ускорителей. Предполагается, что это поможет решать проблемы, связанные с перегревом оборудования и его надёжностью, увеличив его срок службы и производительность. NVIDIA отдельно подчёркивает, что телеметрия собирается только в режиме чтения без слежки за оборудованием, а в ПО нет «аварийных выключателей» и бэкдоров. Да и в целом использование новинки опционально. ПО обеспечивает операторам ЦОД доступ к мониторингу потребления энергии, загрузки, пропускной способности памяти и других ключевых параметров в масштабах всего парка ускорителей. Это помогает выявлять на ранних стадиях риски и проблемные компоненты и условия работы, отслеживать использование ИИ-ускорителей, их конфигурации и ошибки. Детализированная телеметрия становится всё важнее для планирования и управления масштабными инфраструктурами, говорит компания. ПО позволит:
Такой мониторинг особенно важен на фоне недавнего отчёта учёных Принстонского университета, в котором сообщается, что интенсивные тепловые и электрические нагрузки способны сократить срок службы ИИ-чипов до года-двух, хотя обычно предполагается, что они способны стабильно проработать до трёх лет. Современные ускорители потребляют 700 Вт и более, а высокоплотные системы — от 6 кВт. Из-за этого формируются зоны перегрева, происходят колебания энергопотребления и растёт риск деградации интерконнектов в высокоплотных стойках. Телеметрия, позволяющая оценить потребление энергии в реальном времени, состояние интерконнектов, систем воздушного охлаждения и др. позволяет перейти от реактивного мониторинга к проактивному проектированию. Рабочие нагрузки можно размещать с учётом теплового режима, быстрее внедрять СЖО или гибридные системы охлаждения, оптимизировать работу сетей с уменьшением тепловыделения. Также ПО может помочь операторам ЦОД выявлять скрытые ошибки, вызванные несоответствием версий прошивки или драйверов. Благодаря этому можно повысить общую стабильность парка ускорителей. Кроме того, без задержек передаваемые данные об ошибках и состоянии компонентов могут значительно сократить среднее время восстановления работы и упростить анализ причин сбоев. Соответствующие данные могут влиять на решения о тратах на инфраструктуру и стратегию её развития на уровне предприятия.
Источник изображения: NVIDIA Как заявляют в Gartner, современный ИИ представляет собой «энергоёмкого и сильно нагревающегося монстра», разрушающего экономику и принципы работы ЦОД. В результате, предприятиям нужны специальные инструменты мониторинга и управления для того, чтобы ситуация не вышла из-под контроля. В ближайшие годы использование подобных решений, вероятно, станет обязательным. Кроме того, прозрачность на уровне всего парка оборудования становится необходимой для обоснования роста бюджетов на ИИ-инфраструктуру. По словам экспертов, такие программные инструменты позволяют оптимизировать капитальные и операционные затраты на ЦОД и инфраструктуру, запланированные на ближайшие годы. «Каждый доллар и каждый ватт» должны быть учтены при эффективном использовании ресурсов.
08.12.2025 [09:28], Руслан Авдеев
И запитать, и охладить: LG и LS сделали Microsoft пакетное предложение на инфраструктуру для ИИ ЦОД стоимостью миллиарды долларовТоп-менеджеры южнокорейских LG Group и LS Group посетили штаб-квартиру Microsoft в США для того, чтобы предложить всеобъемлющий план внедрения ИИ-инфраструктуры нового поколения. Это довольно редкий случай координации действий компаний на уровне высшего руководства для привлечения внимания одного из ключевых инвесторов в ИИ, сообщает The Korea Herald. Вместо того, чтобы предлагать отдельные продукты, южнокорейская делегация представила комплексную концепцию, направленную на решение двух главных проблем современных ЦОД — высокого тепловыделения и высокого энергопотребления. Вместо закупок компонетов по отдельности у компаний вроде Vertiv или Schneider Electric, в последнее время не готовых похвастаться малыми сроками поставок оборудования, Microsoft получила чрезвычайно выгодное пакетное предложение от вертикально интегрированных участников цепочки поставок. Для решения проблем с теплоотводом LG предложила передовые технологии терморегуляции вроде прямого жидкостного охлаждения чипов, системы иммерсионного охлаждения и чиллеры с центробежными компрессорами на магнитных подшипниках. Все эти решения направлены на оптимизацию использования энергии и улучшения коэффициента PUE. Ранее уже было объявлено о партнёрстве LG и Microsoft в вопросе охлаждения будущих ИИ ЦОД. LS предложила инфраструктурные решения, связанные непосредственно с подачей энергии, в том числе технологию шин, заменяющих громоздкие кабели для экономии места и снижения тепловыделения в условиях высокой плотности размещения оборудования в стойках, высоковольтные трансформаторы и системы подключения к энергосетям. LS включила в пакет предложений и аккумуляторные энергохранилища для сглаживания потребления в часы пиковых нагрузок. Хотя южнокорейские СМИ поспешили сообщить, что крупномасштабная сделка с Microsoft, стоимость которой оценивается в несколько миллиардов в год, уже подписана, участники делегации выпустили официальное уведомление о том, что окончательного соглашения ещё нет и дальнейшее взаимодействие продолжают обсуждать. Впрочем, присутствие топ-менеджеров двух крупных южнокорейских бизнес-групп в Редмонде уже свидетельствует о серьёзном настрое южнокорейского бизнеса позиционировать себя как инфраструктурного партнёра мирового уровня для ИИ-проектов. Стремление к унификации и объединения технологий прослеживается и среди других игроков рынка ЦОД. Так, в ноябре сообщалось, что NVIDIA ужесточит контроль над выпуском ИИ-платформ, задвинув Foxconn и других партнёров на второй план.
01.12.2025 [09:15], Руслан Авдеев
Японская Daikin намерена утроить продажи систем охлаждения ЦОД в Северной Америке, надеясь на гиперскейлеров и ИИ-бумЯпонская Daikin Industries рассчитывает утроить продажи охлаждающего оборудования для ЦОД в Северной Америке на фоне бума ИИ-технологий — до более чем ¥300 млрд ($1,92 млрд) к 2030 финансовому году, сообщает Nikkei Asian Review. Сейчас Daikin скупает технологии охлаждения американских компаний и намерена учредить отдельную штаб-квартиру для североамериканского рынка в 2026 финансовом году. Основная цель — работа со всеми гиперскейлерами. По оценкам Daikin, на Северную Америку приходится 40 % мирового рынка решений для охлаждения ЦОД, и её доля, вероятно, продолжит расти. Ключевыми заказчиками являются гиперскейлеры, и Daikin уже работает с Google и Amazon. Крупные HVAC-системы нередко приобретаются для нескольких зданий одновременно, так что объёмы единовременных продаж обычно составляют десятки миллионов долларов. Доля Daikin на североамериканском рынке, по её собственным оценкам, составляет около 12 %. Она занимает третье место в своём сегменте. К 2030 году компания намерена довести долю до 30 %. Конкуренцию ей составит как минимум LG, которая будет поставлять свои системы охлаждения для ИИ ЦОД Microsoft. В 2007 году Daikin купила малайзийскую OYL Industries, которая владела американским производителем кондиционеров McQuay International (бренд Applied). В 2023 году за ¥30 млрд ($192 млн) она купила американскую Alliance Air Products, специалиста по оборудованию для обработки воздуха. В августе того же года она приобрела американскую же Dynamic Data Centers Solutions, разрабатывавшую технологию индивидуального охлаждения стоек. Наконец, в ноябре компания купила американский стартап Chilldyne, специализирующийся на СЖО. Массовое производство систем воздушного и жидкостного охлаждения для серверов начнётся весной следующего года. По прогнозам Daikin, приблизительно 70 % рынка к 2030 году будет приходиться на системы воздушного охлаждения и около 30 % — на СЖО. Daikin намерена предлагать оптимальные комбинации этих методов для операторов ЦОД и отраслевых подрядчиков. Дополнительно она предлагает и системы контроля охлаждения. Также компания сообщает, что намерена создать в США хаб по выпуску решений для ЦОД в 2026 фискальном году для контроля над североамериканским рынком. По данным индийской Fortune Business Insights, мировой рынок систем охлаждения для ЦОД должен вырасти более чем вдвое с 2024 по 2032 гг. до $42,4 млрд. Впрочем, гиперскейлеры работают над собственными решениями, которые позволят обрести им «суверенитет» от независимых вендоров. Например, собственную СЖО всего за 11 месяцев разработала и запустила в производство AWS. А Meta✴ пришлось пойти на ухищрения, чтобы обойтись воздушным охлаждением ИИ-стоек.
28.11.2025 [21:12], Владимир Мироненко
Сбой в системе охлаждения ЦОД обрушил крупнейшую в мире товарную биржу CMEВ пятницу, 28 ноября, на мировых фьючерсных рынках началась неразбериха после того, как CME Group (Чикагская товарная биржа, Chicago Mercantile Exchange), крупнейший в мире биржевой оператор по рыночной стоимости, столкнулся с одним из самых длительных сбоев в работе за последние годы, из-за которого была приостановлена торговля акциями, облигациями, сырьевыми товарами и валютой. Как сообщает агентство Reuters со ссылкой на данные LSEG, после продолжительного перерыва торговля на CME Group возобновилась в 13:35 по Гринвичу (16:35 МСК). EBS market, платформа, используемая для обмена валюты, вновь открылась немного раньше — в 15:00 МСК, пишет Bloomberg со ссылкой на уведомление на веб-сайте CME Group. В уведомлении не содержится никакой информации о том, когда возобновят работу другие затронутые рынки, от акций до облигаций и сырьевых товаров. CME сообщила о прекращении торгов на своих ключевых площадках из-за сбоя в системе охлаждения ЦОД CyrusOne в Авроре (Aurora, Иллинойс). Сбой повлиял на фьючерсы Globex, валютный рынок EBS и другие, остановив торги фондовыми индексами, сырьевыми товарами, энергоносителями, металлами и сельскохозяйственными товарами примерно на 10 часов в период низких объемов торгов в «чёрную пятницу». По данным LSEG, из-за сбоя были приостановлены торги основными валютными парами на платформе CME EBS, а также фьючерсами на нефть WTI, пальмовое масло, золото, Nasdaq 100 и Nikkei.
Источник изображения: CyrusOne «27 ноября на нашем объекте CHI1 произошел сбой в работе холодильной установки, затронувший несколько холодильных агрегатов. Наши инженерные группы совместно со специализированными подрядчиками по механическому оборудованию работают на месте над восстановлением полной мощности охлаждения. Мы успешно перезапустили несколько охлаждающих установок с ограниченной мощностью и развернули временное охлаждающее оборудование в дополнение к нашим постоянным системам», — пояснила CyrusOne в письме ресурсу Data Center Dynamics. Компания отметила, что находится на прямой связи со всеми пострадавшими клиентами и регулярно предоставляет обновлённую информацию по мере развития ситуации. «Наши команды работают круглосуточно, чтобы как можно быстрее и безопаснее восстановить нормальную работу», — подчеркнула CyrusOne. Как сообщает Data Center Dynamics, CyrusOne управляет примерно 55 ЦОД по всему миру. В 2016 году CME Group продала за $130 млн свой ЦОД в Авроре компании CyrusOne, который тут же арендовала на 15 лет. Кампус Aurora включает три ЦОД общей площадью 41,8 тыс. м2 общей мощностью 109 МВт. Глава CMC Markets по Азии и Ближнему Востоку Кристофер Форбс (Christopher Forbes) сообщил агентству Reuters, что не видел столь масштабного сбоя порядка 20 лет. Нынешний сбой в работе CME произошёл более чем через десять лет после того, как в апреле 2014 года бирже пришлось закрыть электронную торговлю некоторыми сельскохозяйственными контрактами из-за технических проблем. В 2021 году CME подписала соглашение с Google Cloud, в рамках которого Google инвестировала в неё $1 млрд, а CME запланировала перенести свою ИТ-инфраструктуру на платформу Google Cloud в течение следующего десятилетия. Биржа также является клиентом ЦОД Equinix за пределами США. Похожая сделка была заключена между Microsoft Azure и Лондонской фондовой биржей. А Nasdaq постепенно перебирается в AWS. Последняя недавно пережила крупный сбой. UPD 01.12.2025: CyrusOne сообщила, что сбой произошёл из-за проблем с чиллерами, но компания уже приняла меры и повысила надёжность охлаждения пострадавшего ЦОД. UPD 08.12.2025: причиной сбоя официально назван человеческий фактор — при подготовке системы охлаждения к холодам не были соблюдены все необходимые процедуры.
17.11.2025 [10:14], Руслан Авдеев
Vertiv представила иммерсионные СЖО CoolCenter Immersion на 25–240 кВтVertiv объявила о выпуске системы погружного охлаждения CoolCenter Immersion. Иммерсионная СЖО обеспечивает поддерживает отвод от 25 кВт до 240 кВт на модуль ёмкостью 24U до 52U, обеспечивая при этом PUE на уровне 1,08. По словам компания, иммерсионное охлаждение играет всё более важную роль из-за повсеместного внедрения HPC- и ИИ-платформ. В Vertiv CoolCenter Immersion применяется многолетний опыт, полученный Vertiv в сфере СЖО для создания спроектированных «под ключ» систем, безопасно и эффективно справляющихся с высокоплотными системами. Операторы ЦОД смогут практично масштабировать ИИ-инфраструктуру без ущерба надёжности и удобству обслуживания. Каждая система включает внутренний или внешний резервуар для теплоносителя, блок распределения жидкости (CDU), датчики температуры, а также насосы с регулируемой скоростью работы и трубки. Модуль включает два источника питания и резервные насосы, а также встроенные датчики мониторинга состояния и 9″ сенсорный дисплей. Предусмотрена возможность подключения к системе управления зданием (BMS). Тепло отводится через пластинчатый теплообменник во внешний водяной контур. Vertiv уже заключила контракт с Digital Realty в Италии на поставку электроэнергии и систем охлаждения для римского объекта Digital ROM1 мощностью 3 МВт. Запуск ЦОД запланирован на 2027 год. На объекте будет использоваться фрикулинг и система охлаждения, готовая к ИИ-нагрузкам, передаёт DataCenter Dynamics. Сделка стала ещё одной в череде европейских проектов Digital Realty в Париже, Мадриде, Амстердаме и др.
Источник изображения: Vertiv В Digital Realty подчеркнули, что Рим становится важнейшим шлюзом для цифровой инфраструктуры между Европой и Средиземноморским регионом. Передовые технологии для ROM1 помогут стать дата-центру стратегическим ИИ-хабом, задающим новые стандарты энергоэффективности и производительности в сфере HPC. Также Vertiv работает с Nextra в Африке и намерена сотрудничать с Ezditek для создания ЦОД в Саудовской Аравии. Ранее сообщалось, что нежелание NVIDIA сертифицировать иммерсионные СЖО во многом тормозит их развитие. Прямое жидкостное охлаждение (DLC) менее эффективно, чем иммерсионные системы, но NVIDIA всё ещё считает, что пока достаточно этого. Впрочем, эксперты прогнозируют, что настоящий расцвет технологии придётся на 2027–2028 гг. Ожидается, что она будут активно распространяться после выхода ускорителей NVIDIA Rubin Ultra.
07.11.2025 [12:17], Сергей Карасёв
Sugon ScaleX640 — первая в мире стоечная система с 640 ИИ-ускорителямиКитайская компания Sugon (Dawning Information Industry), специализирующаяся на разработке суперкомпьютеров, серверов и СХД, представила ИИ-систему ScaleX640. Это, как утверждается, первое в мире решение в виде одной стойки, допускающее использование до 640 ускорителей. Суперускоритель выполнен на «сверхскоростной ортогональной архитектуре». Используются вычислительные узлы высокой плотности, которые допускают установку ИИ-карт различных производителей. Говорится о совместимости с существующей экосистемой ПО для задач ИИ. Платформа ScaleX640 предусматривает применение иммерсионного жидкостного охлаждения с фазовым переходом и высоковольтных источников питания постоянного тока (DC). СЖО способна отвести до 1,72 МВт. По заявлениям Sugon, по плотности вычислений новинка до 20 раз превосходит другие суперузлы, доступные на рынке. При этом обеспечивается высокий показатель эффективности использования электроэнергии (PUE) — 1,04. Два суперузла ScaleX640 могут формировать вычислительный блок с поддержкой 1280 ускорителей ИИ. Стойки соединяются между собой посредством высокоскоростной сети. В целом, возможно развёртывание кластеров, насчитывающих до 100 тыс. ИИ-карт. Sugon утверждает, что по сравнению с традиционными платформами новая система обеспечивает повышение производительности на 30–40 % в сценариях обучения больших языковых моделей (LLM) с триллионами параметров и инференса. Проведённое всестороннее тестирование ScaleX640 говорит о высокой надёжности и стабильности работы комплекса.
06.11.2025 [17:12], Руслан Авдеев
Daikin Applied купила разработчика необычных СЖО с отрицательным давлением ChilldyneDaikin Applied Americas сообщила о покупке компании Chilldyne — лидера в сфере СЖО с отрицательным давлением, применяемых в HCP/ИИ-платформах. Покупка поможет пополнить существующее портфолио Applied для дата-центров, поддерживая миссию компании по предоставлению комплексных решений для охлаждения, отвечающих требованиям гиперскейлеров для дата-центров следующего поколения. Сделка позволит Chilldyne быстро расширить присутствие на рынке. Как заявляют в Daikin Applied Materials, покупая Chilldyne, компания стремится удовлетворить меняющиеся потребности клиентов и задать новый стандарт при обеспечении производительности и работы без сбоев. Утверждается, что системы компании с отрицательным давлением в контуре выгоднее экономически и надёжнее в сравнении с традиционными системами для ЦОД с положительным давлением. Проще говоря, в случае повреждения контура СЖО Chilldyne Cool-Flo охлаждающая жидкость будет из него высосана, что снизит риск повреждения оборудования, вероятность незапланированных простоев и стомость обслуживания. Покупка Chilldyne стала поворотным моментом в реализации более широкой стратегии Daikin Applied по созданию всеобъемлющей экосистемы решений для охлаждения для ЦОД гиперскейл-уровня. Chilldyne и DDC Solutions, купленная Daikin Applied в августе 2025 года, позволяет интегрировать СЖО Chilldyne с модульными охлаждающими шкафами DDC. Вместе они обеспечат высокоэффективные и надёжные решения для стоек высокой плотности. Это уже третья по счёту сделка в области СЖО для ЦОД за последние недели. Так, на днях появилась новость, что Vertiv купит за $1 млрд поставщика сервисов для СЖО и HVAC PurgeRite, а Eaton поглотит Boyd Thermal, чтобы пополнить портфолио решений для ИИ ЦОД передовыми СЖО.
06.11.2025 [08:46], Руслан Авдеев
Vertiv купит за $1 млрд поставщика сервисов для СЖО и HVAC PurgeRiteVertiv Holdings объявила о покупке Purge Rite Intermediate (PurgeRite) — ведущего в США провайдера сервисов промывки, продувки и очистки HVAC и иных систем для ЦОД и других критических важных объектов. Компанию купят у Milton Street Capital приблизительно за $1 млрд наличными. Ещё до $250 млн будет выплачено в случае достижения Purge Rite определённых финансовых показателей в 2026 году. Цена покупки вдесятеро выше прогнозируемой прибыли по EBITDA за 2026 год. Ожидается, что покупка будет способствовать росту рентабельности сервисного направления Vertiv. Ожидается, что PurgeRite будет способствовать развитию возможностей Vertiv и укрепит позиции компании в качестве мирового лидера в области терморегулирования и жидкостного охлаждения. Основная цель — рынок СЖО для ИИ ЦОД. Поскольку HPC- и ИИ-фабрики будущего требуют все большей энергетической плотности, крайне важно развивать и поддерживать частоту контуров циркуляции охлаждающих жидкостей. Управление жидкостями, включая экспресс-промывку контуров для удаления засоров, продувку, удаление воздуха и иных газов, а также и заполнение чистой жидкостью — важнейший сервис, обеспечивающий работу высокоплотных ЦОД. У PurgeRite имеется инженерный опыт, собственные технологии и возможности масштабирования для обеспечения комплексного жидкостного охлаждения ЦОД по всей цепочке — от чиллеров до CDU. Благодаря прочным связям с гиперскейлерами и другими компаниями отрасли, PurgeRite, по её же словам, стала лидером в области сервисного обслуживания. После закрытия сделки активы PurgeRite объединят с существующими сервисами Vertiv, связанными с СЖО. Это обеспечит комплексные решения по управлению температурой «под ключ» — от объекта до помещения, от ряда до стойки. Ожидается, что сделка будет закрыта с IV квартале 2025 года. В это же время Eaton объявила о покупке за $9,5 млрд Boyd Thermal, одного из мировых лидеров в производстве компонентов для терморегулирования критически важных объектов, в том числе ЦОД. А Daikin Applied Americas, поставщик HVAC-решений, объявила о покупке разработчика СЖО Chilldyne. В августе она также купила поставщика стоек для HPC/ИИ-систем DDC Solutions.
05.11.2025 [14:42], Руслан Авдеев
Eaton поглотит Boyd Thermal и пополнит портфолио решений для ИИ ЦОД передовыми СЖОEaton объявила о покупке бизнеса Boyd Thermal компании Boyd Corporation, принадлежащей Goldman Sachs Asset Management. Boyd Thermal является одним из мировых лидеров в производстве компонентов для терморегулирования, систем и защищённых решений для ЦОД, аэрокосмической отрасли и других рынков, сообщает пресс-служба Eaton. Eaton обязалась заплатить $9,5 млрд за новый актив — это в 22,5 раза выше предполагаемой скорректированной прибыли EBITDA Boyd Thermal за 2026 год. Объём продаж Boyd Thermal в 2026 году прогнозируется на уровне $1,7 млрд, из которых $1,5 млрд придётся на жидкостное охлаждение. В Eaton подчеркнули, что объединение передовых технологий Boyd с глобальной сервисной моделью, существующими продуктами и масштабом Eaton обеспечит дополнительные преимущества для клиентов. В частности, объединённый опыт в области электропитания и жидкостного охлаждения позволит заказчикам быстрее удовлетворять растущие потребности в обеих областях. В Boyd заявили, что «с нетерпением» ждут объединения с Eaton, поскольку совместная продуктовая линейка позволит предлагать клиентам инновации, отвечающие требованиям ИИ ЦОД.
Источник изображения: Eaton Boyd Thermal — компания со штаб-квартирой в США, штатом более 5 тыс. сотрудников и производственными площадками в Северной Америке, Азии и Европе. Она начинала с поставок систем терморегулирования для аэрокосмической отрасли, а сегодня обслуживает рынки ЦОД, промышленности и др. В Eaton ожидают, что Boyd Thermal увеличит скорректированную прибыль на второй год после закрытия сделки. Завершение сделки запланировано на II квартал 2026 года. Eaton основана в 1911 году, специализируется на интеллектуальном управлении электроэнергией и выпускает продукцию для дата-центров, коммунальных компаний, промышленности, жилищного строительства, рынка мобильных технологий и других сфер. В 2024 году выручка компании составила почти $25 млрд — она обслуживает клиентов более чем в 160 странах. После завершения сделки бизнес Boyd по выпуску высокотехнологичных материалов продолжит действовать как независимая компания под брендом Boyd Corporation при поддержке Goldman Sachs Alternatives. Как сообщает Datacenter Dynamics, в июле 2025 года компания представила CDU-систему охлаждения, способную отводить 2,3 МВт тепла, что позволяет охлаждать более десяти стоек NVIDIA GB200 NVL72. В середине октября OCP запустила инициативу Open Data Center for AI для стандартизации инфраструктуры передовых ИИ ЦОД с мегаваттными стойками. Это может сказаться на многих отраслях, связанных с инфраструктурой дата-центров.
14.10.2025 [02:00], Сергей Карасёв
OCP запустила инициативу Open Data Center for AI для стандартизации инфраструктуры передовых ИИ ЦОД с мегаваттными стойкамиНекоммерческая организация Open Compute Project Foundation (OCP) анонсировала инициативу Open Data Center for AI по стандартизации компонентов физической инфраструктуры дата-центров, ориентированных на задачи ИИ и другие ресурсоёмкие нагрузки. Проект Open Data Center for AI является частью программы OCP Open Systems for AI, которая была представлена в январе 2024 года при участии Intel, Microsoft, Google, Meta✴, NVIDIA, AMD, Arm, Ampere, Samsung, Seagate, SuperMicro, Dell и Broadcom. Цель заключается в разработке открытых стандартов для кластеров ИИ и ЦОД, в которых размещаются такие системы. Запуск Open Data Center for AI продиктован быстрым развитием экосистемы дата-центров, результатами, полученными в рамках OCP Open Systems for AI, и новым открытым письмом о сотрудничестве, подготовленным Google, Meta✴ и Microsoft. В настоящее время, как отмечается, отрасль ЦОД сталкивается с проблемами, связанными с тем, что разрозненные усилия её участников, включая гиперскейлеров и колокейшн-провайдеров, порождают различные требования к проектированию инфраструктуры. Это замедляет внедрение инноваций и увеличивает сроки развёртывания передовых площадок. Цель Open Data Center for AI заключается в том, чтобы стандартизовать требования к системам электропитания, охлаждения и телеметрии, а также к механическим компонентам в ЦОД. Предполагается, что это обеспечит взаимозаменяемость элементов физической инфраструктуры дата-центров. При реализации инициативы Open Data Center for AI планируется использовать уже имеющиеся наработки сообщества OCP в области блоков распределения охлаждающей жидкости (CDU) и блоков распределения питания (PDU). Это, в частности, проект Mt. Diablo, который реализуется Meta✴, Microsoft и Google. Он предполагает создание общих стандартов электрических и механических интерфейсов. Идея заключается в разделении стойки на независимые шкафы для компонентов подсистемы питания и вычислительного оборудования. При этом планируется переход от единой шины питания постоянного тока с напряжением 48 В на архитектуру 400 В DC (Diablo 400). Ещё одним проектом, наработки которого пригодятся в рамках Open Data Center for AI, назван CDU Deschutes, разработанный Google. Это решение с резервными теплообменниками и насосами обеспечивает уровень доступности 99,999 %. Система Deschutes рассчитана на тепловые нагрузки до 2 МВт. Открытая спецификация позволит любой компании совершенствовать конструкцию CDU и производить изделия данного типа. Наконец, упоминаются серверные шасси Clemente, разработанные в Meta✴. Это узлы 1U, содержащие два суперчипа NVIDIA Grace Blackwell GB300 для ресурсоёмких ИИ-нагрузок. Платформа предполагает применение жидкостного охлаждения для CPU, GPU и коммутатора, а также воздушного охлаждения для других компонентов. |
|
