Материалы по тегу: дефицит

07.10.2024 [14:06], Руслан Авдеев

Не только ЦОД: производитель серверов Quanta Computer приобрёл топливные элементы для питания своего завода в Калифорнии

В современном мире электроэнергии не достаёт не только операторам дата-центров. По данным The Register, тайваньский производитель серверов Quanta Computer объявил о покупке трёх комплектов на топливных элементах Bloom Energy — от них будет питаться один из заводов компании в Калифорнии. Местная коммунальная компания фактически расписалась в своём бессилии, объявив, что сможет обеспечить электроснабжение предприятия только через несколько лет.

Ещё два комплекта производитель приобрёл в апреле этого года. Апрельская закупка обошлась компании в $50 млн, а нынешняя — в $80 млн. В предварительном заявлении производителя сообщается, что применение инновационных модульных решений для микросетей, предложенное Bloom Energy, позволит Quanta Computer избежать задержек с поставками электричества. В качестве топлива можгут применяться природный газ, водород или даже биогаз.

В заявлении Quanta не раскрываются спецификации элементов, но известно, что речь идёт о системах Bloom Energy, которые могут масштабироваться от 200 кВт до 20 МВт. Так, вариант Bloom Series 10 предлагает микросеть на 10 МВт, электроэнергия обойдётся в $0,099/кВт∙ч. Bloom Energy уже ведёт дела со многими операторами ЦОД, например AWS и CoreWeave, на объектах которых будут внедряться её топливные ячейки.

 Источник изображения: Bloom Energy

Источник изображения: Bloom Energy

Многие отрасли, в первую очередь операторы ЦОД, уже обеспокоены дефицитом электричества. Особенно это касается инфраструктуры, использующей ресурсоёмкие ИИ-ускорители. Не видя более подходящих вариантов, многие обращаются к атомной энергетике — так, недавно Microsoft заключила соглашение о возобновлении работы реактора для своих ЦОД на печальной известной АЭС Three Mile Island в США.

Постоянный URL: http://servernews.ru/1112082
07.10.2024 [12:43], Руслан Авдеев

Техас заставит операторов ЦОД строить собственные электростанции

Техасский регулятор Public Utility Commission начал предупреждать операторов дата-центров о необходимости самостоятельно снабжать свои объекты электричеством, хотя бы частично. По данным The Register, бизнесу предлагается не пристраивать ЦОД к электростанциям, а возводить новую электростанцию одновременно с дата-центром.

Представители комиссии считают, что выдача разрешений на строительство в текущей ситуации угрожает дефицитом энергии, поскольку операторы дата-центров готовы скупить всё. Техас и без того страдал от недостатка электричества в отдельные моменты новейшей истории, поэтому заявляется, что изъять ресурсы для дата-центров из общих сетей — непозволительная роскошь, особенно в долгосрочной перспективе.

Многие гиперскейлеры и без того активно участвуют в энергопроектах. Например, AWS в марте согласилась потратить $650 млн на кампус ЦОД в Пенсильвании, подключенный к АЭС Susquehanna. Constellation Energy намерена заново ввести в эксплуатацию АЭС Three Mile Island для продажи энергии Microsoft. Google и Oracle тоже изучают вопрос использования АЭС или SMR для питания будущих гигаваттных дата-центров.

 Источник изображения: Casey Horner/unsplash.com

Источник изображения: Casey Horner/unsplash.com

Представители техасских властей уже заявили, что желающие подключиться к местным энергосетям операторы в ближайшие 12–15 месяцев должны будут сами поставлять некоторое количество энергии. По их мнению, IT-гиганты могут позволить себе строительство новых электростанций. А излишки энергии, если таковые будут, от этих станций можно передавать в сети общего пользования.

Многие операторы рассматривают в качестве альтернативы обычным станциям малые модульные реакторы (SMR) вроде разработок NuScale. Но, хотя соответствующих проектов немало, некоторые эксперты допускают, что такие реакторы вообще не заработают — из-за высокой цены и массы технических недостатков, мешающих им заменить решения на ископаемом топливе даже в теории. Во всяком случае, в коммерческой эксплуатации их пока нет.

 Источник изображения: Documerica / Unsplash

Источник изображения: Documerica / Unsplash

В то же время AWS, например, рассматривала использование природного газа для электроснабжения некоторых ЦОД в Орегоне. На ирландском рынке ЦОД, где энергии тоже не хватает, Microsoft использует природный газ для питания нескольких дата-центров. Правда, по информации самой Microsoft, электростанция мощностью 170 МВт будет использовать 22 газовых генератора только временами, когда не справляется национальная энергосеть.

В прошлый четверг Министерство энергетики США также анонсировало вложение $1,5 млрд в четыре проекта энергопередачи, которые увеличат ёмкость американских сетей на 7,1 ГВт, что повысит надёжность местных энергетических сетей и, в частности, позволит подключить пока что изолированную энергосеть Техаса (ERCOT) к национальным магистралям.

Постоянный URL: http://servernews.ru/1112080
04.10.2024 [08:31], Руслан Авдеев

Евросоюзу не хватает мощностей ЦОД для обретения суверенного ИИ

Страны Евросоюза, пытающиеся развивать суверенные системы искусственного интеллекта, столкнулись с важной проблемой. По данным DigiTimes, ЕС попросту не хватает ёмкости дата-центров, чтобы удовлетворить растущий спрос.

По статистике Synergy Research Group, абсолютным лидером по ёмкости ЦОД гиперскейл-класса являются США с долей 75 %. На Евросоюз приходится лишь 16 %, хотя население надгосударственного образования значительно больше, чем в Соединённых Штатах. Другими словами, ЕС пока не удаётся удовлетворить растущий спрос на соответствующую инфраструктуру.

Как свидетельствуют данные CBRE, по состоянию на февраль 2024 года в десятку лидеров отрасли ЦОД по их числу вошли США (2710 объектов), Германия (522), Великобритания (517), Франция (315), Нидерланды (300), Россия (251), Италия (158), Польша (144), Испания (143) и Швейцария (120). Помимо США указаны страны лишь европейского региона, поскольку в Китае, Канаде и, например, Австралии тоже насчитываются сотни ЦОД.

 Источник изображения: Joss Woodhead/unsplash.com

Источник изображения: Joss Woodhead/unsplash.com

Впрочем, в последние годы Евросоюз последовательно наращивает инвестиции в дата-центры, что косвенно свидетельствует об отложенном спросе. При этом отраслевые эксперты допускают, что планы развития ЦОД в ЕС на ближайшие три года могут оказаться недостаточными для удовлетворения спроса из-за дефицита материалов и оборудования.

Принятый в ЕС в 2024 году закон задаёт стандарт регулирования отрасли, продвигая развитие и инновации. При этом Евросоюзу приходится конкурировать с США и Китаем, вкладывающими в отрасль огромные средства. Для сохранения конкурентоспособности ЕС следует обеспечить технологический суверенитет.

Ещё в 2023 году Германия удвоила инвестиции в исследование ИИ-технологий до €1 млрд ($1,11 млрд) для поддержки инициативы AI Made in Germany — это свидетельствует о желании стать одним из мировых лидеров в области искусственного интеллекта. А немецкий ИИ-стартап Aleph Alpha привлёк рекордные $500 млн, компания занимается обеспечением «суверенитета данных» — тренд востребован как в Германии, так и в Европе в целом.

 Источник изображения: Gerard Albanell / Unsplash

Источник изображения: Gerard Albanell / Unsplash

К гонке по разработке суверенных ИИ-технологий присоединяются всё больше стран Евросоюза. Усилия европейских структур соответствуют давно преследуемой Евросоюзом цели по ослаблению зависимости от IT-гигантов из США в вопросах контроля данных, от хранения до обработки. Также принимаемые меры отражают усилия ЕС, направленные на «децентрализацию» и сохранение конкурентоспособности в гонке за первенство на рынке ИИ.

В Schneider Electric заявили, что первичные рынки ЦОД, включая Франкфурт, Лондон, Амстердам, Париж и Дублин уже насыщены гиперскейлерами, поэтому отрасль сегодня фокусирует внимание на вторичных рынках, в т.ч. в Барселоне, Мадриде, Марселе, Берлине, а также в Португалии. Перспективной локацией для инвестиций со всего мира стала и Испания — благодаря обилию возобновляемой энергии и квалифицированных кадров, а также развитой телеком-инфраструктуре. Ещё в конце 2023 года говорилось о подготовке Евросоюзом облачного суверенного проекта с государственной поддержкой.

Постоянный URL: http://servernews.ru/1111935
26.09.2024 [14:27], Руслан Авдеев

Развитию ИИ ЦОД на Тайване мешает дефицит электроэнергии

Растущий спрос на электроэнергию для ИИ ЦОД вынуждает операторов расширять свои безуглеродные энергетические проекты и развивать системы СЖО. Однако не всегда и везде это удаётся. По данным DigiTimes, лидеры индустрии ЦОД подчёркивают важность бесперебойного электроснабжения для создания новых дата-центров на Тайване.

По данным доклада 2023 National Power Supply and Demand местного министерства экономики, спрос на электричество для ИИ-проектов на Тайване, вероятно, вырастет с 240 МВт в 2023 году до 2240 МВт к 2028 году. Основное энергопотребление ЦОД приходится на серверы и системы охлаждения. Отраслевые эксперты заявляют, что стабильность энергоснабжения стала главным приоритетом при выборе местоположения ЦОД. На ранних стадия планирования проекты обязательно необходимо представлять на согласование местному оператору Taipower.

 Источник изображения: American Public Power Association/unsplash.com

Источник изображения: American Public Power Association/unsplash.com

Для охлаждения серверов пока применяются преимущественно воздушные системы. Чтобы повысить их эффективность, многие ведущие компании переходят на СЖО, в том числе иммерсионное охлаждение, значительно снижая PUE. По данным DigiTimes Research, около 80 % энергопотребления ЦОД приходится на обеспечение работы серверов и охлаждение. В последнее время власти многих стран предъявляют жёсткие требования к новым ЦОД, PUE которых не должен быть выше 1,4.

Помимо обеспечения стабильного электроснабжения, операторы ЦОД также уделяют особое внимание использованию возобновляемой энергии. Тайваньская энергетическая политика пока предусматривает «безъядерный» энергопереход с агрессивным внедрением «зелёной» энергетики. С учётом наплыва иностранных компаний, желающих построить ЦОД на острове, обеспечение доступа к «зелёному» электричеству стало приоритетом.

IT-гиганты вроде AWS, Microsoft и Google активно рассматривают на Тайване переход на углеродно-нейтральные источники питания, включая АЭС. Энергокомпании действительно отмечают рост спроса со стороны операторов ЦОД на «зелёную» энергию. Впрочем, пока в основном ведутся лишь предварительные обсуждения, а поставщики не уверены, стоит ли поставлять энергию такого типа исключительно дата-центрам.

Постоянный URL: http://servernews.ru/1111558
26.09.2024 [09:31], Руслан Авдеев

Всё для ЦОД, всё для ИИ: старые атомные и угольные электростанции США смогут получить новые ядерные реакторы на 269 ГВт

Старые угольные и атомные электростанции США могут предоставить место для новых атомных реакторов на 190 площадках, пишет Datacenter Dynamics со ссылкой на исследование Министерства энергетики США (DoE). Теоретически это позволит увеличить генерацию на 269 ГВт при использовании 600-МВт реакторов. При проведении исследования оценивались различные характеристики площадок, в том числе готовность инфраструктуры, близость к населённым пунктам и потенциальные риски вроде наводнений и землетрясений.

Впервые соответствующие данные появились в докладе «Оценка площадок атомных и угольных электростанций для создания новых атомных мощностей» (The Evaluation of Nuclear Power Plant and Coal Power Plant Sites for New Nuclear Capacity), подготовленном для Министерства энергетики США. Сообщается, что 145 угольных электростанций признаны пригодными для потенциального размещения реакторов суммарной мощностью 128–174 ГВт, а действующие или недавно закрытые АЭС могут обеспечить ещё 95 ГВт.

Из подходящих угольных электростанций 27 недавно остановлены, но в DoE полагают, что их можно оснастить 45 передовыми реакторами. Также приняты во внимание 33 действующих, но готовящихся к остановке к 2040 году электростанции, и ещё 85 площадок, для которых даты вывода из эксплуатации пока не определены. На территории первых можно разместить 72 передовых реактора, последних — до 173 реакторов.

 Источник изображения: Nicolas HIPPERT / Unsplash

Источник изображения: Nicolas HIPPERT / Unsplash

Также рассматривается использование 20 АЭС, которые отказались от расширения мощностей или пока не получили разрешения на это. Они могли бы получить 31 крупный легководный (суммарно 37,9 ГВт), а 18 из 20 станций потенциально могут вместить 72 малых реактора (суммарно 43,2 ГВт). Из оставшихся 34 атомных электростанций 17 можно дополнить легководными реакторами общей мощностью 21,2 ГВт, а 23 могут разместить 79 малых передовых реакторов на 47,4 ГВт.

Стоит отметить, что сегодня нагрузка на американские электросети весьма велика, потребление энергии дата-центрами и другой цифровой инфраструктурой требует дополнительных мощностей. Только ЦОД, согласно январскому докладу Newmark, к концу десятилетия будут требовать 35 ГВт. В мае 2024 года Министерство энергетики анонсировало планы организовать десять «коридоров передачи энергии в национальных интересах» для того, чтобы помочь расширить национальную сеть в зонах, где срочно требуются дополнительные энергомощности.

В сентябре американские власти создали своеобразный «спецназ» — команду Task Force on AI Datacenter Infrastructure, которая должна упростить поиск источников энергии и получение разрешений на их строительство в США. В том числе предполагалось содействие Министерства энергетики в перепрофилировании закрытых угольных электростанций при сотрудничестве со строителями ЦОД. В августе министерство представила информацию о ресурсах и льготах для рынка ЦОД. Также планируется встречаться на регулярной основе со строителями дата-центров, поставщиками решений для «зелёной» энергетики, операторами электросетей и другими заинтересованными сторонами для развития инновационных решений.

 Источник изображения: Lukáš Lehotský / Unsplash

Источник изображения: Lukáš Lehotský / Unsplash

Некоторые гиперскейлеры изучают возможность использования атомной энергии в своих проектах и уже заключили соответствующие соглашения с партнёрами. Только за последние несколько недель Microsoft анонсировала планы на 100 % использовать энергию АЭС для питания ЦОД, AWS ищет главного инженера по атомным проектам, а Oracle сообщила, что планировала гигаваттный ЦОД на базе малых модульных реакторов (SMR). Google также подняла вопрос о потенциальных перспективах SMR для индустрии ЦОД.

Пока что операторы ЦОД и энергетики рассматривают возможность отложить закрытие или разрешить строительство новых электростанций на ископаемом топливе. Кроме того, растёт интерес к поставкам природного газа — это один из самых простых и доступных способов организовать генерацию энергии непосредственно на территории кампуса. Аналогичные проекты реализуются и в Европе.

Постоянный URL: http://servernews.ru/1111502
26.08.2024 [22:30], Руслан Авдеев

«Сомнительный» 5G, дефицит кадров, импортозамещение, экосистемы и ИБ: печали и надежды российского телеком-рынка

Компания Nexign (Нэксайн) обнародовала результаты исследования, посвящённого телеком-рынку России. Как сообщает пресс-служба компании, участники рынка прогнозируют его рост в ближайшие пять лет благодаря экосистемным решениям, включающим телеком-услуги и партнёрские сервисы, а также сервисы ИБ и комплексные предложения для бизнеса. Рост поддержат ИИ-системы и инвестиции в микросервисную архитектуру. Компания опросила 31 топ-менеджера крупных операторов связи России, Беларуси, Узбекистана и Таджикистана.

Опрос показал, что 57 % респондентов ожидают рост рынка связи на 5–10 %, а почти треть — более чем на 30 %. Драйверы роста вроде экосистемных предложений, технологий информационной безопасности и комплексные предложения для бизнеса (услуги связи, облачные сервисы, ИБ-сервисы, аналитика и реклама) рассматриваются как основные. При этом выручка в телеком-отрасли растёт как в России, так и во всё мире, в среднем на 15 % ежегодно.

73 % назвали главным вызовом отрасли дефицит кадров — не хватает высококвалифицированных специалистов в сфере IT и кибербезопасности, причём такая ситуация сохраняется не первый год. Для решения проблемы компании не только увеличивают зарплаты, но и автоматизируют всё больше задач с помощью ИИ. В тройке главных проблем и санкции (47 % опрошенных), а также нехватка телеком-оборудования с параллельным удорожанием (43 %).

 Источник изображения: Nexign

Источник изображения: Nexign

Импортозамещение довольно хорошо получается в системах биллинга, более половины опрошенных оценивают его довольно высоко, в том числе 7 % — на 10 баллов из 10 возможных. Замена ядра сети происходит не так гладко, 23 % и вовсе оценивают его в 1 балл по шкале от 0 до 10. Другими словами, в первую очередь компании стремились заместить самые востребованные системы, а теперь фокус сместился на более специализированные решения, требующие высокой квалификации и времени на разработку. Российские решения для ядра сети уже развивается.

 Источник изображения: Nexign

Источник изображения: Nexign

При этом опрошенные в основном не верят в возвращение иностранных вендоров, а 43 % из них считает, что при попытке вернуться их ждёт неудача, поскольку те «созреют» лишь к тому времени, когда рынок будет занять отечественными альтернативами. В Nexign подчёркивают, что в сегменте ядра сети большинство операторов по-прежнему используют комплексные решения Huawei и Oracle, но ситуация будет меняться «в ближайшее время».

 Источник изображения: Nexign

Источник изображения: Nexign

Ключевыми технологиями, которые окажут самое сильное влияние на IT-стратегию телеком-компаний в ближайшую пятилетку, опрошенные назвали «традиционные» ИИ-системы (в т.ч. машинное обучение и предиктивную аналитику), генеративный ИИ и микросервисуню архитектуру. При этом популярная в мире технология OpenRAN в России пока не вызывает особенного интереса. Нет и 5G в числе ключевых драйверов отечественного рынка на ближайшие годы. Кроме того, хотя 43 % респондентов уверены в том, что старт 5G в стране станет новым источником выручки, 30 % в этом сомневаются.

Постоянный URL: http://servernews.ru/1110013
26.08.2024 [17:10], Руслан Авдеев

Новый дефицит: Mitsubishi Electric безуспешно пытается справиться со спросом на оптические компоненты для ИИ ЦОД

Японская Mitsubishi Electric Corp. пытается справиться с нарастающим в мире спросом на оптические компоненты, используемые в ИИ ЦОД, передаёт Bloomberg. Компания контролирует почти половину мирового рынка устройств оптической передачи данных для ЦОД, выпуская высокоэффективные лазерные диоды, модуляторы и сборки, которые используются в трансиверах. При этом в выручке самой компании данное направление занимает очень небольшую долю.

В Bloomberg сообщают, что, например, в США, без преувеличения все гиперскейлеры так или иначе являются клиентами Mitsubishi Electric. По словам представителя компании, уже в следующем месяце Mitsubishi Electric сможет нарастить выпуск оптических компонентов на 50 % в сравнении с прошлым годом, но этого всё равно будет недостаточно, чтобы удовлетворить все получаемые запросы. Понадобится вдвое нарастить производство в сравнении с тем, на что оно будет способно в сентябре.

Высказывания официального представителя компании стали последним из признаков дефицита компонентов для ИИ-инфраструктур. По оценкам Mitsubishi Electric, спрос со стороны пятёрки первых ведущих провайдеров США «очень силён» и продолжает расти. Буквально на днях компания пообещала начать поставки образцов решения для сетей 800 Гбит/с и 1,6 Тбит/с.

 Источник изображения: Mitsubishi Electric

Источник изображения: Mitsubishi Electric

На оптические компоненты приходится лишь малая часть бизнеса Mitsubishi Electric, выпускающей самую разную продукцию, от промышленных роботов до спутникового оборудования. Подразделение, занимающееся соответствующими полупроводниками и устройствами, принесло в прошлом финансовом году 4 % от выручки компании. В июне эксперты уже предупреждали о росте спроса на оптическое оборудование для дата-центров.

Постоянный URL: http://servernews.ru/1109997
14.08.2024 [14:51], Руслан Авдеев

Не было гвоздя: дефицит быстроразъёмных соединений для СЖО обошёлся Supermicro в $800 млн отложенной выручки

Любой производитель не застрахован от сбоя цепочки поставок небольших комплектующих, ведущих к значительным убыткам, иногда исчисляемым сотнями миллионов долларов. Как сообщает Tom’s Hardware, Supermicro не удалось вовремя получить достаточное количество быстроразъёмных соединений для систем жидкостного охлаждения (СЖО), из-за чего произошла задержка поставок готовой продукции покупателям. В результате сформировалась «отложенная выручка» в размере $800 млн, которую пришлось перенести с одного квартала на другой.

СЖО чрезвычайно важны для ИИ-серверов и обычно состоят из нескольких компонентов, объединяемых быстроразъёмными соединениями. Такие разъёмы могут подтекать, поэтому их качество имеет ключевое значение. Из-за высокого спроса на ИИ-серверы спрос на соединения тоже вырос. Их цена уже поднялась с $40 до $60, причём потенциальные покупатели готовы переплачивать ещё больше, лишь бы забронировать поставки.

 Источник изображения: Cejn

Источник изображения: Cejn

Рынок быстроразъёмных соединителей контролируется семью компаниями, в том числе двумя китайскими, попавшими под санкции США, что только усугубляет глобальный дефицит. Тайваньские производители Global Tek, Fositek и Lotes охотно пользуются ситуацией, наращивая и ускоряя производство и сертификацию соответствующих продуктов — это поможет заполнить «пустоту» от ухода попавших под санкции китайских компаний. Global Tek активно работает с партнёрами на своих заводах, образцы уже проходят тестирование. Компания рассчитывает, что выручка от этих проектов начнёт поступать уже в IV квартале 2024 года.

Спрос на СЖО действительно высок и ожидается, что к 2028 году они займут треть рынка систем охлаждения для дата-центров. При этом уже поступают рекламации — не исключено, что поставки суперускорителей NVIDIA GB200 могут задержаться из-за протечек вспомогательной «фурнитуры» систем жидкостного охлаждения.

Постоянный URL: http://servernews.ru/1109451
10.08.2024 [23:28], Руслан Авдеев

ЦОД с газопроводом: энергокомпании США обсуждают с операторами дата-центров поставки голубого топлива

Американские энергокомпании US Energy Transfer и Williams Cos. обсуждают с операторами дата-центров возможность строительства трубопроводов для поставки газа непосредственно на территорию кампусов для питания электростанций. По данным Datacenter Dynamics, бум ИИ ведёт к росту спроса на энергию и многие видят в получении энергии на месте возможное решение проблемы.

По словам представителя Energy Transfer, общавшегося с отраслевыми экспертами, компания обсуждает возможности с ЦОД разных масштабов. Многие из них весьма положительно относятся к самой идее генерировать электричество на месте. Сейчас компания расширяет уже существующие электростанции и изучает возможность подключения к газовым магистралям новых.

Williams Cos. также отмечает рост спроса и, как сообщают в компании, пытаются найти решение в ответ на многочисленные запросы. В частности речь идёт о юго-восточной части США и центре атлантического побережья страны. В число регионов попал и штат Вирджиния, на территории которого расположено огромное количество ЦОД, уже страдающих от дефицита электроэнергии.

 Источник изображения: Quinten de Graaf/unsplash.com

Источник изображения: Quinten de Graaf/unsplash.com

Местный поставщик электричества Dominion Energy в докладе за 2023 год сообщил, что принадлежащая ему распределяющая компания Virginia Power продавала 24 % всего поставляемого здесь электричества именно дата-центрам в минувшем году, в 2022 году рост составлял 21 %. Компания объявила, что потребление индивидуальных объектов выросло с приблизительно 30 МВт до 60–90 МВт, а аппетиты кампусов могут составлять от 300 МВт до нескольких гигаватт.

В январе 2024 года PJM Interconnection отметила, что ожидает роста энергопотребления в зонах своей ответственности почти на 40 % в следующие 15 лет, одним из ключевых драйверов роста должны стать дата-центры. С увеличением ограничений для сетей электропередач выработка энергии на месте может стать единственным средством получения одобрения на строительство новых ЦОД.

Нечто подобное уже происходит и в Ирландии. В результате фактического моратория на строительство дата-центров в районе Дублин, некоторые ЦОД выразили намерение подключиться к газовым магистралям вместо попыток присоединения к энергосети. С тех пор Ирландия уже начала реализовывать политику частного энергоснабжения, позволяя компаниям строить собственную энерготранспортную инфраструктуру во избежание проблем с энергоснабжением в других сферах, использующих сети общего пользования.

Постоянный URL: http://servernews.ru/1109273
08.08.2024 [00:48], Сергей Карасёв

NVIDIA задержит выпуск ускорителей GB200, отложит B100/B200, а на замену предложит B200A

Компания NVIDIA, по сообщению ресурса The Information, вынуждена повременить с началом массового выпуска ИИ-ускорителей следующего поколения на архитектуре Blackwell, сохранив высокие темпы производства Hopper. Проблема, как утверждается, связана с технологией упаковки Chip on Wafer on Substrate (CoWoS) от TSMC.

Отмечается, что NVIDIA недавно проинформировала Microsoft о задержках, затрагивающих наиболее продвинутые решения семейства Blackwell. Речь, в частности, идёт об изделиях Blackwell B200. Серийное производство этих ускорителей может быть отложено как минимум на три месяца — в лучшем случае до I квартала 2025 года. Это может повлиять на планы Microsoft, Meta и других операторов дата-центров по расширению мощностей для задач ИИ и НРС.

По данным исследовательской фирмы SemiAnalysis, задержка связана с физическим дизайном изделий Blackwell. Это первые массовые ускорители, в которых используется технология упаковки TSMC CoWoS-L. Это сложная и высокоточная методика, предусматривающая применение органического интерпозера — лимит возможностей технологии предыдущего поколения CoWoS-S был достигнут в AMD Instinct MI300X. Кремниевый интерпорзер, подходящий для B200, оказался бы слишком хрупок. Однако органический интерпозер имеет не лучшие электрические характеристики, поэтому для связи используются кремниевые мостики.

В используемых материалах как раз и кроется основная проблема — из-за разности коэффициента теплового расширения различных компонентов появляются изгибы, которые разрушают контакты и сами чиплеты. При этом точность и аккуратность соединений крайне важна для работы внутреннего интерконнекта NV-HBI, который объединяет два вычислительных тайла на скорости 10 Тбайт/с. Поэтому сейчас NVIDIA с TSMC заняты переработкой мостиков и, по слухам, нескольких слоёв металлизации самих тайлов.

Вместе с тем у TSMC наблюдается нехватка мощностей по упаковке CoWoS. Компания в течение последних двух лет наращивала мощности CoWoS-S, в основном для удовлетворения потребностей NVIDIA, но теперь последняя переводит свои продукты на CoWoS-L. Поэтому TSMC строит фабрику AP6 под новую технологию упаковки, а также переведёт уже имеющиеся мощности AP3 на CoWoS-L. При этом конкуренты TSMC не могут и вряд ли смогут в ближайшее время предоставить хоть какую-то альтернативную технологию упаковки, которая подойдёт NVIDIA.

Таким образом, как сообщается, NVIDIA предстоит определиться с тем, как использовать доступные производственные мощности TSMC. По мнению SemiAnalysis, компания почти полностью сосредоточена на стоечных суперускорителях GB200 NVL36/72, которые достанутся гиперскейлерам и небольшому числу других игроков, тогда как HGX-решения B100 и B200 «сейчас фактически отменяются», хотя малые партии последних всё же должны попасть на рынок. Однако у NVIDIA есть и запасной план.

План заключается в выпуске упрощённых монолитных чипов B200A на базе одного кристалла B102, который также станет основой для ускорителя B20, ориентированного на Китай. B200A получит всего четыре стека HBM3e (144 Гбайт, 4 Тбайт/с), а его TDP составит 700 или 1000 Вт. Важным преимуществом в данном случае является возможность использования упаковки CoWoS-S. Чипы B200A как раз и попадут в массовые HGX-системы вместо изначально планировавшихся B100/B200.

На смену B200A придут B200A Ultra, у которых производительность повысится, но вот апгрейда памяти не будет. Они тоже попадут в HGX-платформы, но главное не это. На их основе NVIDIA предложит компромиссные суперускорители MGX GB200A Ultra NVL36. Они получат восемь 2U-узлов, в каждом из которых будет по одному процессору Grace и четыре 700-Вт B200A Ultra. Ускорители по-прежнему будут полноценно объединены шиной NVLink5 (одночиповые 1U-коммутаторы), но вот внутри узла всё общение с CPU будет завязано на PCIe-коммутаторы в двух адаптерах ConnectX-8.

Главным преимуществом GX GB200A Ultra NVL36 станет воздушное охлаждение из-за относительно невысокой мощности — всего 40 кВт на стойку. Это немало, но всё равно позволит разместить новинки во многих ЦОД без их кардинального переоборудования пусть и ценой потери плотности размещения (например, пропуская ряды). По мнению SemiAnalysis, эти суперускорители в случае нехватки «полноценных» GB200 NVL72/36 будут покупать и гиперскейлеры.

Постоянный URL: http://servernews.ru/1109037

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus