Материалы по тегу: google

09.04.2025 [21:55], Владимир Мироненко

Google представила ИИ-ускоритель TPU v7 Ironwood, созданный специально для инференса «размышляющих» моделей

Компания Google Cloud представила тензорный ускоритель TPU седьмого поколения Ironwood, который охарактеризовала как свой самый производительный и масштабируемый настраиваемый ИИ-ускоритель на сегодняшний день и первый среди её чипов, разработанный специально для инференса.

Новый чип представляет собой важный поворот в десятилетней стратегии Google по разработке ИИ-чипов, отметил ресурс VentureBeat. В то время как предыдущие поколения TPU были созданы в первую очередь для рабочих нагрузок обучения и инференса, Ironwood — первый чип, специально созданный для инференса.

Как пояснила Google, Ironwood знаменует значительный сдвиг в развитии ИИ и инфраструктуры — переход от простых ИИ-моделей, которые просто предоставляют информацию в режиме реального времени, к моделям, которые обеспечивают проактивную генерацию идей и интерпретацию данных. Компания назвала этот период «эпохой инференса», когда ИИ-агенты будут активно извлекать и генерировать данные, чтобы совместно предоставлять информацию и ответы, а не просто «голые» сведения.

 Источник изображений: Google

Источник изображений: Google

Ironwood разработан в соответствии со сложными вычислительными и коммуникационными требованиями «моделей мышления», которые охватывают большие языковые модели (LLM), смешанные экспертные модели (MoE) и сложные задачи для рассуждения. Эти модели требуют массивной параллельной обработки и эффективного доступа к памяти. В частности, Ironwood разработан для минимизации перемещения данных и задержек на чипе при выполнении массивных тензорных манипуляций. Требования размышляющих моделей к вычислительным мощностям выходят далеко за рамки возможностей любого отдельного чипа.

Google Cloud Ironwood будет поставляться в двух конфигурациях: с 256 или с 9216 чипами. Один чип может похвастаться пиковой вычислительной мощностью 4614 Тфлопс (FP8), а кластер из 9216 чипов мощностью порядка 10 МВт выдаёт в общей сложности 42,5 Эфлопс. Ironwood оснащён усовершенствованным блоком SparseCore, предназначенным для ускорения работы с ИИ-моделями, которые используются в системах ранжирования и рекомендаций. Расширенная реализация SparseCore в Ironwood позволяет ускорить более широкий спектр рабочих нагрузок, выйдя за рамки традиционной области ИИ в финансовые и научные сферы.

Каждый чип оснащен 192 Гбайт памяти HBM, что в шесть раз больше, чем у TPU v6 Trillium. Пропускная способность памяти достигает 7,2 Тбайт/с на чип, что в 4,5 раза больше, чем у Trillium. Также используется межчиповый интерконнект Inter-Chip Interconnect (ICI) с пропускной способностью 1,2 Тбайт/с в дуплексе, что в 1,5 раза больше, чем у Trillium. Наконец, самое важное в эпоху ограниченных по мощности ЦОД — Ironwood обеспечивает вдвое большую производительность на Вт по сравнению с Trillium, а в сравнении с самым первым TPU от 2018 года он почти в 30 энергоэффективнее. Для Ironwood используется СЖО.

С Ironwood разработчики также могут задействовать программный стек Pathways от Google DeepMind, чтобы использовать объединённую вычислительную мощность десятков тысяч TPU Ironwood. Как сообщается, Ironwood будет доступен клиентам Google и её собственным разработчикам в конце 2025 года.

Google зафиксировала 10-кратный рост спроса на ИИ-вычисления за последние восемь лет. Как отметил ресурс VentureBeat, перенос Google фокуса на оптимизацию инференса имеет смысл. Обучение производится редко, а операции инференса — миллиарды раз в день. Экономика ИИ всё больше связана с затратами на инференс, особенно по мере того, как модели становятся всё более сложными и требующими больших вычислительных ресурсов.

Постоянный URL: http://servernews.ru/1121034
07.04.2025 [08:36], Руслан Авдеев

Google, Meta✴, Microsoft и Amazon намерены закупать «зелёную» сталь для своих ЦОД

Компания Google присоединилась к коалиции Sustainable Steel Buyers Platform (SSBP), организованной американской НКО RMI, занимающейся вопросами «зелёной» энергетики и экоустойчивости в целом. В SSBP уже входят Meta, Microsoft и Amazon. Вместе с Google она объединяет восемь участников, сообщает Datacenter Dynamics.

SSBP призвана объединить усилия крупных корпораций в технологическом, строительном и производственном секторе для продвижения закупки в Северной Америке стали, выпускаемой с низкими углеродными выбросами. Группа названа «первой в своём роде». Она заработала при поддержке нескольких партнёров, имеющих опыт работы с экопроектами: First Mover Coalition, Climate Group и Responsible Steel.

В III квартале 2023 года платформа запросила информацию о технологиях производства стали предприятиями соответствующего профиля, в том числе данных о наличии технологий с почти нулевыми выбросами. После этого был объявлен запрос предложений (RFP), чтобы упростить прямые закупки «экологичной» стали, согласовать спрос с техническими требованиями и решить проблемы измерения, проверки и отчётности по выбросам.

 Источник изображения: Viktor Forgacs/unspalsh.com

Источник изображения: Viktor Forgacs/unspalsh.com

Запрос предложений был открыт для всех производителей железа и стали, а также их партнёров по цепочке поставок. Цель — найти поставщиков, способных поставить североамериканским заказчикам от 1 до 2 млн тонн «зелёной» стали с почти нулевыми выбросами к 2030 году. Участники должны соблюдать строгие нормы выбросов на уровне производства и предоставлять прозрачные данные о жизненном цикле продукции. После закрытия RFP покупатели могут заключать индивидуальные соглашения о закупке на основе согласованной «зелёной премии», спецификаций стали и других условий.

Сталь является критически важным материалом в создании дата-центров. Она применяется не только при возведении зданий, но и для производства стоек, систем охлаждения, генерации энергии и др. AWS уже выразила приверженность использованию «зелёной» стали, после оформления партнёрства с SSAB в ноябре прошлого года. Проект AWS предусматривает использование экобезопасной стали в одном из трёх своих новых ЦОД в Швеции. «Зелёная» сталь будет применяться при укладке крыши и создания стен в ЦОД AWS Västerås. Поставками материала займётся подразделение SSAB — Ruukki Construction.

Постоянный URL: http://servernews.ru/1120861
03.04.2025 [16:47], Руслан Авдеев

Google готовится к аренде ИИ-серверов с ускорителями NVIDIA Blackwell у CoreWeave

Компания Google близка к тому, чтобы согласиться на сделку с CoreWeave. Предполагается, что гиперскейлер будет арендовать у последней серверы, оснащённые ускорителями серии NVIDIA Blackwell, сообщает The Information. Сделка находится на «поздних стадиях» согласования. Благодаря ей Google сможет получить доступ к большему количеству новейших ИИ-ускорителей. Об этом издание сообщает со ссылкой на два анонимных источника, знакомых с вопросом.

Ещё два источника добавили, что Google уже пыталась договориться с конкурентами CoreWeave о доступе к свободным ускорителям — судя по всему, компании не хватает доступных вычислительных мощностей. Возможные партнёры пока не комментируют ситуацию. По информации Seeking Alpha, на момент закрытия торгов в среду акции CoreWeave выросли на 16 %, колебания курсов акций Google и NVIDIA оказались незначительными.

По данным The Information, отдельно Google и CoreWeave ведут переговоры об аренде площадей в дата-центрах последней — там Google сможет разместить тензорные ускорители (TPU) собственной разработки, которые компания довольно успешно внедряет наряду с решениями NVIDIA.

 Источник изображения:  Microsoft Edge/unsplash.com

Источник изображения: Microsoft Edge/unsplash.com

Потенциальное соглашение косвенно свидетельствует о проблемах компаний, желающих пользоваться ускорителями NVIDIA, но не имеющих возможности удовлетворить спрос в полной мере. Уникальные отношения CoreWeave и NVIDIA и возможности оператора ЦОД предоставлять в распоряжение новые ИИ-мощности привлекают крупные облачные сервисы и ключевых ИИ-разработчиков вроде OpenAI и Meta. По данным Investing.com, за последние несколько дней крупные ИИ-структуры вроде xAI и OpenAI публично озвучивали необходимость увеличения доступных вычислительных ресурсов.

Буквально на днях CoreWeave вышла на IPO — правда, планы развития компании могут оказаться под вопросом, поскольку средств привлечено меньше, чем ожидалось, а капитализация её оказалась значительно меньше, чем рассчитывалось.

Постоянный URL: http://servernews.ru/1120744
19.03.2025 [17:34], Руслан Авдеев

Google купит стартап Wiz за баснословные $32 млрд

Компания Google объявила о покупке стартапа Wiz Inc., работающего в области информационной безопасности, за $32 млрд., что станет крупнейшей сделкой в истории Google. При этом Wiz в ходе последнего раунда инвестиций в прошлом году была оценена в $12 млрд. Тогда же Google предложила Wiz $23 млрд, но стартап отказался от сделки, заявив о намерении выйти на IPO, сообщает Silicon Angle.

Согласно обновлённым данным, Google согласилась выплатить Wiz $3,2 млрд, если сделка не состоится. Например, если ей воспрепятствует один из регуляторов. Некоторые эксперты считают, что именно боязнью блокировки сделки вызван отказ руководства Wiz продать компанию в 2024 году. По слухам, условия новой сделки предполагают, что стартап сможет продолжить действовать независимо в случае, если антимонопольное разбирательство вдруг затянется.

Wiz была основана в 2020 году. Двумя годами позже годовая регулярная выручка компании достигла $100 млн, а не так давно, по слухам, выросла до $700 млн. Компания утверждает, что более половины компаний из списка Fortune 100 использует её платформу для обеспечения кибербезопасности. ПО помогает компаниям устранять уязвимости в облачных средах, защищать код разработчиков и отражать кибератаки.

 Источник изображения: Google

Источник изображения: Google

Компания предлагает несколько ключевых продуктов. Wiz Cloud обнаруживает уязвимости вроде неверной конфигурации облачных сред, выявляет известные эксплойты и слабости систем контроля доступа. Wiz Defend обнаруживает и блокирует кибератаки с использованием eBPF-сенсора и аудита логов. Wiz Defend собирает подробные данные об инцидентах безопасности и получает информацию о потенциальных уязвимостях из других источников. Wiz Code умеет выявлять уязвимости напрямую в редакторе кода и даёт советы по их устранению.

Инструменты Wiz доступны во всех крупнейших публичных облаках. Google объявила, что не планирует менять подобную практику после покупки. Согласно данным в блоге Google, Wiz сохранит совместимость со всеми конкурирующими облаками, а Google Cloud Marketplace по-прежнему будет предлагать защитные инструменты, созданные сторонними разработчиками.

 Источник изображения: Sigmund/unsplash.com

Источник изображения: Sigmund/unsplash.com

При этом IT-гигант выразил намерение разработать «унифицированную платформу для обеспечения кибербезопасности», объединив технологии Wiz с решениями Google Security Operations, которые позволяют проводить аудит безопасности и автоматизировать реакцию на кибератаки.

Wiz — не первая многомиллиардная покупка Google в области кибербезопасности. В 2022 году приобрела за $5,4 млрд провайдера защитных сервисов Mandiant. Кроме того, около десяти лет назад внутренний проект компании BeyondCorp помог принятию принципа «нулевого доверия» для любых устройств. Также компания известна разработкой фреймворка SLSA для безопасной разработки ПО. Сделку по покупке Wiz планируется закрыть в 2026 году, пока она ожидает одобрения регуляторов.

Постоянный URL: http://servernews.ru/1119981
19.03.2025 [10:42], Руслан Авдеев

Разработчик «лазерного интернета» Taara отпочковался от Alphabet и стал независимой компанией

Попытка Google разработать технологию для обеспечения отдалённых от цивилизации мест связью с помощью надувных шаров и беспроводной связи в рамках проекта Loon доросла до выделения в самостоятельную компанию. Подобный успех у «побочных» начинаний техногиганта случается довольно редко, но детище Google заслужило особое отношение, сообщает The Register.

Проект Loon развивался в группе, в своё время известной как Google X. После того, как Alphabet стала родительской компанией Google, подразделение стало называться просто в X (не имеет отношения к соцсети Маска). Предполагалось, что X будет заниматься перспективными побочными проектами.

В рамках проекта Loon разработчики пытались обеспечить глухие места интернет-подключением с помощью крупных воздушных шаров, оснащённых LTE-станциями. Шары же общались друг с другом посредством лазерных модулей. Alphabet фактически свернула Loon в 2021 году после того, как попытки коммерциализации провалились.

 Источник изображения: Taara

Источник изображения: Taara

А вот лазерную технологию передачи данных сохранили и после доработки преобразовали в решение Taara Lightbridge, позволяющее передавать данные со скоростью до 20 Гбит/с на расстояние до 20 км. Продукт позиционировался как альтернатива прокладке оптоволоконных кабелей в отдалённых районах и местах с неблагоприятной средой. Кроме того, его предлагали использовать для передачи данных через водные преграды. Телеком-операторам технология понравилась и её внедрили Airtel и Liberty Networks.

Taara создала для Lightbridge специальный чип, потенциально позволяющий создать в будущем очень маленькие беспроводные оптические сетевые устройства. Если технология первого поколения Taara использовала физические методы для управления лучами с помощью системы зеркал, сенсоров и другого оборудования, то теперь почти вся «механика» реализована в самом чипе в виде сотен оптических модулей. Всем теперь управляет ПО и нет громоздких движущихся компонентов. Общие принципы технологии те же, но теперь всё необходимое умещается в модуль размером с ноготь.

 Источник изображения: Taara

Источник изображения: Taara

Если на прокладку кабелей уходят дни, месяцы, а иногда и годы, то для развёртывания Taara Lightbridge достаточно считаных часов. В тестах удавалось передавать с помощью двух чипов данные со скоростью 10 Гбит/с на расстояние до 1 км на открытом воздухе — и это только начало. Использование новых чипов позволяет не только обеспечить связью недоступные места, но и пересмотреть принципы построения и работы ЦОД, а также управления беспилотными автомобилями и др. Новый чип, как ожидается, будет доступен в 2026 году.

Теперь X объявила, что Taara будет выделена в независимую компанию после того, как она получила инвестиции от Series X Capital. В феврале сообщалось, что терминалы Taara, только не на шарах, а на беспилотниках, уже испытала Vodafone.

В целом проект X (он же Moonshot Factory) компании Google/Alphabet более всего известен «выпускником» Waymo — сервисом беспилотных такси. Прочие перспективные технологии вроде помощника разработчика AIDA были «поглощены» Google. Некоторые, конечно, и вовсе не получили широкого распространения. Например, проект Wing по доставке товаров беспилотниками так и не смог добиться успеха.

Постоянный URL: http://servernews.ru/1119956
11.03.2025 [12:21], Руслан Авдеев

Google Cloud запустила облачный регион в Швеции — одним из ключевых клиентов станет IKEA

Google объявила о создании очередного облачного региона на территории Швеции. Это уже 42-й регион Google Cloud в мире и 13—й — в Европе, сообщает пресс-служба компании. Одним из её партнёров-клиентов в этом проекте стала IKEA, объявившая, что она «в восторге» от сотрудничества с Google Cloud и что она разделяет приверженность IT-гиганта к инновациям в Швеции. Поддерживает новый проект и шведский сервис Spotify, который сотрудничает с Google уже с десяток лет.

Регион europe-north2 обеспечит шведские бизнесы, организации и отдельных клиентов платформой для ИИ, машинного обучения и аналитики данных, а низкая задержка доступа сделает использование сервисов комфортным. Так, Шведская правительственная Комиссия по ИИ (AI Comission) недавно опубликовала план, который включает создание «ИИ-фрабрики» для государственного сектора. Создание региона также позволяет решить вопрос с требованиями законодательства по обеспечению суверенитета данных и размещению данных жителей на территории страны. Обещаны шифрование данных во время хранения и передачи, детализированный контроль доступа, передовые системы обнаружения угроз и т.п.

 Источник изображения: Google Cloud

Источник изображения: Google Cloud

Новый облачный регион Google с 2026 году будет как минимум на 99% обеспечен безуглеродной энергией (CFE) благодаря экологически чистой энергосистеме страны. Google также подчеркивает свои усилия для устойчивого развития, в том числе упоминая первые соглашения о покупке экологически чистой энергии (PPA) в Швеции с 2013 года и поддержку проектов ветровой энергетики мощностью более 700 МВт. Регион находится Авесте (Avesta) в лене Даларна (Dalarnas län) недалеко от Стокгольма. Регион включает три зоны доступности, однако расширение до как минимум трёх отдельных ЦОД запланировано на будущее.

При этом Google инвестирует не только в данный облачный регион, но и в цифровую экосистему Швеции вообще, совместно с местными партнёрами вроде Devoteam и Tietoevry Tech Services. Организовано сотрудничество с местными бизнесами, образовательными учреждениями и государственными организациями для создания процветающей экосистемы. Google заявила, что намерена и далее продолжать инвестиции в Швецию, сотрудничать с бизнесом и другими организациями.

Не дремлют и конкуренты. Летом прошлого года Microsoft сообщила, что вложит $3,2 млрд в ИИ-инфраструктуру и облако в Швеции, а в конце августа CoreWeave пообещала, что развернёт в Швеции крупнейший в Европе ИИ-кластер NVIDIA Blackwell.

Постоянный URL: http://servernews.ru/1119527
08.03.2025 [02:05], Владимир Мироненко

Google отключилась от российских IX и ЦОД, но о полном уходе из страны речи нет

Google отключила пиринговые соединения с некоторыми российскими точками обмена трафиком (IX) и дата-центрами, сообщил ресурс RB.ru («Русбейс») со ссылкой на данные международной базы PeeringDB, содержащей актуальную информацию о IX и дата-центрах, с которыми у Google есть пиринг. По словам одного из источников RB.ru, текущая ситуация может быть связана с тем, что российская «дочка» Google находится в состоянии банкротства, счета опустошены из-за штрафов, поэтому оплачивать присутствие на IX и их услуги компании нечем.

По данным интернет-архива Wayback Machine, до середины июля 2024 года в базе PeeringDB было указано, что Google подключена к таким российским IX и дата-центрам, как DataLine-IX и DataLine OST («РТК-ЦОД»), inet2 и W-IX («Эр-Телекомом»), MegaFon-IX, DATAIX, MSK-IX, Piter-IX, Eurasia Peering IX, ЦОД «Цветочная» (Selectel), Санкт-Петербургский ИВЦ РЖД, а с октября 2024 года этой информации в базе PeeringDB больше нет.

Администратор PeeringDB подтвердил ресурсу RB.ru отсутствие в базе данных информации о подключении Google к IX в России, отметив, что организации сами вносят и удаляют данные о подключениях, то есть удалить информацию могли только сотрудники американской компании. В «Мегафоне» подтвердили RB.ru, что Google отключилась от MegaFon-IX, и это произошло по инициативе компании. При этом было отмечено, что это не единственное соединение с Google, и отключение никак не повлияло на качество сервиса. Другой источник подтвердил RB.ru, что Google отключилась от W-IX.

 Источник изображения: Google

Источник изображения: Google

Вместе с тем представители ряда IX утверждают, что полного отключения Google от их точек обмена трафиком не было. Так, Google имеет физическое присоединение к DATAIX, но прекратила анонсировать и принимать маршруты через роут-серверы (route-server). В MSK-IX сообщили, что хотя Google больше не использует роут-серверы, она «продолжает присутствовать на MSK-IX, обеспечивая связность через партнёрские сети и прямые пиринговые соединения». Аналогичная ситуация наблюдается и в Piter-IX.

В Piter-IX сообщили, что речи о полном уходе Google с российского рынка или потере доступа к её сервисам нет: «У нас продолжается работа над поддержанием стабильного доступа к сервисам Google, в том числе за счёт соединения в Германии и Финляндии — как раз на случай отключения всех серверов Google Global Cache в России». Серверы Google Global Cache (GGC) продолжают работу, но компания больше не имеет возможности обновлять или менять оборудование, а со временем GGC могут выйти из строя. Всего в РФ таких серверов более 1,1 тыс., причём частично они обслуживают и клиентов из сопредельных стран.

Стоит отметить, что ещё в конце 2023 года Google заявила о намерении отказаться от роут-серверов на точках обмена трафиком, предложив оператором по всему миру прямое присоединение к своей сети. Прямые пиринговые стыки с сетью Google по-прежнему работают у многих крупных операторов РФ. Однако, как сообщил RB.ru один из экспертов, не у всех операторов есть возможность быстро перейти на прямой пиринг. Особенно актуально это для маленьких операторов, в том числе тех, что были поглощены в последние годы более крупными игроками рынка.

Постоянный URL: http://servernews.ru/1119421
06.03.2025 [21:36], Владимир Мироненко

Google раскрыла детали уязвимости в процессорах AMD и опубликовала инструментарий для анализа и изменения их микрокода

Специалисты Google Security Team сообщили детали уязвимости (CVE-2024-56161), позволяющей обойти механизм проверки цифровой подписи при обновлении микрокода в процессорах AMD на базе микроархитектуры от Zen1 до Zen4, о чём пишет ресурс OpenNet.

Уязвимости присвоен рейтинг опасности CVSS 7,2 балла из 10, что говорит о серьёзности проблемы. «Неправильная проверка подписи в загрузчике исправлений микрокода CPU AMD может позволить злоумышленнику с привилегиями локального администратора загрузить вредоносный микрокод», — говорится в сообщении Google. Исследователи известили AMD об обнаруженной уязвимости 25 сентября 2024 года.

Уязвимость, сделавшая возможной загрузку собственных патчей для микрокода процессоров AMD Zen 1-4, вызвана использованием для верификации вместо рекомендованных хеш-функций алгоритма CMAC, который не подходит для этого и не защищён от подбора коллизий. Компания AMD устранила уязвимость в декабрьском обновлении микрокода путём замены CMAC на криптографически стойкую хеш-функцию.

 Источник изображения: AMD

Источник изображения: AMD

Google также опубликовала под лицензией Apache 2.0 инструментарий Zentool, с помощью которого можно анализировать микрокод, манипулировать им и создавать патчи для изменения микрокода в процессорах AMD Zen. Zentool включает команды: zentool edit — редактирует параметры файлов с микрокодом, изменяет микрокод и заменяет отдельные инструкции; zentool print — выводит информацию о структурах и параметрах микрокода; zentool load — загружает микрокод в CPU; zentool resign — корректирует цифровую подпись с учётом добавленных в микрокод изменений. Также в состав Zentool входят утилиты mcas и mcop с реализациями ассемблера и дизассемблера для микрокода.

Специалисты Google также подготовили руководство по микроархитектуре RISC86, применяемой в микрокоде AMD, и рекомендации по созданию собственного микрокода с пояснением, как создавать собственные процессорные инструкции, реализуемые на микрокоде RISC86, менять поведение существующих инструкций и загружать изменения микрокода в процессор.

Постоянный URL: http://servernews.ru/1119354
03.03.2025 [15:23], Руслан Авдеев

Google развернула уже 100 млн литий-ионных ячеек в своих ЦОД

Системы энергоснабжения дата-центров во многом зависят от аккумуляторов в составе ИБП. Участники рынка ЦОД активно инвестируют в создание аккумуляторных систем — не так давно число используемых Li-Ion элементов в дата-центрах Google по всему миру достигло 100 млн шт., сообщает пресс-служба компании.

В Google используются системы электропитания с 48 В постоянного тока (48Vdc), причём ИБП интегрированы непосредственно в стойки. Такая распределённая архитектура обладает двумя ключевыми преимуществами: область возможного сбоя ИБП ограничивается одной стойкой; нет дополнительной точки отказа между ИБП и серверами. Такой подход снижает общую стоимость владения (TCO), поскольку ИБП масштабируется вместе с инфраструктурой, благодаря чему уменьшаются затраты на начальном этапе внедрения, говорит компания.

Размещение батарей на DC-шине вместе с серверами исключает потери энергии, связанные с промежуточными преобразованиями переменного тока (AC) в постоянный (DC), положительно влияя на общую эффективность системы. В 2016 году Google открыла спецификации своей системы электропитания стоек, включая спецификации для литий-ионных BBU, в рамках Open Compute Project (OCP). Кроме того, Li-Ion аккумуляторы вдвое долговечнее и вдвое мощнее свинцово-кислотных элементов, применявшихся ранее. Таким образом, переход с одних на другие означает, что теперь можно использовать меньше батарей, что также положительно влияет на экологичность ЦОД, говорит Google.

 Источник изображений: Google/OCP

Источник изображений: Google/OCP

В Google отмечают, что развернуть 100 млн Li-Ion элементов можно только благодаря подходу «безопасность прежде всего», принятому в компании. Основным риском для такого типа элементов является возможность неуправляемого нагрева, т. н. «теплового разгона» в случае, если с ними некорректно обращаются, чрезмерно заряжают или не охлаждают должным образом. В результате могут случаться пожары, и хотя такое бывает редко, огонь очень трудно погасить из-за выделения большого количества тепла и риска «цепной реакции» воспламенения соседних элементов.

Для использования большого «парка» АКБ в Google применяют метод тестирования UL9540A (стандарт, разработанный для оценки безопасности энергосистем, включая аккумуляторы) и проводит строгие испытания литий-ионных блоков BBU. В результате Google успешно получила от регуляторов разрешения на использование BBU даже в Азиатско-Тихоокеанском регионе, где действуют самые жёсткие правила. Сейчас в Google изучают возможность использования больших энергохранилищ (BESS).

Безопасность аккумуляторов — не праздный вопрос. Пожары в дата-центрах вообще случаются не так уж редко, а во многих случаях причиной служат именно инциденты с аккумуляторами. За примерами не надо далеко ходить: один из крупнейших в мире сбоев ЦОД южнокорейской площадки Kakao произошёл именно из-за перегрева и возгорания литий-ионных аккумуляторов SK On, что привело к пожару. В сентябре 2024 года из-за возгорания Li-Ion элементов ИБП пострадал сингапурский ЦОД Digital Realty. В 2023 году эксперты Uptime Institute предупреждали о возможной опасности использования Li-Ion элементов в дата-центрах, поскольку они подвержены повышенному риску возгорания.

Постоянный URL: http://servernews.ru/1119119
22.02.2025 [22:45], Сергей Карасёв

В облаке Google Cloud появились инстансы A4X на базе суперускорителей NVIDIA GB200 NVL72

Облачная платформа Google Cloud объявила о запуске виртуальных машин A4 с ускорителями NVIDIA B200 и A4X на основе суперускорителей NVIDIA GB200 NVL72 поколения Blackwell. Эти инстансы ориентированы на ресурсоёмкие приложения ИИ.

 Источник изображения: Google

Источник изображения: Google

По заявлениям Google, виртуальные машины A4 обеспечивают высокий уровень производительности при работе с ИИ-моделями на различных архитектурах. Инстансы подходят для таких рабочих нагрузок, как обучение и тонкая настройка. В свою очередь, экземпляры A4X специально созданы для обучения и обслуживания самых требовательных и сверхмасштабных задач ИИ, включая большие языковые модели (LLM) с наиболее ёмкими контекстными окнами и «рассуждающие» модели.

Суперускорители GB200 NVL72 объединяют в одной стойке 72 чипа B200 и 36 процессоров Grace. Применяются шина NVLink 5 и инфраструктура жидкостного охлаждения Google третьего поколения. Каждая система GB200 NVL72 обеспечивает быстродействие до 1,44 Эфлопс в режиме FP4 и до 720 Пфлопс в режиме FP8. По заявлениям Google, достигается четырёхкратное увеличение производительности при обучении LLM по сравнению с виртуальными машинами A3 на базе ускорителей NVIDIA H100.

Инстансы A4X допускают масштабирование до десятков тысяч графических процессоров Blackwell. Говорится об интеграции с сервисами хранения Cloud Storage FUSE, Parallelstore и Hyperdisk ML, что обеспечивает доступ к данным с малой задержкой (менее 1 мс) и высокую пропускную способность.

Новые виртуальные машины будут развёрнуты в различных регионах Google Cloud. Нужно отметить, что ранее о запуске общедоступных инстансов на базе NVIDIA GB200 NVL200 объявила компания CoreWeave, предоставляющая облачные услуги для ИИ-задач. Скоро эти суперускорители станут доступны и в облаке Lambda Labs.

Постоянный URL: http://servernews.ru/1118687

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus