Материалы по тегу: google cloud platform

19.04.2025 [02:15], Руслан Авдеев

Linux — это дорого и сложно: AWS и Google Cloud заявили, что вырваться из экосистемы Microsoft невероятно трудно

Компании, вложившие большие средства в ПО Microsoft, буквально не могут покинуть принадлежащее последней облако Azure, чтобы перейти в AWS или Google Cloud Platform вместо собственных серверов. Использовать ПО гиганта из Редмонда в облаках сторонних провайдеров из-за лицензионной политики Microsoft очень дорого, но и переписывать ПО для Linux, возможно, ещё дороже, сообщает The Register.

AWS и Google пожаловались в британское Управление по конкуренции и рынкам (CMA), ведущее расследование ситуации на облачном рынке страны, что клиенты столкнулись с дилеммой — либо использовать Azure, либо платить в четыре раза больше за запуск приложений под Windows Server и SQL Server в сторонних облаках. В 2019 году Microsoft ввела систему «запретительного» лицензирования, начав требовать отдельные лицензии для работы Windows Server и SQL Server в облаках Amazon, Google и Alibaba.

Простейшим решением был бы переход клиентов на Linux, но зачастую они вложили немало средств в экосистему Microsoft и выбирать им не приходится — они «очень зависимы» от Windows и других продуктов. Google жалуется на искусственно созданную Microsoft привязку к Windows Server и SQL Server — на модернизацию и перенос таких систем на Linux «уйдут годы и годы». Фактически придётся переписать все приложения, годами создававшиеся под экосистему Microsoft. По данным Google, у некоторых компаний на подобную миграцию действительно уходило по несколько лет, что сказалось на ценах для конечных пользователей. У многих организаций просто нет ресурсов для таких «реформ».

 Источник изображения: CHUTTERSNAP/unsplash.com

Источник изображения: CHUTTERSNAP/unsplash.com

Кроме того, использующие Windows Server на собственном оборудовании и желающие перебраться в облако компании из-за стоимости лицензий фактически не имеют выбора — миграция в Azure для них будет значительно дешевле, чем в другие облака. AWS также согласна с тем, что переход на Linux и другое облако для многих клиентов Azure — это очень дорогая, часто экономически неоправданная задача. По подсчётам Google, 70–80 % выручки Azure поступает от клиентов, использующих Windows Server и SQL Server. Таким образом, говорит Google, конкретно это ПО — «критически важная часть» облачного рынка.

Google и AWS хотят, чтобы CMA решила вопрос с неконкурентным ценообразованием Microsoft. Британский регулятор предварительно уже решил, что такое поведение компании действительно не соответствует правилам «здорового» рынка. В самой Microsoft считают, что в удержании клиентов при переходе с on-premise в облако нет ничего противоправного. По её мнению, при подходе к ценообразованию SPLA она соблюдает баланс, прося «не слишком мало, но и не слишком много». Кроме того, компания предлагает Linux-версию SQL Server.

Окончательное решение CMA должно вынести 4 июля. В числе прочих расследуемых проблем — комиссии за перенос данных (egress fees) и технические барьеры при переходе из облака в облако. В самом CMA больших проблем в этом не видят, но малые облачные провайдеры не согласны, считая, что подобные препятствия на руку лишь гиперскейлерам. Формально «штрафы» за перенос данных в другое облако «большая тройка» отменила. Вот только Amazon не требует при миграции отказываться от всех сервисов и закрывать аккаунты, а Microsoft и Google — требуют.

Постоянный URL: http://servernews.ru/1121514
18.04.2025 [08:56], Руслан Авдеев

AWS: облако Azure лишится половины нагрузок, как только Microsoft ослабит политику лицензирования своего ПО

По оценкам AWS, облако Microsoft Azure лишилось бы половины нагрузок корпоративных клиентов, если бы не «заградительные пошлины» на уход от редмондской компании. Заявление фигурирует в очередной жалобе Управлению по конкуренции и рынкам Великобритании (CMA) в рамках расследования Cloud Services Market Investigation, сообщает The Register. С 2019 года использование Windows Server и ряда других продуктов в облаках прямых конкурентов Microsoft вчетверо дороже, чем в Azure. Сама Microsoft не видит в этом никакой проблемы.

В AWS утверждают, что такая практика лицензирования Microsoft вредит конкуренции и облачному рынку Великобритании. При этом в компании уверены, что Microsoft не имеет убедительных оправданий для подобных изменений, искусственно завышая цены. Google поддерживает AWS в данном вопросе, а заодно подала аналогичную жалобу регуляторам Евросоюза, да и в целом пытается сколачивать союзы против конкурента.

AWS и Google опасаются, что более высокие цены на ПО Microsoft при использовании в чужих облаках коммерчески «привязывают» клиентов к компании. В AWS подчёркивают, что Microsoft доминирует на некоторых сегментах рынка ПО, поэтому клиенты, желающие использовать их в облаке, фактически зависимы от Azure. Кроме того, некоторые «неценовые» ограничения также мешают использовать софт компании в чужих облаках. В частности, BYOL-политика Microsoft заставляет заново покупать лицензии на уже приобретённое ПО, если у клиента появится желание перейти в отличные от Azure облака.

 Источник изображения:  Felix Mittermeier/unsplash.com

Источник изображения: Felix Mittermeier/unsplash.com

CMA инициировало расследование ситуации на британском облачном рынке в 2023 году. Оно всё ещё продолжается, хотя предварительные выводы уже сделаны и в них Microsoft действительно признана злоупотребляющей доминирующим положением (впрочем, досталось и AWS). CMA также считает, что стратегия Microsoft даёт ей возможность «частично блокировать» AWS и Google, что вредит конкуренции. Microsoft в ответ заявила, что вмешательство CMA грубо нарушит права компании на интеллектуальную собственность и что в отрасли никто ещё не сталкивался с подобной несправедливостью.

Теперь AWS утверждает то, что многие пользователи уже сегодня выбрали бы перенос ПО Microsoft в облако AWS, поскольку «хотят и могут». Возможно, 50 % таких нагрузок мигрировало бы из Azure куда-либо ещё, если бы это было экономически целесообразно. От Microsoft требуют отказаться от непомерных лицензионных сборов и других «неценовых» ограничений. Кроме того, даже клиентам Azure приходится платить больше из-за отсутствия конкуренции. Впрочем, в AWS признали, что трудно оценить, сколько клиентов остались бы в Azure, если бы имели возможность уйти, не теряя денег.

 Источник изображения:  Felix Mittermeier/unsplash.com

Источник изображения: Felix Mittermeier/unsplash.com

Google в целом поддерживает позицию AWS и предлагают запретить Microsoft ставить неприемлемые условия лицензирования своего ПО в Google Cloud Platform, заставить отказаться от других практик привязки пользователей к своим сервисам и запретить Microsoft ограничивать третьим сторонам возможность продажи лицензий на её ПО для использования в Google Cloud.

Microsoft не согласна ни с CMA, ни с конкурентами, считая, что решения регулятора об ограничениях ПО слишком расплывчаты, в том числе относительно определений того, почему вдруг прибыли AWS и Google в данном контексте посчитали слишком низкими. Кроме того, компания вовсе не против использования Windows Server и SQL Server в облаках AWS и Google, поскольку это тоже приносит деньги и важно для бизнеса. При этом в компании подчёркивают, что не хотят делать цену за использования ПО слишком низкой, но вот если бы она была чересчур высокой, то клиенты уже перешли бы на альтернативные программные платформы. По мнению Microsoft, AWS и Google зарабатывают достаточно, чтобы успешно конкурировать с ней, так что создавать им дополнительные преимущества нецелесообразно.

Постоянный URL: http://servernews.ru/1121430
15.04.2025 [14:49], Руслан Авдеев

ИБП Google Cloud стали причиной… шестичасового перебоя в электроснабжении одного из облачных регионов

По данным Google, причиной недавнего шестичасового перебоя в работе одного из облачных регионов компании стали, как это ни иронично, источники бесперебойные питания — они не только не выполнили свою задачу, но и помешали наладить нормальную работу. В результате сбоя наблюдалась деградация более 20 сервисов Google Cloud или отсутствие доступа к ним в зоне us-east5-c, расположенной в Коламбусе (Columbus, Огайо). Инцидент произошёл 29 марта в США, сообщает The Register.

В докладе Google, посвящённом инциденту, говорится, что перебои с электричеством начались с отказом энергосети в соответствующей зоне. Обычно у гиперскейлеров всё предусмотрено на этот случай — сначала включаются источники бесперебойного питания (ИБП) для немедленного возобновления электроснабжения, затем запускаются дизельные генераторы.

Однако в данном случае ИБП пережили «критический отказ батарей» и попросту не заработали. Более того, похоже, именно из-за них энергия от генераторов тоже не смогла достичь оборудования, поскольку инженерам пришлось подключать последние в обход ИБП, так что на восстановление питания ушло почти два часа. Вскоре после этого большинство сервисов Google возобновило работу, но часть из них пришлось перезапускать вручную, что тоже отняло время.

Google выразила глубочайшие извинения и обязалась предотвращать повторение проблемы в будущем. Для этого компания пообещала:

  • усовершенствовать восстановление кластеров после отключения питания, чтобы сервисы возвращались в строй быстрее;
  • проверить системы переключения питания и исправить недочёты;
  • разобраться с поставщиком ИБП, чтобы избежать проблем в будущем.

Обычно гиперскейлеры делают акцент на надёжности своих систем. В основном они действительно надёжны, но иногда что-то идёт не так. При этом перебои с электричеством — явление не уникальное, в том числе в США — крупный, но не столь продолжительный инцидент зарегистрировали тоже в марте. Более того, с аккумуляторами связаны и другие происшествия, менее безобидные. Они становятся причиной пожаров, как это, например, произошло в ЦОД Digital Realty в Сингапуре. Как отмечает Uptime Institute, именно проблемы с питанием чаще всего становятся причиной сбоев ЦОД, но избавиться от них не позволяет человеческий фактор.

Постоянный URL: http://servernews.ru/1121306
13.04.2025 [23:54], Владимир Мироненко

ИИ-агенты под присмотром: Google Distributed Cloud заработает на on-premise платформах NVIDIA Blackwell DGX/HGX

NVIDIA объявила о стратегическом партнёрстве с Google Cloud с целью внедрения агентного ИИ на предприятиях, которые хотели бы локально использовать семейство моделей Google Gemini с помощью платформ NVIDIA Blackwell HGX/DGX, а также функции NVIDIA Confidential Computing для повышения безопасности данных.

Интеграция платформы NVIDIA Blackwell с портфелем программно-аппаратных решений Google Distributed Cloud позволяет локальным ЦОД соответствовать нормативным требованиям и законам о суверенитете данных, блокируя доступ к конфиденциальной информации, включая истории болезни пациентов, финансовые транзакции и секретную правительственную информацию. NVIDIA Confidential Computing защищает конфиденциальный код в моделях Gemini от несанкционированного доступа и утечек данных — запросы пользователя к API Gemini, а также данные, которые они использовали для тонкой настройки, остаются в безопасности и защищены от несанкционированного доступа или изменений.

Сачин Гупта (Sachin Gupta), вице-президент и генеральный менеджер по инфраструктуре и решениям в Google Cloud, отметил, что партнёрство позволяет предприятиям в полной мере использовать весь потенциал агентного ИИ, внедряя модели Gemini в локальные системы, и объединяя производительность NVIDIA Blackwell и возможности конфиденциальных вычислений.

Хотя многие уже могут использовать модели с мультимодальным рассуждением — интегрируя текст, изображения, код и другие типы данных для решения сложных проблем и создания облачных приложений агентного ИИ, предприятия с повышенными требованиями к безопасности или суверенитету данных столкнулись с трудностями при внедрении этих технологий. Данное партнёрство позволит решить эти проблемы, благодаря чему Google Cloud становится одним из первых поставщиков, предлагающих возможности конфиденциальных вычислений для защиты рабочих нагрузок ИИ-агентов в любой среде, как облачной, так и гибридной.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Масштабирование агентного ИИ требует надёжного мониторинга и безопасности для обеспечения стабильной производительности и соответствия требованиям. Google Cloud представила новый шлюз GKE Inference Gateway, созданный для оптимизации развёртывания рабочих нагрузок ИИ-агентов с расширенной маршрутизацией и масштабируемостью. Интеграция с NVIDIA Triton Inference Server и NVIDIA NeMo Guardrails обеспечивает интеллектуальную балансировку нагрузки, которая повышает производительность и снижает затраты на обслуживание, также обеспечивая централизованную безопасность и управление моделями.

В дальнейшем Google Cloud планирует улучшить отслеживания рабочих нагрузок агентского ИИ, интегрировав NVIDIA Dynamo, библиотеку с открытым исходным кодом, предназначенную для обслуживания и масштабирования рассуждающих моделей. Этот перспективный подход гарантирует, что предприятия смогут уверенно масштабировать свои приложения агентского ИИ, сохраняя при этом безопасность и соответствие требованиям.

Постоянный URL: http://servernews.ru/1121175
09.04.2025 [17:48], Руслан Авдеев

ИИ Google Gemini поможет переписать приложения для мейнфреймов и перенести их в облако

Незадолго до анонса новых мейнфреймов IBM z17 компания Google анонсировала новые ИИ-инструменты на основе моделей Gemini и других технологий для модернизации инфраструктуры и переносу нагрузок с в облако Google Cloud.

Google Cloud Mainframe Assessment Tool (MAT) на основе ИИ-моделей Gemini уже доступен. Инструмент позволяет оценить и проанализировать общее состояние мейнфреймов, включая приложения и данные. Это даст возможность принимать информированные решения по оптимальной модернизации. MAT обеспечивает глубокий анализ кода, генерирует чёткие объяснения его работы, автоматизирует создание документации и др. Это позволяет ускорить понимание кода мейнфреймов и стимулирует процесс модернизации.

Google Cloud Mainframe Rewrite на основе моделей Gemini позволяет модернизировать приложения для мейнфреймов (инструмент доступен в превью-режиме). Он помогает разработчикам переосмыслить и преобразовать код для мейнфреймов, переписав его на современные языки программирования вроде Java и C#. Mainframe Rewrite предлагает IDE для модернизации кода, тестирования и развёртывания модернизированных приложений в Google Cloud.

 Источник изображения: Ant Rozetsky / Unsplash

Источник изображения: Ant Rozetsky / Unsplash

Наконец, чтобы снизить риски, возникающие при модернизации, предлагается инструмент Google Cloud Dual Run для глубокого тестирования, сертификации и оценки модернизированных приложений. Инструмент позволяет проверить корректность, полноту и производительность модернизированного кода в ходе миграции и до того, как новое приложение заменит старое. Dual Run сравнивает данные, выдаваемые старой и новой системами, для поиска отличий.

Имеются и дополнительные инструменты, разработанные партнёрами Google. Так, Mechanical Orchard предлагает платформу для быстро переписывания приложений на COBOL на современные языки, включая Java, Python и др., без изменения бизнес-логики. Решение позволяет «пошагово» переписывать фрагменты приложений с помощью систем генеративного ИИ с сохранением функциональности и тестировать корректность их работы. Основная цель — создать для облака функциональный эквивалент устаревших решений.

 Источник изображения: Google Cloud

Источник изображения: Google Cloud

Кроме того, в рамках новой программы Google Mainframe Modernization with Gen AI Accelerator компания привлекла Accenture, EPAM и Thoughtworks, которые помогут организациям мигрировать с мейнфреймов. На первом этапе производится анализ кода с помощью MAT и Gemini. На втором реализуется пилотный проект с проверкой работоспособности нового кода. На третьем осуществляется полномасштабная миграция в облако. Первые клиенты могут бесплатно (без учёта расходов на Google Cloud) оценить решения в течение 4-8 недель.

Мейнфреймы ещё рано списывать со счетов. Согласно данным опроса Kyndryl 500 топ-менеджеров ИТ-индустрии, многие организации интегрируют мейнфреймы с публичными и частными облачными платформами и совершенствуют свои программы модернизации, перемещая некоторые рабочие нагрузки с мейнфреймов или обновляя их.

Постоянный URL: http://servernews.ru/1120943
27.03.2025 [12:02], Руслан Авдеев

Желающие купить американский бизнес TikTok потянулись за поддержкой к облачным операторам США

Компании, рассматривающие возможность покупки американского подразделения социальной сети TikTok, обращаются за помощью к Microsoft и Google. Это делается в преддверии приближающегося «дедлайна» продажи, установленного на 5 апреля, сообщает The Information.

По данным издания, ссылающегося на людей, «участвовавших в переговорах», некоторые компании, включая небольшие группы частных инвесторов, претендующие на покупку TikTok, но не обладающие собственными облачными ресурсами, ведут переговоры с Microsoft и Google об использовании их облачной инфраструктуры для поддержания работы сервиса в США. С 2022 года американский сегмент TikTok эксклюзивно использует облако Oracle — со времён первого президентства Дональда Трампа (Donald Trump), который требовал, чтобы ByteDance продала свой бизнес в США местным компаниям.

Утверждается, что в тот период Oracle была близка к покупке подразделения, но после того, как пост президента занял Джо Байден (Joe Biden), необходимость продажи временно пересмотрели. Ранее китайская ByteDance, владеющая TikTok, рассчитывала, что размещение данных в облаке Oracle позволит спасти бизнес и снимет опасения американских властей по поводу угрозы национальной безопасности. Однако этого не произошло.

 Источник изображения: Jonathan Kemper/unsplash.com

Источник изображения: Jonathan Kemper/unsplash.com

Как сообщает Datacenter Dynamics, в декабре 2024 года TikTok не удалось выиграть апелляцию по делу о запрете деятельности социальной сети в США, и приложение даже было временно отключено для американских пользователей — ещё во время президентства Байдена. Однако пришедший к власти Дональд Трамп подписал указ, отсрочивший запрет на 75 дней. По некоторым данным, интерес к покупке американского сегмента TikTok проявили Microsoft и Oracle. Крайний срок продажи — всего через несколько дней, 5 апреля. Однако достоверно неизвестно, кто станет покупателем, если сделка вообще состоится.

Как сообщает The Information, вполне вероятно, что Oracle продолжит предоставлять хостинг TikTok в случае продажи. Однако информация о переговорах с Google и Microsoft может свидетельствовать о том, что некоторые прежние соглашения с Oracle могут оказаться под вопросом. Сами облачные операторы ситуацию не комментируют. Примечательно, что TikTok и так является клиентом Google, Microsoft и AWS, которые предоставляют социальной сети услуги по хранению данных.

В Европе массивы данных TikTok разделены между Green Mountain в Норвегии и ирландским ЦОД, вероятно, на территории Echelon. Ранее в марте TikTok обязался увеличить инвестиции в дата-центры в Таиланде до $8,8 млрд, но как теперь будут связаны американский и глобальный сегменты, пока неизвестно.

Постоянный URL: http://servernews.ru/1120386
11.03.2025 [12:21], Руслан Авдеев

Google Cloud запустила облачный регион в Швеции — одним из ключевых клиентов станет IKEA

Google объявила о создании очередного облачного региона на территории Швеции. Это уже 42-й регион Google Cloud в мире и 13—й — в Европе, сообщает пресс-служба компании. Одним из её партнёров-клиентов в этом проекте стала IKEA, объявившая, что она «в восторге» от сотрудничества с Google Cloud и что она разделяет приверженность IT-гиганта к инновациям в Швеции. Поддерживает новый проект и шведский сервис Spotify, который сотрудничает с Google уже с десяток лет.

Регион europe-north2 обеспечит шведские бизнесы, организации и отдельных клиентов платформой для ИИ, машинного обучения и аналитики данных, а низкая задержка доступа сделает использование сервисов комфортным. Так, Шведская правительственная Комиссия по ИИ (AI Comission) недавно опубликовала план, который включает создание «ИИ-фрабрики» для государственного сектора. Создание региона также позволяет решить вопрос с требованиями законодательства по обеспечению суверенитета данных и размещению данных жителей на территории страны. Обещаны шифрование данных во время хранения и передачи, детализированный контроль доступа, передовые системы обнаружения угроз и т.п.

 Источник изображения: Google Cloud

Источник изображения: Google Cloud

Новый облачный регион Google с 2026 году будет как минимум на 99% обеспечен безуглеродной энергией (CFE) благодаря экологически чистой энергосистеме страны. Google также подчеркивает свои усилия для устойчивого развития, в том числе упоминая первые соглашения о покупке экологически чистой энергии (PPA) в Швеции с 2013 года и поддержку проектов ветровой энергетики мощностью более 700 МВт. Регион находится Авесте (Avesta) в лене Даларна (Dalarnas län) недалеко от Стокгольма. Регион включает три зоны доступности, однако расширение до как минимум трёх отдельных ЦОД запланировано на будущее.

При этом Google инвестирует не только в данный облачный регион, но и в цифровую экосистему Швеции вообще, совместно с местными партнёрами вроде Devoteam и Tietoevry Tech Services. Организовано сотрудничество с местными бизнесами, образовательными учреждениями и государственными организациями для создания процветающей экосистемы. Google заявила, что намерена и далее продолжать инвестиции в Швецию, сотрудничать с бизнесом и другими организациями.

Не дремлют и конкуренты. Летом прошлого года Microsoft сообщила, что вложит $3,2 млрд в ИИ-инфраструктуру и облако в Швеции, а в конце августа CoreWeave пообещала, что развернёт в Швеции крупнейший в Европе ИИ-кластер NVIDIA Blackwell.

Постоянный URL: http://servernews.ru/1119527
03.03.2025 [15:23], Руслан Авдеев

Google развернула уже 100 млн литий-ионных ячеек в своих ЦОД

Системы энергоснабжения дата-центров во многом зависят от аккумуляторов в составе ИБП. Участники рынка ЦОД активно инвестируют в создание аккумуляторных систем — не так давно число используемых Li-Ion элементов в дата-центрах Google по всему миру достигло 100 млн шт., сообщает пресс-служба компании.

В Google используются системы электропитания с 48 В постоянного тока (48Vdc), причём ИБП интегрированы непосредственно в стойки. Такая распределённая архитектура обладает двумя ключевыми преимуществами: область возможного сбоя ИБП ограничивается одной стойкой; нет дополнительной точки отказа между ИБП и серверами. Такой подход снижает общую стоимость владения (TCO), поскольку ИБП масштабируется вместе с инфраструктурой, благодаря чему уменьшаются затраты на начальном этапе внедрения, говорит компания.

Размещение батарей на DC-шине вместе с серверами исключает потери энергии, связанные с промежуточными преобразованиями переменного тока (AC) в постоянный (DC), положительно влияя на общую эффективность системы. В 2016 году Google открыла спецификации своей системы электропитания стоек, включая спецификации для литий-ионных BBU, в рамках Open Compute Project (OCP). Кроме того, Li-Ion аккумуляторы вдвое долговечнее и вдвое мощнее свинцово-кислотных элементов, применявшихся ранее. Таким образом, переход с одних на другие означает, что теперь можно использовать меньше батарей, что также положительно влияет на экологичность ЦОД, говорит Google.

 Источник изображений: Google/OCP

Источник изображений: Google/OCP

В Google отмечают, что развернуть 100 млн Li-Ion элементов можно только благодаря подходу «безопасность прежде всего», принятому в компании. Основным риском для такого типа элементов является возможность неуправляемого нагрева, т. н. «теплового разгона» в случае, если с ними некорректно обращаются, чрезмерно заряжают или не охлаждают должным образом. В результате могут случаться пожары, и хотя такое бывает редко, огонь очень трудно погасить из-за выделения большого количества тепла и риска «цепной реакции» воспламенения соседних элементов.

Для использования большого «парка» АКБ в Google применяют метод тестирования UL9540A (стандарт, разработанный для оценки безопасности энергосистем, включая аккумуляторы) и проводит строгие испытания литий-ионных блоков BBU. В результате Google успешно получила от регуляторов разрешения на использование BBU даже в Азиатско-Тихоокеанском регионе, где действуют самые жёсткие правила. Сейчас в Google изучают возможность использования больших энергохранилищ (BESS).

Безопасность аккумуляторов — не праздный вопрос. Пожары в дата-центрах вообще случаются не так уж редко, а во многих случаях причиной служат именно инциденты с аккумуляторами. За примерами не надо далеко ходить: один из крупнейших в мире сбоев ЦОД южнокорейской площадки Kakao произошёл именно из-за перегрева и возгорания литий-ионных аккумуляторов SK On, что привело к пожару. В сентябре 2024 года из-за возгорания Li-Ion элементов ИБП пострадал сингапурский ЦОД Digital Realty. В 2023 году эксперты Uptime Institute предупреждали о возможной опасности использования Li-Ion элементов в дата-центрах, поскольку они подвержены повышенному риску возгорания.

Постоянный URL: http://servernews.ru/1119119
22.02.2025 [22:45], Сергей Карасёв

В облаке Google Cloud появились инстансы A4X на базе суперускорителей NVIDIA GB200 NVL72

Облачная платформа Google Cloud объявила о запуске виртуальных машин A4 с ускорителями NVIDIA B200 и A4X на основе суперускорителей NVIDIA GB200 NVL72 поколения Blackwell. Эти инстансы ориентированы на ресурсоёмкие приложения ИИ.

 Источник изображения: Google

Источник изображения: Google

По заявлениям Google, виртуальные машины A4 обеспечивают высокий уровень производительности при работе с ИИ-моделями на различных архитектурах. Инстансы подходят для таких рабочих нагрузок, как обучение и тонкая настройка. В свою очередь, экземпляры A4X специально созданы для обучения и обслуживания самых требовательных и сверхмасштабных задач ИИ, включая большие языковые модели (LLM) с наиболее ёмкими контекстными окнами и «рассуждающие» модели.

Суперускорители GB200 NVL72 объединяют в одной стойке 72 чипа B200 и 36 процессоров Grace. Применяются шина NVLink 5 и инфраструктура жидкостного охлаждения Google третьего поколения. Каждая система GB200 NVL72 обеспечивает быстродействие до 1,44 Эфлопс в режиме FP4 и до 720 Пфлопс в режиме FP8. По заявлениям Google, достигается четырёхкратное увеличение производительности при обучении LLM по сравнению с виртуальными машинами A3 на базе ускорителей NVIDIA H100.

Инстансы A4X допускают масштабирование до десятков тысяч графических процессоров Blackwell. Говорится об интеграции с сервисами хранения Cloud Storage FUSE, Parallelstore и Hyperdisk ML, что обеспечивает доступ к данным с малой задержкой (менее 1 мс) и высокую пропускную способность.

Новые виртуальные машины будут развёрнуты в различных регионах Google Cloud. Нужно отметить, что ранее о запуске общедоступных инстансов на базе NVIDIA GB200 NVL200 объявила компания CoreWeave, предоставляющая облачные услуги для ИИ-задач. Скоро эти суперускорители станут доступны и в облаке Lambda Labs.

Постоянный URL: http://servernews.ru/1118687
05.02.2025 [23:04], Владимир Мироненко

Рост Google Cloud замедлился, но ради ИИ компания готова потратить $75 млрд на серверы и ЦОД в 2025 году

Холдинг Alphabet, материнская структура Google, сообщил финансовые результаты IV квартала и всего 2024 финансового года, завершившегося 31 декабря. По итогам 2024 года чистая прибыль Alphabet впервые превысила отметку в $100 млрд, составив $100,12 млрд при выручке в $ 350,02 млрд, выросшей год к году на 14 %. Результаты Alphabet оказались ниже прогнозов Уолл-стрит, поэтому акции холдинга упали на 9 % во вторник на внебиржевых торгах.

Консолидированная выручка Alphabet в IV квартале 2024 года выросла на 12 % в годовом исчислении до $96,47 млрд США, что, как утверждает холдинг, отражает устойчивую динамику во всём бизнесе. Вместе с тем показатель оказался ниже консенсус-прогноза аналитиков, опрошенных LSEG, полагавших, что выручка должна быть выше — в пределах $96,56 млрд. Также аналитиков разочаровал квартальный доход облачного подразделения Google Cloud, составивший $11,96 млрд, что на 30 % выше прошлогоднего результата, но ниже консенсус-прогноза в размере $12,19 млрд экспертов, опрошенных StreetAccount.

 Источник изображений: Google

Источник изображений: Google

Чистая прибыль Alphabet выросла на 28 % до $26,54 млрд, превысив прогноз аналитиков LSEG в размере $26,0 млрд, при этом чистая прибыль на акцию выросла на 31 % до $2,15, что выше ожиданий аналитиков, опрошенных LSEG, в размере $2,13 на акцию. Alphabet объявил, что выделит $75 млрд на капитальные затраты в 2025 году по сравнению с $52,5 млрд в прошлом году. Это тоже вызвало вопросы у инвесторов, поскольку разница более чем в $22 млрд могла быть добавлена к прибыли холдинга. При этом другие гиперскейлеры также увеличат траты на инфраструктуру: Meta готова вложить $60–65 млрд, а Microsoft — $80 млрд.

В свою очередь, руководство Alphabet настаивает на том, что инвестиции оправданны, поскольку Google Cloud сейчас не в состоянии удовлетворить спрос на ИИ-технологии. Финансовый директор Alphabet Анат Ашкенази (Anat Ashkenazi) заявила в ходе онлайн-конференции с аналитиками, что холдинг прилагает все усилия, чтобы развернуть больше мощностей и справиться со спросом. По её словам, эти цифры в первую очередь отражат инвестиции в техническую инфраструктуру, причем крупнейшим компонентом являются инвестиции в серверы, за которыми следуют ЦОД «для поддержки роста бизнеса Google Services, Google Cloud и Google DeepMind».

«Мы находимся в ситуации с дефицитом предложения при высоком спросе, и усердно работаем над тем, чтобы ввести больше мощностей в эксплуатацию», — отметила Ашкенази. Она сообщила, что темпы роста облачного подразделения Google могут измениться в 2025 году, поскольку компания продолжает закупать всё больше оборудования и строить больше объектов. По её словам, капитальные затраты Alphabet в I квартале составят от $16 до $18 млрд, и квартальный показатель изменится в течение года. Это выше прогноза аналитиков FactSet в размере $14,3 млрд. Капитальные затраты Alphabet за IV квартал составили $14 млрд превысив ожидания Уолл-стрит в $13,26 млрд, согласно StreetAccount.

Сомнения инвесторов в правильности инвестиционной политики Alphabet усилились после анонса китайским стартапом DeepSeek ряда ИИ-моделей, расходы на обучение которых оказались гораздо ниже, чем у Google. «Неутешительные результаты Cloud говорят о том, что импульс, основанный на ИИ, может начать ослабевать как раз в то время, как стратегия Google с закрытой моделью ставится под сомнение DeepSeek», — отметила Эвелин Митчелл-Вольф (Evelyn Mitchell-Wolf), аналитик исследовательской компании Emarketer.

Что касается остальных подразделений Alphabet, то рост доходов от рекламы Google составил 10,6 % по сравнению с 11 % годом ранее. Доходы от поиска выросли год к году на 12,0 % до $54,03 млрд по сравнению с ростом на 12,7 % в IV квартале 2023 года. Доходы от рекламы на YouTube выросли на 13,8 % до $10,47 млрд по сравнению с 15,5 % роста годом ранее, а рост всех доходов сервисов (Google Services) составил 10,2 % по сравнению с 12, % годом ранее.

Постоянный URL: http://servernews.ru/1117798

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus