Microsoft объявила о доступности предварительной версии Arm-инстансов Azure Cobalt 200, разработанных с нуля для масштабируемых, облачно-ориентированных и основанных на Linux ИИ-нагрузок с использованием агентов и обеспечивающих до 50 % более высокую производительность по сравнению с Cobalt 100.
Компания сообщила, Cobalt 200 объединил её новейшие разработки — от «кремния» до серверов и сервисов — в области безопасности, сетей, хранения данных и разгрузки, что позволяет превосходить традиционные вычислительные решения на базе Arm. Совместная оптимизация аппаратного и программного обеспечения позволяет расширять возможности масштабирования, повышать безопасность и снижать затраты при использовании ИИ-инференса, конвейеров передачи данных, а также веб-сервисов и API, обеспечивающих работу современных сервисов.
Microsoft отметила, что агенты отличаются от традиционных рабочих нагрузок тем, что они рассуждают, принимают последовательные решения и непрерывно работают в больших масштабах, что требует принципиально иного профиля вычислений. Cobalt 200 создан именно для этой среды и обеспечивает 50-% прирост производительности для таких нагрузок, делая агентов более быстрыми, функциональными и экономически эффективными в масштабах предприятия.
Его предшественник, Cobalt 100, доступен в 32 регионах ЦОД Azure по всему миру. Такие компании, как Databricks и Snowflake, используют Cobalt 100 для оптимизации своей облачной инфраструктуры, а такие клиенты, как Amadeus, OneTrust, Siemens, Sprinklr и Temenos, добились значительного повышения производительности и эффективности, сообщила Microsoft.
На собственных облачных сервисах компании ВМ Azure Cobalt 100 обеспечивают повышение производительности до 45 % при использовании на 35 % меньшего количества вычислительных ядер по сравнению с предыдущей вычислительной платформой. Microsoft Defender for Endpoint (MDE) продемонстрировал повышение производительности на 40 % в своём инструменте управления данными.
Ключевые преимущества инстансов Cobalt 200:
- По сравнению с инстансами Cobalt 100 предыдущего поколения, ВМ Cobalt 200 обеспечивают до 50 % более высокую производительность CPU, на 20 % более высокий показатель IOPS удалённого хранилища с NVMe, на 10 % более высокую пропускную способность удалённого хранилища с NVMe и на 15 % более высокую пропускную способность сети, при этом улучшения варьируются в зависимости от рабочей нагрузки.
- Масштабирование до 128 vCPU.
- Интеграция Azure Boost позволяет повысить производительность удалённого хранилища (IOPS) и пропускную способность NVMe-хранилищ, одновременно увеличивая пропускную способность сети, обеспечивая преимущества для распределённых приложений, ресурсоёмких сервисов и высокопроизводительных конвейеров обработки данных.
- Чиплетная архитектура процессора с более крупной иерархией кеша — 3 Мбайт L2-кеша на ядро и 192 Мбайт системного L3-кеша — позволяет размещать больше активных данных ближе к рабочей нагрузке, помогая снизить задержку и повысить скорость отклика для баз данных, in-memory кешей, аналитических движков и других ресурсоёмких сервисов.
Компания отметила, что Cobalt 200 обеспечивает производительность на ядро и масштабируемость, необходимые для современных нагрузок агентного ИИ. Каждое ядро Cobalt 200 представляет собой полноценное физическое ядро, дополненное ёмким L2-кешем и повышенной пропускной способностью памяти на ядро. Эти конструктивные особенности обеспечивают более высокую изоляцию и стабильную производительность под нагрузкой, что позволяет агентным рабочим нагрузкам размещать больше песочниц агентов в одной виртуальной машине, одновременно удовлетворяя требованиям к задержке и пропускной способности.
| Семейство ВМ | Кол-во vCPU | RAM/vCPU | Локальное NVMe-хранилище | Подходящие нагрузки |
|---|---|---|---|---|
| Dplsv7/Dpldsv7 | 1–128 | 2:1 | До 7 ТиБ | Большинство нетребовательных к памяти и горизонтально масштабируемых рабочих нагрузок, таких как микросервисы, небольшие базы данных, кеши, игровые серверы и многое другое. |
| Dpsv7/Dpdsv7 | 1–128 | 4:1 | До 7 ТиБ | Большинство горизонтально масштабируемых корпоративных рабочих нагрузок, таких как веб-серверы и серверы приложений, небольшие и средние базы данных, кеши и многое другое. |
| Epsv7/Epdsv7 | 1–128 | 8:1 | До 7 ТиБ | Крупные реляционные и NoSQL базы данных, кеши в оперативной памяти, такие как Redis и Memcached, и аналитика в реальном времени. |
| Mpsv4/Mpdsv4 | 1–84 | 16:1 | До 4,4 ТиБ | Крупные in-memory базы данных (IMDB), ERP-системы, масштабные уровни кеширования и ресурсоёмкие аналитические задачи. |
| Lpsv5 | 1–128 | 8:1 | До 23 ТиБ | Предварительная обработка и подготовка данных, реляционные и NoSQL базы данных с требованиями к локальному хранилищу, аналитика больших данных и поисковые/индексные системы. |
Инстансы Cobalt 200 обеспечивают значительное улучшение по сравнению с Cobalt 100 в наиболее важных для продуктовой среды рабочих нагрузках, в том числе рост производительности до 135 % для облачных баз данных, до 40 % — для веб-серверов, до 45 % — для задач шифрования связи и до 80 % — для нагрузок кеширования. Инстансы Cobalt 200 полностью совместимы с инстансами Cobalt 100, что делает миграцию бесшовной. Основные платформы и языки программирования для разработчиков, включая C++, .NET, Java, Python и Rust, уже предлагают версии, разработанные специально для Arm.
В числе собственных сервисов Microsoft, использующих ВМ Cobalt 200 — Dataverse и базы данных Azure. Напомним, что ранее Google объявила, что портировала около 30 тыс. внутренних нагрузок на Arm-архитектуру с использованием собственных Arm-чипов Axion и планирует перенести ещё порядка 70 тыс. В свою очередь, Oracle ещё несколько лет назад завершила миграцию всех своих облачных сервисов на Arm, как и AWS, также получившая заказы на поставку Graviton от Snowflake, Anthropic и Meta✴.
Microsoft отметила, что запуск инстансов Cobalt 200 позволил ей расширить портфель Arm-инстансов для поддержки более широкого набора рабочих нагрузок. Если на базе Cobalt 100 предлагаются семейства ВМ общего назначения (Dp, Dpl) и оптимизированные по памяти (Ep), то Cobalt 200 позволил добавить ещё два семейства инстансов: Mpsv4 с увеличенным объёмом памяти и Lpsv5 с плотным локальным хранилищем. Новинки уже доступны в формате предварительных версий. Инстансы будут доступны в следующих регионах: West US3, East US2, Central US, Sweden Central, East US, West US2, Spain Central и Indonesia Central. Об их доступности в других регионах будет объявлено позже.
Источник:
