Oracle Cloud расширяет портфель HPC-решений: 160-ядерные ARM-инстансы на базе Ampere, кластеры с NVIDIA A100 и новые средства автоматизации

 

Oracle Cloud Infrastructure (OCI) сделала сразу несколько крупных анонсов: инстансы с GPU NVIDIA A100, расширение сотрудничества с Rescale и Altair, а также планы на новые инстансы на базе Arm, но обо всем по порядку.

Новый bare-metal инстанс называется GPU4.8 и оснащается восемью графическими ускорителями NVIDIA A100 с тензорными ядрами, 40 Гбайт памяти и используют общую шину NVLink. В роли центрального процессора выступает AMD EPYC Rome с 64 ядрами, работающих на частоте 2,9 ГГц. Поддерживается до 2 Тбайт ОЗУ и 24 Тбайт хранилища на основе NVMe-накопителей.

Новый инстанс Oracle для подключения к кластеру использует высокоскоростное сетевое соединение на базе NVIDIA Mellanox RDMA (RoCE), позволяя создавать кластер из более чем 500 узлов. По словам Oracle новый кластер сопоставим по скорости работы с системами DGX, кроме того, предоставляются все передовые возможности, такие как GPUDirect через RDMA и NVIDIA GPU Cloud (NGC). Новые инстансы с графическими ускорителями NVIDIA A100 будут доступны с 30 сентября в США, странах Европы, Ближнего Востока и Африки по цене 3,05 доллара за час.

Oracle анонсировала несколько дополнительных видов инстансов и комплексных решений, включая:

  • Стек решений AI Engineered MLOps — автоматизация рабочих процессов с помощью Apache AirFlow и создание экземпляра кластера c NVIDIA A100 на «голом железе» для машинного обучения;
  • Media Ops — автоматизация рабочих процессов с помощью AirFlow для управления конвейером автономных операций с мультимедиа в Oracle Cloud. Это расширяет возможности клиентов по сжатию, кодированию и распространению контента;
  • Cloud Native MLOps Orchestration — позволяет специалистам по данным сосредоточиться на новых технологиях с Kuberflow и облачных образов NVIDIA GPU Cloud для автоматизации перемещения данных и создания вычислительных инстансов;
  • Julia AI HPC Image — стек автоматизации для инженерных HPC-образов с Julia, Jupyter Notebook и средой разработки IJulia. Стек автоматизации был протестирован и оптимизирован для графических процессоров NVIDIA A100 и показал очень хорошие результаты, по сравнению со старыми системами с Python;
  • Предварительно сконфигурированные Data Science и AI образы — включают в себя библиотеки NVIDIA для нейронных сетей, общие фреймворки для машинного обучения, стандартные интегрированные среды разработки Python/R.

Новые образы доступны в Oracle Cloud Marketplace.

Компания Ampere в качестве поставщика процессоров недавно вошла в лагерь Arm для OCI. В настоящее время Arm используется для перекодирования, запуска контейнеров и Kubernetes. В следующем году Oracle обещает новые инстансы с двумя сокетами, суммарно поддерживающие до 160 ядер. Доступны они будут в двух вариантах: bare-metal платформы и виртуальные машины.

Расширение партнерства OCI с Rescale и Altair нацелено на помощь начинающим пользователям облачных вычислений и HPC. Обе компании имеют большой опыт в области услуг по оркестрации облаков для HPC. В прошлом Altair строил SaaS на основе графических ускорителей для ПО ultrafluidX и nanofluidX. Теперь они переносят весь свой набор продуктов HyperNetworks в облако Oracle.

Подход Oracle отличается от конкурентных решений прежде всего тем, что компания сама создает свои системы — от материнской платы до стойки, что позволяет более гибко распределять необходимые ресурсы и иметь единую, хорошо понятную экосистему.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Постоянный URL: https://servernews.ru/1021426

Комментарии

Система Orphus