Материалы по тегу: graviton
11.05.2023 [15:09], Сергей Карасёв
AWS запустила инстансы EC2 I4g на базе собственных CPU Graviton2 и Nitro SSDОблачная платформа AWS объявила о запуске инстансов EC2 I4g, оптимизированных для хранения данных. В основу положены процессоры AWS Graviton2 и NVMe-накопители AWS Nitro SSD. Утверждается, что по сравнению с другими инстансами, нацеленными на хранение информации, решения I4g обеспечивают прирост производительности до 15 %. В зависимости от конфигурации (см. таблицу ниже) заказчикам предоставляются от 2 до 64 vCPU и от 468 Гбайт до 15 Тбайт SSD-хранилища. Заявленная пропускная способность сетевого подключения варьируется от 10 Гбит/с до 37,5 Гбит/с, пропусканая способность EBS — от 40 до 80 Гбит/с. ![]() Источник изображения: Amazon Amazon отмечает, что инстансы на базе Graviton2 поддерживают широкий спектр вычислительных нагрузок: универсальные, с повышаемой производительностью, оптимизированные для вычислений, памяти и хранения, а также ускоренные. Утверждается, что инстансы на базе Graviton2 — лучшее решение по соотношению цены и быстродействия для рабочих нагрузок в EC2. SSD в составе EC2 I4g выдают показатель IOPS при произвольном чтении данных до 1 млн, при произвольной записи — до 800 тыс. Скорость последовательного чтения достигает 8000 Мбайт/с, скорость последовательной записи — 5600 Мбайт/с. Инстансы EC2 I4g уже доступны для клиентов в США и Европе.
29.11.2022 [17:12], Алексей Степин
AWS представила Arm-процессор Graviton3E, оптимизированный для задач ИИ и HPCОдин из крупнейших облачных провайдеров, компания Amazon Web Services объявила о доступности новых инстансов EC2 на базе процессора Graviton3E. Новый чип — наследник анонсированного в конце 2021 года Graviton3, 5-нм 64-ядерного процессора на дизайне Arm Neoverse V1 (Zeus) с поддержкой DDR5 и PCI Express 5.0. Graviton3 использует набор команд Armv8.4 c расширениями Neon (4×128 бит) и SVE (2×256 бит) и поддерживает работу с популярными в сфере машинного обучения форматами данных INT8 и BF16. В сравнении c Graviton2 процессор быстрее на 25-60 % при сохранении аналогичного уровня тепловыделения. Дизайн серверов AWS предусматривает наличие трёх процессоров на узел высотой 1U. ![]() Изображения: AWS Новый процессор Graviton3E представляет собой дальнейшее развитие Graviton3. Чип оптимизирован с учётом потребностей рынка высокопроизводительных вычислений и основное внимание в его архитектуре уделено повышению производительности на операциях с плавающей запятой и вычислениях с использованием векторной математики. AWS, к сожалению, пока не раскрывает деталей относительно архитектуры Graviton3E, но прирост производительности на векторных операциях относительно обычного Graviton3 может достигать 35 %. Помимо классического теста HPL новый процессор хорошо проявляет себя в тестах, имитирующих медико-биологические и финансовые задачи. ![]() Сценарии нагрузок, характерные для HPC, как правило, активно оперируют перемещением крупных объемов данных. Чтобы оптимизировать этот процесс, в новых инстансах AWS использует сеть на базе Elastic Fabric с новыми адаптерами Elastic Network Adapter (ENA). Такая сеть оперирует т. н. Scalable Reliable Datagram (SRD) вместо всем привычных TCP-пакетов. SRD позволяет организовать повторную отправку пакетов за микросекунды вместо миллисекунд в классическом Ethernet. Сердцем же новых инстансов AWS стало пятое поколение аппаратных гипервизоров Nitro 5. В сравнении с предыдущим поколением, Nitro 5 обладает вдвое более высокой вычислительной производительностью, на 50 % повышенной пропускной способностью памяти, а также позволяет обрабатывать на 60 % больше сетевых пакетов при сниженной на 30 % латентности. ![]() Здесь и далее источник изображений: AWS Инстансы Hpc7g с процессорами Graviton3E получат внутреннюю сеть с пропускной способностью 200 Гбит/с и станут доступны в различных конфигурациях вплоть до 64 vCPU и 128 ГиБ памяти. Аналогичные параметры имеют инстансы C7gn, предназначенные для задач с интенсивным сетевым трафиком: виртуальных маршрутизаторов, сетевых экранов, балансировщиков нагрузки и т.п. Также компания анонсировала инстансы R7iz, в которых используются процессоры Intel Xeon Scalable четвёртого поколения (Sapphire Rapids) с постоянной частотой всех ядер 3,9 ГГц. Они могут иметь конфигурацию до 128 vCPU с 1 ТиБ памяти.
25.05.2022 [18:51], Владимир Мироненко
AWS объявила о доступности инстансов на Arm-процессорах Graviton3Amazon Web Services (AWS) объявила о доступности инстансов следующего поколения Amazon Elastic Compute Cloud (Amazon EC2) C7g, оптимизированных для вычислений с использованием Arm-процессоров Graviton3 собственной разработки компании. Процессоры AWS Graviton3 обеспечивают до 25% более высокую вычислительную производительность в ресурсоёмких приложениях по сравнению с процессорами AWS Graviton2 в составе инстансов C6g. Благодаря этому клиенты могут более эффективно выполнять широкий спектр ресурсоёмких рабочих нагрузок — от веб-серверов, балансировщиков нагрузки и пакетной обработки до автоматизации проектирования электроники (EDA), высокопроизводительных вычислений (HPC), игр, кодирования видео, научного моделирования, распределённой аналитики, инференса при машинном обучении. ![]() Источник изображения: Noah Berger/hpcwire.com Новые инстансы C7g на базе процессоров AWS Graviton3 обеспечивают лучшее соотношение цены и производительности для широкого спектра клиентских приложений по сравнению с инстансами C6g. Процессоры AWS Graviton3 обеспечивают по сравнению с AWS Graviton2 вдвое более высокую производительность для криптографических рабочих нагрузок, до 3 раз более высокую производительность для инференса при машинном обучении и почти вдвое более высокую производительность при вычислениях с плавающей запятой для научных задач, машинного обучения и кодирования мультимедиа. Процессоры AWS Graviton3 также более энергоэффективны: они потребляют на 60 % меньше энергии при той же производительности, что у сопоставимых инстансов EC2. Инстансы C7g первыми в облаке Amazon получили память DDR5, обеспечивающую пропускную способность на 50% выше, чем память в инстансах на базе AWS Graviton2, что позволяет повысить производительность ресурсоёмких научных приложений, таких как вычислительная гидродинамика, геонаучное моделирование и обработка сейсмических данных. Инстансы C7g также обеспечивают пропускную способность сети на 20% выше, чем инстансы C6g, для ресурсоёмких приложений, таких как балансировка сетевой нагрузки и анализ данных. Новые инстансы C7g построены на базе AWS Nitro System. Для клиентов, стремящихся повысить производительность приложений, требующих параллельной обработки, таких как высокопроизводительные вычисления и кодирование видео, инстансы C7g в ближайшие недели получат поддержку интерфейса Elastic Fabric Adapter (EFA), который позволяет приложениям взаимодействовать напрямую с сетевыми интерфейсными картами, обеспечивая более низкую и более стабильную задержку. ![]() Источник изображения: AWS AWS C7g доступны как инстансы по требованию, по модели Savings Plans, а также как зарезервированные или спотовые инстансы. В настоящее время инстансы C7g доступны в облачных регионах us-east (Северная Виргиния) и us-west (Орегон). При использовании инстансов C7g клиенты платят только за объём используемых вычислений. Более подробно о C7g можно узнать по ссылке.
04.12.2021 [03:42], Игорь Осколков
Процессор Amazon Graviton3: 64 ядра Arm, 5-нм техпроцесс, чиплетная компоновка и DDR5 с PCIe 5.0Анонсированный на днях Arm-процессор Graviton3, создававшийся специально для нужд Amazon и AWS, неожиданно оказался по ряду параметров на голову выше ещё даже не вышедших EPYC и Xeon следующего поколения. И это не самый хороший сигнал для AMD, Intel, Qualcomm и прочих производителей. ![]() Amazon Graviton3. Фото: Ian Colle Graviton3 — первый массовый (самой Amazon и рядом избранных клиентов он используется уже не один месяц) серверный процессор с поддержкой DDR5 и PCIe 5.0. CPU выполнен по 5-нм техпроцессу TSMC и содержит примерно 55 млрд транзисторов. Для удешевления он использует BGA-корпусировку и чиплетную компоновку из семи отдельных кристаллов — два PCIe-контроллера и четыре двухканальных контроллера DDR5 вынесены за пределы собственно CPU. ![]() Узел EC2 C7g. Здесь и ниже изображения Amazon AWS Более того, их упаковка использует передовые решения с каналами длиной менее 55 мкм, что вдвое меньше, чем у других серверных CPU. Уменьшение длины проводников положительно сказывается на энергоэффективности, которая очень важна для любого гиперскейлера. Этим же объясняется и относительно небольшое по современным меркам число ядер (всего 64) и их частота (2,6 ГГц). Всё это позволило добиться энергопотребления примерно в 100 Вт. ![]() Есть и ещё один важный плюс в сохранении числа ядер — переход на DDR5-4800 позволил не только достичь пиковой суммарной пропускной способности памяти в 300 Гбайт/с на чип, но и повысить реальную скорость работы с памятью каждого vCPU (фактически ядра) в полтора раза по сравнению с прошлым поколением. Та же ситуация и с PCIe 5.0 — для достижения той же пропускной способности, что ранее, нужно вдвое меньше линий. ![]() Для удешевления используются готовые IP-блоки сторонних компаний и, судя по всему, ядра тоже несильно отличаются от референсов Arm. А вот какие именно, узнаем не сразу, поскольку Amazon явно не указала, будут ли это Neoverse V1 (Zeus) или N2 (Perseus). Вероятно, это всё же V1 (ARMv8.5-A), поскольку по описанию Graviton3 похожи именно на эту архитектуру. Новые ядра стали значительно «шире» прежних — они забирают 8 инструкций, декодируют от 5 до 8 из них и отправляют на исполнение сразу 15 инструкций. Соответственно и число исполнительных блоков по сравнению с Neoverse-N1 (Graviton2) практически удвоилось. ![]() Кроме того, они обзавелись поддержкой 256-бит векторных инструкций SVE, что повысило не только скорость выполнения «классических» FP-операций (например, для задач медиакодирования и шифрования), но и благодаря поддержке bfloat16 позволило утверждать Amazon, что новые чипы годятся и для инференса. Среди упомянутых ранее мер защиты есть, например, принудительное шифрование оперативной памяти, изолированные кеши для каждого vCPU (ядра), аппаратная защита стека. ![]() В подписи второго столбца явная опечатка В целом, средний прирост производительности Graviton3 по сравнению с Graviton2 составил 25 %, но в некоторых задачах он достигает 60 %. И всё это при сохранении того же уровня энергопотребления и тепловыделения. Всё это позволило уместить в одном 1U-узле с воздушным охлаждением сразу три процессора Graviton3. И они разительно отличаются от грядущих 128-ядерных процессоров Altra Max и EPYC Bergamo, которые Ampere и AMD позиционируют как решения для гиперскейлеров. Зато в чём-то похожи на Yitian 710 от Alibaba Cloud. Но CPU — это лишь часть платформы, фундамент для которой несколько лет назад заложило появление чипов Nitro. Их сейчас стоило бы назвать DPU/IPU, хотя на момент их появления такого понятия, можно сказать, и не было. Nitro берёт на себя все задачи по обслуживанию гипервизора, обеспечению безопасности, работе с хранилищем и сетью и т.д., высвобождая, с одной стороны, все ресурсы CPU, памяти и SSD для обработки задачи клиента, а с другой — позволяя практически полностью дезагрегировать всю инфраструктуру. ![]() Узел с Nitro SSD Впрочем, Amazon пошла ещё дальше — теперь она самостоятельно закупает NAND-чипы и производит SSD, тоже под управлением Nitro. То есть у компании под контролем практически полный стек современных аппаратных решений: CPU, DPU, SSD, ИИ-ускорители для обучения (Trainium) и инференса (Inferentia). Она активно переносит на него собственные сервисы и предлагает их клиентам. И именно это и должно обеспокоить крупных вендоров, поскольку их решения вряд ли позволят добиться такого же уровня TCO, а гиперскейлеров, желающих перейти на аналогичную модель, немало. UPD 06.12.21: презентация новых процессоров стала доступна публично, поэтому в материал добавлены некоторые иллюстрации, а в галерее ниже приведены результаты тестов производительности.
01.12.2021 [18:30], Алексей Степин
AWS представила серверы Outposts c Graviton2 и Intel Xeon Ice Lake-SPОдин из крупнейших провайдеров облачных услуг, Amazon Web Services, продолжает развивать платформу AWS Outposts, в рамках которой заказчику предоставляет локальное облако на базе выделенных серверов, которое интегрировано с «большим» облаком AWS. AWS Outposts позиционируется в качестве решения для региональных офисов, предприятий, розничных точек торговли и медицинских учреждений. В рамках AWS Outposts предлагаются как отдельные серверы, так и полностью готовые к установке стойки (42U) со всей необходимой инфраструктурой. Вчера же для этой платформы были представлены три новых сервера. Если решения на базе Intel Xeon Ice Lake-SP довольно обыденны, то вариант на базе AWS Graviton2 любопытен — при одинаковых с x86-системой числе ядер и объёмах RAM и SSD он имеет высоту 1U, а не 2U. ![]() Новые серверы AWS Outposts STBKRBE (сверху) и LMXAD41/KOSKFSF. Здесь и ниже изображения Amazon Каждый вариант позволяет создавать VPC и запускать инстансы Amazon EC2, а также работать с Amazon ECS и EKS. Даже младшие варианты могут обслуживать практически все типы инстансов, за исключением самого крупного c6id.32xlarge, а старшая версия Outposts 2U (KOSKFSF) таких ограничений не имеет. Доступна любая комбинация инстансов в пределах аппаратных возможностей сервера. ![]() AWS Outposts может иметь как обычное интернет-подключение, так и использовать выделенные каналы AWS Direct Connect. В дополнение к этому предусмотрен локальный сетевой интерфейс. Однако сами по себе серверы имеют высокий уровень защиты благодаря использованию AWS Nitro: отключен административный низкоуровневый доступ, имеются средства обнаружения вторжения в шасси, а данные защищены NIST-совместимым аппаратным ключом. ![]() Джефф Барр (Jeff Barr) и Бьянка Наги (Bianca Nagy) представляют новый сервер Outposts Заказать новые серверы можно будет прямо в консоли AWS Management Console. Доступны они станут в первом квартале следующего года. Ожидаемое время поставки составляет от 2 до 6 недель. Установку сервера можно выполнить самостоятельно или с помощью специалистов AWS.
01.12.2021 [00:44], Игорь Осколков
Amazon анонсировала серверные Arm-процессоры Graviton3 и ИИ-чипы TrainiumAWS, облачное подразделение Amazon, анонсировало EC2-инстансы C7g на базе Graviton3, третьего поколения Arm-процессоров собственной разработки, а также инстансы Trn1, использующие ИИ-ускорители Trainium, созданные силами AWS специально для задач машинного обучения. Впрочем, оба анонса носят предварительный характер. Так, для Graviton3 не уточняется ни поколения архитектуры Arm, ни число ядер, ни частоты. Зато утверждается, что новинки по сравнению с инстансами на базе Graviton2 имеют на четверть более высокую производительность и вдвое быстрее в вычислениях с плавающей запятой и при работе с криптографией. При этом они потребляет на 60 % меньше энергии. ![]() Упомянуты и некоторые архитектурные изменения. Так, поддержка bfloat16 позволяет втрое ускорить выполнение ИИ-задач (речь, вероятно, всё же об инференсе), а переход на DDR5 — на 50 % повысить пропускную способность памяти. У каждого vCPU есть выделенный кеш, а дополнительную безопасность обеспечивает аппаратная защита стека. Кроме того, в новых инстансах по умолчанию используется принудительное шифрование памяти, есть поддержка шифрованных EBS-томов, а скорость EFA-подключения достигает 30 Гбит/с. EC2 C7g, по словам AWS, подойдут для HPC, EDA, аналитики, игровых и рекламных платформ, медиакодирования и т.д. Для них доступны дистрибутивы Amazon Linux 2, RHEL, SUSE и Ubuntu, а также целый ряд уже адаптированного ПО. Пока что C7g доступны в рамках закрытого тестирования по заявкам, но их уже успели оценить Epic Games, Formula 1 Management, Honeycomb.io и Twitter. ![]() Сами процессоры Graviton3, как и его предшественники, вряд ли будут продаваться «на сторону» и за пределами основной инфраструктуру AWS попадут разве что в Outposts. Тем не менее, для самой Amazon это — наряду с внедрением Nitro — важный шаг к независимости от сторонних поставщиков и повышению производительности собственных сервисов. На базе Graviton2 сейчас предлагается всего 12 типов инстансов, однако AWS довольно активно и успешно переводит все остальные сервисы и услуги на собственные CPU. EC2-инстансы Trn1, в целом, направлены на достижение тех же целей. Они базируются на ускорителях Trainium, это второй чип собственной разработки Amazon, созданный специально для задач машинного обучения. Чип оснащён 32 Гбайт HBM2e, а его производительность составляет до 210 Топс. Инстансы Trn1 объединяют до 16 таких ускорителей, связанных интерконнектом NeuronLink (768 Гбайт/с), имеют EFA-подключение со скоростью до 800 Гбит/c (вдвое выше, чем у нынешних GPU-инстансов) и предлагают до 8 Тбайт NVMe SSD. ![]() AWS позволяет формировать кластеры из десятков тысяч Trainium, объединённых сетью петабитного класса и подключённых посредством Amazon FSx к петабайтному Lustre-хранилищу. Всё это позволяет быстро обучать гигантские модели. Для работы предлагается фирменный набор инструментов Neuron SDK (тот же, что и для AWS Inferentia), но есть и поддержка популярных фреймворков вроде Tensorflow или PyTorch. Trn1 пока что находятся в предварительном доступе по запросу.
30.11.2021 [20:48], Андрей Галадей
Стали доступны инстансы AWS EC2 G5g: Graviton2 + NVIDIA T4GВ AWS стали доступны инстансы EC2 G5g, которые построены на собственных Arm-процессорах AWS Graviton2 и ускорителях NVIDIA T4G. Как утверждается, эти решения обеспечивают наилучшее соотношение цены и производительности для GPU-нагрузок, включая графические приложения и задачи инференса — они могут быть почти на треть выгоднее x86-инстансов. Инстансам доступно подключение к сети со скоростью вплоть до 25 Гбит/сек, а к EBS-томам — до 19 Гбит/сек. Новинки предлагают от 4 до 64 vCPU и от 8 до 128 Гбайт RAM (соотношение 1:2), но старшая конфигурация с двумя ускорителями доступна и в виде bare metal. Стоимость аренды начинается от $0,42/час. Всего на выбор доступны шесть конфигураций: ![]() Среди возможных нагрузок приводятся следующие:
Отметим, что инстансы совместимы со всеми популярными графическими библиотеками и библиотеками машинного обучения, включая NVENC, NVDEC, nvJPEG, OpenGL, Vulkan, CUDA, CuDNN, CuBLAS и TensorRT. Кроме того, NVIDIA предложит готовые AMI-образы со всем необходимым ПО и драйверами, а также доступом к каталогу NGC.
17.03.2021 [22:59], Владимир Мироненко
AWS EC2 X2gd — новые ARM-инстансы с Graviton2 и увеличенным объёмом RAMОблачный сервис AWS объявил о доступности EC2-инстансов X2gd. Новые инстансы на базе разработанных AWS ARM-процессоров Graviton2 обеспечивают до 55 % лучшее соотношение цены и производительности по сравнению с инстансами на базе архитектуры x86 текущего поколения Intel, а также предлагают увеличенный объем памяти на один vCPU по сравнению с другими инстансами на базе Graviton2. Инстансы X2gd обеспечивают самую низкую стоимость гигабайта памяти среди всех инстансов Amazon EC2 и позволяют более эффективно выполнять такие рабочих нагрузок, как базы данных в памяти (например, Redis, Memcached и т. д.), реляционные базы данных (например, MySQL, PostGreSQL и т. д.), хранилища данных (например, Amazon Redshift), кеширование и автоматизация электронного проектирования (EDA). Кроме того, по мере того, как все больше клиентов запускают контейнеры на AWS для обеспечения переносимости приложений и повышения эффективности инфраструктуры, экземпляры X2gd также позволяют им использовать контейнерные приложения с большим объёмом памяти в одном инстансе, чтобы снизить общую стоимость владения. ![]() Инстансы Amazon EC2 на базе процессоров AWS Graviton2 начали предлагаться в мае 2020 года. Сейчас уже многие популярные решения AWS, включая Elastic Container Service, Elastic Container Registry, Elastic Kubernetes Service, CodeBuild, CodeCommit, CodePipeline, CodeDeploy, CloudWatch, ElastiCache и Elastic Map Reduce поддерживают Graviton2 для предоставления клиентам услуг с улучшенным соотношения цены к производительности. X2gd присоединяются к растущему портфелю EC2-инстансов на базе AWS Graviton2: M6g/M6gd, C6g/C6gd/C6gn, R6g/R6gd и T4g. Инстансы X2gd доступны для повременной оплаты, с тарифом Savings Plans, как зарезервированные (RI) или как спотовые инстансы (SI). Экземпляры X2gd первоначально доступны в регионах США (Северная Вирджиния, Огайо, Орегон) и Европы (Ирландия). Чуть позже в этом году они будут доступны и в других регионах.
12.01.2021 [22:44], Алексей Степин
Битва за королевство ARM: Ampere Altra против AWS Graviton2Вторжение архитектуры ARM в мир современных высокоплотных центров обработки и хранения данных оказалось успешным: в настоящее время AWS активно использует процессоры Graviton2, а Ampere начала поставки чипов Altra, показавших себя не хуже AMD EPYC второго поколения. Обе реализации серверных ARM-процессоров показывают в среднем лучшую в сравнении с x86-64 энергоэффективность, но как они проявят себя в прямом столкновении между собой? Вкратце напомним: платформа Ampere Altra является открытой: процессоры имеют свой разъём LGA 4926, тогда как AWS Graviton2 хотя и базируются на той же архитектуре ARM Neoverse N1, но сторонним заказчикам не поставляются — воспользоваться можно лишь облачными инстансами, запускаемыми на системах с этими ЦП. ![]() Ядер больше у Altra (80 против 64), но оба процессора не имеют поддержки SMT. В тактовых частотах преимущество также у Altra: 64-ядерный инстанс AWS m6g.metal имеет фиксированную частоту 2,5 ГГц, а у процессоров Altra Quicksilver Q80-33 она может достигать 3,3 ГГц. Кроме того, доступны конфигурации с двумя процессорными разъёмами, обеспечивающими суммарно 160 ядер. Тем не менее, результаты тестов представляют существенный интерес: столь серьёзные реализации архитектуры ARM столкнулись друг с другом впервые. Полностью с обзором можно ознакомиться на сайте Phoronix, мы же рискнём выделить отдельные, на наш взгляд, наиболее интересные результаты. Так, в тесте HPCG победу одержала реализация Ampere, но при равном активном количестве ядер превосходство над Graviton2 составило лишь около 5%, и это с учётом возможности ядер Quicksilver разгоняться до 3,3 ГГц. Зато эта же возможность очень помогла процессорам Ampere одержать убедительную победу в тестах на сжатие данных. Тест Stream показал чуть более высокий результат на платформе Graviton2, но разница столь незначительна, что её можно не принимать во внимание. А вот в Coremark 1.0, наборе тестов, созданном специально для оценки вычислительных способностей процессоров, Altra Quicksilver одерживает безоговорочную победу. Даже при равном с Graviton2 количестве активных ядер разница довольно серьёзна, а в 80-ядерном режиме Altra Q80-33 не оставляет процессору AWS ни шанса. И это же можно сказать про тесты с трассировкой лучей. ![]() Ampere Altra Quicksilver: лучшая серверная платформа с архитектурой ARM В остальных тестах картина схожая, либо не столь зависящая от количества активных ядер у Altra. Но Graviton2 не удалось выиграть нигде. Впрочем, это не значит, что решение AWS хуже: оба процессора базируются на дизайне ядер ARM Neoverse N1, но Graviton2 работает на существенно более низкой частоте и, по всей видимости, его проигрыш на 9/10 объясняется этой причиной. В целом же, ARM-платформа Ampere выглядит интереснее: она доступна и в виде классических серверов, а не только как облачная услуга, кроме того, в двухпроцессорной конфигурации со 160 ядрами платформа Mount Jade обеспечивает великолепную производительность.
01.12.2020 [23:44], Владимир Мироненко
В AWS появятся инстансы с GPU AMD, самые быстрые облачные Xeon и 100GbE-подключение для машин с Graviton2Стив Робертс (Steve Roberts) из Amazon Web Services (AWS) сообщил о том, что вскоре будут доступны новые инстансы Amazon Elastic Compute Cloud (EC2) в семействе инстансов G4, которые позволят повысить производительность и снизить затраты на рабочие нагрузки с интенсивным использованием графики, такие как потоковая передача игр, анимация и рендеринг видео. До этого самыми экономичными инстансами компании на базе GPU в EC2 были инстансы G4dn, выпущенные в 2019 году и оснащенные ускорителями NVIDIA T4. Инстансы G4ad используют новейшие GPU AMD Radeon Pro V520 и процессоры EPYC 2-го поколения, и являются первыми в EC2, оснащенными GPU AMD. Они идеально подходят для развёртывания моделей машинного обучения в производственной среде, а также для приложений с интенсивным использованием графики. Доступны инстансы трех размеров: от G4ad.4xlarge с 1 графическим процессором до G4ad.16xlarge с 4 графическими процессорами, как указано ниже. По сравнению с G4dn новые экземпляры G4ad на 45 % лучше по соотношению цены и производительности для рабочих нагрузок с интенсивным использованием графики, включая вышеупомянутую потоковую передачу игр, удалённые графические рабочие станции и сценарии рендеринга. По сравнению с экземпляром G4dn такого же размера, экземпляры G4ad обеспечивают повышение производительности до 40 %. ![]() Следует отметить, что экземпляры G4dn по-прежнему будут лучшим вариантом для машинного обучения (ML) в малом масштабе и для задач инференса благодаря тензорным ядрам. Кроме того, экземпляры G4dn по-прежнему лучше всего подходят для приложений, которым требуется доступ к библиотекам NVIDIA, таким как CUDA, CuDNN и NVENC. Однако, когда нет зависимости от библиотек NVIDIA, AWS рекомендует клиентам попробовать экземпляры G4ad, чтобы воспользоваться преимуществами лучшего соотношения цены и производительности. Графические процессоры AMD Radeon Pro V520 поддерживают API DirectX 11/12, Vulkan 1.1 и OpenGL 4.5. В качестве операционных систем клиенты могут выбирать из Windows Server 2016/2019, Amazon Linux 2, Ubuntu 18.04.3 и CentOS 7.7. Инстансы G4ad будут доступны с повременной тарификацией и в качестве зарезервированных или спотовых инстансов. Новые экземпляры G4ad вскоре будут доступны в регионах US East (Северная Виргиния), US West (Орегон) и Европа (Ирландия). ![]() Следующий «железный» анонс касается инстансов на базе Intel Xeon — компания объявила о запуске экземпляров M5zn, которые будут предложены в семи размерах. В них используются специальные процессоры Cascade Lake, все ядра в которых могут работать устоявшейся частотой до 4,5 ГГц. M5zn являются разновидностью вариантом инстансов M5 общего назначения и базируются на Nitro System. Эти экземпляры оснащены сетью со скоростью передачи данных 100 Гбит/с с низкой задержкой и адаптером Elastic Fabric (EFA) для повышения производительности при выполнении высокопроизводительных вычислений и запуске приложений с интенсивным обменом данными. Все экземпляры M5zn приведены в таблице ниже. ![]() Гипервизор Nitro позволяет инстансам M5zn обеспечивать производительность, практически неотличимую от инстансов bare-metal. Другие компоненты системы AWS Nitro System, такие как Nitro Security Chip и аппаратная обработка EBS, повышают производительность, а шифрование VPC обеспечивает больше безопасности. Новые инстансы уже доступны в ряде регионов США, а также в регионах Европа (Ирландия и Франкфурт-на-Майне) и Азия (Токио). Кроме того, AWS сообщила о пополнении портфолио Graviton2 на базе Arm-чипов инстансами C6gn, которые обеспечивают пропускную способность сети до 100 Гбит/с, скорость работы с томами EBS до 38 Гбит/с, повышение производительности обработки пакетов до 40 % и улучшение соотношения цены и производительности на 40 % по сравнению с сопоставимыми экземплярами на процессорах x86. Инстансы C6gn будут доступны в 8 размерах: ![]() |
|