Материалы по тегу: ии

12.04.2024 [21:28], Сергей Карасёв

Dell сумела сократить сроки поставок ИИ-серверов, но теперь компания полагается не только на ускорители NVIDIA, но и на Intel Gaudi3

Компании Dell, по сообщению The Register, удалось сократить сроки поставок серверов для задач ИИ в несколько раз. Речь идёт о высокопроизводительных системах с ускорителями на основе GPU, в том числе NVIDIA H100. Спрос на них настолько высок, что производители не справляются с потоком заказов.

О текущей ситуации в отрасли рассказал руководитель тайваньского подразделения Dell Теренс Ляо (Terence Liao). В конце 2023 года срок поставок серверов Dell, оборудованных ускорителями H100, составлял в среднем 39 недель, или около 8–9 месяцев. По словам Ляо, с февраля 2024-го отгрузки продукции NVIDIA значительно улучшились, и Dell смогла уменьшить сроки поставок серверов до 8–12 недель, или 2–3 месяцев. Таким образом, время выполнения заказов уменьшилось в три–четыре раза.

Тем не менее, дефицит высокопроизводительных ИИ-ускорителей сохраняется. Связано это в том числе с возможностями TSMC по выпуску чипов с применением технологии CoWoS (Chip on Wafer on Substrate). Именно компоновка CoWoS применяется при изготовлении Н100.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

В сентябре 2023 года спрос на передовые технологии упаковки чипов был настолько высоким, что TSMC заявила о способности удовлетворить только 80 % заказов. Вместе с тем TSMC сообщила о намерении расширить производственные мощности CoWoS на 20 % — это поможет смягчить проблему дефицита ИИ-ускорителей.

Между тем Dell приходится искать альтернативы ускорителям NVIDIA. В частности, она намерена использовать ИИ-ускорители Intel Gaudi3. Поддержка Gaudi3 заявлена для сервера Dell XE9680, который также поддерживает ускорители AMD Instinct MI300X. Эта ИИ-платформа наделена 32 слотами для модулей памяти DDR5, восемью разъёмами PCIe 5.0 и шестью портами OSFP 800GbE. Возможна установка 16 накопителей EDSFF3.

Постоянный URL: http://servernews.ru/1103165
12.04.2024 [14:25], Владимир Мироненко

Нужно больше меди: рост ИИ и ЦОД увеличит потребление дорожающего металла на 1 млн тонн в 2030 году

Расширение использования ИИ-технологий и увеличение потребности в вычислительных мощностях ЦОД повлекут за собой рост спроса к 2030 году на медь на 1 млн тонн в год, пишет агентство Reuters со ссылкой на исследование компании Trafigura.

В Trafigura утверждают, что переход на возобновляемые источники энергии, внедрение технологий ИИ и реализация программ по сокращению выбросов углекислого газа, включая отказ от выпуска автомобилей с ДВС в пользу электромобилей, усугубят дефицит поставок меди. Ожидается, что в этом году мировой спрос на медь составит около 26 млн тонн. Согласно январскому исследованию Reuters, это выше предложения рынка на 35 тыс. тонн. Аналитики агентства ожидают, что дефицит меди вырастет к 2025 году до 100 тыс. тонн.

 Фото: Rich Smith / Unsplash

Фото: Rich Smith / Unsplash

Джереми Вейр (Jeremy Weir), генеральный директор Trafigura, отметил, что внедрение ИИ и развёртывание ЦОД значительно увеличат спрос на медь из-за необходимости строительства большего количества электропроводов и сетевых подключений. Он добавил, что недостаток инвестиций в медные рудники также будет способствовать дефициту.

Согласно отчёту Linesight, опубликованному ранее в этом месяце, цены на медь в этом году должны увеличиться из-за роста сектора возобновляемых источников энергии. Крупнейшим в мире производителем и потребителем меди в настоящее время является Китай. Он также доминирует в мировых поставках других металлов, используемых в промышленности.

Постоянный URL: http://servernews.ru/1103170
12.04.2024 [13:55], Сергей Карасёв

18 апреля пройдет «MLечный путь 2024» — ежегодный митап Selectel, посвященный трендам и инструментам ML

На мероприятии «MLечный путь 2024» обсудят инфраструктуру для ML и вопросы построения ML-систем, разберут актуальные тренды отрасли, а также сложности, с которыми сталкиваются MLOps-специалисты и ML-инженеры. Отдельное внимание будет посвящено большим языковым моделям. В рамках встречи эксперты обсудят оптимизацию таких моделей, построение системы их безопасности, а также сокращение расходов на инференс. С докладами выступят специалисты Selectel, СберМаркета, Dstack, Axenix, MIL Team и Raft.

 Источник изображения: Selectel

Источник изображения: Selectel

Ключевые темы, которые эксперты затронут в своих докладах:

  • Тенденции развития генеративного ИИ
  • Оптимизация LLM и инфраструктурные векторы атак на них
  • Текущие перспективы Feast в качестве Feature store
  • Деплой ML-сервисов и сокращение затрат их работу

В рамках «MLечного пути 2024» гости смогут пообщаться с экспертами, узнать о новых трендах отрасли, подробнее разобрать конкретные кейсы, а также познакомиться с коллегами из индустрии. Митап будет интересен для MLOps и DevOps-инженеров, менеджеров ML-проектов, CTO и технических руководителей.

Форма регистрации и подробная программа доступны на странице мероприятия. Митап пройдет в офисе Selectel в Санкт-Петербурге, также будет вестись онлайн-трансляция.

Постоянный URL: http://servernews.ru/1103183
12.04.2024 [12:00], SN Team

OS DAY 2024: Архитектурные аспекты безопасности операционных систем

XI научно-практическая конференция OS DAY состоится 20–21 июня 2024 года. Она будет посвящена архитектурным и инженерным решениям в создании операционных систем, обеспечивающим безопасность программного обеспечения на различных уровнях. Помимо разработчиков российских операционных платформ в ней примут участие представители компаний-производителей аппаратных систем и компаний-заказчиков программно-аппаратных комплексов.

Организатор конференции — консорциум научных институтов и компаний-вендоров ОС: ИСП РАН, «Лаборатория Касперского», НТП «Криптософт», «Открытая мобильная платформа», Группа Астра, «Базальт СПО», «РЕД СОФТ», РОСА и НИЦ «Институт имени Н.Е. Жуковского».

«Различные аспекты безопасности российских операционных систем так или иначе уже обсуждали на нескольких конференциях в минувшие годы», — отметил директор ИСП РАН, председатель программного комитета OS DAY Арутюн Аветисян. — «В этом году мы решили сосредоточиться на важной теме, которую еще подробно не рассматривали в рамках OS DAY — обеспечении безопасности ОС на архитектурном уровне. Поговорим о том, какие бывают модели угроз и как их необходимо учитывать при разработке архитектуры, а также о том, какие инженерные подходы существуют для их отражения. Особенное внимание уделим вопросам аппаратной поддержки, ведь доверенной должна быть вся среда исполнения, начиная от процессора и загрузчика. Совместно разработчики загрузчиков и ОС смогут обеспечить новый уровень защиты».

 Источник изображения: OS DAY

Источник изображения: OS DAY

В последнее время эти вопросы получили критическую важность для обеспечения технологической независимости страны. Разработанные в России верифицированные средства аппаратной поддержки обеспечения безопасности помогут значительно поднять доверие к отечественным операционным системам.

На два дня здание РЭУ им. Г.В. Плеханова, где состоится OS DAY 2024, станет коммуникационной площадкой для теоретиков и практиков системного программирования и разработки операционных систем, местом встречи российских разработчиков ОС, регуляторов, заказчиков, всех, кому небезразличны темы, связанные с созданием и безопасным функционированием российских операционных платформ. Оба дня будут наполнены общением, научными докладами и дискуссиями, где обсудят самые животрепещущие и актуальные вопросы российской ИТ-отрасли и направления системного программирования.

«Чрезвычайно важно, что у всей этой активности есть практический результат», — подчеркнул Арутюн Аветисян. — «Вокруг конференции собралось сообщество единомышленников — представителей науки, бизнеса и образования, которые ведут совместные работы в Центре исследований безопасности системного ПО на базе ИСП РАН. Более 300 исправлений уже внесены в ядро Linux и критичные компоненты ОС».

 Источник изображения: OS DAY

Источник изображения: OS DAY

Программный комитет OS DAY до 10 мая принимает заявки на доклады по следующим темам:

  • архитектура механизмов безопасности российских операционных систем, функционал ОС;
  • реализация политик безопасности в программно-аппаратном комплексе на уровне ПО и аппаратной составляющей;
  • модели угроз, подходы к реализации защиты или к ответу на модели угроз;
  • тенденции развития механизмов безопасности ОС;
  • использование аппаратных средств для обеспечения безопасности российских ОС;
  • доверенная загрузка и защита от подмены компонентов ОС;
  • доверенные среды исполнения;
  • цифровые отечественные платформы: перспективы отечественных операционных систем;
  • прикладное программное обеспечение и операционные системы;
  • жизненный цикл создания операционных систем: от разработки до сертификации.

Также программный комитет готов рассматривать заявки на доклады, которые не вписываются в указанную тематику, но укладываются в общее направление разработки операционных платформ и системного инструментария. Кроме того, в рамках OS DAY 2024 по традиции пройдет выставка технологий, где будут представлены решения, разработанные российскими производителями операционных систем.

Конференция проводится при поддержке: РАН, ФСТЭК России, АРПП «Отечественный софт», НП «РУССОФТ».

Время и место проведения конференции: 20–21 июня 2024 года, РЭУ им. Г.В. Плеханова. Адрес: Москва, ул. Большая Серпуховская, д. 11, корпус 9, этажи 7–8, «Точка-кипения РЭУ».

Для участия просьба зарегистрироваться на сайте https://osday.ru. Зарегистрированным участникам, выбравшим формат онлайн, будет предоставлен доступ на адрес электронной почты, указанный при регистрации. По дополнительным вопросам просьба обращаться: Анна Новомлинская, исполнительный директор OS DAY, [email protected].


Справка

Научно-практическая конференция OS DAY проводится в России ежегодно с 2014 г. Это место консолидации российских разработчиков операционных платформ и поиска перспектив для совместной деятельности. Задачи конференции — определить перспективные направления и технологии в сфере разработки операционных систем, обозначить главные вызовы современной ИТ-отрасли и помочь разработчикам, производителям и заказчикам обменяться опытом. Организует конференцию консорциум OS DAY, в который входят: ИСП РАН, «Лаборатория Касперского», НТП «Криптософт», «Открытая мобильная платформа», Группа Астра, «Базальт СПО», «РЕД СОФТ», РОСА и НИЦ «Институт имени Н.Е. Жуковского». Целью создания сообщества организаторов было определить задачи и возможности России в области разработки операционных платформ, выделить перспективные технологии, обменяться опытом, обозначить вызовы ИТ-отрасли и направления движения.

Постоянный URL: http://servernews.ru/1103153
11.04.2024 [21:10], Сергей Карасёв

Тяжелейший путь, который того стоил: «Ростелеком» перевёл свои дата-центры на российское оборудование YADRO

Компания «Ростелеком» в рамках комплексной программы импортозамещения полностью перевела свои ЦОД на отечественное оборудование. Об этом, как сообщает «Интерфакс», на форуме «Открытые инновации» объявил президент «Ростелекома».

В качестве альтернативы серверам и СХД зарубежного производства выбраны решения российского производителя IT-оборудования YADRO («КНС групп»). Эта компания предлагает такие продукты, как серверы Vegman, СХД Tatlin.Unified, объектные хранилища корпоративного уровня Tatlin.Object и системы резервного копирования Tatlin.Backup. Кроме того, в ассортименте YADRO представлены 25GbE-коммутаторы Kornfeld.

«Компания Yadro, с которой мы прошли тяжелейший, я бы сказал — кровавый — путь замещения серверов в наших ЦОД за последний год ценой ошибок, стрессов, круглосуточной работы. Но вот эта деятельность позволила нам на 100% отказаться от импортного оборудования, которое нам не продают, ну и по понятным причинам мы и сами не хотим покупать», — заявил Осеевский.

 Источник изображения: YADRO

Источник изображения: YADRO

Несмотря на то, что сам «Ростелеком» полностью отказался от зарубежного оборудования в ЦОД, говорится, что в данной сфере наблюдаются «очень серьёзные проблемы с импортозамещением». По его словам, регулирование деятельности дата-центров, это та область, которая «требует дополнительного внимания». Глава «Ростелекома» также предложил распределить по годам стоимость подключения дата-центров к электросетям, а не производить оплату сразу. Речь идёт о введении специальных тарифов для ЦОД.

Постоянный URL: http://servernews.ru/1103142
11.04.2024 [18:00], Алексей Степин

YADRO TATLIN.BACKUP: резервное копирование без отрыва от производства

Необходимость надёжной системы резервного копирования для любого бизнеса неоспорима. Хотя бы потому, что порой только наличие сделанных вовремя копий может спасти предприятие от срыва налаженных процессов и серьёзных материальных убытков. В России это направление активно развивается и всё больше компаний предлагают свои решения для резервного копирования, в том числе и аппаратные. К последним относится и новинка YADRO — TATLIN.BACKUP.

YADRO давно и успешно занимается созданием различными СХД, но TATLIN.BACKUP.M — первая модель в новом для компании сегменте. Основная идея семейства TATLIN.BACKUP — непрерывность всех процессов: резервного копирования, восстановления, защиты от кибервымогателей, бесшовного расширения хранилища, сквозные (E2E) интеграция и верификация и многое другое. Новая платформа спроектирована с учётом возможной поддержки любых программных систем резервного копирования и может быть основой для создания референс-дизайнов программно-аппаратных комплексов защиты данных.

 Источник изображений: YADRO

Источник изображений: YADRO

Главной особенностью TATLIN.BACKUP.M является крайне эффективное сжатие информации. Во-первых, используется глобальная многопоточная дедупликация, причём обработка данных происходит блоками переменной длины (content defined chunking), что повышает эффективность использования дисковых ресурсов. Во-вторых, всё осуществляется «на лету», а это даёт возможность идентификации уже имеющихся в хранилище данных за счёт поиска по метаданным в оперативной памяти и SSD-кеше. Это и ускоряет поиск, и снижает нагрузку на основные накопители.

Для компрессии используется современный алгоритм ZSTD, не сильно нагружающий хост-процессоры (не более 1 %, по словам создателей системы). При этом итоговый коэффициент сжатия при активных дедупликации и компрессии достигает значений 6:1 и выше при производительности до 15 Тбайт/час. Сохранность данных обеспечивается использованием RAID6-массивов как для основных дисков NL-SAS, так и для кеширующих SSD, что позволяет избежать потери информации даже при выпадении двух накопителей из массива. При этом сами накопители можно заменить «на горячую». Кроме того, задействована фирменная технология T-RAID со схемой защиты 10+2.

Хранилище устойчиво к потере питания в любой момент времени, оно также нечувствительно к различным программным сбоям, ошибкам DRAM или самих накопителей. Корректность сохраняемых данных гарантируется применением сквозной верификации записи, реализованной аппаратно вплоть до накопителя. Кроме того, используется механизм CoW, который позволяет откатиться к заведомо консистентному состоянию данных в случае сбоя. Другим элементом защиты является упреждающая журнализация, при которой информация о производимых с ФС изменениях вносятся в журнал предзаписи (write-ahead log).

Периодически система осуществляет тестовое считывание (RAID Scrubbing) данных для сверки контрольных сумм, при их несовпадении происходит автоматическое восстановление. Также в фоновом режиме постоянно работает сборщик мусора, освобождающий хранилище от неиспользованных блоков и проверяющий блоки данных на консистентность. Что касается восстановления данных, то система гарантирует соблюдение RTO (Recovery Time Objectives) и RPO (Recovery Point Objectives).

Ещё одно важное преимущество TATLIN.BACKUP — механизм передачи уникальных данных из источника T-Boost, оригинальная разработка инженеров YADRO. Это решение расширяет возможности систем TATLIN.BACKUP и кратно повышает скорость передачи данных, снижая нагрузку на сеть, что крайне важно для корпоративных заказчиков.

В состав TATLIN.BACKUP.M входит один двухпроцессорный контроллер высотой 2U, содержащий шесть 3,84-Тбайт NVMe SSD (3+2 в массиве, 1 hot spare) для метаданных и кеша и четырнадцать (10+2 в массиве, 2 hot spare) жёстких дисков LFF ёмкостью 8 или 16 Тбайт каждый. К контроллеру можно подключить до четырёх дисковых полок (2U, 12 × LFF SAS HDD 8/16 Тбайт). В максимальной конфигурации «сырая» ёмкость достигает 690 Тбайт, а эффективная — более 4 Пбайт при сжатии 6:1. Объём RAM контроллера — 2 Тбайт.

Сетевая часть на данный момент представлена четырьмя портами класса 10/25GbE (полки подключаются по другому интерфейсу). Система поддерживает файловый доступ NFSv3 и SMBv2/v3. Для уведомлений и мониторинга используется SNMP v3. Управляться контроллер может с помощью web-интерфейса или из командной строки. Также есть интеграция с LDAP/AD. Стоимость лицензирования TATLIN.BACKUP.M определяется исключительно эффективной ёмкостью системы с точностью до Тбайт и не предполагает какого-либо ограничения функциональных возможностей.

Этим кратким обзором возможности TATLIN.BACKUP.M не ограничиваются: запланировано дальнейшее развитие системы, наделение её новыми возможностями, включая дедупликацию на источнике, поддержку VLAN и интеграцию с российским ПО. В дальнейшем должна появиться поддержка Fibre Channel, асинхронная репликация и ряд других возможностей. А вслед за TATLIN.BACKUP.M в следующем году должны появиться двухконтроллерная СХД петабайтного класса TATLIN.BACKUP.L и TATLIN.BACKUP.VE для развёртывания в виртуальных средах.

Постоянный URL: http://servernews.ru/1102898
11.04.2024 [17:59], Алексей Степин

Сделано в Европе: Kalray представила ускоритель Turbocard4 для машинного зрения и обработки ИИ-данных

Компания Kalray объявила о коммерческой доступности новых ускорителей Turbocard4 (TC4). Новинка позиционируется в качестве решения для ускорения работы систем машинного зрения, либо как акселератор «умной» индексации данных.

На борту ускорителя, выполненного в формате FHFL установлено сразу четыре чипа DPU Coolidge 2 с фирменной архитектурой Kalray MPPA. Эти процессоры были анонсированы ещё летом прошлого года в качестве энергоэффективных DPU с производительностью до 1,5 Тфлопс в режиме FP32 и 50 Топс в характерном для инференса режиме INT8.

 Источник изображений здесь и далее: Kalray

Источник изображений здесь и далее: Kalray

Выбор рынков не случаен: машинное зрение сегодня является быстро растущей отраслью, в 2023 году оцененной в более чем $20 млрд, а к 2032 году эта цифра обещает вырасти до $175 млрд. Про индексацию данных для генеративного ИИ нечего и говорить — на дворе бум подобных технологий, а объёмы наборов данных постоянно растут. Такие датасеты требуют эффективной предобработки, иначе растущее время выборки нужных данных будет сдерживать производительность и обучения, и инференса.

Интересно, что производятся TC4 в Европе, на французской фабрике Asteelflash, уже получившей первый заказ на сумму более $1 млн. В силу перспективности избранных направлений не следует удивляться, что европейская инициатива Kalray и Asteelflash поддержана французским правительством в рамках программы CARAIBE. Уже в 2025 году планируется довести темпы производства ускорителей TC4 с сотен до нескольких тысяч в месяц.

Coolidge 2, по словам создателей, представляет собой универсальное решение на базе архитектуры VLIW. Он имеет 80 ядер с частотой до 1,2 ГГц, причём каждое ядро располагает FPU (IEEE 754-2008). Имеются оптимизации для матричных операций и трансцендентных функций. Процессор разделён на 5 кластеров по 16 ядер, каждый кластер имеет дополнительное управляющее ядро, отвечающее также за функции безопасности. Дополняет Coolidge 2 кеш объёмом 8 Мбайт, двухканальный контроллер памяти DDR4-3200 и пара интерфейсов 100GbE с поддержкой RoCE. Чип поддерживает форматы INT8, FP16, FP32 и даже FP64.

Поскольку на борту Turbocard4 работает сразу четыре Coolidge 2, речь идёт о 6 Тфлопс для FP32, 100 Тфлопс для FP16 и 200 Топс для INT8 при теплопакете в районе 120 Вт. Что касается программной поддержки, Kalray сопровождает свои решения SDK, базирующимся на открытых стандартах. Поддерживаются Linux и RTOS.

Постоянный URL: http://servernews.ru/1103129
11.04.2024 [15:23], Сергей Карасёв

Студенты США первыми в мире получили собственный ИИ-суперкомпьютер NVIDIA

Инженерный колледж Технологического института Джорджии (Georgia Tech) объявил о заключении соглашения о сотрудничестве с NVIDIA с целью создания первого в мире суперкомпьютерного центра ИИ, предназначенного для обучения студентов. Проект получил название AI Makerspace.

Отмечается, что AI Makerspace позволит демократизировать доступ к вычислительным ресурсам, которые традиционно были доступны только исследователям и технологическим компаниям. В рамках проекта студенты смогут использовать возможности НРС-комплекса для углубления своих навыков работы с ИИ. Это поможет в выполнении курсовых работ и позволит учащимся получить ценный практический опыт.

Фактически AI Makerspace — это выделенный вычислительный кластер. В создании системы приняли участие специалисты Penguin Solutions. Применяется платформа для работы с ИИ-приложениями NVIDIA AI Enterprise. На начальном этапе в составе ИИ-суперкомпьютера задействованы 20 систем NVIDIA HGX H100, насчитывающие в общей сложности 160 ускорителей NVIDIA H100. В качестве интерконнекта применяется NVIDIA Quantum-2 InfiniBand.

 Источник изображения: Georgia Tech

Источник изображения: Georgia Tech

В рамках сотрудничества с Georgia Tech компания NVIDIA окажет поддержку студентам и преподавателям Инженерного колледжа по программе NVIDIA Deep Learning Institute (Институт глубокого обучения NVIDIA). Данная инициатива предусматривает все виды практикумов по ИИ, ускоренным вычислениям, графике, моделированию и другим современным технологиям. AI Makerspace расширяет базовую теоретическую учебную программу Georgia Tech по ИИ, предлагая студентам практическую платформу для решения реальных задач, разработки передовых приложений и реализации своих идей.

Постоянный URL: http://servernews.ru/1103105
11.04.2024 [14:52], Сергей Карасёв

В России растёт спрос на мощные облачные серверы для ИИ-задач

Компания iKS-Consulting обнародовала результаты исследования российского рынка облачных инфраструктур. По оценкам, в 2023 году его объём достиг 121,4 млрд руб., что на 33,9 % больше по сравнению с предыдущим годом, когда затраты оценивались в 90,6 млрд руб. При этом, как отмечается, в России растёт спрос на услуги аренды мощных серверов, предназначенных для задач ИИ и машинного обучения.

Аналитики iKS-Consulting учитывают затраты в сегментах IaaS и PaaS. Говорится, что рынок облачных услуг в РФ находится на этапе бурного роста. Однако пока ещё не сложилась устоявшаяся структура спроса и предложения, а также существуют определённые опасения со стороны потенциальных клиентов.

Директор по развитию бизнеса iKS-Consulting Дмитрий Горкавенко сообщил газете «Ведомости», что доля аренды серверов для обучения моделей ИИ на российском рынке облачных услуг в 2023 году составила 5,4 %. Для сравнения: годом ранее этот показатель равнялся приблизительно 4,0 %.

 Источник изображения: iKS-Consulting

Источник изображения: iKS-Consulting

Общая выручка компаний от аренды таких серверов в 2023 году составила почти 6,6 млрд руб. против 3,7 млрд руб. в 2022-м. Ключевыми игроками данного направления являются Cloud.ru, «Яндекс», «Крок», «Мегaфон», Selectel и CloudМТS. По прогнозам iKS-Consulting, к 2030 году доля выручки от услуг по аренде ИИ-серверов вырастет до 8,6 %, или до 50,3 млрд руб., при общем объёме рынка в 585,1 млрд руб.

В исследовании также отмечается, что по итогам 2023 года в общем объёме выручки на рынке облачных инфраструктур около 4,8 %, или 5,9 млрд руб., пришлось на услуги вычислений на суперкомпьютерах. Годом ранее показатель был в 2,5 раза ниже — примерно 2,4 млрд руб., или 2,6% от общей выручки. Основными игроками в данном сегменте стали Cloud.ru, «Яндекс» и CloudМТS.

В исследовании iKS-Consulting сказано, что сегмент B2G на российском рынке облачных услуг становится всё более значимым. Это связано с развитием государственных сервисов на базе облаков и активным переводом федеральных и региональных органов власти на единую облачную платформу.

Постоянный URL: http://servernews.ru/1103104
11.04.2024 [14:47], Сергей Карасёв

AMD представила гибридные FPGA Versal Gen 2 для встраиваемых систем с ИИ

Компания AMD анонсировала так называемые адаптивные SoC семейства Versal второго поколения (Gen 2), предназначенные для встраиваемых систем со средствами ИИ. Утверждается, что чипы обеспечивают до трёх раз более высокий показатель производительности TOPS/Вт по сравнению с решениями Versal AI Edge первого поколения.

Дебютировали чипы серий Versal AI Edge Gen 2 и Versal Prime Gen 2. Изделия первого семейства, как утверждается, содержат оптимальный набор блоков для решения задач на встраиваемых системах с ИИ: это предварительная обработка данных с помощью программируемой логики FPGA, инференс и постобработка с использованием ядер Arm.

 Источник изображений: AMD

Источник изображений: AMD

Производительность INT8 у чипов Versal AI Edge Gen 2 в зависимости от модификации варьируется от 31 до 185 TOPS, быстродействие MX6 — от 61 до 370 TOPS. В составе процессора приложений задействованы ядра Arm Cortex-A78AE, количество которых может составлять 4 или 8. Кроме того, используются 4 или 10 ядер реального времени Arm Cortex-R52. Заявлена поддержка интерфейсов PCI Express 5.0 x4, USB 3.2, DisplayPort 1.4, 10GbE и 1GbE, UFS 3.1, CAN/CAN-FD, SPI, UART, USB 2.0, I2C/I3C, GPIO.

В свою очередь, решения Versal Prime Gen 2 предназначены для ускорения задач в традиционных встраиваемых системах, которые не работают с ИИ-приложениями. Они объединяют до восьми ядер Arm Cortex-A78AE и до 10 ядер реального времени Arm Cortex-R52. Набор поддерживаемых интерфейсов аналогичен изделиям Versal AI Edge Gen 2. Говорится о возможности многоканальной обработки видео в формате 8K.

Отмечается, что новые процессоры лягут в основу систем для автомобильной, аэрокосмической и оборонной отраслей, промышленности, а также сфер машиностроения, здравоохранения, вещания и пр. Чипы позволяют разрабатывать высокопроизводительные продукты для периферийных вычислений.

Постоянный URL: http://servernews.ru/1103101
Система Orphus