Материалы по тегу: ускоритель

09.06.2023 [22:52], Сергей Карасёв

Анонсирован китайский ускоритель Metax Xisi N100 для ИИ и потоковой обработки видео

Китайская компания Metax, по сообщению ресурса ITHome, разработала ускоритель Xisi N100, предназначенный для решения задач, связанных с обработкой видеоматериалов, алгоритмами ИИ и пр. Новинка уже готова к серийному производству и в скором времени поступит на местный рынок.

Технических подробностей относительно Xisi N100 пока не слишком много. Известно, что основой ускорителя служит GPU с обозначением MXN100. Обеспечивается 128-канальное кодирование и 96-канальное декодирование. Заявлена поддержка форматов HEVC, H.264, AV1 и AVS2, а также разрешений вплоть до 8К.

Ускоритель выполнен в виде однослотовой карты расширения с интерфейсом PCIe. Применено пассивное охлаждение. Заявленное быстродействие достигает 160 TOPS при вычислениях INT8 и 80 Тфлопс на операциях FP16.

 Источник изображений: ITHome

Источник изображений: ITHome

Metax намерена в 2025 году выпустить GPU для игровых приложений. Чип получит поддержку всех основных методов рендеринга графики и сможет использовать современные API. Кроме того, Metax обещает предоставить оптимизированное ПО и необходимые драйверы: это, как ожидается, поможет в продвижении продукта на коммерческом рынке.

Разработка собственных GPU важна для Китая в условиях торговой войны с США. Из-за американских санкций NVIDIA прекратила поставки в Поднебесную ускорителей A100 и H100: компании пришлось выпустить экспортные варианты названных изделий, не подпадающие под ограничения.

Постоянный URL: http://servernews.ru/1088185
05.06.2023 [22:19], Владимир Мироненко

Разработчик фотонных ИИ-ускорителей Lightmatter привлёк $154 млн инвестиций и втрое увеличил капитализацию

Стартап Lightmatter сообщил о завершении раунда финансирования серии C, в результате которого он привлёк инвестиции на сумму $154 млн. В этом раунде приняли участие венчурные подразделения Alphabet и HPE, а также ряд других институциональных инвесторов. Сообщается, что после этого раунда утроилась нераскрытая оценка Lightmatter, которую стартап получил после проведения раунда финансирования в 2021 году.

По словам Lightmatter, разработанный ею оптический интерконнект Passage обеспечивает до 100 раз большую пропускную способность, чем традиционные альтернативы. Ускорение перемещения данных в чипе и между чипами повышает производительность приложений. Lightmatter утверждает, что Passage занимает значительно меньше места, чем традиционные электрические соединения, и потребляет в пять раз меньше энергии. Кроме того, Passage упрощает работу с системой, позволяя автоматические менять конфигурацию интернконнекта менее чем 1 мс.

 Источник изображения: Lightmatter

Источник изображения: Lightmatter

Lightmatter Passage является частью инференс-платформы Envise 4S, оптимизированной для работы с самыми крупными ИИ-моделями. По данным компании, система втрое быстрее, чем NVIDIA DGX A100, занимая при этом 4U-шасси и потребляя порядка 3 кВт. Сервер Envise 4S оснащён 16 фотонными ИИ-ускорителями Envise, каждый из которых содержит 500 Мбайт памяти, 400G-подключение к соседним чипам и 256 RISC-ядер общего назначения. Ускорители объединены оптической фабрикой производительностью 6,4 Тбит/с.

Полученные в результате нового раунда средства компания планирует использовать для коммерциализации Passage и Envise, а также внедрения Idiom, программного инструментария, который упрощает написание приложений для Envise.

Постоянный URL: http://servernews.ru/1087916
03.06.2023 [15:10], Сергей Карасёв

Intel и Supermicro продемонстрировала образцы ускорителей Ponte Vecchio на Computex 2023

Корпорация Intel и компания Supermicro показала на выставке Computex 2023 ускорители Ponte Vecchio для HPC-систем и комплексов ИИ. Речь идёт об изделиях Data Center GPU Max 1550 в формате OAM-модулей, которые были продемонстрированы в составе сервера Supermicro X13 8U.

Ускоритель насчитывает более 100 млрд транзисторов (без учёта памяти). Кристалл имеет общую площадь 2330 мм2. В конструктивном плане Ponte Vecchio получил сложную чиплетную компоновку, включающую 47 «плиток». Компоненты соединены между собой с помощью Embedded Multi-Die Interconnect Bridge (EMIB) и Foveros. При этом чиплеты разного типа изготавливаются с применением разных технологических норм, после чего собираются воедино.

Что касается сервера Supermicro X13 8U, то он оборудован восемью ускорителями Data Center GPU Max 1550. Возможна установка двух процессоров Intel Xeon Sapphire Rapids с показателем TDP до 350 Вт. Доступны 32 слота для модулей оперативной памяти DDR5. Во фронтальной части находятся 20 отсеков для SFF-накопителей в конфигурации 12 × NVMe и 8 × SATA; допускается горячая замена.

Отмечается, что TDP Ponte Vecchio достигает 600 Вт. Это требует наличия сложного модуля регулирования напряжения, который включает в себя два высокопроизводительных преобразователя. Между тем разъём OAM может обеспечивать до 700 Вт, поэтому изделия Intel, скорее всего, были разработаны с учётом запаса мощности. Для их охлаждения применяются крупногабаритные радиаторы и вентиляторы с высоким показателем статического давления. Эти радиаторы имеют по семь медных тепловых трубок и массив алюминиевых рёбер.

Постоянный URL: http://servernews.ru/1087851
01.06.2023 [19:50], Сергей Карасёв

НТЦ «Модуль» представил серверный нейроускоритель NM Quad на отечественных чипах

Научно-технический центр (НТЦ) «Модуль» анонсировал изделие NM Quad — высокопроизводительное устройство для задач, связанных с обработкой ИИ-алгоритмов, машинным зрением, нейросетями и пр. Новинка может применяться в суперкомпьютерах и НРС-серверах.

В основу NM Quad положены четыре DSP-процессора К1879ВМ8Я на базе оригинальной векторно-матричной архитектуры NeuroMatrix Core 4. В состав каждого DSP входят четыре независимых вычислительных кластера, насчитывающих по четыре ядра NMC4. Таким образом, общее количество ядер NeuroMatrixCore4 достигает 64 (FP32/64). Они функционируют на частоте до 1 ГГц.

 Источник изображения: НТЦ «Модуль»

Источник изображения: НТЦ «Модуль»

Пользователь может самостоятельно выбрать режим работы DSP — обрабатывать данные всеми четырьмя кластерами сразу, либо дать каждому из них собственную задачу. Таким образом, доступны 16 независимых вычислительных кластеров, каждый из которых может быть настроен на индивидуальную работу или задействован параллельно с другими. Заявленная FP32-производительность составляет 2 Тфлопс, FP64 — 0,5 Тфлопс.

 Источник: НТЦ «Модуль»

Источник: НТЦ «Модуль»

Кроме того, в состав NM Quad входят 20 ядер Arm Cortex-A5 с частотой 800 МГц, 512 Кбайт кеша L2 в расчёте на процессор и 20 Гбайт памяти DDR3L. Суммарная пропускная способность интерфейсов межпроцессорного обмена достигает 160 Гбит/с. Модуль выполнен в виде двухслотовой карты расширения с интерфейсом PCIe x16 (PCIe 2.0 x4). Габариты составляют 277 × 143 × 39 мм. Заявленная потребляемая мощность не превышает 80 Вт (50 Вт при обычных нагрузках).

 Источник изображения: НТЦ «Модуль»

Источник изображения: НТЦ «Модуль»

Постоянный URL: http://servernews.ru/1087756
29.05.2023 [07:30], Сергей Карасёв

NVIDIA начала массовое производство суперчипов Grace Hopper для генеративного ИИ

Компания NVIDIA в ходе выставки Computex 2023 сообщила о начале серийного производства суперчипов GH200 Grace Hopper, предназначенных для построения НРС-систем и платформ генеративного ИИ. Ожидается, что изделия возьмут на вооружение ведущие облачные провайдеры и гиперскейлеры, включая Google, Meta и Microsoft.

В состав Grace Hopper входят 72-ядерный Arm-процессор NVIDIA Grace и ускоритель NVIDIA H100 с 96 Гбайт HBM3. Объём общей для обоих кристаллов памяти составляет 576 Гбайт (480 Гбайт LPDDR5x). Кристаллы соединены между собой шиной NVLink-C2C, обеспечивающей пропускную способность 900 Гбайт/с: это приблизительно в семь раз больше по сравнению с PCIe 5.0. Заявленный уровень производительности GH200 — 4 Пфлопс с использованием Transformer Engine.

«Генеративный ИИ быстро трансформирует IT-пространство, предоставляя новые возможности и ускоряя открытия в здравоохранении, финансах, бизнес-сфере и многих других отраслях. С началом серийного выпуска суперчипов Grace Hopper производители по всему миру вскоре представят ускоренные инфраструктуры для решения ИИ-задач корпоративного класса на основе уникальных массивов данных», — сказал Иэн Бак (Ian Buck), вице-президент HPC-подразделения NVIDIA.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Говорится, что в число производителей серверов с ускорителями NVIDIA входят такие компании, как Cisco, Dell Technologies, Gigabyte, HPE, Lenovo, Supermicro, Eviden (Atos). Среди тайваньских партнёров компании были названы AAEON, Advantech, Aetina, ASRock Rack, ASUS, GIGABYTE, Ingrasys, Inventec, Pegatron, QCT, Tyan, Wistron и Wiwynn. Изделия NVIDIA H100 уже применяют в составе своих платформ облачные провайдеры AWS, Cirrascale, CoreWeave, Google Cloud, Lambda, Microsoft Azure, Oracle Cloud, Paperspace и Vultr.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Системы нового поколения на базе NVIDIA Grace, Hopper и Ada Lovelace обеспечат поддержку полного набора ПО NVIDIA, включая NVIDIA AI Enterprise, NVIDIA Omniverse и NVIDIA RTX. Платформы на основе суперчипов GH200 Grace Hopper станут доступны позднее в текущем году.

Постоянный URL: http://servernews.ru/1087470
24.05.2023 [14:14], Сергей Карасёв

AMD рассказала об архитектуре гигантского APU Instinct MI300: 24 ядра EPYC Genoa, ускоритель CDNA 3 и 128 Гбайт HBM3

Компания AMD на суперкомпьютерной конференции ISC 2023, по сообщению ресурса Tom's Hardware, раскрыла дополнительную информацию о гибридном изделии Instinct MI300. Новый APU найдёт применение в HPC-системах, а также в высокопроизводительных серверах для дата-центров.

Как говорилось ранее, MI300 — это самый крупный и сложный чип, когда-либо созданный специалистами AMD. Он содержит в общей сложности около 146 млрд транзисторов. Конструкция включает ядра CPU (Zen 4) и GPU (CDNA 3), вспомогательную логику, I/O-контроллер, а также память HBM3. В общей сложности задействованы 13 чиплетов, четыре из которых изготавливаются по 6-нм технологии, а ещё девять — по 5-нм.

По сравнению с Instinct MI250 новинка получила ряд архитектурных изменений. В частности, узел с Instinct MI250 (как у Frontier) имеет отдельные блоки CPU и GPU, дополненные единственным процессором EPYC для координации рабочих нагрузок. В свою очередь, узел Instinct MI300 содержит интегрированный 24-ядерный чип EPYC Genoa, а поэтому необходимость во внешнем CPU отпадает.

 Источник изображений: AMD

Источник изображений: AMD

Вместе с тем сохранена топология, позволяющая каждому из блоков обмениваться данными со всеми другими. Причём в случае Instinct MI300 снижается задержка и повышается общая производительность. Компоненты чипа объединены посредством Infinity Fabric четвёртого поколения. В оснащение ходят 128 Гбайт общей для CPU и GPU памяти HBM3. Похожий подход реализован в чипах NVIDIA Grace Hopper, а вот Intel от гибридности в ускорителях Falcon Shores пока отказалась.

Постоянный URL: http://servernews.ru/1087241
23.05.2023 [14:47], Сергей Карасёв

Ускорители Intel Falcon Shores не получат гибридную конфигурацию CPU + GPU

Корпорация Intel на суперкомпьютерной конференции ISC 2023, как сообщает AnandTech, рассказала о планах по выводу на рынок ускорителей семейства Falcon Shores, рассчитанных на применения в НРС-системах, а также в составе ИИ-платформ. В конструкцию новинок будут внесены изменения, а их анонс снова откладывается.

Изначально предполагалось, что изделия Falcon Shores появятся после выхода ускорителей серии Rialto Bridge, которые должны были прийти на смену Ponte Vecchio. Однако в марте нынешнего года Intel отменила выпуск Rialto Bridge, попутно сообщив о задержках с разработкой Falcon Shores.

 Источник изображений: Intel

Источник изображений: Intel

Ранее предполагалось, что ускорители Falcon Shores будут иметь гибридную архитектуру XPU в виде связки CPU + GPU. Однако теперь Intel заявляет, что эти решения получат исключительно GPU-составляющую. В корпорации пришли к выводу, что вывод на коммерческий рынок XPU-изделий является преждевременным, а поэтому планы в отношении Falcon Shores пришлось пересмотреть.

Известно, что изделия Falcon Shores получат модульную структуру на основе так называемых «плиток» — это чиплетная конструкция. Предусмотрено наличие памяти до 288 Гбайт HBM3 (ПСП до 9,8 Тбайт/с) и специализированного IO-блока «для масштабирования». Упомянуты единый интерфейс программирования, поддержка Ethernet-коммутации и CXL.

Сообщается, что выпуск Falcon Shores сдвигается до 2025 года. Это означает, что как минимум до середины текущего десятилетия Ponte Vecchio останутся наиболее технологичными НРС-ускорителями Intel. Корпорация также отмечает, что полностью отказываться от выпуска XPU-решений не планируется. Но сроки появления таких продуктов не уточняются.

Постоянный URL: http://servernews.ru/1087172
22.05.2023 [16:20], Владимир Мироненко

Китайские производители подняли цены на ИИ-серверы из-за ограничений на поставки чипов NVIDIA

Компания Inspur и другие китайские производители серверов повысили цены на выпускаемые серверы для ИИ, сообщает ресурс DigiTimes со ссылкой на местные СМИ,. Это решение связано с введением США ограничений на поставки в Китай передовых ускорителей вычислений компании NVIDIA.

Ещё в апреле этого года из Китая начали поступать сообщения инсайдеров о том, что Inspur повысит цены на свои серверы ИИ примерно на 20 % после того, как NVIDIA прекратила из-за американских санкций поставки в Поднебесную ускорителей NVIDIA A100 и H100. Источники китайского издания The Paper, осведомлённые о бизнесе китайского производителя суперкомпьютеров Sugon, недавно также подтвердили рост цен на его ИИ-серверы, но не указали насколько значительным было увеличение стоимости этих продуктов.

Впрочем, из Китая поступает и другая информация. Некоторые источники DigiTimes сообщают, что поставщики серверов повысили цены только на оборудование на базе ИИ-ускорителей NVIDIA, а цены на другие серверные продукты остались прежними.

 Источник изображения: Inspur

Источник изображения: Inspur

По данным китайского инвестиционного банка Pacific Securities, в 2022 году на долю топ-8 поставщиков серверов приходилось 92 % китайского рынка серверов ИИ. При этом у лидера рынка Inspur доля составляла 37 %. Согласно раскрытой финансовой информации Inspur, компания NVIDIA была её крупнейшим поставщиком чипов. В 2019 году ведущими поставщиками чипов для Inspur были Intel и NVIDIA.

Проблемы с чипами для серверов в Китае начались в прошлом году после введения США запрета на поставку компаниями NVIDIA и AMD ускорителей вычислений, соответствующих определённым критериям производительности, таких как NVIDIA A100 и H100, а также AMD Instinct MI250.

Постоянный URL: http://servernews.ru/1087119
19.05.2023 [10:20], Сергей Карасёв

Meta✴ представила ИИ-процессор MTIA для дата-центров — 128 ядер RISC-V и потребление всего 25 Вт

Meta анонсировала свой первый кастомизированный процессор, разработанный специально для ИИ-нагрузок. Изделие получило название MTIA v1, или Meta Training and Inference Accelerator: оно оптимизировано для обработки рекомендательных моделей глубокого обучения.

Проект MTIA является частью инициативы Meta по модернизации архитектуры дата-центров в свете стремительного развития ИИ-платформ. Утверждается, что чип MTIA v1 был создан ещё в 2020 году. Это интегральная схема специального назначения (ASIC), состоящая из набора блоков, функционирующих в параллельном режиме.

 Источник изображения: ***

Источник изображений: Meta

Известно, что при производстве MTIA v1 используется 7-нм технология. Конструкция включает 128 Мбайт памяти SRAM. Чип может использовать до 64/128 Гбайт памяти LPDDR5. Задействован фреймворк машинного обучения Meta PyTorch с открытым исходным кодом, который может применяться для решения различных задач в области компьютерного зрения, обработки естественного языка и пр.

Процессор MTIA v1 имеет размеры 19,34 × 19,1 мм. Он содержит 64 вычислительных элемента в виде матрицы 8 × 8, каждый из которых объединяет два ядра с архитектурой RISC-V. Тактовая частота достигает 800 МГц, заявленный показатель TDP — 25 Вт.

Meta признаёт, что у MTIA v1 присутствуют «узкие места» при работе с ИИ-моделями большой сложности: требуется оптимизация подсистем памяти и сетевых соединений. Однако в случае приложений низкой и средней сложности платформа, как утверждается, обеспечивает более высокую эффективность по сравнению с GPU.

В дальнейшем в семействе MTIA появятся более производительные изделия, но подробности о них не раскрываются. Ранее говорилось, что Meta создаёт некий секретный чип, который подойдёт и для обучения ИИ-моделей, и для инференса: это решение может увидеть свет в 2025 году.

Постоянный URL: http://servernews.ru/1086993
19.05.2023 [10:00], Сергей Карасёв

Meta✴ анонсировала чип MSVP для ускорения обработки видео

Компания Meta представила специализированный чип MSVP, или Meta Scalable Video Processor, спроектированный для ускорения выполнения операций, связанных с обработкой видеоматериалов. Это могут быть задачи по транскодированию роликов или потоковая передача контента.

По данным Meta, пользователи соцсети Facebook тратят 50 % своего времени на просмотр в общей сложности примерно 4 млрд видеороликов ежедневно. Эти материалы сжимаются после загрузки, а затем преобразовываются в другие форматы и передаются пользователям. Сложность заключается в том, чтобы быстро уменьшить размер файла, сохранить его на серверах Facebook и передать в потоковом режиме с максимально возможным качеством для того или иного устройства, например, смартфона, планшета или ПК.

 Источник изображения: ***

Источник изображения: Meta

Эти задачи берёт на себя процессор MSVP. Он представляет собой интегральную схему специального назначения (ASIC). Чип предназначен для высококачественного транскодирования материалов для сервисов «видео по запросу», а также для оптимизации потоковых трансляций.

В перспективе подобные процессоры, как ожидается, помогут организовать работу с видеороликами, созданными посредством генеративного ИИ. Кроме того, такие чипы будут использоваться в составе платформ AR/VR. Решение MSVP обеспечивает производительность транскодирования на уровне 4K@15в максимальном качестве в режиме «один поток на входе и пять на выходе». В стандартном качестве возможна работа в формате 4K@60.

Постоянный URL: http://servernews.ru/1086995

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus