Intel Stratix 10 NX: новые высокоскоростные ПЛИС для машинного интеллекта

 

Одним из главных нововведений в Intel Xeon Scalable третьего поколения стала поддержка формата вычислений bfloat16, что дало возможность как исполнять, так и обучать нейронный сети на CPU. Но с такими узкими задачами как машинное обучение обычно лучше справляются специализированные устройства. Одной из них — новая ПЛИС Intel Stratix 10 NX.

Само семейство Stratix 10 уже имеет богатую историю: так, в конце прошлого года Intel выпустила ПЛИС Stratix 10 GX 10M, которая стала самой сложной ПЛИС на тот момент. Она содержала более 10 миллионов логических элементов и использовала мультикристальную компоновку: два основных «ядра» и четыре меньших кристалла с трансиверами.

Но для вычислительных задач, требующих быстрого доступа к серьёзным объёмам оперативной памяти, новые ПЛИС Stratix 10 NX подходят существенно лучше — у Stratix 10 GX было всего 308 Мбит набортной памяти, а новинки располагают как небольшим блоком ячеек DDR, расположенных в основном «ядре», так и модулем HBM большого объёма, соединенным с основной частью посредством EMIB.

Лучше всего Stratix 10 NX будет чувствовать себя на задачах с большим количеством тензорных вычислений, благодаря наличию специализированных ИИ-блоков AI Tensor Block.  По заявлению Intel, производительность в режиме INT8 у новинок более чем в 15 раз превышает аналогичные показатели у старых представителей семейства Stratix 10. При этом блоки тензорных вычислений могут быть объединены в каскады для поддержки более крупных матриц вычислений. Поддерживаются также форматы INT4, FP12, FP16 и классические FP32/INT32.

Кроме того, новые ПЛИС используют новые высокоскоростные трансиверы с модуляцией PAM4, обеспечивающие скорость 57,8 Гбит/с каждый, а трансиверных модулей у новинки три. Аппаратная реализация поддержки Ethernet дополнительно поможет при разработке периферийных систем на базе новых ПЛИС. Помимо прочего имеется и свой контроллер PCI Express, а также блоки для реализации кастомных вычислений, функций ввода/вывода и нестандартных протоколов связи.

Сочетание всех качеств, которыми обладают Stratix 10 NX, делают новые ПЛИС идеально подходящими для систем машинного интеллекта, действующих в реальном времени и требующих высокой вычислительной плотности. К таковым, например, относятся комплексы машинного зрения с функциями распознавания образов, системы распознавания речи и так далее. Также новинки должны отлично показать себя в сетевых задачах, например, при глубоком анализе сетевых пакетов (DPI) на лету. Высокий уровень интеграции позволяет использовать эти FPGA для периферийных вычислений.

В рамках сегодняшнего анонса Intel также представила второе поколение памяти Intel Optane DCPMM 200 для новых процессоров Xeon Cooper Lake и PCIe 4.0 накопители  Intel D7-P5500 и D7-5600.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER. | Можете написать лучше? Мы всегда рады новым авторам.

Источник:

Постоянный URL: https://servernews.ru/1013616
Поделиться:  

Комментарии

Система Orphus