Представленная в марте работа компании Xilinx над проектом Everest вылилась на днях в анонс новой архитектуры Versal и продуктов на её основе. Разработка решений ведётся в рамках развития новой гетерогенной платформы компании для ускорителей с поддержкой адаптивных вычислений или ACAP (Adaptive Computer Accelerator Platform). В новых ПЛИС программируемым вентилям отводится всё меньше места, тогда как ядрам ARM, DSP и ИИ-ускорителям на кристаллах выделяются всё возрастающие площади. Это уже не просто FPGA, это фактически однокристальные сборки или SoC с элементами FPGA.

Xilinx
Решения поколения Versal разделены в шесть продуктовых серий или семейств, каждое из которых ориентировано на свою сферу применения. Первыми в 2019 году выйдут 7-нм продукты семейств AI Core и Prime. Продукты AI Core будут использоваться в системах машинного обучения с функцией принятия решений. Продукты Prime займут нишу ускорителей расчётов в центрах по обработке данных. В последующие годы появятся серии AI Edge, AI RF, Premium и HBM, с позиционированием которых можно ознакомится по таблице ниже.

Xilinx
По большому счёту, новые решения Xilinx должны и будут конкурировать с гибридными решениями Intel в виде ускорителей на FPGA-матрицах бывшей компании Altera. Разница только в том, что в паре с FPGA Altera компания Intel продвигает процессоры Xeon, а Xilinx — ядра ARM. Другие составные части платформ обеих компаний — это специализированные ИИ-движки, в чём они примерно равны (у Intel — это решения Mobileye, у Xilinx — свой движок, о котором ниже). Тем самым отличия будут лежать в обслуживающих ядрах, где у ARM в заявленной нише ускорителей есть определённое преимущество. Но это не мешает Xilinx открыто противопоставлять Versal как x86-совместимым процессорам, так и актуальным графическим процессорам.
По словам Xilinx, продукты Versal в области распознавания изображений в 43 раза превосходят процессоры Intel Xeon Platinum и от двух до восьми раз опережают ускоритель NVIDIA Tesla V100, а также в пять раз производительнее ускорителя на обычной FPGA. Более того, в задачах финансового анализа, секвенции генома и в поддержке Elasticsearch продукты Versal опережают процессоры в 89, 90 и в 91 раз.

Xilinx
Чуть подробнее о продуктах семейства AI Core. Помимо двух ядер ARM Cortex-A72 и двух ядер ARM Cortex-R5 они будут нести 256 Кбайт встроенной памяти и свыше 1900 DSP для обслуживания вычислений с плавающей запятой. Абсолютным новшеством станет интеграция в решения новых векторных ускорителей или AI Engines. Таковых будет в чипе от 128 штук до 400 штук и все они будут связаны внутричиповой сетью network-on-chip (NoC) с пропускной способностью в несколько терабит в секунду. Внешние интерфейсы решения будут представлены PCIe Gen4 x8 и x16, CCIX, 32G SerDes и от двух до четырёх встроенных контроллеров памяти DDR4. Флагман семейства AI Core обеспечит производительность в 147 TOPs на нагрузке INT8. Для сравнения, NVIDIA Tesla T4 обеспечивает 130 INT8 TOPs.
Продукты Versal Prime будут лишены ИИ-движков и нацелены на нагрузку общего назначения, такую как обработка изображений медицинского назначения, обслуживание сетей и систем хранения данных, систем управления в авиации и тестовое коммуникационное оборудование. Вместо ИИ-ускорителей Versal Prime получат 3080 DSP и несколько большее число программируемых вентилей.

Xilinx
Ещё одной отличительной особенностью поддержки новых ПЛИС станет ориентация на языки программирования верхних уровней — C, C++ и Python. По мнению Xilinx, это упростит работу с новой платформой.
Источник: