Материалы по тегу: fpga

17.09.2020 [15:23], Алексей Степин

Microchip представила первый комплект разработчика на базе RISC-V стоимостью менее $500

Помимо вездесущей x86 и популярной ARM понемногу набирает обороты архитектура RISC-V; как считают разработчики Linux, к 2030 году только эта троица будет доминировать на рынке массовых процессоров общего назначения. Но если x86 и ARM имеют за собой огромную поддержку в виде средств разработки, то для RISC-V подобные средства только создаются. Вчера Microchip, крупный производитель микроэлектроники, анонсировал первый в индустрии комплект разработки на базе ПЛИС, использующий набор инструкций RISC-V.

В свете недавних новостей, касающихся NVIDIA и ARM, будущее RISC-V может выглядеть достаточно перспективно: этот набор инструкций является открытым и бесплатным. Кроме того, на него делают ставки такие группы, как Европейский консорциум EPI. Но платформа RISC-V очень нуждается в доступных, стандартизированных средствах разработки, которые позволят отработать все нюансы архитектуры и избежать таких ошибок, которые в дальнейшем могут нанести этим процессорам серьёзный ущерб, как это случилось с уязвимостями Spectre и Meltdown.

Прекрасным средством отработки процессорных архитектур являются ПЛИС, и представив новый комплект, Microchip сделала ставку на ПЛИС PolarFire. Эта SoC характеризуется низким потреблением и доступностью, но при этом в серии имеются устройства с количеством логических элементов от 100 до 500 тысяч. Экономичность микросхем данной серии может на 50% превосходить показатели аналогичных по классу устройств других производителей. Новинка получила название Icicle Development Kit, она выпущена в рамках инициативы Mi-V RISC-V Partner Ecosystem.

Применение Icicle позволит разработчикам создавать и отлаживать практически любые, в том числе и программные, решения на базе RISC-V. Это могут быть ОС реального времени, дебаггеры, компиляторы, аппаратные и программные системы безопасности, наконец, просто «системы-на-модуле» (SoM). Как заявил вице-президент FPGA-отдела Microchip, Брюс Вейер (Bruce Weyer), новая платформа разработчика существенно снизит барьер входа в мир RISC-V. Как отмечают представители самой инициативы RISC-V, новинка со стоимостью менее $500 очень впечатляет. С учётом того, сколько обычно стоят комплекты разработки, эта цена весьма невысока.

При этом набор Icicle имеет 250 тысяч логических элементов, поддержку PCIe, разъём mikroBUS, пару портов RJ45 (Ethernet), разъемы micro-USB, CAN, JTAG, а также интерфейсы SD и стандартную «гребёнку» GPIO (совместима с Raspberry Pi). В конструкции используются проверенные и сертифицированные компоненты, такие как контроллеры PHY (VSC8662XIC) и USB (USB3340-EZK-TR), а также токовые датчики PAC1934T-I/JQ. Приобрести комплект Icicle Kit (MPFS-ICICLE-KIT-ES) можно уже сейчас, стоимость стартует с отметки $489.

Постоянный URL: http://servernews.ru/1020885
16.09.2020 [18:23], Алексей Степин

Xilinx T1: FPGA-ускоритель для сотовых сетей ORAN нового поколения

Ускорители на базе программируемых логических схем (ПЛИС) продолжают активно завоевывать всё новые сферы, а особенно активно они применяются в коммуникационных и сетевых сценариях. Компания Xilinx, один из признанных лидеров в создании мощных ПЛИС, анонсировала новый ускоритель T1, предназначенный для использования в сфере Open Radio Access Network (ORAN).

Концепция открытых сетей радиодоступа была впервые предложена некоммерческой организацией O-RAN, основанной крупными мировыми операторами мобильной связи. Этот альянс поставил перед собой задачу выработки открытых требований и стандартов, описывающих радиочастотные сети нового поколения. В основе лежит виртуализация и использование платформ со стандартной открытой архитектурой, позволяющей провайдерам связи не быть привязанными к закрытым и дорогим решениям крупных поставщиков подобного рода оборудования. Решение Xilinx, представившей T1, в этом свете выглядит совершенно логичным — ПЛИС сочетают в себе гибкость программно-определяемого подхода с мощностью чисто аппаратных решений.

Благодаря ORAN, новые сети пятого поколения должны стать более гибкими и массовыми, нежели это случилось с рынком 4G LTE, который сильно полагается на проприетарные ОЕМ-решения. Задача Xilinx T1 — находиться на стороне базовой станции и выполнять конвертацию сетевого потока в стандартные ORAN-протоколы, подавая их на входы и выходы радиотрансиверов.

В традиционных базовых станциях обычно обычно применяется три класса чипов: процессор общего назначения, выполняющий обработку пакетов на уровнях 2 и 3, базовый FPGA или ASIC, ответственный за реализацию физического уровня, и так называемый fronthaul-FPGA, преобразующий трафик CPRI в формат, понятный вышеупомянутому контроллеру физического уровня. Xilinx T1 должен эффективно сочетать в себе качества всех трёх процессоров, что существенно упростит компоновку сервера базовой станции.

Физически это плата расширения PCI Express формата HHHL, укладывающаяся в пакет потребления 75 Ватт. На борту она несёт как fronthaul-часть (на базе Zynq RFSoC), так и мощную матрицу Zynq Ultrascale+ для всего остального. Стандартный формат позволяет использовать обычные широко распространённые серверы, поскольку слоты PCIe сейчас можно встретить везде; впрочем, системная плата должна уметь выполнять бифуркацию шины. В текущем варианте используется версия 3.0, но ожидается и скорое появление моделей с PCIe 4.0.

Xilinx реализовала в концепции T1 ряд референсных дизайнов с готовыми блоками IP, уже реализованными в набортных ПЛИС, так что ускорители практически готовы к работе прямо «из коробки» и провайдеру, решившему использовать это решение, не придется разрабатывать всё с нуля. Вместо этого можно сочетать готовые IP на плате и блоки от третьих разработчиков. Что интересно, T1 уже доступен к заказу, хотя Xilinx обычно объявляет новинки за квартал или более до начала массовых поставок.

Постоянный URL: http://servernews.ru/1020793
09.09.2020 [20:09], Алексей Степин

S2C Prodigy Quad 10M: эмулятор SoC и CPU на базе Intel Stratix 10 GX 10M

FPGA всегда выручали разработчиков, когда требовалась гибкость в конфигурировании, но именно сегодня ПЛИС выходят на новый уровень и находят применение во всё большем количестве сценариев — в «умных» сетевых адаптерах, в системах машинного обучения, в прототипировании новых процессоров и во многих других. Одной из популярных серий ПЛИС является Intel Stratix, а сейчас S2C, известный разработчик средств прототипирования, представил новый комплекс на базе Stratix 10 GX.

ПЛИС удобны, в числе прочего, тем, что позволяют сэмулировать практически любую процессорную архитектуру. Конечно, такой «процессор» будет работать намного медленнее полностью реализованного в кремнии, но зато программируемость матриц позволяет производить отладку и усовершенствование архитектуры ещё на этапе проектирования. Существуют даже эмуляторы игровых консолей, реализованные полностью на ПЛИС и воспроизводящие все ошибки и особенности оригинальных приставок, которые часто использовались создателями игр для достижения какого-либо эффекта. Это наиболее точный способ эмуляции аппаратных решений.

Но разработка современных процессоров и SoC требует большого количества логических ячеек, поскольку такие архитектуры намного сложнее архитектур прошлого. И такой известный разработчик систем прототипирования, как S2C, предложила своё видение «аппаратного эмулятора», заложив в его основу сверхмощные матрицы Intel Stratix 10 GX 10M. Это одна из самых мощных в мире ПЛИС, с более чем 10 миллионами логических элементов и 48 трансиверами, каждый из которых развивает 17,5 Гбит/с, а внутренние части микросхемы связаны шиной EMIB, и межкристальная скорость составляет 6,5 Тбит/с.

S2C создаёт полные комплексы прототипирования на базе ПЛИС Xilinx или Intel

S2C создаёт полные комплексы прототипирования на базе ПЛИС Xilinx или Intel

Новинка S2C носит название Prodigy Logic System Quad 10M. Она довольно компактна, но тем не менее, включает в себя четыре микросхемы Stratix 10 GX 10M. Таким образом, общее количество элементов в системе достигает 40,8 миллионов, а количество слайсов DSP — почти 14 тысяч. Компания говорит об эквиваленте 300 миллионов элементов ASIC, это число выглядит весьма внушительно. Заявляется также о самом выгодном соотношении удельной стоимости в пересчёте на ячейку.

Система содержит встроенный отладочный модуль (Prodigy Multi-Debug Module), способный работать в различных режимах. За счёт наличия 4608 высокоскоростных линий ввода-вывода обеспечивается подключение различных дочерних карт, так что система полностью модульная. Уже на старте поставок компания S2C говорит о совместимости более чем с 90 прототипами дизайнов и бесшовной интеграции с уже имеющимися средствами разработки, такими как Prodigy Player Pro и Prodigy ProtoBridge.

Основное назначение Quad 10M — разработка SoC нового поколения, особенно делается упор на беспроводные сети пятого поколения. Заказать S2C Prodigy Logic System Quad 10M можно уже сейчас, для этого можно воспользоваться формой заказа на сайте разработчика.

Постоянный URL: http://servernews.ru/1020226
06.08.2020 [13:54], Юрий Поздеев

ScaleFlux SSD с набортной ПЛИС в три раза ускоряет работу Percona MySQL

СУБД MySQL в реализации от Percona работает быстрее с SSD ScaleFlux и есть замеры, подтверждающие это. В сравнительных тестах ScaleFlux CSD 2000 оказался почти в 3 раза быстрее, чем Intel DC P4610 (на определенных рабочих нагрузках, разумеется).

Основная идея ScaleFlux проста — отдельные аппаратные блоки в накопителях могут выполнять некоторые операции быстрее, чем сам сервер, где эти накопители находятся: сжатие/распаковка, перекодирование видео и тому подобное. В частности, ScaleFlux CSD 2000 поддерживает аппаратное сжатие GZIP, которое эффективно удваивает емкость и обеспечивает на 40-70 процентов больше операций ввода-вывода в секунду, чем аналогичные твердотельные NVMe-накопители при смешанных рабочих нагрузках чтения-записи OLTP.

В своих совместных тестах Percona и ScaleFlux сравнили CSD 2000 с твердотельным накопителем Intel DC P4610 емкостью 3,2 Тбайт (64-слойная TLC 3D NAND + NVMe PCIe 3.1 x4). Модель CSD 2000 во многом похожа на него: интерфейс NVMe PCIe 3.0, ёмкость 4 Тбайт, чипы памяти TLC 3D NAND. Однако у неё есть FPGA, выполняющий функции обработки данных (сжатие и кодирование) и функции ускорения для баз данных.

База данных Percona имеет буфер «DoubleWrite» для защиты от потери и повреждения данных, в котором набор страниц извлекается из буфера и хранится до тех пор, пока данные не будут окончательно записаны в базу данных. Твердотельный накопитель CSD 2000 имеет функцию «атомарной записи», которая делает двойной буфер избыточным и его можно отключить, что значительно ускоряет запись в базу данных. Intel P4610 не имеет функции атомарной записи.

Ниже представлены результаты тестов двух накопителей в Sysbench, причем CSD 2000 был протестирован как с функцией двойного буфера, так и без нее, а для накопителя Intel отдельно сделан тест со сжатием данных силами самого сервера:

По диаграммам видно, что по мере увеличения потоков от 8 до 256 преимущество ScaleFlux растет, при этом атомарная запись становится значительным фактором при 64 потоках и выше (темно-синий столбец). Отключение Percona DoubleWrite позволило CSD 2000 повысить производительность при 64 потоках с 2000 запросов в секунду до более чем 2700. При количестве потоков от 64 до 128 накопитель ScaleFlux почти в три раза быстрее, чем Intel.

Идея переноса вычислений «ближе к данным» существует уже не первый год, обычно для этого в СХД используются специализированные ускорители (ASIC), расположенные в контроллерах, однако в последние годы наметилась тенденция переноса некоторых рабочих нагрузок непосредственно в устройства хранения (накопители), что дает значительный прирост производительности, разгружая контроллер СХД и центральный процессор.

Постоянный URL: http://servernews.ru/1017543
03.08.2020 [15:32], Алексей Степин

Проект IoTSDR: универсальный шлюз для «интернета вещей»

В настоящее время «умные системы» встречаются в нашем окружении всё чаще. К сожалению, «интернет вещей» не имеет единого стандарта и породил массу несовместимых между собой протоколов обмена данными, что иногда весьма затрудняет интеграцию устройств разных производителей в единую систему. Группа EmbedINN анонсировала свою разработку — плату универсального шлюза под названием IoTSDR.

IoTSDR сочетает универсальность с токчи зрения программирования и поддержку всех основных низкоскоростных радиостандартов обмена данными в IoT-сетях. Проект является полностью открытым и призван упростить независимым разработчикам создание IoT-устройств и сетей, в которых те функционируют.

В устройствах такого рода часто применяются ПЛИС, и IoTSDR не стал исключением: шлюз будет выпускаться в двух вариантах, с Xilinx Zynq-Z7010 или Zynq-Z7020 в качестве основного вычислительного модуля. FPGA серии Zynq-7000 содержат пару ядер ARM Cortex-A9 общего назначения и 256 Кбайт набортной памяти, но отличаются возможностью программируемой части: Z7010 может предложить разработчику 28 тысяч логических ячеек, 17,6 тысяч LUT, 80 блоков DSP и 2,1 Мбайт памяти. У Z7020 все эти параметры выше: ячеек 85 тысяч, LUT — 53,2 тысячи, блоков DSP целых 220, а объём памяти увеличен до 4,9 Мбайт.

На этом различия заканчиваются: оба варианта платы будет комплектоваться 512 Мбайт общей оперативной памяти DDR3, микросхемой флеш-памяти QSPI объёмом 128 Мбит для хранения прошивок и микросхемой SPI EEPROM Microchip AT24MAC602 — в ней будет храниться прошивка радиотрансиверов.

Самих трансиверов у IoTSDR два, оба используют чипы Microchip/Atmel AT86RF215. Благодаря наличию двух трансиверов поддерживается широчайший набор IoT-частот, принятых в различных регионах нашей планеты:

  • Европейский диапазон: 863 ‒ 921 МГц (три поддиапазона);
  • Североамериканский диапазон: 902 ‒ 928 МГц;
  • Китайский диапазон: 470 ‒ 510 МГц и 779 ‒ 787 МГц;
  • Японский диапазон: 920 ‒ 928 МГц;
  • Корейский диапазон: 917 ‒ 923,5 МГц;
  • Мировой стандартный диапазон 2,4G: 2400 ‒ 2483,5 МГц.

Дополнительно на плате имеется процессор навигационных данных Maxim MAX2769B, он поддерживает данные GPS, GLONASS, Galileo и Beidou — всех крупных спутниковых навигационных систем в мире. Имеется тактовый генератор для ресивера, сам ресивер GNSS подключается посредством разъёма SMA.

Со стороны «компьютерных» интерфейсов имеется порт Gigabit Ethernet (таким устройствам более высокие скорости вряд ли нужны), а также порты USB 2.0 High Speed (480 Мбит/с) и Full Speed (12 Мбит/с) — последний для совместимости с низкоскоростной экономичной USB-периферией.

Для связи с другими платами и устройствами предусмотрено два интерфейса GPIO (8 бит, 2,5 и 3,3 Вольта) и восьмибитный интерфейс GPIO (только 3,3 Вольта). Для отладки предусмотрен разъём JTAG. Плата IoTSDR компактна, её габариты составляют всего 101,6 × 76,2 мм.

Программная поддержка представлена фреймворками Xilinx PYNQ Python, Jupyter Notebooks и открытой платформой GNU Radio SDR. Компания планирует сопровождать свой продукт API на языке Python для реализации базовых ядер и типов модуляции (MR-FSK, MR-O-QPSK, and MR-OFDM). Также будет доступна программная реализация 6LoWPAN с поддержкой IPv6. Разработчики обещают полную открытость всего проекта, включая код ПЛИС HDL, все данные будут выложены в отдельном репозитории на GitHub.

Проект IoTSDR хорошо проработан и имеет ряд преимуществ над устройствами аналогичного класса: он либо обладает более широкой функциональностью, либо существенно дешевле. К примеру, Ettus Research USRP B210 SDR поддерживает любые частоты от 70 МГц до 6 ГГц, но в России его цена составляет свыше 117 тысяч рублей (1360 евро). IoT SDR оценен создателями в $399 за младшую версию и $599 за старшую; правда, речь идёт только о плате, без аксессуаров, вроде антенн и кабелей — их комплект обойдётся будущему заказчику ещё в $99. Заказы уже принимаются, первые поставки должны начаться в конце января 2021 года.

Постоянный URL: http://servernews.ru/1017302
24.07.2020 [13:07], Юрий Поздеев

Molex BittWare представила ПЛИС в форм-факторе M.2

У подразделения Molex BittWare есть ряд действительно интересных решений для ПЛИС. Новинка BittWare 250-M2D представляет собой компактную плату M.2 c FPGA и локальной DRAM. Решение ориентировано на использование в системах OCP.

BittWare «упаковала» Xilinx Kintex UltraScale+ в распространенный форм-фактор PCIe 3.0 x4 M.2. Решение включает в себя локальную память DDR4 DRAM. FPGA в форм-факторе M.2 позволяет интегрировать новое устройство во многие серверы без особых затрат. Новинка BittWare может применяться для сжатия, шифрования или операций ввода/вывода для задач ИИ, что значительно разгружает центральный процессор.

Форм-фактор M.2 хорошо зарекомендовал себя в Open Compute Project (OCP). Есть даже отдельный форм-фактор двойной ширины для установки более производительных ускорителей или накопителей. Такие устройства активно используются Facebook и Microsoft.

Сейчас Facebook переходит на серверы Yosemite V3, где установлены два накопителя M.2, которые внешне несколько отличаются от BittWare 250-M2D. Отличается радиатор и некоторые компоненты, что должно облегчить доступ к устройству для его замены. Можно предположить, что FPGA-модуль разрабатывался для Yosemite V2, однако это не является существенным недостатком, ведь радиатор является сменной деталью, дизайн и размер которой можно без проблем поменять.

Ключевым преимуществом использования FPGA в качестве ускорителя является возможность переконфигурирования, что может быть весьма полезно. Так как гиперскейлеры стремятся к унификации своих систем, можно использовать одни и те же машины под разные задачи или, например, с течением времени обновлять «прошивку» ПЛИС, улучшая обработку конкретной задачи.

Постоянный URL: http://servernews.ru/1016529
18.06.2020 [16:11], Алексей Степин

Intel Stratix 10 NX: новые высокоскоростные ПЛИС для машинного интеллекта

Одним из главных нововведений в Intel Xeon Scalable третьего поколения стала поддержка формата вычислений bfloat16, что дало возможность как исполнять, так и обучать нейронный сети на CPU. Но с такими узкими задачами как машинное обучение обычно лучше справляются специализированные устройства. Одной из них — новая ПЛИС Intel Stratix 10 NX.

Само семейство Stratix 10 уже имеет богатую историю: так, в конце прошлого года Intel выпустила ПЛИС Stratix 10 GX 10M, которая стала самой сложной ПЛИС на тот момент. Она содержала более 10 миллионов логических элементов и использовала мультикристальную компоновку: два основных «ядра» и четыре меньших кристалла с трансиверами.

Но для вычислительных задач, требующих быстрого доступа к серьёзным объёмам оперативной памяти, новые ПЛИС Stratix 10 NX подходят существенно лучше — у Stratix 10 GX было всего 308 Мбит набортной памяти, а новинки располагают как небольшим блоком ячеек DDR, расположенных в основном «ядре», так и модулем HBM большого объёма, соединенным с основной частью посредством EMIB.

Лучше всего Stratix 10 NX будет чувствовать себя на задачах с большим количеством тензорных вычислений, благодаря наличию специализированных ИИ-блоков AI Tensor Block.  По заявлению Intel, производительность в режиме INT8 у новинок более чем в 15 раз превышает аналогичные показатели у старых представителей семейства Stratix 10. При этом блоки тензорных вычислений могут быть объединены в каскады для поддержки более крупных матриц вычислений. Поддерживаются также форматы INT4, FP12, FP16 и классические FP32/INT32.

Кроме того, новые ПЛИС используют новые высокоскоростные трансиверы с модуляцией PAM4, обеспечивающие скорость 57,8 Гбит/с каждый, а трансиверных модулей у новинки три. Аппаратная реализация поддержки Ethernet дополнительно поможет при разработке периферийных систем на базе новых ПЛИС. Помимо прочего имеется и свой контроллер PCI Express, а также блоки для реализации кастомных вычислений, функций ввода/вывода и нестандартных протоколов связи.

Сочетание всех качеств, которыми обладают Stratix 10 NX, делают новые ПЛИС идеально подходящими для систем машинного интеллекта, действующих в реальном времени и требующих высокой вычислительной плотности. К таковым, например, относятся комплексы машинного зрения с функциями распознавания образов, системы распознавания речи и так далее. Также новинки должны отлично показать себя в сетевых задачах, например, при глубоком анализе сетевых пакетов (DPI) на лету. Высокий уровень интеграции позволяет использовать эти FPGA для периферийных вычислений.

В рамках сегодняшнего анонса Intel также представила второе поколение памяти Intel Optane DCPMM 200 для новых процессоров Xeon Cooper Lake и PCIe 4.0 накопители  Intel D7-P5500 и D7-5600.

Постоянный URL: http://servernews.ru/1013616
09.06.2020 [22:51], Алексей Степин

Exor GigaSOM GS01: Intel Atom E39xx и ПЛИС Cyclone GX 10

В 2015 году корпорация Intel поглотила компанию Altera, пополнив тем самым своё портфолио FPGA-решениями. В её арсенале есть не только сверхмощные и дорогие модели, но и доступные, к числу которых относится Cyclone 10 GX. EXOR International решила создать удобную для разработчика систему-на-модуле, сочетающую в себе недорогую ПЛИС серии Cyclone 10 и процессор Atom x5-E39xx.

Процессор Intel Atom E39xx использует ядра с архитектурой Apollo Lake, он производится с использованием 14-нм техпроцесса. В серии присутствует три модели, одна из которых, x5-E3930 имеет два ядра с частотой 1,3 ГГц, а две других — x5-E3940 и x7-E3950 — располагают четырьмя такими ядрами, работающими уже на частоте 1,6 ГГц. Графическое ядро во всех случаях Intel HD Graphics 500, с 12 (у x5) или 18 (у x7) исполнительными модулями, теплопакет варьируется в пределах 6,5 ‒ 12 Ватт.

ПЛИС Intel Cyclone 10 GX представляет собой недорогую программируемую матрицу, которая позиционируется производителем в качестве основы относительно бюджетных устройств и систем. Она использует не самый новый 20-нм техпроцесс и может иметь до 220 тысяч логических ячеек. В наличии трансивер с пропускной способностью 12,5 Гбит/с и аппаратная поддержка PCI Express 2.0 x4.

Комплект Exor GigaSOM GS01 несёт на борту оба чипа. Каждый из них имеет свой банк памяти: до 8 Гбайт LPDDR4 у процессора и до 2 Гбайт DDR3 у ПЛИС, а между собой компоненты общаются посредством двух линий PCI Express. Intel Atom обслуживает интерфейсы общего назначения: DisplayPort, HD Audio, I2C/I2S, SMB, GPIO и USB 2.0/3.0. У ПЛИС предусмотрены интерфейсы JTAG, CAN, I2C, SPI, GPIO и UART.

Сетевой контроллер i210 находится на стороне Intel Atom, также этот процессор обслуживает и два порта PCI Express, а вот шесть высокоскоростных трансиверов обслуживаются Cyclone 10 GX. Система выполнена в виде модуля SoM с габаритами 81,6 × 54 миллиметра, который может поставляться как отдельно, так и впаянным в системную плату, на которой удобно расположены стандартные разъёмы различных интерфейсов, включая три порта M.2 (два полноразмерных с ключом B, один укороченный с ключом E).

Комплект поставляется с блоком питания и быстрым руководством. ПЛИС изначально запрограммирована на поддержку двух портов Ethernet. В комплекте идёт программное обеспечение — комплект разработчика Linux BSP/SDK и пробная версия OpenHMI. Дата начала поставок не определена, но стоимость известна: в зависимости от конфигурации модуль SoM стоит от $443 до $828, цена на полный комплект начинается с $2101. Массовый заказ обойдётся дешевле, стоимость одного модуля может упасть до $274.

Постоянный URL: http://servernews.ru/1013022
03.06.2020 [23:12], Алексей Степин

InAccel предлагает инструментарий для доступа к ресурсам ПЛИС с помощью браузера

Иметь в своём распоряжении аппаратные ресурсы ПЛИС (FPGA) — всего лишь полдела. Нужно ещё располагать удобными инструментами, позволяющими эти ресурсы задействовать. Компания InAccel предлагает новый способ: использовать возможности ПЛИС-ускорителей с помощью браузера и браузерных приложений.

Один из вариантов ускорителя Xilinx Alveo

Один из вариантов ускорителя Xilinx Alveo

Изначально компания Xilinx представила открытый набор библиотек Vitis Library. Он позволял буквально «из коробки» использовать выпускаемые Xilinx программируемые матрицы совместно с уже имеющимися приложениями практически без вмешательства или же с минимальным вмешательством в их код. В список Vitis Library входили библиотеки для обычных вычислений, статистики, линейной алгебры и библиотеки обработки сигналов (DSP), а также ряд специфических библиотек, вроде поддержки машинного зрения и финансовых расчётов.

Веб-браузеры в наше время применяются очень широко. Даже программное обеспечение недавно запущенного космического корабля Dragon 2 использует связку HTML5 + JavaScript, правда, только для интерфейса; системы класса mission critiral всё же написаны на C++.

Компания InAccel решила совместить преимущества современных браузеров с преимуществами ПЛИС. Пока выпущена демоверсия разработанной InAccel технологии, но она уже работает с платами Xilinx серии Alveo.

Новый фреймворк основан на Jupyter Hub, платформе, позволяющей создавать среды для научных задач, работающие в облаке и не требующие процедур инсталляции и поддержки от конечных пользователей. Частью комплекса является Jupyter Notebook, веб-приложение, позволяющее создавать различные документы, сочетающие в себе выполняемый код, уравнения, визуализации и описательные тексты; этими документами можно делиться с коллегами в онлайн-режиме.

С помощью фреймворка InAccel теперь пользователи Jupyter Hub смогут пользоваться всеми преимуществами ПЛИС, такими, как низкая латентность и высокая производительность в специфических задачах. Система способна работать как локально, с использованием плат Alveo, так и в облаке, включая таких провайдеров, как AWS, Azure и Alibaba Cloud. Имеется пробный доступ для тех, кто желает протестировать новую технологию. Полный список библиотек VitAll можно найти на сайте компании.

Постоянный URL: http://servernews.ru/1012576
27.05.2020 [20:54], Алексей Степин

Новая ПЛИС Xilinx Virtex UltraScale+ оптимизирована для сетей и СХД

С момента своего появления программируемые логические схемы проделали большой путь. В конце прошлого года рекорд Xilinx, составивший 9 млн. логических ячеек был побит Intel, представившей Stratix 10 GX 10M с 10 миллионами ячеек.

Сейчас один из самых известных разработчиков ПЛИС в мире подтверждает звание лидера, анонсируя новую микросхему в серии Virtex UltraScale+ — VU23P.

Предыдущая модель, Virtex UltraScale+ VU19P, представляла собой высокопроизводительную ПЛИС общего назначения, предназначенную для разработки и прототипирования однокристальных платформ и чипов ASIC. Новая VU23P более специализирована: компания-разработчик нацелила её на использование в производительных сетевых решениях, а также для ускорения крупных систем хранения данных. Специально оговаривается тот факт, что по соотношению LUT и DSP-ячеек новинка уступает VU19P, но превосходит остальные ПЛИС в серии UltraScale+.

Зато коммуникационные возможности у VU32P развиты великолепно: в ней реализованы новейшие PAM4-трансиверы со скоростью 58 Гбит/с, поддержка шины PCI Express 4.0 и интегрированный MAC-контроллер класса 100G; конфигурация в качестве «умного» сетевого процессора допускает использование скоростей 200 Гбит/с. Всё это довольно компактно упаковано: размер кристалла не превышает 35 × 35 мм.

Комплект разработчика на базе старшей ПЛИС с PAM4-трансиверами класса 58G, VU29P

Комплект разработчика на базе старшей ПЛИС с PAM4-трансиверами класса 58G, VU29P

Virtex UltraScale+ VU23P ориентирована не только на работу в качестве сетевого ускорителя. Она с тем же успехом может выполнять и роль акселератора в масштабных сетевых системах хранения данных. Для этого в ней реализована полноценная поддержка технологии NVMe over Fabrics, ведь уже очевидно, что протокол NVMe одержал победу в сфере накопителей и именно за ним будущее.

В VU23P поддерживается ряд сценариев ускорения, востребованных в таких системах: сжатие и декомпрессия данных, их дедупликация, выстраивание очередей (sequencer functionality) и других. Также новинка найдёт своё место в конвергентных сетях, поскольку может работать в качестве шлюза, позволяющего объединять все используемые в такой сети службы в едином интерфейсе без потери производительности.

Информацию о новинке можно найти на веб-сайте компании-разработчика. Там же имеется обзор архитектуры UltraScale в целом и руководство по выбору наиболее подходящей под ваши задачи ПЛИС.

Постоянный URL: http://servernews.ru/1012016
Система Orphus