Материалы по тегу: fpga

18.06.2020 [16:11], Алексей Степин

Intel Stratix 10 NX: новые высокоскоростные ПЛИС для машинного интеллекта

Одним из главных нововведений в Intel Xeon Scalable третьего поколения стала поддержка формата вычислений bfloat16, что дало возможность как исполнять, так и обучать нейронный сети на CPU. Но с такими узкими задачами как машинное обучение обычно лучше справляются специализированные устройства. Одной из них — новая ПЛИС Intel Stratix 10 NX.

Само семейство Stratix 10 уже имеет богатую историю: так, в конце прошлого года Intel выпустила ПЛИС Stratix 10 GX 10M, которая стала самой сложной ПЛИС на тот момент. Она содержала более 10 миллионов логических элементов и использовала мультикристальную компоновку: два основных «ядра» и четыре меньших кристалла с трансиверами.

Но для вычислительных задач, требующих быстрого доступа к серьёзным объёмам оперативной памяти, новые ПЛИС Stratix 10 NX подходят существенно лучше — у Stratix 10 GX было всего 308 Мбит набортной памяти, а новинки располагают как небольшим блоком ячеек DDR, расположенных в основном «ядре», так и модулем HBM большого объёма, соединенным с основной частью посредством EMIB.

Лучше всего Stratix 10 NX будет чувствовать себя на задачах с большим количеством тензорных вычислений, благодаря наличию специализированных ИИ-блоков AI Tensor Block.  По заявлению Intel, производительность в режиме INT8 у новинок более чем в 15 раз превышает аналогичные показатели у старых представителей семейства Stratix 10. При этом блоки тензорных вычислений могут быть объединены в каскады для поддержки более крупных матриц вычислений. Поддерживаются также форматы INT4, FP12, FP16 и классические FP32/INT32.

Кроме того, новые ПЛИС используют новые высокоскоростные трансиверы с модуляцией PAM4, обеспечивающие скорость 57,8 Гбит/с каждый, а трансиверных модулей у новинки три. Аппаратная реализация поддержки Ethernet дополнительно поможет при разработке периферийных систем на базе новых ПЛИС. Помимо прочего имеется и свой контроллер PCI Express, а также блоки для реализации кастомных вычислений, функций ввода/вывода и нестандартных протоколов связи.

Сочетание всех качеств, которыми обладают Stratix 10 NX, делают новые ПЛИС идеально подходящими для систем машинного интеллекта, действующих в реальном времени и требующих высокой вычислительной плотности. К таковым, например, относятся комплексы машинного зрения с функциями распознавания образов, системы распознавания речи и так далее. Также новинки должны отлично показать себя в сетевых задачах, например, при глубоком анализе сетевых пакетов (DPI) на лету. Высокий уровень интеграции позволяет использовать эти FPGA для периферийных вычислений.

В рамках сегодняшнего анонса Intel также представила второе поколение памяти Intel Optane DCPMM 200 для новых процессоров Xeon Cooper Lake и PCIe 4.0 накопители  Intel D7-P5500 и D7-5600.

Постоянный URL: http://servernews.ru/1013616
09.06.2020 [22:51], Алексей Степин

Exor GigaSOM GS01: Intel Atom E39xx и ПЛИС Cyclone GX 10

В 2015 году корпорация Intel поглотила компанию Altera, пополнив тем самым своё портфолио FPGA-решениями. В её арсенале есть не только сверхмощные и дорогие модели, но и доступные, к числу которых относится Cyclone 10 GX. EXOR International решила создать удобную для разработчика систему-на-модуле, сочетающую в себе недорогую ПЛИС серии Cyclone 10 и процессор Atom x5-E39xx.

Процессор Intel Atom E39xx использует ядра с архитектурой Apollo Lake, он производится с использованием 14-нм техпроцесса. В серии присутствует три модели, одна из которых, x5-E3930 имеет два ядра с частотой 1,3 ГГц, а две других — x5-E3940 и x7-E3950 — располагают четырьмя такими ядрами, работающими уже на частоте 1,6 ГГц. Графическое ядро во всех случаях Intel HD Graphics 500, с 12 (у x5) или 18 (у x7) исполнительными модулями, теплопакет варьируется в пределах 6,5 ‒ 12 Ватт.

ПЛИС Intel Cyclone 10 GX представляет собой недорогую программируемую матрицу, которая позиционируется производителем в качестве основы относительно бюджетных устройств и систем. Она использует не самый новый 20-нм техпроцесс и может иметь до 220 тысяч логических ячеек. В наличии трансивер с пропускной способностью 12,5 Гбит/с и аппаратная поддержка PCI Express 2.0 x4.

Комплект Exor GigaSOM GS01 несёт на борту оба чипа. Каждый из них имеет свой банк памяти: до 8 Гбайт LPDDR4 у процессора и до 2 Гбайт DDR3 у ПЛИС, а между собой компоненты общаются посредством двух линий PCI Express. Intel Atom обслуживает интерфейсы общего назначения: DisplayPort, HD Audio, I2C/I2S, SMB, GPIO и USB 2.0/3.0. У ПЛИС предусмотрены интерфейсы JTAG, CAN, I2C, SPI, GPIO и UART.

Сетевой контроллер i210 находится на стороне Intel Atom, также этот процессор обслуживает и два порта PCI Express, а вот шесть высокоскоростных трансиверов обслуживаются Cyclone 10 GX. Система выполнена в виде модуля SoM с габаритами 81,6 × 54 миллиметра, который может поставляться как отдельно, так и впаянным в системную плату, на которой удобно расположены стандартные разъёмы различных интерфейсов, включая три порта M.2 (два полноразмерных с ключом B, один укороченный с ключом E).

Комплект поставляется с блоком питания и быстрым руководством. ПЛИС изначально запрограммирована на поддержку двух портов Ethernet. В комплекте идёт программное обеспечение — комплект разработчика Linux BSP/SDK и пробная версия OpenHMI. Дата начала поставок не определена, но стоимость известна: в зависимости от конфигурации модуль SoM стоит от $443 до $828, цена на полный комплект начинается с $2101. Массовый заказ обойдётся дешевле, стоимость одного модуля может упасть до $274.

Постоянный URL: http://servernews.ru/1013022
03.06.2020 [23:12], Алексей Степин

InAccel предлагает инструментарий для доступа к ресурсам ПЛИС с помощью браузера

Иметь в своём распоряжении аппаратные ресурсы ПЛИС (FPGA) — всего лишь полдела. Нужно ещё располагать удобными инструментами, позволяющими эти ресурсы задействовать. Компания InAccel предлагает новый способ: использовать возможности ПЛИС-ускорителей с помощью браузера и браузерных приложений.

Один из вариантов ускорителя Xilinx Alveo

Один из вариантов ускорителя Xilinx Alveo

Изначально компания Xilinx представила открытый набор библиотек Vitis Library. Он позволял буквально «из коробки» использовать выпускаемые Xilinx программируемые матрицы совместно с уже имеющимися приложениями практически без вмешательства или же с минимальным вмешательством в их код. В список Vitis Library входили библиотеки для обычных вычислений, статистики, линейной алгебры и библиотеки обработки сигналов (DSP), а также ряд специфических библиотек, вроде поддержки машинного зрения и финансовых расчётов.

Веб-браузеры в наше время применяются очень широко. Даже программное обеспечение недавно запущенного космического корабля Dragon 2 использует связку HTML5 + JavaScript, правда, только для интерфейса; системы класса mission critiral всё же написаны на C++.

Компания InAccel решила совместить преимущества современных браузеров с преимуществами ПЛИС. Пока выпущена демоверсия разработанной InAccel технологии, но она уже работает с платами Xilinx серии Alveo.

Новый фреймворк основан на Jupyter Hub, платформе, позволяющей создавать среды для научных задач, работающие в облаке и не требующие процедур инсталляции и поддержки от конечных пользователей. Частью комплекса является Jupyter Notebook, веб-приложение, позволяющее создавать различные документы, сочетающие в себе выполняемый код, уравнения, визуализации и описательные тексты; этими документами можно делиться с коллегами в онлайн-режиме.

С помощью фреймворка InAccel теперь пользователи Jupyter Hub смогут пользоваться всеми преимуществами ПЛИС, такими, как низкая латентность и высокая производительность в специфических задачах. Система способна работать как локально, с использованием плат Alveo, так и в облаке, включая таких провайдеров, как AWS, Azure и Alibaba Cloud. Имеется пробный доступ для тех, кто желает протестировать новую технологию. Полный список библиотек VitAll можно найти на сайте компании.

Постоянный URL: http://servernews.ru/1012576
27.05.2020 [20:54], Алексей Степин

Новая ПЛИС Xilinx Virtex UltraScale+ оптимизирована для сетей и СХД

С момента своего появления программируемые логические схемы проделали большой путь. В конце прошлого года рекорд Xilinx, составивший 9 млн. логических ячеек был побит Intel, представившей Stratix 10 GX 10M с 10 миллионами ячеек.

Сейчас один из самых известных разработчиков ПЛИС в мире подтверждает звание лидера, анонсируя новую микросхему в серии Virtex UltraScale+ — VU23P.

Предыдущая модель, Virtex UltraScale+ VU19P, представляла собой высокопроизводительную ПЛИС общего назначения, предназначенную для разработки и прототипирования однокристальных платформ и чипов ASIC. Новая VU23P более специализирована: компания-разработчик нацелила её на использование в производительных сетевых решениях, а также для ускорения крупных систем хранения данных. Специально оговаривается тот факт, что по соотношению LUT и DSP-ячеек новинка уступает VU19P, но превосходит остальные ПЛИС в серии UltraScale+.

Зато коммуникационные возможности у VU32P развиты великолепно: в ней реализованы новейшие PAM4-трансиверы со скоростью 58 Гбит/с, поддержка шины PCI Express 4.0 и интегрированный MAC-контроллер класса 100G; конфигурация в качестве «умного» сетевого процессора допускает использование скоростей 200 Гбит/с. Всё это довольно компактно упаковано: размер кристалла не превышает 35 × 35 мм.

Комплект разработчика на базе старшей ПЛИС с PAM4-трансиверами класса 58G, VU29P

Комплект разработчика на базе старшей ПЛИС с PAM4-трансиверами класса 58G, VU29P

Virtex UltraScale+ VU23P ориентирована не только на работу в качестве сетевого ускорителя. Она с тем же успехом может выполнять и роль акселератора в масштабных сетевых системах хранения данных. Для этого в ней реализована полноценная поддержка технологии NVMe over Fabrics, ведь уже очевидно, что протокол NVMe одержал победу в сфере накопителей и именно за ним будущее.

В VU23P поддерживается ряд сценариев ускорения, востребованных в таких системах: сжатие и декомпрессия данных, их дедупликация, выстраивание очередей (sequencer functionality) и других. Также новинка найдёт своё место в конвергентных сетях, поскольку может работать в качестве шлюза, позволяющего объединять все используемые в такой сети службы в едином интерфейсе без потери производительности.

Информацию о новинке можно найти на веб-сайте компании-разработчика. Там же имеется обзор архитектуры UltraScale в целом и руководство по выбору наиболее подходящей под ваши задачи ПЛИС.

Постоянный URL: http://servernews.ru/1012016
22.04.2020 [22:24], Алексей Степин

BittWare TeraBox 200DE: FPGA-серверы для периферийных вычислений

Ускорение вычислений с помощью графических процессоров уже успело стать очень популярным, а сейчас наблюдается рост популярности решений, базирующихся на микросхемах программируемой логики (FPGA).

Иногда такие ускорители обладают большей энергоэффективностью, а это особенно важно для сферы периферийных вычислений, где сервер может быть ограничен как по питанию, так в возможностях отвода тепла. Именно на ПЛИС базируются новые серверы периферийных вычислений BittWare TeraBox 200DE.

Компания анонсировала целую серию сертифицированных решений, предназначенных именно для периферийных вычислений и ориентированных на установку различных FPGA-ускорителей. Новые серверы рассчитаны в том числе и на работу в достаточно неблагоприятных внешних средах, для чего они опционально оснащаются системой фильтрации поступающего в корпус воздуха.

В качестве основы послужила платформа DELL PowerEdge XE2420, отличающаяся компактными габаритами и имеющая высоту всего 2U. В качестве основных процессоров применяются чипы Intel Xeon Scalable, в зависимости от цены и комплектации это могут быть Xeon Bronze, Silver или Gold, укомплектованные 48, 96 или 192 Гбайт оперативной памяти.

BittWare S7t-VG6 хорошо подходит для быстрых сетей

BittWare S7t-VG6 хорошо подходит для быстрых сетей

В зависимости от потребностей заказчика TeraBox 200DE могут комплектоваться различными ускорителями на базе ПЛИС производства Achronix, Xilins или Intel. На текущий момент доступно три различных ускорителя: Speedster7t, 520N-MX и XUP-P3R. Во всех вариантах сервер оснащается двумя такими ускорителями. В основном, новинки нацелены на растущий рынок сетей пятого поколения, но также могут использоваться для сбора и первичного анализа статистики или выполнять задачи машинного обучения.

Ускоритель BittWare XUP-P3R: 4 порта 100GbE и до 512 Гбайт оперативной памяти

Ускоритель BittWare XUP-P3R: 4 порта 100GbE и до 512 Гбайт оперативной памяти

Версия с ускорителями S7t-VG6 на базе ПЛИС Speedster7t оптимальна для сетевых задач, поскольку поддерживает стандарт 400GbE (хотя доступен и вариант с шестью каналами 100GbE). Вариант 520N-MX (Intel Stratix 10 MX) создан для задач с большим расходом памяти, он поддерживает до 256 Гбайт DDR4 и 16 Гбайт HBM2. XUP-P3R предназначена для тех случаев, когда требуется массивная обработка пакетов и низкая латентность. Эта карта использует чип Xilinx UltraScale+ и может нести до 512 Гбайт памяти DDR4.

BittWare 520N-MX: блок-схема и возможности

BittWare 520N-MX: блок-схема и возможности

Заказать новые серверы BittWare можно как у самой компании, так и у DELL Technologies. Новинки сопровождаются трёхлетней гарантией, распространяющейся как на основную платформу, так и на FPGA-ускорители.

Постоянный URL: http://servernews.ru/1009166
16.04.2020 [21:03], Алексей Степин

Samsung и Xilinx объединяют усилия для завоевания рынка базовых станций 5G

Ещё в начале весны компания Xilinx анонсировала новую платформу Versal Premium, сердцем которой стал универсальный чип, содержащий в себе блоки программируемой логики, криптографии, DSP и ядра ARM общего назначения.

Разработчик присвоил новинке термин ACAP (adaptive compute acceleration) — адаптивная вычислительная платформа. А совсем недавно новинкой заинтересовалась Samsung, осваивающая рынок 5G-решений.

Активность Samsung в этом сегменте весьма велика: если пару лет назад доля компании на рынке базовых станций 5G колебалась около нулевой отметки, то к началу 2019 года она достигла 30%, а сейчас продолжает увеличиваться ударными темпами.

Война США и Huawei продолжается, поэтому Samsung на сегодня можно назвать одним из крупнейших поставщиков оборудования для создания беспроводных сетей пятого поколения. И разработка Xilinx была оценена корейским гигантом по достоинству. Компании объявили о сотрудничестве в сфере производства базовых станций для сетей пятого поколения.

Платформа Xilinx Versal доступна уже сейчас для избранных клиентов; массовые поставки начнутся в четвёртом квартале. Для сравнения, Intel, обещавшая своим партнёрам в лице Nokia и ZTE свой вариант процессора для базовых станций 5G — Snow Ridge, так и не смогла сдержать своих обещаний в 2019 году из-за проблем с 10-нм техпроцессом. Кроме того, Xilinx Versal обладает более широкими возможностями и может предложить большую степень гибкости.

Благодаря богатым возможностям в области цифровой обработки сигналов, Versal подходит как для использования в низкочастотных реализациях 5G (600 ‒ 700 МГц, 30 ‒ 250 Мбит/с), так и в высокочастотных (2,5 ‒ 3,5 ГГц, 1 ‒ 3 Гбит/с). В настоящее время Versal, по словам производителя, является наиболее продвинутой платформой для 5G.

Постоянный URL: http://servernews.ru/1008652
12.03.2020 [19:44], Алексей Степин

Xilinx Versal Premium: сверхмощная гетерогенная платформа для сетей нового поколения

Компания Xilinx, один из ведущих разработчиков программируемых логических схем (ПЛИС), анонсировала третье поколение адаптивных сетевых процессоров Versal — Versal Premium. Новинка является наиболее производительной в серии и предназначена для использования в высокоскоростных сетях нового поколения.

Компания называет Versal «адаптивной платформой для ускорения вычислений» (adaptive compute acceleration, ACAP).

И действительно, архитектура Versal достаточно уникальна. По своей структуре она гетерогенна и включает в себя самые различные блоки — так, Versal Premium имеет в своём составе два ядра ARM Cortex-A72, два ядра ARM Cortex-R5F для приложений реального времени, набор движков DSP, набор криптографических движков, способных работать со скоростями до 400 Гбит/с, интерфейсы Ethernet со скоростями от 100 до 600 Гбит/с, контроллеры периферийных шин, а также набор программируемой логики, являющийся сердцем чипа.

Новый чип разработан с применением 7-нм технологического процесса TSMC и, по словам Xilinx, втрое превосходит другие ПЛИС, когда речь идёт о пропускной способности сетевых подсистем. Versal Premium должен стать новым словом в разработке однокристальных сетевых процессоров классов 400G и 800G. Полностью технические характеристики приведены на сайте компании-разработчика. Отметим только, что в старшем варианте Versal Premium будет иметь более 14 тысяч DSP-движков, 7352 ячейки системной логики и свыше 3,3 миллионов LUTs.

В сравнении с предыдущими чипами Versal, версия Premium получила трансиверы PAM4 со скоростью 112 Гбит/с, поддержку сетевого проткола Interlaken, высокоскоростные криптографические движки и реализацию PCI Express 5.0. В комплекте с платформами разработки Vitis и Vivado Design Suite это наиболее мощное на сегодня решение для разработчиков аппаратного и программного сетевого обеспечения нового поколения.

Плата VMK180 из комплекта разработчика Versal Prime Series

Плата VMK180 из комплекта разработчика Versal Prime Series

Пока речь идёт лишь об анонсе новой платформы. Поставки образцов Versal Premium избранным клиентам Xilinx начнутся в первой половине следующего года. Но документация уже доступна и разработчики могут приступить к прототипированию новых устройств, используя комплект Versal Prime Evaluation Kit.

Постоянный URL: http://servernews.ru/1005810
11.03.2020 [18:27], Андрей Галадей

TornadoVM: ускорение Java и Node.js на GPU и FPGA

На QCon London доктор Хуан Фумеро (Juan Fumero) из Университета Манчестера представил демонстрацию реальной работы TornadoVM, ВМ для гетерогенных систем. Это плагин к OpenJDK и GraalVM, позволяющий запускать Java-приложения на GPU и FPGA. Демонстрация показала, что такой подход позволяет в сотни раз ускорять работу приложений.

Отметим, что TornadoVM позволяет запускать приложения, написанные на Java и Node.js, за счёт распараллеливания и выполнения расчётов на разных типах оборудования.

Фумеро показал это на примере макбука, где код выполнялся на CPU, интегрированном GPU и графическом процессоре NVIDIA. Также поддерживаются решения AMD и Intel FPGA. А вот Tensor Processing Units (TPU) пока не поддерживаются, но по словам разработчика, здесь всё упирается в поддержку OpenCL. Создать же дополнительный бэкэнд к TornadoVM — не проблема.

Пока что разработчики не готовы к коммерческому внедрению TornadoVM, хотя система уже используется для ускорения машинного обучения. Эти решения используются для работы с данными о здравоохранении. При этом из-за ограничений в базовой модели программирования, TornadoVM не поддерживает объекты (за исключением тривиальных случаев), рекурсию, динамическое выделение памяти или исключения.

Слайды с демонстрации и исходный код уже доступны для изучения.  

Постоянный URL: http://servernews.ru/1005698
07.03.2020 [14:54], Алексей Степин

Xilinx Alveo U25: полку «умных» сетевых карт прибыло

Рынок так называемых «умных» сетевых адаптеров в последние годы активно развивается, поскольку растут и сами сети. Оптимальным решением всё чаще становится выбор сетевого адаптера, не отнимающего ценные вычислительные ресурсы у центральных процессоров.

Столь лакомый кусок рынка, составляющий по разным оценкам, от 10 до 12 миллионов серверов, не мог не привлечь внимания компании Xilinx, которая представила новые экономичные, но при этом весьма производительные сетевые ускорители Alveo U25.

Единого, устоявшегося подхода к реализации ускорения сетевых функций нет. Свои преимущества и недостатки имеет каждый из трёх встречающихся сегодня вариантов — на базе специализированного кремния (ASIC), на базе процессоров общего назначения и на базе ПЛИС (FPGA).

Самым гибким является третий путь, но он же до недавнего времени оставался и самым сложным с точки зрения программирования. Ускорители Xilinx Alveo U25 должны это изменить. Во многом они базируются на наработках Solarflare, компании, стоящей у истоков высокоскоростных сетевых карт с минимальными задержками и выкупленной Xilinx прошлым летом за $400 миллионов.

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

По словам представителя Xilinx, Alveo U25 — первый по-настоящему универсальный «умный» сетевой адаптер, позволяющий развёртывать различные сценарии ускорения практически так же быстро, как и карты на базе процессоров общего назначения. Но при этом он обладает несопоставимо более высоким уровнем производительности при энергопотреблении в районе 40 ‒ 50 Ватт. В этот пакет можно уместить 8 или даже 16-ядерный ЦП с архитектурой ARM, что позволяет достичь скорости обработки порядка 32 миллионов сетевых пакетов в секунду на частоте 2 ГГц.

В то же время Alveo U25 может обработать 300 миллионов пакетов в секунду при частоте всего 300 МГц, что позволяет либо на порядок увеличить производительность в заданном диапазоне энергопотребления, либо на порядок сократить само энергопотребление при сохранении уровня производительности.

Рынок «умных» сетевых решений весьма широк

Рынок «умных» сетевых решений весьма широк

Всё дело в развитом параллелизме, который можно синтезировать с помощью FPGA. 8 или даже 16 фиксированных ядер ARM не позволяют достичь такого же уровня параллелизма, как тысячи одновременно работающих обработчиков, синтезированных из ресурсов FPGA. В Alveo U25 используется матрица из серии Zynq, XCU25 с 520 тысячами LUT; в ней также интегрировано 4 ядра ARM Cortex-A53. Объём оперативной памяти DDR4 составляет 6 Гбайт. Два порта SFP28 обеспечивают скорость 25 Гбит/с.

Для минимизации задержки в Alveo U25 реализована технология Solarflare Onload, позволяющая карте работать напрямую с пользовательскими приложениями, минуя уровень ядра операционной системы и её стека TCP/IP. Помимо стандартных сценариев разгрузки, новинка Xilinx поддерживает сценарии машинного обучения и аналитики данных и даже транскодирования видеопотоков на лету, что наверняка найдёт своё применение в активно развивающейся сфере периферийных вычислений.

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Ускорители Alveo U25 поддерживают среду разработки Xilinx Vitis, содержащую все необходимые библиотеки, компиляторы и отладчики. Поддерживаются популярные фреймворки TensorFlow и FFmpeg, а также приложения сторонних разработчиков, написанные на языках Python, C, C++ или P4. Компания Xilinx уже поставляет опытные партии Alveo U25 избранным клиентам, массовые поставки новых «умных» сетевых карт должны начаться в третьем квартале.

Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Отметим, что крупные веб-провайдеры используют решения собственной разработки: так, Microsoft применяет порядка миллиона карт серии Catapult, Amazon Web Services располагает примерно таким же количеством ARM-адаптеров Nitro, а китайская Alibaba Group активно экспериментирует с сетевыми процессорами X-Dragon.

Но, как уже было отмечено в начале, поле для игры очень широкое: на долю всех остальных поставщиков услуг приходится гораздо больше серверов, от 12 до 14 миллионов, и из них лишь 2 или 3 миллиона уже оснащены сетевыми ускорителями. Ни Baidu, ни Tencent в активном внедрении «умных» сетевых карт пока не замечены, так что у Xilinx c Alveo U25 есть серьёзные шансы на успех.

Правда, конкуренция предстоит жёсткая: в этот же сектор метят такие опытные разработчики, как Mellanox и Broadcom, не дремлют Marvell и Silicom, и весьма агрессивно продвигают свои разработки молодые компании, такие, как Fungible или Pensando.

Постоянный URL: http://servernews.ru/1005284
12.02.2020 [22:44], Алексей Степин

Swarm64 продемонстрировала PostgreSQL-ускоритель на базе FPGA Intel Arria 10

Ускорители на базе ПЛИС продолжают осваивать рынок. На конференции PgConf.Russia 2020 компания Swarm64 представила в России свою разработку, ускоритель для СУБД PostgreSQL — решение HTAP (Hybrid Transaction Acceleration Processing) базируется на FPGA Intel Arria 10.

Принцип работы ускорителя Swarm64

ПЛИС ускорителя HTAP сконфигурирована разработчиками Swarm64 для ускорения структуризация массивов данных, операций комплексных вычислений, обработки поисковых запросов. Новинка показала весьма впечатляющие результаты — в популярном бенчмарке TPC-H она продемонстрировала ускорение в 25 — 80 раз, в зависимости от задачи.

Этот набор тестов имитирует «тяжёлые» сценарии работы с СУБД вроде обработки множества одновременных запросов. Именно на этой задаче (обработка запросов класса Q6) выигрыш составил до 80х в сравнении с системой на базе двух 24-ядерных Xeon Gold 8268 с 384 Гбайт оперативной памяти и 1,536 Тбайт памяти в модулях Optane DCPMM в режиме App Direct.

На операциях записи выигрыш был скромнее и составил 25 ‒ 35 раз. Использование ускорителя Swarm64 позволило тестовой системе продемонстрировать производительность на уровне 12 миллионов транзакций в минуту и 5 тысяч аналитических решений в секунду.

Решения Swarm64 также доступны и для ПЛИС Xilinx, а для тех, кто хочет оценить возможности ускорителя, компания предлагает воспользоваться FPGA-инстансами AWS F1

Постоянный URL: http://servernews.ru/1003566
Система Orphus