Материалы по тегу: fpga

19.12.2019 [21:34], Алексей Степин

Napatech представила «умные» 200GbE-адаптеры Link NT200A02 с FPGA-ускорителем

Растущие скорости сетей требуют от сетевых адаптеров всё большего «разума» и компании-разработчики таких решений отвечают на вызовы технологии и рынка.

Компания Napatech, разработчик реконфигурируемых вычислительных платформ, объявила о доступности новых программируемых сетевых адаптеров Link.

Как правило, «умные» сетевые адаптеры делятся на три категории — ASIC, FPGA (ПЛИС) и «процессорные». Новые решения Napatech относятся ко второму типу, наиболее дорогостоящему, но и демонстрирующему наилучшие результаты в плане производительности на специфических задачах. Программируются такие карты также весьма сложно, но благодаря поддержке стандарта Xilinx Vivaldo эта задача облегчается. Базируются новинки на высокопроизводительной ПЛИС-платформе Xilinx Viretx UltraScale+.

Архитектура новинки

Архитектура новинки

Анонсированная модель, Link NT200A02, базируется на дизайне модуля XCVU5P, но будут доступны и более производительные варианты на базе XCVU7P или XCVU9P. Доступен соответствующий комплект разработчика.

Плата имеет два разъёма QSFP28 с поддержкой скоростей от 1 до 100 Гбит/с и обычный разъём RJ45 (1000Base-T). Поддерживается работа в режиме PCIe x16 3.0, имеется начальная поддержка PCIe 4.0 (в режиме 2×8). Несколько Link NT200A02 могут общаться друг с другом посредством специальной системы межсоединений с пропускной способностью 675 Гбит/с. Кроме того, есть отдельный интерфейс для синхронизации времени с наносекундной точностью. 

Доступна версия с пассивным охлаждением

Доступна версия с пассивным охлаждением

Позиционируется новый продукт в качестве решений для сетевых систем, требующих высокой вычислительной производительности или критичных ко времени отклика: машинного зрения, кодирования видео в реальном времени, высокочастотной торговли, шифрования/дешифровки трафика, обработки данных, получаемых со спутников и других подобного рода задач.

Link NT200A02 имеет сертификацию PCI-SIG, гарантирующую совместную работу в единой системе восьми и более таких карт, что, по мнению компании, позволяет получить вычислительную мощность уровня небольшого кластера в объёмах одного сервера. Мощная ПЛИС означает высокий тепловой пакет, и он у новинки действительно достигает 120 Ватт. Доступны варианты как с собственной активной системой охлаждения, так и оснащённые только пассивным радиатором и полагающиеся на систему охлаждения сервера.

Постоянный URL: http://servernews.ru/1000110
17.12.2019 [21:12], Алексей Степин

Открытый SDR-стек OpenWiFi работает на платформе ПЛИС под управлением Linux

Технология Wi-Fi очень распространена в наши дни, но это не означает, что она избавлена от всех проблем.

Целый сегмент таких проблем связан с тем, что часть прошивки некоторых устройств поставляется исключительно в закрытом бинарном виде. Обойти это ограничение планируют создатели проекта OpenWiFi.

Стек OpenWiFi. Жёлтым цветом отмечены компоненты разработчиков проекта, белым - компоненты Linux

Стек OpenWiFi. Жёлтым цветом отмечены компоненты разработчиков проекта, белым - компоненты Linux

Желание разработчиков защитить свою интеллектуальную собственность или обеспечить уверенность в том, что пользователи не нарушат регуляции FCC, вполне понятно. Но можно понять и пользователей, не уверенных в том, что бинарные компоненты прошивки не содержат закладок и бэкдоров.

Проект OpenWiFi ставит своей целью создание полностью открытой реализации Wi-Fi, совместимой с операционными системами семейства Linux. Хотя сама реализация и относится к классу «программно определяемого радио» (Software Defined Radio, SDR), радиочастотный фронт-энд в OpenWiFi реализуется с помощью ПЛИС. Выбор вполне логичный, поскольку именно программируемые матрицы сочетают максимальную гибкость конфигурации с необходимым для целей разработчиков проекта уровнем производительности.

ZC706 Evaluation Board обладает весьма развитыми возможностями для запуска OpenWiFi

ZC706 Evaluation Board обладает весьма развитыми возможностями для запуска OpenWiFi

В текущей реализации радиочастотный трансивер создан на базе комплекта разработчика Xilinx Zynq-7000 (ZC706). Его основой служит достаточно мощная ПЛИС XC7Z045 FFG900, имеющая в своём составе не только логические ячейки и DSP-слайсы, но и пару процессорных ядер ARM Cortex-A9.

Уже реализована поддержка протоколов 802.11a/g и 802.11n и модуляций MCS c 0 по 7, ширина радиоканала составляет 20 МГц с шагом 2 МГц для 802.11ah или 10 МГц для 802.11p.

Демонстрация работоспособности OpenWiFi

OpenWiFi находится в начале пути, поэтому говорить о запредельных скоростях уровня, предлагаемого современными устройствами 802.11ac/ax, пока не приходится. Пока разработчикам удалось добиться 30,6 Мбит/с для нисходящего и 17 Мбит/с для восходящего трафика TCP (для UDP показатели несколько выше ‒ 38,8 и 21,5 Мбит/с соответственно). В планах OpenWiFi значится реализация поддержки 802.11ax WiFi 6, а также расширение спектра используемых ПЛИС-платформ.

Все ресурсы можно найти в соответствующем репозитории на Github; доступно два типа лицензирования — полностью открытое AGPLv3 и закрытое. Существует также руководство по запуску ZYNQ SDR с Linux. Создатели OpenWiFi планируют представить свой проект на встрече европейских разработчиков открытого ПО FOSDEM 2020, которая откроется 1 февраля следующего года.

Постоянный URL: http://servernews.ru/999938
17.12.2019 [11:21], Владимир Романченко

Cisco объявила о поглощении Exablaze, разработчика сетевых решений с ультранизкими задержками

Cisco Systems намерена купить австралийскую частную компанию Exablaze, которая специализируется на разработке и производстве сетевых устройств. Об этом в корпоративном блоге написал Роб Сальваньо (Rob Salvagno), вице-президент Cisco по корпоративному развитию и инвестициям. Помимо записи в блоге Сальваньо, о предстоящей сделке стало известно из заявления Грега Робинсона (Greg Robinson), соучредителя и председателя совета директоров Exablaze, а также из официального пресс-релиза Cisco.

Среди причин и целей слияния, в частности, указываются планы по интеграции продуктов и технологий Exablaze в портфолио Cisco. Ключевым интеллектуальным ресурсом австралийской компании в Cisco называют технологии использования программируемых вентильных матриц (FPGA) для обеспечения программируемости и гибкости будущей сетевой продукции.

Список перспективных сетевых продуктов Cisco на базе FPGA Exablaze со сверхнизкими задержками и технологией пикосекундной синхронизации включает коммутаторы и сетевые карты (NIC).

Среди ключевых рынков, на которые ориентированы сетевые устройства Exablaze, указан финансовый сектор, компании высокочастотного (алгоритмического) трейдинга (High-frequency trading, HFT), приложения искусственного интеллекта, машинного обучения, суперкомпьютеры, ЦОДы, облачные и пограничные вычисления.

Компания Exablaze была создана в 2013 году и сегодня имеет офисы в Сиднее, Нью-Йорке, Шанхае и Лондоне. Помимо приложений финансового сектора, продукция компании традиционно ориентирована на аналитику больших данных, высокопроизводительные вычисления и телекоммуникации.

Ожидается, что слияние объединение Exablaze и Cisco будет завершено в третьем квартале финансового 2020 года. Финансовая сторона сделки и дальнейшие планы касательно сотрудников Exablaze пока не разглашаются. 

Постоянный URL: http://servernews.ru/999872
12.12.2019 [14:14], Геннадий Детинич

Lattice представила первые ПЛИС CrossLink-NX на пластинах FD-SOI

Американская компания Lattice Semiconductor, которую пару лет назад пытались купить китайцы, и чему помешал специальный указ Дональда Трампа, представила уникальные и первые на рынке по комбинации возможностей FPGA. Это программируемые матрицы для маломощных решений с высочайшей энергоэффективностью.

Это качество достигается за счёт 28-нм техпроцесса на пластинах с изолятором из полностью обеднённого кремния (FD-SOI, fully depleted silicon-on-insulator). Производством матриц занимается компания Samsung.

Технология FD-SOI решает два вопроса. Во-первых, снижаются паразитные токи утечки. Во-вторых, поскольку транзисторный канал очень небольшой (помечен оранжевым цветом на картинке выше), то так называемые мягкие ошибки оказывают меньше влияния на работу транзисторов. Это ошибки, вызванные бомбардировкой чипов высокоэнергетическими частицами. Например, из космоса. В исполнении матриц Lattice на FD-SOI уровень «мягких» ошибок снижен примерно на два порядка, что важно для использования матриц компании в транспортной и промышленной электронике.

Первой продукцией Lattice на пластинах FD-SOI стали ПЛИС CrossLink-NX (новая платформа Nexus). По сравнению с конкурирующими решениями энергопотребление CrossLink-NX на 25 % меньше без снижения производительности. Это свойство будет востребовано для создания на базе ПЛИС Lattice компактных решений для периферийных ИИ и самообучающихся платформ по управлению массивами датчиков и для видеонаблюдения.

Область использования матриц CrossLink-NX охватывает ПЛИС с числом логических ячеек от 10 тыс. до 200 тыс. В дальнейшем компания планирует расширить ассортимент FPGA-продукции на основе 28-нм FD-SOI-процесса Samsung, чему поможет продуманное масштабирование проекта.

Матрицы CrossLink-NX на платформе Nexus поставляются в двух версиях: с 17К логических программируемых вентилей и с 40К вентилями. Размер матрицы с вентилями на кристалле составляет всего 6 × 6 мм. Пропускная способность встроенного интерфейса MIPI достигает 2,5 Гбит/с. Подобные решения оптимальны для систем видеонаблюдения со встроенными блоками для обработки потокового видео. Кроме перепрограммируемых вентилей в состав ПЛИС входят также универсальные цифровые сигнальные процессоры.

Типичное потребление матриц CrossLink-NX при максимальной рабочей температуре 85 °C составляет около 35 мВт. Кроме видеонаблюдения новые матрицы Lattice будут использоваться для управления датчиками, обеспечения безопасности оборудования, инфраструктуры 5G и приложений промышленной автоматизации.

Постоянный URL: http://servernews.ru/999604
06.11.2019 [23:10], Андрей Созинов

Intel Stratix 10 GX 10M: самая большая в мире ПЛИС с 10 млн элементов

Компания Intel представила Stratix 10 GX 10M — самую большую в мире программируемую интегральную схему (FPGA). Новинка выполнена по 14-нм техпроцессу и насчитывает 43,3 млрд транзисторов. Заметим, что предыдущим рекордсменом была ПЛИС  Xilinx Virtex VU19P, обладающая 35 млрд транзисторов. 

Новая матрица Stratix 10 GX 10M насчитывает 10,2 млн логических элементов, на что как раз и указывает сокращение «10М» в её названии. Логика разместилась на двух кристаллах, соединённых между собой вмонтированным в подложку полупроводниковым мостом EMIB (Embedded Multi-Die Interconnect Bridge).

Помимо кристаллов с логикой на подложке Stratix 10 GX 10M расположилось четыре кристалла, на которых в сумме расположилось 48 трансиверов, которые способны обеспечить общую пропускную способность до 0,85 Тбит/с (17,5 Гбит/с каждый). Трансиверы подключены к кристаллам с логикой также посредством интерфейса EMIB.

Всего новинка обладает 25 920 соединениям EMIB, что обеспечивает пропускную способность в 6,5 Тбит/с между всеми кристаллами, из которых состоит Stratix 10 GX 10M. Так что EMIB вряд ли станет узким местом новинки.

Ещё одной важной особенностью рекордной ПЛИС является наличие 2304 контактов ввода/вывода, доступных пользователю. Это позволит создавать самые разнообразные системы с большим количеством внешних интерфейсов. Есть у Stratix 10 GX 10M и 308 Мбит набортной памяти.

По словам Intel, новинка потребляет на 40 % меньше энергии, нежели её прежняя самая большая ПЛИС Stratix 10 GX 2800. Также новая Stratix 10 GX 10M обладает в 3,7 раза более высокой плотностью размещения транзисторов и вдвое большим числом контактов ввода/вывода.

Постоянный URL: http://servernews.ru/997101
01.11.2019 [21:42], Алексей Степин

ВКонтакте осваивает Intel Optane DCPMM и FPGA Arria 10 GX

«ВКонтакте» имеет 97 млн активных пользователей в месяц. Каждый день они просматривают 9 млрд постов, ставят 1 млрд лайков, пишут 10 млрд сообщений, 650 млн раз просматривают видео и генерируют трафик 3,5 Тбит/с. Общий объём пользовательских данных достиг 1,1 экзабайта. 

За всем этим стоит немалая IT-инфрастуктура: 19 тыс. серверов, 3 связанных между собой ЦОД, 30 CDN-узлов и дополнительных точек присутствия по всему миру. Малейшая возможность повысить их эффективность выливается в миллионы долларов экономии ежегодно. На мероприятии Intel Experience Day 2019 VK рассказала о такой возможности. 

До недавних пор имелись два основных типа машин: 1U-сервер приложений на базе пары Intel Xeon 2660v4 и четырёх HDD + 4U-сервер хранения данных с двумя Xeon 2620v4 и 36 HDD. То есть фактически было лишь два уровня хранения информации: DRAM и жёсткие диски. Разделение между «горячими» и «холодными» данными простое, но далеко не самое эффективное, так как с ростом объёма информации итоговая производительность падает, а стоимость хранения, напротив, растёт день ото дня. 

В результате проведённых экспериментов было принято решение по изменению серверной инфраструктуры с учётом новых технологий хранения данных, имеющихся на рынке. Это снижает стоимость владения инфраструктурой на величину от 65% до 90%.

Проект получился комплексный: число уровней хранения информации выросло до четырёх, не считая DRAM. Для наиболее «горячих» данных используются модули Intel Optane DC Persistent Memory (DCPMM) объёмом 1 Тбайт (8 × 128 Гбайт) в сочетании с PCIe-накопителями Intel Optane P4800X ёмкостью 750 Гбайт. Использование DCPMM и DRAM вместо одной только оперативной памяти снизило капитальные затраты в два раза. 

Появился новый уровень, «тёплый», где данные хранятся на 8 SSD Intel P4320 с интерфейсом NVMe (QLC 7,68 Тбайт). Так что все эти 1U-сервера работают исключительно с твердотельными накопителями. Лишь на самом «холодном» уровне по-прежнему используются традиционные HDD. Но и тут плотность размещения резко возросла — в 4U-шасси с вертикальной загрузкой теперь помещается 102 жёстких диска. 

Но даже при новой системе разделения слоёв содержание более 1 экзабайта данных стоит очень дорого. Компания решила провести опыт по оптимизации хранения изображений, которых на серверах VK хранится несколько сотен петабайт, причём часто в нескольких форматах и разрешениях. 

Наилучшим решением проблемы стало использование серверов с восемью ускорителями Intel на базе ПЛИС Arria 10 GX, производящих при отдаче контента преобразование изображений на лету в нужную пользователю форму. По итогу удалось уменьшить объём хранимых изображений на 20%, сэкономив десятки петабайт места. В настоящее время компания рассматривает возможность применения FPGA для других типов нагрузок. 

Все новые серверы построены на базе двух процессоров Intel Xeon Gold 6230  (20/40, 2,1/3,9 ГГц, 27,5 Мбайт, 125 Вт), так что вычислительные мощности существенно возросли. Сеть подверглась модернизации c 10GbE на 25GbE. Пересмотр структуры хранения и передачи данных позволил увеличить среднюю плотность размещения в три раза, что положительно сказывается на затратах на содержание. 

Постоянный URL: http://servernews.ru/996764
30.10.2019 [15:45], Геннадий Детинич

BittWare VectorPath S7t: ускоритель на базе 7-нм ПЛИС Achronix Speedster7t с 400Gb-интерфейсом

Компания BittWare, которая входит в широко известную группу Molex, представила интересный ускоритель расчётов на программируемых матрицах компании Achronix. Это ускорители VectorPath S7t-VG6 на 7-нм ПЛИС Achronix Speedster7t.

Поставки ускорителей в виде отдельных карт или в составе готовых систем компаний Dell или HP стартуют в начале второго квартала 2020 года.

Видимо, к этому времени с дефицитом 7-нм линий будет покончено. Сейчас спрос на 7-нм мощности находится в стадии ажиотажа.

Отдельно надо отметить, что компания Achronix долгое время была клиентом скромного, но многообещающего контрактного производства Intel. Увы, компания Intel перекормила «завтраками» всех, включая себя. Похоже, терпение Achronix иссякло, и производство новых ПЛИС она предпочла разместить за пределами заводов Intel. Вероятнее всего, этим будет заниматься компания TSMC, но мы пока не будем на этом настаивать.

Что касается ускорителей BittWare S7t-VG6, то ещё одной изюминкой платформы станет использование в качестве основной бортовой памяти память типа GDDR6 объёмом до 8 Гбайт. Суммарная пропускная способность подсистемы памяти в составе ускорителя BittWare S7t-VG6 будет достигать 4 Тбайт/с.

По словам разработчиков, это разумная по цене альтернатива памяти HBM. Почти не уступая ей по скорости доступа, память GDDR6 окажется ощутимо дешевле и удержит стоимость ускорителей BittWare на приемлемом уровне.

Кроме памяти GDDR6 на плате ускорителя можно обнаружить банк памяти DDR4-2666 с поддержкой ECC и три порта Ethernet: один 400 GbE и два 100 GbE. В комплекте с ускорителями поставляются инструменты для разработки приложений, драйвера и примеры, включая приложения для диагностики ускорителя.

Блок-схема ускорителя BittWare S7t-VG6

Блок-схема ускорителя BittWare S7t-VG6

О стоимости решений не сообщается. Поставки ускорителей BittWare S7t-VG6, повторим, стартуют в начале второго квартала будущего года.

Постоянный URL: http://servernews.ru/996543
18.10.2019 [10:11], Алексей Степин

Плата Tang Nano несёт на борту ПЛИС и стоит всего $5

Компания Lichee, ранее нацеленная на выпуск недорогих средств для разработки под архитектуру RISC-V, сменила имя и выпустила новый продукт. Теперь компания называется Sipeed, а представила она миру плату Tang Nano стоимостью всего $5.

Несмотря на цену, это достаточно интересное устройство, построенное на базе ПЛИС Gowin GW1N-1-LV.

Микросхема, относящаяся к семейству Little Bee, достаточно серьёзна по своим возможностям, несмотря на крошечные габариты. Она имеет 864 логических блока, таблицу LUT4 объёмом 1152 записи, 8 Мбайт системной памяти PSRAM и DSP-блоки.

На плате предусмотрен стандартный 40-контактный разъём для подключения экранов LCD RGB, имеется порт USB Type-C и 34 порта ввода/вывода.

Питается Tang Nano от порта USB, габариты платы составляют всего 58,4×21,3×4,8 миллиметра. Для разработки ПО предлагается среда GOWIN IDE, но, к сожалению, пока основной объём информации не переведён даже на английский язык.

Стоит новинка действительно $5, за $18 можно заказать плату в комплекте с 5″ цветным экраном. При столь низких ценах Tang Nano может являться удобным источником для «модов», подобных тем, что описаны в недавней заметке, посвящённой аппаратному взлому.

Постоянный URL: http://servernews.ru/995776
06.10.2019 [13:39], Алексей Степин

Единая программная платформа Xilinx Vitis упростит жизнь FPGA-разработчиков

В ходе мероприятия Xilinx Developer Forum 2019 компания объявила о запуске новой единой программной платформы Vitis. Это весьма важный шаг, поскольку решения на основе ПЛИС сильно зависят от программной части, и наличие доступного унифицированного комплекса ПО позволит привлечь новых разработчиков к работе с решениями Xilinx, сделав их, таким образом, более массовыми и доступными широкой публике. 

О масштабности проекта говорит то, что платформу Vitis уже успели назвать «Xilinx’s CUDA». Все, вероятно, помнят, что именно инициатива CUDA позволила в своё время NVIDIA агрессивно выйти на рынок ускорителей вычислений (GPGPU).

Широко доступной Xilinx Vitis должна стать в начале ноября. Что немаловажно, платформа станет бесплатной и не будет содержать зашифрованных бинарных файлов. В мире ПЛИС такой подход является большой редкостью — обычно создатели сопровождают их весьма дорогостоящими средствами разработки.

Доступность и открытость Vitis должны помочь Xilinx в конкуренции на рынке ускорителей вычислений и систем искусственного интеллекта. Как известно, ПЛИС способны на многое: в ряде специализированных задач они демонстрируют результаты не хуже специализированных ускорителей, но при этом являются куда более гибким решением.

В предварительном докладе Xilinx отметила ряд ключевых особенностей Vitis. Так, было заявлено, что новая платформа послужила точкой объединения пяти различных сред разработки, существовавших до этого в виде отдельных продуктов. Такую унификацию, наверняка, по достоинству оценят разработчики соответствующих решений на базе ПЛИС разработки и производства Xilinx.

Более всего, по мнению компании, от внедрения Vitis должны выиграть создатели систем и платформ машинного обучения. Как было отмечено в докладе, сегодня новые продвинутые модели машинного обучения появляются каждый квартал, и самые актуальные модели ускорителей на базе GPU не поспевают за этой тенденцией. В то же время ускорители на базе ПЛИС могут быть просто переконфигурированы с учётом особенностей новейшего ПО.

Если верить заявлениям Xilinx, в настоящее время в разработке находится 2024 модели автономных транспортных средств, «мозгом» которых были избраны решения Xilinx именно в силу их гибкости и способности к переконфигурации буквально «на лету». Платформа Vitis придётся здесь как нельзя более к месту, так как она совместима с популярными инструментами для машинного обучения: TensorFlow, Caffe и PyTorch.

Vitis позволит разработчикам не беспокоиться о низкоуровневых драйверах и распределении памяти, а пользоваться вместо этого привычными средами разработки и концентрировать свои усилия на решении действительно важных задач. В настоящее время Xilinx продолжает пополнять базы открытого программного кода, публикуя новые библиотеки, примеры и документацию для платформы Vitis. Также компания запустила в тестовом режиме новый портал для разработчиков.

Целью Xilinx, как уже было отмечено, является упрощение доступа разработчиков ко всем богатейшим возможностям, которые могут предоставить микросхемы с программируемой логикой. Помимо новой программной платформы компания обещает ускорить поставки комплектов разработчика на базе новейших ПЛИС: ACAP Versal и Alveo. С учётом нацеленности Xilinx на открытость и бесплатность программных решений новые инициативы компании можно лишь приветствовать.

Постоянный URL: http://servernews.ru/995128
02.10.2019 [16:53], Сергей Карасёв

Exxact выпустила серверы и рабочие станции с ускорителями Xilinx Alveo

Exxact Corporation начала поставки серверов и рабочих станций, оборудованных FPGA-ускорителями Xilinx Alveo.

Компания предлагает рабочую станцию начального уровня TensorEX Workstation. Она оборудована четырьмя ускорителями Alveo U200 или U250, двумя процессорами Intel Xeon Scalable (Silver) и четырьмя модулями оперативной памяти ёмкостью 16 Гбайт каждый (64 Гбайт в сумме).

Станция TensorEX Workstation среднего уровня несёт на борту четыре акселератора Alveo U200 или U250, два чипа Intel Xeon Scalable (Silver) и двенадцать модулей ОЗУ объёмом 16  Гбайт каждый (192 Гбайт в сумме).

Наконец, стоечная система TensorEX 4U Server располагает восемью акселераторами Alveo U200 или U250 и двумя процессорами Intel Xeon Scalable (Gold). Общий объём оперативной памяти составляет 192 Гбайт. 

Устройства Xilinx Alveo выполнены в виде карт расширения с интерфейсом PCIe. Решения обеспечивают повышение производительности при выполнении самых разных задач, с которыми сталкиваются современные центры обработки данных и корпоративные пользователи. Подробнее об акселераторах можно узнать здесь.

Постоянный URL: http://servernews.ru/994976
Система Orphus