Материалы по тегу: xilinx

12.03.2020 [19:44], Алексей Степин

Xilinx Versal Premium: сверхмощная гетерогенная платформа для сетей нового поколения

Компания Xilinx, один из ведущих разработчиков программируемых логических схем (ПЛИС), анонсировала третье поколение адаптивных сетевых процессоров Versal — Versal Premium. Новинка является наиболее производительной в серии и предназначена для использования в высокоскоростных сетях нового поколения.

Компания называет Versal «адаптивной платформой для ускорения вычислений» (adaptive compute acceleration, ACAP).

И действительно, архитектура Versal достаточно уникальна. По своей структуре она гетерогенна и включает в себя самые различные блоки — так, Versal Premium имеет в своём составе два ядра ARM Cortex-A72, два ядра ARM Cortex-R5F для приложений реального времени, набор движков DSP, набор криптографических движков, способных работать со скоростями до 400 Гбит/с, интерфейсы Ethernet со скоростями от 100 до 600 Гбит/с, контроллеры периферийных шин, а также набор программируемой логики, являющийся сердцем чипа.

Новый чип разработан с применением 7-нм технологического процесса TSMC и, по словам Xilinx, втрое превосходит другие ПЛИС, когда речь идёт о пропускной способности сетевых подсистем. Versal Premium должен стать новым словом в разработке однокристальных сетевых процессоров классов 400G и 800G. Полностью технические характеристики приведены на сайте компании-разработчика. Отметим только, что в старшем варианте Versal Premium будет иметь более 14 тысяч DSP-движков, 7352 ячейки системной логики и свыше 3,3 миллионов LUTs.

В сравнении с предыдущими чипами Versal, версия Premium получила трансиверы PAM4 со скоростью 112 Гбит/с, поддержку сетевого проткола Interlaken, высокоскоростные криптографические движки и реализацию PCI Express 5.0. В комплекте с платформами разработки Vitis и Vivado Design Suite это наиболее мощное на сегодня решение для разработчиков аппаратного и программного сетевого обеспечения нового поколения.

Плата VMK180 из комплекта разработчика Versal Prime Series

Плата VMK180 из комплекта разработчика Versal Prime Series

Пока речь идёт лишь об анонсе новой платформы. Поставки образцов Versal Premium избранным клиентам Xilinx начнутся в первой половине следующего года. Но документация уже доступна и разработчики могут приступить к прототипированию новых устройств, используя комплект Versal Prime Evaluation Kit.

Постоянный URL: http://servernews.ru/1005810
07.03.2020 [14:54], Алексей Степин

Xilinx Alveo U25: полку «умных» сетевых карт прибыло

Рынок так называемых «умных» сетевых адаптеров в последние годы активно развивается, поскольку растут и сами сети. Оптимальным решением всё чаще становится выбор сетевого адаптера, не отнимающего ценные вычислительные ресурсы у центральных процессоров.

Столь лакомый кусок рынка, составляющий по разным оценкам, от 10 до 12 миллионов серверов, не мог не привлечь внимания компании Xilinx, которая представила новые экономичные, но при этом весьма производительные сетевые ускорители Alveo U25.

Единого, устоявшегося подхода к реализации ускорения сетевых функций нет. Свои преимущества и недостатки имеет каждый из трёх встречающихся сегодня вариантов — на базе специализированного кремния (ASIC), на базе процессоров общего назначения и на базе ПЛИС (FPGA).

Самым гибким является третий путь, но он же до недавнего времени оставался и самым сложным с точки зрения программирования. Ускорители Xilinx Alveo U25 должны это изменить. Во многом они базируются на наработках Solarflare, компании, стоящей у истоков высокоскоростных сетевых карт с минимальными задержками и выкупленной Xilinx прошлым летом за $400 миллионов.

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

По словам представителя Xilinx, Alveo U25 — первый по-настоящему универсальный «умный» сетевой адаптер, позволяющий развёртывать различные сценарии ускорения практически так же быстро, как и карты на базе процессоров общего назначения. Но при этом он обладает несопоставимо более высоким уровнем производительности при энергопотреблении в районе 40 ‒ 50 Ватт. В этот пакет можно уместить 8 или даже 16-ядерный ЦП с архитектурой ARM, что позволяет достичь скорости обработки порядка 32 миллионов сетевых пакетов в секунду на частоте 2 ГГц.

В то же время Alveo U25 может обработать 300 миллионов пакетов в секунду при частоте всего 300 МГц, что позволяет либо на порядок увеличить производительность в заданном диапазоне энергопотребления, либо на порядок сократить само энергопотребление при сохранении уровня производительности.

Рынок «умных» сетевых решений весьма широк

Рынок «умных» сетевых решений весьма широк

Всё дело в развитом параллелизме, который можно синтезировать с помощью FPGA. 8 или даже 16 фиксированных ядер ARM не позволяют достичь такого же уровня параллелизма, как тысячи одновременно работающих обработчиков, синтезированных из ресурсов FPGA. В Alveo U25 используется матрица из серии Zynq, XCU25 с 520 тысячами LUT; в ней также интегрировано 4 ядра ARM Cortex-A53. Объём оперативной памяти DDR4 составляет 6 Гбайт. Два порта SFP28 обеспечивают скорость 25 Гбит/с.

Для минимизации задержки в Alveo U25 реализована технология Solarflare Onload, позволяющая карте работать напрямую с пользовательскими приложениями, минуя уровень ядра операционной системы и её стека TCP/IP. Помимо стандартных сценариев разгрузки, новинка Xilinx поддерживает сценарии машинного обучения и аналитики данных и даже транскодирования видеопотоков на лету, что наверняка найдёт своё применение в активно развивающейся сфере периферийных вычислений.

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Ускорители Alveo U25 поддерживают среду разработки Xilinx Vitis, содержащую все необходимые библиотеки, компиляторы и отладчики. Поддерживаются популярные фреймворки TensorFlow и FFmpeg, а также приложения сторонних разработчиков, написанные на языках Python, C, C++ или P4. Компания Xilinx уже поставляет опытные партии Alveo U25 избранным клиентам, массовые поставки новых «умных» сетевых карт должны начаться в третьем квартале.

Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Отметим, что крупные веб-провайдеры используют решения собственной разработки: так, Microsoft применяет порядка миллиона карт серии Catapult, Amazon Web Services располагает примерно таким же количеством ARM-адаптеров Nitro, а китайская Alibaba Group активно экспериментирует с сетевыми процессорами X-Dragon.

Но, как уже было отмечено в начале, поле для игры очень широкое: на долю всех остальных поставщиков услуг приходится гораздо больше серверов, от 12 до 14 миллионов, и из них лишь 2 или 3 миллиона уже оснащены сетевыми ускорителями. Ни Baidu, ни Tencent в активном внедрении «умных» сетевых карт пока не замечены, так что у Xilinx c Alveo U25 есть серьёзные шансы на успех.

Правда, конкуренция предстоит жёсткая: в этот же сектор метят такие опытные разработчики, как Mellanox и Broadcom, не дремлют Marvell и Silicom, и весьма агрессивно продвигают свои разработки молодые компании, такие, как Fungible или Pensando.

Постоянный URL: http://servernews.ru/1005284
22.01.2020 [12:13], Геннадий Детинич

Для среды разработки Xilinx выпущено полное руководство по интеграции STT-MRAM

Скорость распространение нового типа энергонезависимой памяти STT-MRAM зависит не только от наличия микросхем памяти, но также от уровня поддержки разработчиков. Для решения последней задачи выпущено полное руководство по проектированию для среды Xilinx Vivado.

Компания Everspin Technologies сообщила, что поддержала относительно недавний старт массового производства 1-Гбит чипов памяти STT-MRAM выпуском всеобъемлющего руководства по проектированию интерфейсов с использованием магнитно-резистивной оперативной памяти со спиновым переносом. На момент анонса руководство интегрировано в среду Vivado компании Xilinx.

Интерфейс памяти Everspin 1 Гбит STT-MRAM представлен стандартом DDR4 со скоростью передачи данных 1333 МТ/с на линию. Задержки, уровни питания и некоторые другие параметры сигнальной структуры STT-MRAM отличаются от сигнальной структуры обычной оперативной памяти с интерфейсом DDR4. Тем не менее, базовые контроллеры памяти Xilinx, которые входят в среду Vivado, поддерживают уже второе поколение памяти STT-MRAM Everspin, что позволяет быстро и с гарантией выводить на рынок новые продукты.

Новые микросхемы памяти STT-MRAM компании Everspin выпускаются с использованием 28-нм техпроцесса на заводе компании GlobalFoundries. До производства 1-Гбит чипов, выпуск которых стартовал в конце прошлого лета или в начале осени, Everspin выпускала 256-Мбит микросхемы STT-MRAM. Дискретные чипы памяти MRAM кроме неё никто в мире больше не производит в товарных объёмах.

Можно рассчитывать, что четырёхкратный рост объёма микросхем STT-MRAM сделает их более популярным продуктом для установки в качестве энергонезависимых буферов или для обслуживания критически важных нагрузок. А сотрудничество с Xilinx позволит ускорить разработку новых устройств. 

Постоянный URL: http://servernews.ru/1001976
23.11.2019 [20:20], Андрей Созинов

SC19: Western Digital показала U.2-ускорители ИИ на базе FPGA Xilinx

В рамках конференции SC19 компания Western Digital показала свои ускорители машинного обучения (Machine Learning Accelerator) на базе ПЛИС Xilinx Zynq UltraScale+.

Ключевой особенностью данных ускорителей является то, что они выполнены в нестандартном для таких устройств форм-факторе U.2, который характерен для твердотельных накопителей.

В ускорителях Western Digital используются гибридные программируемые матрицы Xilinx Zynq UltraScale+ ZU7EV. Помимо 504 000 логических элементов данные чипы содержат в себе четыре процессорных ядра Cortex-A53 с частотой 1,5 ГГц и два вспомогательных ядра Cortex-R5 с частотой 600 МГц. Для подключения используется либо стандартный разъём U.2, либо адаптер PCIe x4. Энергопотребление ускорителя составляет всего 20 Вт.

Производитель позиционирует FPGA-ускорители формата U.2 в качестве альтернативы ускорителям на графических процессорах в задачах, связанных с искусственным интеллектом и машинным обучением. Отмечается, что новинки обеспечивают такой же уровень точности при машинном обучении, и также способны работать с числами INT8 и INT16.

Ускорители способны работать с нейросетями на базе TensorFlow, Caffe, Caffe2 и MXNET. Причём какие-либо изменения в коде и повторная тренировка сетей, уже обученных на GPU, не требуются. Производительность, по словам WD, составляет 239 кд/с в Resnet50 и 561 кд/с в Googlenet.

Помимо довольно необычных ускорителей машинного обучения, компания Western Digital продемонстрировала в рамках SC19 различные твердотельные накопители и жёсткие диски высокой ёмкости для промышленного использования. В частности, были показаны «расширители» оперативной памяти Ultrastar DC ME200 Memory Extension Drive, вместительные твердотельные накопители Ultrastar DC SN640 и DC SN340, а также жёсткие диски Ultrastar DC HC550 и DC HC650 объёмом до 20 Тбайт.

Постоянный URL: http://servernews.ru/998323
06.10.2019 [13:39], Алексей Степин

Единая программная платформа Xilinx Vitis упростит жизнь FPGA-разработчиков

В ходе мероприятия Xilinx Developer Forum 2019 компания объявила о запуске новой единой программной платформы Vitis. Это весьма важный шаг, поскольку решения на основе ПЛИС сильно зависят от программной части, и наличие доступного унифицированного комплекса ПО позволит привлечь новых разработчиков к работе с решениями Xilinx, сделав их, таким образом, более массовыми и доступными широкой публике. 

О масштабности проекта говорит то, что платформу Vitis уже успели назвать «Xilinx’s CUDA». Все, вероятно, помнят, что именно инициатива CUDA позволила в своё время NVIDIA агрессивно выйти на рынок ускорителей вычислений (GPGPU).

Широко доступной Xilinx Vitis должна стать в начале ноября. Что немаловажно, платформа станет бесплатной и не будет содержать зашифрованных бинарных файлов. В мире ПЛИС такой подход является большой редкостью — обычно создатели сопровождают их весьма дорогостоящими средствами разработки.

Доступность и открытость Vitis должны помочь Xilinx в конкуренции на рынке ускорителей вычислений и систем искусственного интеллекта. Как известно, ПЛИС способны на многое: в ряде специализированных задач они демонстрируют результаты не хуже специализированных ускорителей, но при этом являются куда более гибким решением.

В предварительном докладе Xilinx отметила ряд ключевых особенностей Vitis. Так, было заявлено, что новая платформа послужила точкой объединения пяти различных сред разработки, существовавших до этого в виде отдельных продуктов. Такую унификацию, наверняка, по достоинству оценят разработчики соответствующих решений на базе ПЛИС разработки и производства Xilinx.

Более всего, по мнению компании, от внедрения Vitis должны выиграть создатели систем и платформ машинного обучения. Как было отмечено в докладе, сегодня новые продвинутые модели машинного обучения появляются каждый квартал, и самые актуальные модели ускорителей на базе GPU не поспевают за этой тенденцией. В то же время ускорители на базе ПЛИС могут быть просто переконфигурированы с учётом особенностей новейшего ПО.

Если верить заявлениям Xilinx, в настоящее время в разработке находится 2024 модели автономных транспортных средств, «мозгом» которых были избраны решения Xilinx именно в силу их гибкости и способности к переконфигурации буквально «на лету». Платформа Vitis придётся здесь как нельзя более к месту, так как она совместима с популярными инструментами для машинного обучения: TensorFlow, Caffe и PyTorch.

Vitis позволит разработчикам не беспокоиться о низкоуровневых драйверах и распределении памяти, а пользоваться вместо этого привычными средами разработки и концентрировать свои усилия на решении действительно важных задач. В настоящее время Xilinx продолжает пополнять базы открытого программного кода, публикуя новые библиотеки, примеры и документацию для платформы Vitis. Также компания запустила в тестовом режиме новый портал для разработчиков.

Целью Xilinx, как уже было отмечено, является упрощение доступа разработчиков ко всем богатейшим возможностям, которые могут предоставить микросхемы с программируемой логикой. Помимо новой программной платформы компания обещает ускорить поставки комплектов разработчика на базе новейших ПЛИС: ACAP Versal и Alveo. С учётом нацеленности Xilinx на открытость и бесплатность программных решений новые инициативы компании можно лишь приветствовать.

Постоянный URL: http://servernews.ru/995128
02.10.2019 [16:53], Сергей Карасёв

Exxact выпустила серверы и рабочие станции с ускорителями Xilinx Alveo

Exxact Corporation начала поставки серверов и рабочих станций, оборудованных FPGA-ускорителями Xilinx Alveo.

Компания предлагает рабочую станцию начального уровня TensorEX Workstation. Она оборудована четырьмя ускорителями Alveo U200 или U250, двумя процессорами Intel Xeon Scalable (Silver) и четырьмя модулями оперативной памяти ёмкостью 16 Гбайт каждый (64 Гбайт в сумме).

Станция TensorEX Workstation среднего уровня несёт на борту четыре акселератора Alveo U200 или U250, два чипа Intel Xeon Scalable (Silver) и двенадцать модулей ОЗУ объёмом 16  Гбайт каждый (192 Гбайт в сумме).

Наконец, стоечная система TensorEX 4U Server располагает восемью акселераторами Alveo U200 или U250 и двумя процессорами Intel Xeon Scalable (Gold). Общий объём оперативной памяти составляет 192 Гбайт. 

Устройства Xilinx Alveo выполнены в виде карт расширения с интерфейсом PCIe. Решения обеспечивают повышение производительности при выполнении самых разных задач, с которыми сталкиваются современные центры обработки данных и корпоративные пользователи. Подробнее об акселераторах можно узнать здесь.

Постоянный URL: http://servernews.ru/994976
01.10.2019 [18:38], Сергей Карасёв

Xilinx берёт на вооружение память Micron Xccela Flash

Компания Xilinx будет использовать флеш-память Micron Xccela в составе Versal — адаптивной платформы для ускорения вычислений (Adaptive Compute Acceleration Platform, ACAP).

Отмечается, что память Micron Xccela Flash использует интерфейс xSPI (Expanded Serial Peripheral Interface), что обеспечивает восьмикратное увеличение быстродействия на операциях загрузки и конфигурирования по сравнению с нынешними SPI-решениями NOR Flash. Кроме того, память Micron Xccela Flash потребляет на 30% меньше энергии в сравнении с ними.

Флеш-память Xccela изготавливается с применением 45-нанометровой технологии. Заявленный диапазон рабочих температур весьма широк — он простирается от минус 40 до плюс 125 градусов Цельсия.

Изделия доступны в модификациях вместимостью от 256 Мбит до 2 Гбит. 

Постоянный URL: http://servernews.ru/994935
22.08.2019 [06:42], Андрей Созинов

Xilinx Virtex UltraScale+ VU19P: самая большая в мире FPGA с 9 млн логических элементов

Компания Xilinx анонсировала Virtex UltraScale+ VU19P — самую большую программируемую логическую интегральную схему (вентильную матрицу) FPGA, которая содержит в себе 9 миллионов логических элементов.

Помимо 9 млн логических элементов, Virtex VU19P имеет восемь каналов для подключения оперативной памяти DDR4 с общей пропускной способностью 1,5 Тбит/с, восемьдесят приёмопередатчиков с пропускной способностью 4,5 Тбит/с, а также 2072 входов-выходов GPIO. Заметим, что предшественник новинки — Virtex UltraScale 440 — также был самой большой FPGA с 5,5 млн логических элементов.

Xilinx позиционирует Virtex VU19P в качестве решения для разработки различных однокристальных платформ (SoC) и ASIC. С помощью новинки можно эмулировать различные решения, создавать их прототипы или тестировать работоспособность. Также Virtex VU19P позволит разработчикам приступить к созданию ПО ещё до того, как сама SoC будет произведена. Помимо этого, Virtex VU19P может применяться в различных других областях, например, в качестве основы для ускорителей вычислений для ЦОД.

Новая FPGA будет производиться по 16-нм техпроцессу на мощностях компании TSMC. Он содержит 35 млрд транзисторов. Стоит отметить, что Virtex VU19P на самом деле состоит из четырёх прямоугольных кристаллов, которые соединены через интерпозер. Собственно, в этом нет ничего удивительного, ведь чип Virtex VU19P слишком большой, чтобы быть монолитным кристаллом — его площадь составляет около 900 мм2. Заметим, что самым большим 16-нм монолитным кристаллом на текущий момент является графический процессор NVIDIA V100 площадью 815 мм2.

Xilinx пока только анонсировала Virtex UltraScale+ VU19P, а выход продуктов с ним запланирован на осень будущего года.

Постоянный URL: http://servernews.ru/992831
07.08.2019 [21:05], Геннадий Детинич

Оружие победы? ― Xilinx представила FPGA-ускорители Alveo U50

Второй крупнейший игрок на рынке программируемых матриц компания Xilinx представил новые ускорители на ПЛИС модели Alveo U50. Ускорители выполнены в формфакторе PCIe-адаптеров с низким профилем и занимают на материнской плате один слот. До этого в семействе продуктов Alveo были представлены лишь двухслотовые модели, требующие дополнительного питания PCIe. Устройства построены на 16-нм чипах с архитектурой FPGA UltraScale+.

Адаптеры Xilinx Alveo U50 питаются исключительно через слот и свободны от подключения дополнительных разъёмов, что, безусловно, означает пониженное потребление и меньшую производительность. Но эти жертвы могут окупиться сполна. Ускорители Alveo U50 можно установить практически в любой сервер, где есть хоть один свободный слот PCIe. Это решение может стать массовым и оказаться тем камешком с горы, который вызовет лавину интереса к продукции Xilinx и экосистеме ИИ-платформ компании. Фактически Alveo U50 могут стать для Xilinx оружием победы, как бы громко это ни звучало.

Отказ от дополнительного питания свёл пиковое потребление адаптера Alveo U50 до 75 Вт или до номинального значения 50 Вт. Тем самым адаптер Xilinx оказался конкурентом NVIDIA Tesla T4 и предназначен для платформ ИИ с функцией принятия решений. Это могут быть как локальные (пограничные) системы, так и облачные. Компания Xilinx активно работает с облачным сервисом Amazon (AWS) и предоставляет драйверы, компиляторы и другие необходимые программные компоненты.

Интерфейс Xilinx Alveo U50 ― это PCI Express 4.0 с поддержкой спецификаций CCIX. В семействе ускорителей Alveo шину PCIe 4.0 и CCIX поддерживает только старшее решение Alveo U280. Это ещё один плюс в копилку преимуществ младшего и, как надеются в Xilinx, массового решения. Другим преимуществом стало использование в качестве бортовой памяти массива HBM2 объёмом 8 Гбайт с пропускной способностью до 460 Гбайт/с. Адаптеры U200 и U250 используют память DDR4, которая дешевле, но не так быстра.

Наконец, адаптеры Alveo U50 поддерживают протокол NVMe-oF. Это означает, что адаптер снимает с процессора задачу по обслуживанию передачи пакетов данных и обеспечивает минимальные задержки при работе с данными ― на уровне обмена с прямым подключением, хотя может находиться удалённо. Сетевой разъём у адаптера, кстати, QSFP28, который позволяет обмениваться данными со скоростью до 100 Гбит/с. Также предусмотрена модификация Alveo U50DD с двумя портами QSFP28. О цене вопроса не сообщается, но будет явно не выше цен на адаптеры NVIDIA Tesla T4.

Постоянный URL: http://servernews.ru/992007
30.07.2019 [19:31], Сергей Юртайкин

Xilinx получила рекордную выручку

Компания Xilinx, известная своими FPGA и SoC для серверного, телекоммуникационного и сетевого оборудования, опубликовала отчётность за первый квартал 2020 финансового года.

За трёхмесячный период, закрытый в конце июня 2019-го календарного, выручка Xilinx составила рекордные $849,6 млн, что на 3 % и 24 % больше показателей квартальной и годичной давности соответственно.

Чистая прибыль компании оказалась равной $241 млн. Это на 27 % больше прибыли, полученной по итогам первой четверти 2019 финансового года. Большую часть выручки (около 51 %) чипмейкер получает в Азиатско-Тихоокеанском регионе (за исключением Японии). Доли доходов в Северной Америке, Европе и Японии в прошлом квартале достигли 23 %, 18 % и 8 % соответственно.

Что касается подразделений, то наиболее доходным у Xilinx остается Wired and Wireless Group (решения для оборудования, обеспечивающего проводную и беспроводную связь). В апреле–июне 2019 года эта структура зафиксировала $350,1 млн или 41 % выручки. В подразделении A&D, Industrial and TME квартальный оборот достиг $333,5 млн, что соответствует 39 % от суммарного. Продажи решений для ЦОДов (Data Center Group) оказались равными $42,4 млн и принесли Xilinx около 5 % выручки. Наконец, объём бизнеса в подразделении Automotive, Broadcast and Consumer составил $124 млн ($15 млн). 

Xilinx специализируется на решениях FPGA, спрос на которые растёт на рынках телекоммуникационного оборудования и дата-центров. Конкуренция здесь обострилась после покупки Altera компанией Intel. На выставке SC18 Xilinx показала продукты на базе новых решений: «умные» SSD и сетевые адаптеры, ускорители для ИИ и баз данных. А весной Xilinx поглотила бывшего партнёра, компанию Solarflare Communications, которая занимается разработкой сетевых контроллеров.

Постоянный URL: http://servernews.ru/991612
Система Orphus