Материалы по тегу: плис

04.10.2018 [13:02], Геннадий Детинич

Xilinx анонсировала гибридные FPGA/SoC-ускорители для любых задач

Представленная в марте работа компании Xilinx над проектом Everest вылилась на днях в анонс новой архитектуры Versal и продуктов на её основе. Разработка решений ведётся в рамках развития новой гетерогенной платформы компании для ускорителей с поддержкой адаптивных вычислений или ACAP (Adaptive Computer Accelerator Platform). В новых ПЛИС программируемым вентилям отводится всё меньше места, тогда как ядрам ARM, DSP и ИИ-ускорителям на кристаллах выделяются всё возрастающие площади. Это уже не просто FPGA, это фактически однокристальные сборки или SoC с элементами FPGA.

Xilinx

Xilinx

Решения поколения Versal разделены в шесть продуктовых серий или семейств, каждое из которых ориентировано на свою сферу применения. Первыми в 2019 году выйдут 7-нм продукты семейств AI Core и Prime. Продукты AI Core будут использоваться в системах машинного обучения с функцией принятия решений. Продукты Prime займут нишу ускорителей расчётов в центрах по обработке данных. В последующие годы появятся серии AI Edge, AI RF, Premium и HBM, с позиционированием которых можно ознакомится по таблице ниже.

Xilinx

Xilinx

По большому счёту, новые решения Xilinx должны и будут конкурировать с гибридными решениями Intel в виде ускорителей на FPGA-матрицах бывшей компании Altera. Разница только в том, что в паре с FPGA Altera компания Intel продвигает процессоры Xeon, а Xilinx — ядра ARM. Другие составные части платформ обеих компаний — это специализированные ИИ-движки, в чём они примерно равны (у Intel — это решения Mobileye, у Xilinx — свой движок, о котором ниже). Тем самым отличия будут лежать в обслуживающих ядрах, где у ARM в заявленной нише ускорителей есть определённое преимущество. Но это не мешает Xilinx открыто противопоставлять Versal как x86-совместимым процессорам, так и актуальным графическим процессорам.

По словам Xilinx, продукты Versal в области распознавания изображений в 43 раза превосходят процессоры Intel Xeon Platinum и от двух до восьми раз опережают ускоритель NVIDIA Tesla V100, а также в пять раз производительнее ускорителя на обычной FPGA. Более того, в задачах финансового анализа, секвенции генома и в поддержке Elasticsearch продукты Versal опережают процессоры в 89, 90 и в 91 раз.

Xilinx

Xilinx

Чуть подробнее о продуктах семейства AI Core. Помимо двух ядер ARM Cortex-A72 и двух ядер ARM Cortex-R5 они будут нести 256 Кбайт встроенной памяти и свыше 1900 DSP для обслуживания вычислений с плавающей запятой. Абсолютным новшеством станет интеграция в решения новых векторных ускорителей или AI Engines. Таковых будет в чипе от 128 штук до 400 штук и все они будут связаны внутричиповой сетью network-on-chip (NoC) с пропускной способностью в несколько терабит в секунду. Внешние интерфейсы решения будут представлены PCIe Gen4 x8 и x16, CCIX, 32G SerDes и от двух до четырёх встроенных контроллеров памяти DDR4. Флагман семейства AI Core обеспечит производительность в 147 TOPs на нагрузке INT8. Для сравнения, NVIDIA Tesla T4 обеспечивает 130 INT8 TOPs.

Продукты Versal Prime будут лишены ИИ-движков и нацелены на нагрузку общего назначения, такую как обработка изображений медицинского назначения, обслуживание сетей и систем хранения данных, систем управления в авиации и тестовое коммуникационное оборудование. Вместо ИИ-ускорителей Versal Prime получат 3080 DSP и несколько большее число программируемых вентилей.

Xilinx

Xilinx

Ещё одной отличительной особенностью поддержки новых ПЛИС станет ориентация на языки программирования верхних уровней — C, C++ и Python. По мнению Xilinx, это упростит работу с новой платформой.

Постоянный URL: http://servernews.ru/976339
22.04.2016 [19:39], Алексей Степин

Микросервер Fixtars Olive умещается на ладони и имеет ёмкость 13 Тбайт

Поистине, процессу миниатюризации электроники нет конца: компания Fixstars продемонстрировала прототип экспериментального сервера под названием Olive, выполненного в форм-факторе... обыкновенного 2,5-дюймового SSD. В это пространство удалось уместить не только системную плату с процессором и прочей периферией, но и 13 Тбайт дискового пространства. Для сравнения, 10 Тбайт в классическом виде представляют собой более крупный 3,5-дюймовый жёсткий диск, хотя та же Fixstars уже демонстрировала SSD-накопители ёмкостью 13 Тбайт.

Olive действительно легко спутать с обычным SSD

Olive действительно легко спутать с обычным SSD

Olive легко поддается оптимизации под нужные пользователю задачи, поскольку базируется на технологии ПЛИС. Сфера использования таких микросерверов очень обширна, но особенно хорошо они подходят в качестве портативных сборщиков данных, в том числе, весьма объёмных, таких, как видео высокого разрешения или базы данных. Они также могут выступать в роли облачных серверов быстрого развёртывания. Трудно сказать, где 13 Тбайт пространства в таком маленьком корпусе могли бы не пригодиться. Впрочем, речи о коммерческих поставках Olive пока не идёт, хотя у устройства явно неплохие перспективы с учётом его универсальности и объёма сохраняемых данных.

На снимке внутренностей хорошо виден крупный корпус ПЛИС

Компания продолжает экспериментировать с опытными образцами, совершенствуя их, а также собирает отклики партнёров, которым были предоставлены тестовые экземпляры микросервера. Текущая версия Olive использует центральный процессор ARM Cortex-A9, имеет 512 Мбайт оперативной памяти и снабжена интерфейсом Gigabit Ethernet. В качестве операционной системы используется специализированная 32-битная версия Linux, но в планах компании создание новой версии устройства, способной работать с 64-битными приложениями. Прототип Olive был продемонстрирован на выставке NAB Show, ориентированной, в основном, на профессионалов и энтузиастов в области телевещания и киносъемки, весьма заинтересованных в росте параметров устройств хранения данных.

Постоянный URL: http://servernews.ru/931857
15.04.2016 [13:21], Алексей Степин

Intel начала поставки процессоров Xeon с интегрированными ПЛИС

На рынке супервычислений Intel находится не в самой приятной позиции: с обеих сторон поджимают NVIDIA и AMD с их «графическими» процессорами, на деле способными развивать терафлопсы, а то и десятки терафлопс вычислительной мощности. По соотношению производительности на ватт им проигрывают даже самые мощные процессоры Xeon. К счастью, у Intel есть Xeon Phi, но что более важно, компания начала интеграцию ПЛИС в свои процессоры и уже поставляет соответствующие чипы крупным клиентам. Такая возможность у процессорного гиганта появилась благодаря приобретению активов Altera стоимостью $16,7 миллиардов. Теперь компания начала пилотные поставки процессоров Xeon E5-2600 v4 в специальных вариантах, включающих в себя один из вариантов ПЛИС Altera Arria 10.

Так выглядит Xeon с интегрированной ПЛИС сейчас

Так выглядит Xeon с интегрированной ПЛИС сейчас ©nextplatform.com

Пока эти процессоры Broadwell-EP производятся по технологии мультичиповых модулей, то есть, ПЛИС монтируется на подложке отдельным кристаллом, но в будущем, как заявил представитель Intel, соответствующая функциональность будет включена непосредственно в кристалл процессора. Это позволит ускорить обмен данными между ядрами x86 и ПЛИС, а также оптимизировать уровень энергопотребления. ПЛИС, благодаря своей реконфигурируемости, является очень гибкой технологией, гораздо более гибкой, чем даже последние решения AMD и NVIDIA, которые, по сути, представляют собой просто массивы вычислительных ядер. В специализированных задачах правильно задействованные программируемые логические схемы не имеют себе равных.

Планы Intel по внедрению ПЛИС в сфере ЦОД и облачных сервисов

Планы Intel по внедрению ПЛИС в сфере ЦОД и облачных сервисов

Так, Microsoft использует их для ускорения работы поискового движка Bing, китайский гигант Baidu — для лучшего распознавания и поиска изображений. У ПЛИС есть свои недостатки, в частности, сравнительно высокий уровень энергопотребления и сложность разработки программного обеспечения. Но Intel делает ставку именно на эту технологию, намереваясь со временем внедрить программируемые логические схемы повсюду, от автомобилей и роботов до серверов, суперкомпьютеров, контроллеров «умных домов» и Интернета вещей. ПЛИС также широко используются в телекоммуникационном оборудовании, так что компания явно не упустит своего куска на рынке беспроводных сетей пятого поколения (5G), которому аналитики предсказывают взрывной рост в ближайшем будущем.

Постоянный URL: http://servernews.ru/931511
04.04.2016 [14:30], Алексей Степин

Российские разработчики представили реконфигурируемую вычислительную систему на базе ПЛИС

Микросхемы ПЛИС (FPGA) являются уникальными по многим параметрам; чего стоит одна возможность программной реконфигурации внутренней схемотехники такого чипа. Причём реконфигурации под требуемую задачу, а ведь известно, что узкоспециализированные чипы решают определённого рода задачи в разы, а то и на порядки быстрее процессоров общего назначения. Нет никакой проблемы превратить ПЛИС, к примеру, в процессор цифровой обработки сигналов или даже эмулировать на ней архитектуру другого процессора, что иногда делают энтузиасты, создающие клоны любимых ретро-консолей и систем типа Amiga. Это было возможно даже на старых поколениях ПЛИС, новые же чипы этого типа представляют собой настоящих монстров производительности. Интерес к ним со стороны разработчиков суперкомпьютеров вполне логичен.

НИИ МВС и НИЦ супер-ЭВМ и нейрокомпьютеров

НИИ МВС и НИЦ супер-ЭВМ и нейрокомпьютеров

Ни для кого не секрет, что Российская Федерация нуждается в вычислительных мощностях, как и любое другое крупное государство, имеющее стратегическое влияние на высшем уровне. А в определённых отраслях нужна не просто вычислительная мощность, а мощность, максимально защищённая от атак изнутри — разработанная и проверенная собственными силами и лишённая каких-либо вредоносных «закладок». Хотя тема «закладок» и отдаёт порой изрядной параноидальностью, есть сферы, где лучше лишний раз убедиться в безопасности всего электронного оборудования. Все помят историю с вирусом Stuxnet, полностью парализовавшим иранское производство ядерного топлива и впоследствии обнаруженным даже в системах одной из российских АЭС и на компьютерах международной космической станции. Понемногу эта область вычислительной техники в России развивается: в частности, существует неплохой двухъядерный процессор Байкал-Т1 (28 нм) и более серьёзный восьмиядерный Эльбрус-8С (1,3 ГГц, 4 Мбайт L2, 16 Мбайт L, 250 Гфлопс).

Основа суперкомпьютеров и вычислительных модулей нового поколения

Основа суперкомпьютеров и вычислительных модулей нового поколения

Это процессоры общего назначения; они, несомненно, будут востребованы и найдут своё место в оборонной, аэрокосмической и научной отраслях. Но ведутся исследования и в других направлениях, связанных с вычислительной техникой. В частности, на конференции ПаВТ 2016 НИИ МВС Южного федерального университета (г. Таганрог) и Научно-исследовательский центр супер-ЭВМ и нейрокомпьютеров представили уникальную реконфигурируемую вычислительную систему на основе ПЛИС Virtex UltraScale с жидкостным охлаждением. Последний факт не удивляет: в последнее время владельцы крупных ЦОД и суперкомпьютеров по всему миру активно интересуются темой жидкостного охлаждения и внедряют соответствующие системы, как более выгодные и надёжные в эксплуатации.

Модули с воздушным охлаждением: «Плеяда» (слева) и «Тайгета»

Модули с воздушным охлаждением: «Плеяда» (слева) и «Тайгета»

Интересно, что в качестве хладагента используются не дорогостоящие высокомолекулярные составы, выпускаемые компанией 3M и ставящие отечественные системы с СЖО в зависимость от этой компании, а специальное маловязкое масло МД-4,5, обладающее подходящими параметрами, в частности, высокой теплоёмкостью на уровне 1,666 кДж/(кг·К) и низким коэффициентом объёмного расширения. Вполне на уровне и электрические характеристики: электрическая прочность 280 МВ/м и удельное сопротивление 2,2×1012 Ом. Стоит эта жидкость примерно $15 за килограмм и производится на предприятиях НПЦ Спецнефтьпродукт. Ещё один плюс к автономности и независимости от зарубежных источников. Вероятно, к ней стоит присмотреться и энтузиастам-оверклокерам, особенно тем, кто любит эксперименты.

Конструкция погружной СЖО довольно проста

Конструкция погружной СЖО довольно проста

Сами ПЛИС, разумеется, производятся Xilinx, поскольку освоение такой технологии своими силами — дело не одного года: современные ПЛИС являются чрезвычайно комплексными устройствами и расходы на их разработку (R&D) могут быть весьма солидными, а кроме того, при желании полной автономности производства потребуется постройка соответствующих фабрик, что тоже обойдётся весьма недёшево. Как показали предыдущие эксперименты с модулями «Плеяда» РВС-7 и «Тайгета» с пиковой производительностью на стойку 62 и 43‒53 терафлопса, высокая плотность компоновки модулей и плат с установленными на них микросхемами Virtex-6 или Virtex-7 подтвердили кризис систем воздушного охлаждения при высокой плотности упаковки чипов в малоразмерных корпусах. Температура ПЛИС в модуле «Тайгета» составила 72,9 градуса при допустимом диапазоне 65‒70 градусов, а модуль на базе более сложных чипов UltraScale и вовсе продемонстрировал 85 градусов, что уже угрожало работоспособности ПЛИС.

Вся хитрость —  в правильной подаче хладагента

Вся хитрость —  в правильной подаче хладагента

В итоге была разработана новая компоновка вычислительных ПЛИС-модулей, изначально рассчитанная на применение жидкостного охлаждения с помощью промышленных холодильных установок (чиллеров), тепловой поток к которым должны передавать специальные теплообменники, установленные в каждом модуле. За стандарт был взят форм-фактор шасси высотой 3U для установки в стандартные 19-дюймовые шкафы с расчётом не менее 12 модулей на шкаф. При этом каждый модуль несёт в себе от 12 до 16 плат с 8 ПЛИС, каждая из которых генерирует тепловой поток 100 ватт. Конструкция модуля делится на 2 зоны — вычислительную и теплообменную. В последней установлен автономный циркуляционный насос и высокоэффективный пластинчатый теплообменник, подключаемый к общей чиллер-системе, а также краны на случай аварии или необходимости замены модуля.

Испытательный стенд теплового макета

Испытательный стенд теплового макета

Вычислительная секция состоит из 12 плат ПВМ, трёх модулей питания, модулей загрузки и управления, платы индикации, а также кросс-платы питания, загрузки. Как уже было сказано, каждая плата вычислительного модуля несёт на себе 8 ПЛИС Kintex UltraScale XCKU095. Это предпоследняя модель в серии 20-нанометровых ПЛИС Kintex, содержащая в себе 1176 логических ячеек, 768 частей DSP, 59,1 Мбайт блочной памяти, 64 трансивера со скоростью передачи данных 16,3 Гбит/с и располагающая 702 линиями ввода/вывода. Кроме ПЛИС на плате содержится оперативная память, флеш-память для загрузки, тактовый генератор с необходимой обвязкой и преобразователи подсистемы питания. Не вполне понятно, почему разработчики выбрали стандарт 12 вольт. Они не были привязаны к существующей инфраструктуре и вполне могли позволить себе эксперименты с более высокими напряжениями, например, 48 вольт — именно этим сейчас занимаются Intel и Google.

Компоновка вычислительного модуля

Компоновка вычислительного модуля

Любопытно, что в модуле загрузки и управления не обошлось без Intel: в нём может быть установлен любой процессор семейства Broadwell-U, соединённый с ПЛИС Xilinx седьмой серии, которая, в свою очередь, уже общается с остальными платами посредством интерфейсов LVDS/MGT и RS-422. Эта же микросхема отвечает за индикацию и управление насосной группой СЖО. Типовой модуль питания предназначен для подключения к сетям с напряжением 380 вольт и имеет четыре выходных канала по 12 вольт с нагрузочной способностью 80 ампер на канал. Вся вычислительная зона является герметичной, поскольку используется погружная концепция СЖО, не требующая установки теплообменника на каждый греющийся элемент. Такая система содержит меньше соединительных элементов, требующих герметичности, проще в обслуживании и в целом надёжнее, хотя её эксплуатация и сопряжена с некоторыми неудобствами: не слишком-то приятно вынимать из ремонтируемого модуля платы, покрытые слоем охлаждающего масла.

Компоновка модуля управления

Компоновка модуля управления

Второй, общий контур системы охлаждения является водяным. Применение эффективных теплообменников позволило добиться ситуации, когда даже под нагрузкой средняя температура корпуса ПЛИС составила от 50,3 до 52,6 градусов в зависимости от модели. Температура хладагента при этом не поднималась выше 19,3 градусов. Таким образом, прототип нового вычислительного модуля был успешно испытан и проведённые эксперименты доказали, что погружная система охлаждения работоспособна и в состоянии отвести до 12 киловатт тепла. Блоки питания тоже не подкачали и смогли обеспечить эффективность до 89 %. Похоже, им смело можно присваивать сертификат не ниже 80 PLUS Silver. Также доказали свою эффективность при обмене данными между ПЛИС интегрированные в них высокоскоростные трансиверы последнего поколения: в пределах модуля проблемы «бутылочного горлышка» не наблюдалось.

Образец модуля «Скат». Хорошо видны особенности системы охлаждения

Образец модуля «Скат». Хорошо видны особенности системы охлаждения

Новый вычислительный модуль получил название «Скат». Хотя внешне он выглядит абсолютно непримечательно — как обычный серверный корпус формата 3U, внутри расположена высокоэффективная жидкостная система охлаждения погружного типа, обеспечивающая гидравлический «обдув» важных компонентов. При полной компоновке с использованием шкафа 47U 12 модулей «Скат» могут обеспечить пиковую производительность на уровне 1 петафлопса при общей потребляемой мощности 154 киловатта. Для сравнения, суперкомпьютер IBM Roadrunner, введённый в строй в 2008 году при сопоставимой вычислительной производительности занимает площадь около 1100 квадратных метров, весит 226 тонн и потребляет 3,9 мегаватта электроэнергии. Отечественный «Ломоносов» при пиковой мощности 1,7 петафлопс занимает 252 квадратных метра и потребляет 2,8 мегаватта электроэнергии. Преимущества архитектуры «Скат», таким образом, очевидны.

Стандарный вычислительный узел с 12 модулями «Скат»

Стандартный вычислительный узел с 12 модулями «Скат»

Использование единой холодильной системы легко позволяет собирать из таких шкафов вычислительную систему любой необходимой мощности. Тут возникает вопрос «бутылочного горлышка» при обмене данными между шкафами, но эта проблема, вероятно уже решена разработчиками и соответствующие интерфейсы (100GbE или 290GbE EDR Infiniband) входят в состав системы. Конечно, новые суперкомпьютерные модули используют ПЛИС зарубежного производства, но доля вложенного в их проектирование и отладку труда столь велика, что их вполне можно считать отечественными. «Скат» вполне можно считать одной из самых удачных разработок в мире реконфигурируемых суперкомпьютеров; во всяком случае в этой конструкции, достигнута непревзойдённая плотность упаковки вычислительных узлов и высочайшая эффективность охлаждения. Вполне возможно, что именно за ПЛИС-системами — будущее супервычислений: никакая другая архитектура не может предложить сравнимого уровня гибкости конфигурации. Системы, разработанные в НИИ МВС, уже используются в ряде ведомств РФ.

Постоянный URL: http://servernews.ru/930949
27.04.2012 [10:04], SN Team

Achronix рассказала о сетевых ПЛИС Speedster22i

Как известно, Intel тяготеет к контрактному производству программируемых логических интегральных схем (ПЛИС) для сторонних разработчиков. Одним из заказчиков компании из Санта-Клары выступает Achronix, которая рассчитывает приспособить 22 нм технологические нормы для выпуска микросхем Speedster22i. Подробности о решении разработчик опубликовал в начале недели.

Итак, ПЛИС Speedster22i рассчитана на применение в сетевом оборудовании, соответствующем стандартами 10/40/100 Gigabit Ethernet. Помимо прочего, микросхема обладает поддержкой интерфейса PCI Express 3.0 и встроенным контроллером памяти DDR3-2133. Продукты Speedster22i, как утверждается, потребляют на 50% меньше электроэнергии и работают на 40% быстрее, нежели конкурирующие решения, производимые по 28 нм технологии. Решение выпускается в двух версиях: с префиксом HD (высокая плотность) или HP (высокое быстродействие).

Изделия первой категории будут существовать в четырёх модификациях, самая крупная из которых обладает 1,1 миллиона таблиц поиска и 144 Мбит оперативной памяти, которая располагается непосредственно на кристалле микросхемы. Данные решения позиционируются для использования в коммутаторах и сетевых мостах, где требуется высокая пропускная способность.

ПЛИС второго типа работают на частоте вплоть до 1,5 ГГц, а самая большая микросхема насчитывает 250 тысяч таблиц поиска и 64 Мбит оперативной памяти. Изделия HP поддерживают механизмы самосинхронизирующейся памяти и предназначены для оборудования, интенсивно обрабатывающего потоковые данные.

Поставки первых ПЛИС Speedster22i начнутся в третьем квартале 2012 года, однако полный ассортимент решений будет представлен только в начале 2013 года.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/595799
23.08.2011 [17:28], SN Team

XPedite2300 - универсальный коммуникационный модуль на основе ПЛИС

Компания Extreme Engineering Solutions представила новую версию приёмопередающих модулей XPedite2300, которые основаны на решении Xilinx Virtex-6. XPedite2300 станет частью высокопроизводительной серии реконфигурируемых вентильных матриц.

 

 

Для управления модулем используются IP-блоки и специальное программное обеспечение. Все IP-блоки, для простоты установки, объединены в стандартный интерфейс AXI4, также шина AXI4 упрощает интеграцию нескольких виртуальных модулей от различных поставщиков и разработчиков. Она оптимизирована по пропускной способности, быстродействию и латентной задержке. Поскольку в Virtex-6 поддержка шины реализована на аппаратном уровне,  обеспечивается высокое быстродействие и малое энергопотребление. Блоки данных, передаваемые через AXI4, могут быть расщеплены, объединены, дополнены, урезаны, переставлены в процессе передачи. Модуль XPedite2300 может предложить следующее:

  • ПЛИС Virtex-6 LX130T, LX195T, LX240T, LX365T, SX315T, или SX475T;
  • в зависимости от конфигурации воздушное или пассивное охлаждение;
  • до 1 Гбайт двухканальной памяти DDR3 (512 Мбайт на канал);
  • буфер флеш-памяти объёмом 128 Мбайт;
  • 180-контактный разъём для организации моста из пары карт расширения XPedite2300;
  • 40-контактный разъём для подключения дополнительных интерфейсных модулей;
  • интерфейс PCI Express x8.

XPedite2300 может быть сконфигурирован для приёма и передачи данных через нестандартные каналы связи (или для ретрансляции данных между разнородными соединениями) и удовлетворит потребности любого ресурсоёмкого приложения.

Источник:

Постоянный URL: http://servernews.ru/594946
Система Orphus