Материалы по тегу: плис

18.10.2019 [10:11], Алексей Степин

Плата Tang Nano несёт на борту ПЛИС и стоит всего $5

Компания Lichee, ранее нацеленная на выпуск недорогих средств для разработки под архитектуру RISC-V, сменила имя и выпустила новый продукт. Теперь компания называется Sipeed, а представила она миру плату Tang Nano стоимостью всего $5.

Несмотря на цену, это достаточно интересное устройство, построенное на базе ПЛИС Gowin GW1N-1-LV.

Микросхема, относящаяся к семейству Little Bee, достаточно серьёзна по своим возможностям, несмотря на крошечные габариты. Она имеет 864 логических блока, таблицу LUT4 объёмом 1152 записи, 8 Мбайт системной памяти PSRAM и DSP-блоки.

На плате предусмотрен стандартный 40-контактный разъём для подключения экранов LCD RGB, имеется порт USB Type-C и 34 порта ввода/вывода.

Питается Tang Nano от порта USB, габариты платы составляют всего 58,4×21,3×4,8 миллиметра. Для разработки ПО предлагается среда GOWIN IDE, но, к сожалению, пока основной объём информации не переведён даже на английский язык.

Стоит новинка действительно $5, за $18 можно заказать плату в комплекте с 5″ цветным экраном. При столь низких ценах Tang Nano может являться удобным источником для «модов», подобных тем, что описаны в недавней заметке, посвящённой аппаратному взлому.

Постоянный URL: http://servernews.ru/995776
06.10.2019 [13:39], Алексей Степин

Единая программная платформа Xilinx Vitis упростит жизнь FPGA-разработчиков

В ходе мероприятия Xilinx Developer Forum 2019 компания объявила о запуске новой единой программной платформы Vitis. Это весьма важный шаг, поскольку решения на основе ПЛИС сильно зависят от программной части, и наличие доступного унифицированного комплекса ПО позволит привлечь новых разработчиков к работе с решениями Xilinx, сделав их, таким образом, более массовыми и доступными широкой публике. 

О масштабности проекта говорит то, что платформу Vitis уже успели назвать «Xilinx’s CUDA». Все, вероятно, помнят, что именно инициатива CUDA позволила в своё время NVIDIA агрессивно выйти на рынок ускорителей вычислений (GPGPU).

Широко доступной Xilinx Vitis должна стать в начале ноября. Что немаловажно, платформа станет бесплатной и не будет содержать зашифрованных бинарных файлов. В мире ПЛИС такой подход является большой редкостью — обычно создатели сопровождают их весьма дорогостоящими средствами разработки.

Доступность и открытость Vitis должны помочь Xilinx в конкуренции на рынке ускорителей вычислений и систем искусственного интеллекта. Как известно, ПЛИС способны на многое: в ряде специализированных задач они демонстрируют результаты не хуже специализированных ускорителей, но при этом являются куда более гибким решением.

В предварительном докладе Xilinx отметила ряд ключевых особенностей Vitis. Так, было заявлено, что новая платформа послужила точкой объединения пяти различных сред разработки, существовавших до этого в виде отдельных продуктов. Такую унификацию, наверняка, по достоинству оценят разработчики соответствующих решений на базе ПЛИС разработки и производства Xilinx.

Более всего, по мнению компании, от внедрения Vitis должны выиграть создатели систем и платформ машинного обучения. Как было отмечено в докладе, сегодня новые продвинутые модели машинного обучения появляются каждый квартал, и самые актуальные модели ускорителей на базе GPU не поспевают за этой тенденцией. В то же время ускорители на базе ПЛИС могут быть просто переконфигурированы с учётом особенностей новейшего ПО.

Если верить заявлениям Xilinx, в настоящее время в разработке находится 2024 модели автономных транспортных средств, «мозгом» которых были избраны решения Xilinx именно в силу их гибкости и способности к переконфигурации буквально «на лету». Платформа Vitis придётся здесь как нельзя более к месту, так как она совместима с популярными инструментами для машинного обучения: TensorFlow, Caffe и PyTorch.

Vitis позволит разработчикам не беспокоиться о низкоуровневых драйверах и распределении памяти, а пользоваться вместо этого привычными средами разработки и концентрировать свои усилия на решении действительно важных задач. В настоящее время Xilinx продолжает пополнять базы открытого программного кода, публикуя новые библиотеки, примеры и документацию для платформы Vitis. Также компания запустила в тестовом режиме новый портал для разработчиков.

Целью Xilinx, как уже было отмечено, является упрощение доступа разработчиков ко всем богатейшим возможностям, которые могут предоставить микросхемы с программируемой логикой. Помимо новой программной платформы компания обещает ускорить поставки комплектов разработчика на базе новейших ПЛИС: ACAP Versal и Alveo. С учётом нацеленности Xilinx на открытость и бесплатность программных решений новые инициативы компании можно лишь приветствовать.

Постоянный URL: http://servernews.ru/995128
22.08.2019 [06:42], Андрей Созинов

Xilinx Virtex UltraScale+ VU19P: самая большая в мире FPGA с 9 млн логических элементов

Компания Xilinx анонсировала Virtex UltraScale+ VU19P — самую большую программируемую логическую интегральную схему (вентильную матрицу) FPGA, которая содержит в себе 9 миллионов логических элементов.

Помимо 9 млн логических элементов, Virtex VU19P имеет восемь каналов для подключения оперативной памяти DDR4 с общей пропускной способностью 1,5 Тбит/с, восемьдесят приёмопередатчиков с пропускной способностью 4,5 Тбит/с, а также 2072 входов-выходов GPIO. Заметим, что предшественник новинки — Virtex UltraScale 440 — также был самой большой FPGA с 5,5 млн логических элементов.

Xilinx позиционирует Virtex VU19P в качестве решения для разработки различных однокристальных платформ (SoC) и ASIC. С помощью новинки можно эмулировать различные решения, создавать их прототипы или тестировать работоспособность. Также Virtex VU19P позволит разработчикам приступить к созданию ПО ещё до того, как сама SoC будет произведена. Помимо этого, Virtex VU19P может применяться в различных других областях, например, в качестве основы для ускорителей вычислений для ЦОД.

Новая FPGA будет производиться по 16-нм техпроцессу на мощностях компании TSMC. Он содержит 35 млрд транзисторов. Стоит отметить, что Virtex VU19P на самом деле состоит из четырёх прямоугольных кристаллов, которые соединены через интерпозер. Собственно, в этом нет ничего удивительного, ведь чип Virtex VU19P слишком большой, чтобы быть монолитным кристаллом — его площадь составляет около 900 мм2. Заметим, что самым большим 16-нм монолитным кристаллом на текущий момент является графический процессор NVIDIA V100 площадью 815 мм2.

Xilinx пока только анонсировала Virtex UltraScale+ VU19P, а выход продуктов с ним запланирован на осень будущего года.

Постоянный URL: http://servernews.ru/992831
07.08.2019 [21:05], Геннадий Детинич

Оружие победы? ― Xilinx представила FPGA-ускорители Alveo U50

Второй крупнейший игрок на рынке программируемых матриц компания Xilinx представил новые ускорители на ПЛИС модели Alveo U50. Ускорители выполнены в формфакторе PCIe-адаптеров с низким профилем и занимают на материнской плате один слот. До этого в семействе продуктов Alveo были представлены лишь двухслотовые модели, требующие дополнительного питания PCIe. Устройства построены на 16-нм чипах с архитектурой FPGA UltraScale+.

Адаптеры Xilinx Alveo U50 питаются исключительно через слот и свободны от подключения дополнительных разъёмов, что, безусловно, означает пониженное потребление и меньшую производительность. Но эти жертвы могут окупиться сполна. Ускорители Alveo U50 можно установить практически в любой сервер, где есть хоть один свободный слот PCIe. Это решение может стать массовым и оказаться тем камешком с горы, который вызовет лавину интереса к продукции Xilinx и экосистеме ИИ-платформ компании. Фактически Alveo U50 могут стать для Xilinx оружием победы, как бы громко это ни звучало.

Отказ от дополнительного питания свёл пиковое потребление адаптера Alveo U50 до 75 Вт или до номинального значения 50 Вт. Тем самым адаптер Xilinx оказался конкурентом NVIDIA Tesla T4 и предназначен для платформ ИИ с функцией принятия решений. Это могут быть как локальные (пограничные) системы, так и облачные. Компания Xilinx активно работает с облачным сервисом Amazon (AWS) и предоставляет драйверы, компиляторы и другие необходимые программные компоненты.

Интерфейс Xilinx Alveo U50 ― это PCI Express 4.0 с поддержкой спецификаций CCIX. В семействе ускорителей Alveo шину PCIe 4.0 и CCIX поддерживает только старшее решение Alveo U280. Это ещё один плюс в копилку преимуществ младшего и, как надеются в Xilinx, массового решения. Другим преимуществом стало использование в качестве бортовой памяти массива HBM2 объёмом 8 Гбайт с пропускной способностью до 460 Гбайт/с. Адаптеры U200 и U250 используют память DDR4, которая дешевле, но не так быстра.

Наконец, адаптеры Alveo U50 поддерживают протокол NVMe-oF. Это означает, что адаптер снимает с процессора задачу по обслуживанию передачи пакетов данных и обеспечивает минимальные задержки при работе с данными ― на уровне обмена с прямым подключением, хотя может находиться удалённо. Сетевой разъём у адаптера, кстати, QSFP28, который позволяет обмениваться данными со скоростью до 100 Гбит/с. Также предусмотрена модификация Alveo U50DD с двумя портами QSFP28. О цене вопроса не сообщается, но будет явно не выше цен на адаптеры NVIDIA Tesla T4.

Постоянный URL: http://servernews.ru/992007
24.07.2019 [19:19], Геннадий Детинич

FPGA Intel Agilex обрастают подробностями и готовятся к выходу

Совсем скоро ― ещё до окончания сентября ― компания Intel начнёт коммерческие поставки нескольких семейств новых 10-нм ПЛИС Agilex. Часть из этих матриц с ядрами ARM Cortex-A53 уже поддерживаются ядром Linux 5.2, вышедшем в десятых числах июля. Новинки представлены в трёх семействах: F, I и M.

Матрицы Agilex F-Series FPGA нацелены на широкий спектр задач в составе сетевых устройств, пограничных (edge) платформ и ЦОД. Сильной стороной этих решений станут четыре интегрированных ядра ARM Cortex-A53, упрощающих работу с устройством. 

Матрицы Agilex I-Series оптимизированы для работы с высокоскоростными процессорными интерфейсами, в частности, с шиной Compute Express Link на основе физического уровня PCIe 5.0. Они смогут работать с процессорами Intel Xeon в когерентном режиме, обслуживая с минимальными задержками вычисления высокой интенсивности.

Третье семейство ПЛИС в лице Agilex M-Series также поддерживает когерентность и оптимизировано для интенсивных расчётов + имеет поддержку памяти HBM, DDR5-4400 и Intel Optane DCPMM.

Модельный ряд матриц Intel Agilex F-series SoC FPGA состоит из семи представителей. Ключевые характеристики семейства включают четыре 64-бит ядра ARM Cortex-A53 с частотами до 1,5 ГГц с 32 Кбайт кешем для данных и адресов, сопроцессор NEON, 1 Мбайт кеш-памяти L2, поддержку DMA (прямого доступа к памяти), блок управления системной памятью, блок согласования кешей, контроллер памяти, 2 USB 2.0, 3 Gigabit EMAC, 2x UART x2, 4x SPI, 5x I2C, 7 таймеров общего назначения, 4 контрольных таймера (слежения).

Матрицы поддерживают память DDR4-3200, QDR IV и RLDRAM 3. Блок FPGA содержит от 392 тыс. до 2,292 млн логических элементов. Расчёты с одинарной точностью Intel Agilex F-series могут выполнять с производительностью от 1,7 до 11,8 терафлопс.

Intel Agilex F-series SoC FPGA поддерживает SerDes-интерфейсы 58 Гбит/с. Шина PCI Express может быть представлена либо блоком с поддержкой PCIe 4.0 x16, либо двумя PCIe 4.0 x8, либо четырьмя PCIe 4.0 x4. Блоков с шиной Ethernet с поддержкой 10/25/50/100/200/400G Ethernet MAC + FEC может быть от двух до четырёх.

Матрицы Intel Agilex I-series SoC FPGA пока представлены только в двух вариантах. Каждая из них включает по четыре 64-битных ядра ARM Cortex-A53 с частотами до 1,5 ГГц. Основной состав Intel Agilex I-series такой же, как Intel Agilex F-series. Исключение ― программируемых вентилей больше: от 2,2 млн до 2,692 млн. Производительность вычислений с одинарной точностью лежит в диапазоне от 9,4 до 11,8 Тфлопс. Матрицы Intel Agilex I оснащены SerDes-интерфейсом со скоростью 112 Гбит/с. Также к блоку контроллера PCIe 4.0 x16 (x8 или x4) добавлен блок контроллера PCIe 5.0 в аналогичных конфигурациях (x16, x8 или  x4).

Agilex M-Series SoC FPGA отличаются от I-series увеличенным числом вентилей — минимум 3 млн. Точных данных об особенностях этого семейства пока нет. Отмечается лишь производительность на уровне 40 Тфлопс для расчётов FP16 и bfloat16. Также говорится о поддержке до четырёх сетевых интерфейсов 400 GbE или восьми 200 GbE. 

Постоянный URL: http://servernews.ru/991264
04.10.2018 [13:02], Геннадий Детинич

Xilinx анонсировала гибридные FPGA/SoC-ускорители для любых задач

Представленная в марте работа компании Xilinx над проектом Everest вылилась на днях в анонс новой архитектуры Versal и продуктов на её основе. Разработка решений ведётся в рамках развития новой гетерогенной платформы компании для ускорителей с поддержкой адаптивных вычислений или ACAP (Adaptive Computer Accelerator Platform). В новых ПЛИС программируемым вентилям отводится всё меньше места, тогда как ядрам ARM, DSP и ИИ-ускорителям на кристаллах выделяются всё возрастающие площади. Это уже не просто FPGA, это фактически однокристальные сборки или SoC с элементами FPGA.

Xilinx

Xilinx

Решения поколения Versal разделены в шесть продуктовых серий или семейств, каждое из которых ориентировано на свою сферу применения. Первыми в 2019 году выйдут 7-нм продукты семейств AI Core и Prime. Продукты AI Core будут использоваться в системах машинного обучения с функцией принятия решений. Продукты Prime займут нишу ускорителей расчётов в центрах по обработке данных. В последующие годы появятся серии AI Edge, AI RF, Premium и HBM, с позиционированием которых можно ознакомится по таблице ниже.

Xilinx

Xilinx

По большому счёту, новые решения Xilinx должны и будут конкурировать с гибридными решениями Intel в виде ускорителей на FPGA-матрицах бывшей компании Altera. Разница только в том, что в паре с FPGA Altera компания Intel продвигает процессоры Xeon, а Xilinx — ядра ARM. Другие составные части платформ обеих компаний — это специализированные ИИ-движки, в чём они примерно равны (у Intel — это решения Mobileye, у Xilinx — свой движок, о котором ниже). Тем самым отличия будут лежать в обслуживающих ядрах, где у ARM в заявленной нише ускорителей есть определённое преимущество. Но это не мешает Xilinx открыто противопоставлять Versal как x86-совместимым процессорам, так и актуальным графическим процессорам.

По словам Xilinx, продукты Versal в области распознавания изображений в 43 раза превосходят процессоры Intel Xeon Platinum и от двух до восьми раз опережают ускоритель NVIDIA Tesla V100, а также в пять раз производительнее ускорителя на обычной FPGA. Более того, в задачах финансового анализа, секвенции генома и в поддержке Elasticsearch продукты Versal опережают процессоры в 89, 90 и в 91 раз.

Xilinx

Xilinx

Чуть подробнее о продуктах семейства AI Core. Помимо двух ядер ARM Cortex-A72 и двух ядер ARM Cortex-R5 они будут нести 256 Кбайт встроенной памяти и свыше 1900 DSP для обслуживания вычислений с плавающей запятой. Абсолютным новшеством станет интеграция в решения новых векторных ускорителей или AI Engines. Таковых будет в чипе от 128 штук до 400 штук и все они будут связаны внутричиповой сетью network-on-chip (NoC) с пропускной способностью в несколько терабит в секунду. Внешние интерфейсы решения будут представлены PCIe Gen4 x8 и x16, CCIX, 32G SerDes и от двух до четырёх встроенных контроллеров памяти DDR4. Флагман семейства AI Core обеспечит производительность в 147 TOPs на нагрузке INT8. Для сравнения, NVIDIA Tesla T4 обеспечивает 130 INT8 TOPs.

Продукты Versal Prime будут лишены ИИ-движков и нацелены на нагрузку общего назначения, такую как обработка изображений медицинского назначения, обслуживание сетей и систем хранения данных, систем управления в авиации и тестовое коммуникационное оборудование. Вместо ИИ-ускорителей Versal Prime получат 3080 DSP и несколько большее число программируемых вентилей.

Xilinx

Xilinx

Ещё одной отличительной особенностью поддержки новых ПЛИС станет ориентация на языки программирования верхних уровней — C, C++ и Python. По мнению Xilinx, это упростит работу с новой платформой.

Постоянный URL: http://servernews.ru/976339
22.04.2016 [19:39], Алексей Степин

Микросервер Fixtars Olive умещается на ладони и имеет ёмкость 13 Тбайт

Поистине, процессу миниатюризации электроники нет конца: компания Fixstars продемонстрировала прототип экспериментального сервера под названием Olive, выполненного в форм-факторе... обыкновенного 2,5-дюймового SSD. В это пространство удалось уместить не только системную плату с процессором и прочей периферией, но и 13 Тбайт дискового пространства. Для сравнения, 10 Тбайт в классическом виде представляют собой более крупный 3,5-дюймовый жёсткий диск, хотя та же Fixstars уже демонстрировала SSD-накопители ёмкостью 13 Тбайт.

Olive действительно легко спутать с обычным SSD

Olive действительно легко спутать с обычным SSD

Olive легко поддается оптимизации под нужные пользователю задачи, поскольку базируется на технологии ПЛИС. Сфера использования таких микросерверов очень обширна, но особенно хорошо они подходят в качестве портативных сборщиков данных, в том числе, весьма объёмных, таких, как видео высокого разрешения или базы данных. Они также могут выступать в роли облачных серверов быстрого развёртывания. Трудно сказать, где 13 Тбайт пространства в таком маленьком корпусе могли бы не пригодиться. Впрочем, речи о коммерческих поставках Olive пока не идёт, хотя у устройства явно неплохие перспективы с учётом его универсальности и объёма сохраняемых данных.

На снимке внутренностей хорошо виден крупный корпус ПЛИС

Компания продолжает экспериментировать с опытными образцами, совершенствуя их, а также собирает отклики партнёров, которым были предоставлены тестовые экземпляры микросервера. Текущая версия Olive использует центральный процессор ARM Cortex-A9, имеет 512 Мбайт оперативной памяти и снабжена интерфейсом Gigabit Ethernet. В качестве операционной системы используется специализированная 32-битная версия Linux, но в планах компании создание новой версии устройства, способной работать с 64-битными приложениями. Прототип Olive был продемонстрирован на выставке NAB Show, ориентированной, в основном, на профессионалов и энтузиастов в области телевещания и киносъемки, весьма заинтересованных в росте параметров устройств хранения данных.

Постоянный URL: http://servernews.ru/931857
15.04.2016 [13:21], Алексей Степин

Intel начала поставки процессоров Xeon с интегрированными ПЛИС

На рынке супервычислений Intel находится не в самой приятной позиции: с обеих сторон поджимают NVIDIA и AMD с их «графическими» процессорами, на деле способными развивать терафлопсы, а то и десятки терафлопс вычислительной мощности. По соотношению производительности на ватт им проигрывают даже самые мощные процессоры Xeon. К счастью, у Intel есть Xeon Phi, но что более важно, компания начала интеграцию ПЛИС в свои процессоры и уже поставляет соответствующие чипы крупным клиентам. Такая возможность у процессорного гиганта появилась благодаря приобретению активов Altera стоимостью $16,7 миллиардов. Теперь компания начала пилотные поставки процессоров Xeon E5-2600 v4 в специальных вариантах, включающих в себя один из вариантов ПЛИС Altera Arria 10.

Так выглядит Xeon с интегрированной ПЛИС сейчас

Так выглядит Xeon с интегрированной ПЛИС сейчас ©nextplatform.com

Пока эти процессоры Broadwell-EP производятся по технологии мультичиповых модулей, то есть, ПЛИС монтируется на подложке отдельным кристаллом, но в будущем, как заявил представитель Intel, соответствующая функциональность будет включена непосредственно в кристалл процессора. Это позволит ускорить обмен данными между ядрами x86 и ПЛИС, а также оптимизировать уровень энергопотребления. ПЛИС, благодаря своей реконфигурируемости, является очень гибкой технологией, гораздо более гибкой, чем даже последние решения AMD и NVIDIA, которые, по сути, представляют собой просто массивы вычислительных ядер. В специализированных задачах правильно задействованные программируемые логические схемы не имеют себе равных.

Планы Intel по внедрению ПЛИС в сфере ЦОД и облачных сервисов

Планы Intel по внедрению ПЛИС в сфере ЦОД и облачных сервисов

Так, Microsoft использует их для ускорения работы поискового движка Bing, китайский гигант Baidu — для лучшего распознавания и поиска изображений. У ПЛИС есть свои недостатки, в частности, сравнительно высокий уровень энергопотребления и сложность разработки программного обеспечения. Но Intel делает ставку именно на эту технологию, намереваясь со временем внедрить программируемые логические схемы повсюду, от автомобилей и роботов до серверов, суперкомпьютеров, контроллеров «умных домов» и Интернета вещей. ПЛИС также широко используются в телекоммуникационном оборудовании, так что компания явно не упустит своего куска на рынке беспроводных сетей пятого поколения (5G), которому аналитики предсказывают взрывной рост в ближайшем будущем.

Постоянный URL: http://servernews.ru/931511
04.04.2016 [14:30], Алексей Степин

Российские разработчики представили реконфигурируемую вычислительную систему на базе ПЛИС

Микросхемы ПЛИС (FPGA) являются уникальными по многим параметрам; чего стоит одна возможность программной реконфигурации внутренней схемотехники такого чипа. Причём реконфигурации под требуемую задачу, а ведь известно, что узкоспециализированные чипы решают определённого рода задачи в разы, а то и на порядки быстрее процессоров общего назначения. Нет никакой проблемы превратить ПЛИС, к примеру, в процессор цифровой обработки сигналов или даже эмулировать на ней архитектуру другого процессора, что иногда делают энтузиасты, создающие клоны любимых ретро-консолей и систем типа Amiga. Это было возможно даже на старых поколениях ПЛИС, новые же чипы этого типа представляют собой настоящих монстров производительности. Интерес к ним со стороны разработчиков суперкомпьютеров вполне логичен.

НИИ МВС и НИЦ супер-ЭВМ и нейрокомпьютеров

НИИ МВС и НИЦ супер-ЭВМ и нейрокомпьютеров

Ни для кого не секрет, что Российская Федерация нуждается в вычислительных мощностях, как и любое другое крупное государство, имеющее стратегическое влияние на высшем уровне. А в определённых отраслях нужна не просто вычислительная мощность, а мощность, максимально защищённая от атак изнутри — разработанная и проверенная собственными силами и лишённая каких-либо вредоносных «закладок». Хотя тема «закладок» и отдаёт порой изрядной параноидальностью, есть сферы, где лучше лишний раз убедиться в безопасности всего электронного оборудования. Все помят историю с вирусом Stuxnet, полностью парализовавшим иранское производство ядерного топлива и впоследствии обнаруженным даже в системах одной из российских АЭС и на компьютерах международной космической станции. Понемногу эта область вычислительной техники в России развивается: в частности, существует неплохой двухъядерный процессор Байкал-Т1 (28 нм) и более серьёзный восьмиядерный Эльбрус-8С (1,3 ГГц, 4 Мбайт L2, 16 Мбайт L, 250 Гфлопс).

Основа суперкомпьютеров и вычислительных модулей нового поколения

Основа суперкомпьютеров и вычислительных модулей нового поколения

Это процессоры общего назначения; они, несомненно, будут востребованы и найдут своё место в оборонной, аэрокосмической и научной отраслях. Но ведутся исследования и в других направлениях, связанных с вычислительной техникой. В частности, на конференции ПаВТ 2016 НИИ МВС Южного федерального университета (г. Таганрог) и Научно-исследовательский центр супер-ЭВМ и нейрокомпьютеров представили уникальную реконфигурируемую вычислительную систему на основе ПЛИС Virtex UltraScale с жидкостным охлаждением. Последний факт не удивляет: в последнее время владельцы крупных ЦОД и суперкомпьютеров по всему миру активно интересуются темой жидкостного охлаждения и внедряют соответствующие системы, как более выгодные и надёжные в эксплуатации.

Модули с воздушным охлаждением: «Плеяда» (слева) и «Тайгета»

Модули с воздушным охлаждением: «Плеяда» (слева) и «Тайгета»

Интересно, что в качестве хладагента используются не дорогостоящие высокомолекулярные составы, выпускаемые компанией 3M и ставящие отечественные системы с СЖО в зависимость от этой компании, а специальное маловязкое масло МД-4,5, обладающее подходящими параметрами, в частности, высокой теплоёмкостью на уровне 1,666 кДж/(кг·К) и низким коэффициентом объёмного расширения. Вполне на уровне и электрические характеристики: электрическая прочность 280 МВ/м и удельное сопротивление 2,2×1012 Ом. Стоит эта жидкость примерно $15 за килограмм и производится на предприятиях НПЦ Спецнефтьпродукт. Ещё один плюс к автономности и независимости от зарубежных источников. Вероятно, к ней стоит присмотреться и энтузиастам-оверклокерам, особенно тем, кто любит эксперименты.

Конструкция погружной СЖО довольно проста

Конструкция погружной СЖО довольно проста

Сами ПЛИС, разумеется, производятся Xilinx, поскольку освоение такой технологии своими силами — дело не одного года: современные ПЛИС являются чрезвычайно комплексными устройствами и расходы на их разработку (R&D) могут быть весьма солидными, а кроме того, при желании полной автономности производства потребуется постройка соответствующих фабрик, что тоже обойдётся весьма недёшево. Как показали предыдущие эксперименты с модулями «Плеяда» РВС-7 и «Тайгета» с пиковой производительностью на стойку 62 и 43‒53 терафлопса, высокая плотность компоновки модулей и плат с установленными на них микросхемами Virtex-6 или Virtex-7 подтвердили кризис систем воздушного охлаждения при высокой плотности упаковки чипов в малоразмерных корпусах. Температура ПЛИС в модуле «Тайгета» составила 72,9 градуса при допустимом диапазоне 65‒70 градусов, а модуль на базе более сложных чипов UltraScale и вовсе продемонстрировал 85 градусов, что уже угрожало работоспособности ПЛИС.

Вся хитрость —  в правильной подаче хладагента

Вся хитрость —  в правильной подаче хладагента

В итоге была разработана новая компоновка вычислительных ПЛИС-модулей, изначально рассчитанная на применение жидкостного охлаждения с помощью промышленных холодильных установок (чиллеров), тепловой поток к которым должны передавать специальные теплообменники, установленные в каждом модуле. За стандарт был взят форм-фактор шасси высотой 3U для установки в стандартные 19-дюймовые шкафы с расчётом не менее 12 модулей на шкаф. При этом каждый модуль несёт в себе от 12 до 16 плат с 8 ПЛИС, каждая из которых генерирует тепловой поток 100 ватт. Конструкция модуля делится на 2 зоны — вычислительную и теплообменную. В последней установлен автономный циркуляционный насос и высокоэффективный пластинчатый теплообменник, подключаемый к общей чиллер-системе, а также краны на случай аварии или необходимости замены модуля.

Испытательный стенд теплового макета

Испытательный стенд теплового макета

Вычислительная секция состоит из 12 плат ПВМ, трёх модулей питания, модулей загрузки и управления, платы индикации, а также кросс-платы питания, загрузки. Как уже было сказано, каждая плата вычислительного модуля несёт на себе 8 ПЛИС Kintex UltraScale XCKU095. Это предпоследняя модель в серии 20-нанометровых ПЛИС Kintex, содержащая в себе 1176 логических ячеек, 768 частей DSP, 59,1 Мбайт блочной памяти, 64 трансивера со скоростью передачи данных 16,3 Гбит/с и располагающая 702 линиями ввода/вывода. Кроме ПЛИС на плате содержится оперативная память, флеш-память для загрузки, тактовый генератор с необходимой обвязкой и преобразователи подсистемы питания. Не вполне понятно, почему разработчики выбрали стандарт 12 вольт. Они не были привязаны к существующей инфраструктуре и вполне могли позволить себе эксперименты с более высокими напряжениями, например, 48 вольт — именно этим сейчас занимаются Intel и Google.

Компоновка вычислительного модуля

Компоновка вычислительного модуля

Любопытно, что в модуле загрузки и управления не обошлось без Intel: в нём может быть установлен любой процессор семейства Broadwell-U, соединённый с ПЛИС Xilinx седьмой серии, которая, в свою очередь, уже общается с остальными платами посредством интерфейсов LVDS/MGT и RS-422. Эта же микросхема отвечает за индикацию и управление насосной группой СЖО. Типовой модуль питания предназначен для подключения к сетям с напряжением 380 вольт и имеет четыре выходных канала по 12 вольт с нагрузочной способностью 80 ампер на канал. Вся вычислительная зона является герметичной, поскольку используется погружная концепция СЖО, не требующая установки теплообменника на каждый греющийся элемент. Такая система содержит меньше соединительных элементов, требующих герметичности, проще в обслуживании и в целом надёжнее, хотя её эксплуатация и сопряжена с некоторыми неудобствами: не слишком-то приятно вынимать из ремонтируемого модуля платы, покрытые слоем охлаждающего масла.

Компоновка модуля управления

Компоновка модуля управления

Второй, общий контур системы охлаждения является водяным. Применение эффективных теплообменников позволило добиться ситуации, когда даже под нагрузкой средняя температура корпуса ПЛИС составила от 50,3 до 52,6 градусов в зависимости от модели. Температура хладагента при этом не поднималась выше 19,3 градусов. Таким образом, прототип нового вычислительного модуля был успешно испытан и проведённые эксперименты доказали, что погружная система охлаждения работоспособна и в состоянии отвести до 12 киловатт тепла. Блоки питания тоже не подкачали и смогли обеспечить эффективность до 89 %. Похоже, им смело можно присваивать сертификат не ниже 80 PLUS Silver. Также доказали свою эффективность при обмене данными между ПЛИС интегрированные в них высокоскоростные трансиверы последнего поколения: в пределах модуля проблемы «бутылочного горлышка» не наблюдалось.

Образец модуля «Скат». Хорошо видны особенности системы охлаждения

Образец модуля «Скат». Хорошо видны особенности системы охлаждения

Новый вычислительный модуль получил название «Скат». Хотя внешне он выглядит абсолютно непримечательно — как обычный серверный корпус формата 3U, внутри расположена высокоэффективная жидкостная система охлаждения погружного типа, обеспечивающая гидравлический «обдув» важных компонентов. При полной компоновке с использованием шкафа 47U 12 модулей «Скат» могут обеспечить пиковую производительность на уровне 1 петафлопса при общей потребляемой мощности 154 киловатта. Для сравнения, суперкомпьютер IBM Roadrunner, введённый в строй в 2008 году при сопоставимой вычислительной производительности занимает площадь около 1100 квадратных метров, весит 226 тонн и потребляет 3,9 мегаватта электроэнергии. Отечественный «Ломоносов» при пиковой мощности 1,7 петафлопс занимает 252 квадратных метра и потребляет 2,8 мегаватта электроэнергии. Преимущества архитектуры «Скат», таким образом, очевидны.

Стандарный вычислительный узел с 12 модулями «Скат»

Стандартный вычислительный узел с 12 модулями «Скат»

Использование единой холодильной системы легко позволяет собирать из таких шкафов вычислительную систему любой необходимой мощности. Тут возникает вопрос «бутылочного горлышка» при обмене данными между шкафами, но эта проблема, вероятно уже решена разработчиками и соответствующие интерфейсы (100GbE или 290GbE EDR Infiniband) входят в состав системы. Конечно, новые суперкомпьютерные модули используют ПЛИС зарубежного производства, но доля вложенного в их проектирование и отладку труда столь велика, что их вполне можно считать отечественными. «Скат» вполне можно считать одной из самых удачных разработок в мире реконфигурируемых суперкомпьютеров; во всяком случае в этой конструкции, достигнута непревзойдённая плотность упаковки вычислительных узлов и высочайшая эффективность охлаждения. Вполне возможно, что именно за ПЛИС-системами — будущее супервычислений: никакая другая архитектура не может предложить сравнимого уровня гибкости конфигурации. Системы, разработанные в НИИ МВС, уже используются в ряде ведомств РФ.

Постоянный URL: http://servernews.ru/930949
27.04.2012 [10:04], SN Team

Achronix рассказала о сетевых ПЛИС Speedster22i

Как известно, Intel тяготеет к контрактному производству программируемых логических интегральных схем (ПЛИС) для сторонних разработчиков. Одним из заказчиков компании из Санта-Клары выступает Achronix, которая рассчитывает приспособить 22 нм технологические нормы для выпуска микросхем Speedster22i. Подробности о решении разработчик опубликовал в начале недели.

Итак, ПЛИС Speedster22i рассчитана на применение в сетевом оборудовании, соответствующем стандартами 10/40/100 Gigabit Ethernet. Помимо прочего, микросхема обладает поддержкой интерфейса PCI Express 3.0 и встроенным контроллером памяти DDR3-2133. Продукты Speedster22i, как утверждается, потребляют на 50% меньше электроэнергии и работают на 40% быстрее, нежели конкурирующие решения, производимые по 28 нм технологии. Решение выпускается в двух версиях: с префиксом HD (высокая плотность) или HP (высокое быстродействие).

Изделия первой категории будут существовать в четырёх модификациях, самая крупная из которых обладает 1,1 миллиона таблиц поиска и 144 Мбит оперативной памяти, которая располагается непосредственно на кристалле микросхемы. Данные решения позиционируются для использования в коммутаторах и сетевых мостах, где требуется высокая пропускная способность.

ПЛИС второго типа работают на частоте вплоть до 1,5 ГГц, а самая большая микросхема насчитывает 250 тысяч таблиц поиска и 64 Мбит оперативной памяти. Изделия HP поддерживают механизмы самосинхронизирующейся памяти и предназначены для оборудования, интенсивно обрабатывающего потоковые данные.

Поставки первых ПЛИС Speedster22i начнутся в третьем квартале 2012 года, однако полный ассортимент решений будет представлен только в начале 2013 года.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/595799
Система Orphus