Материалы по тегу: fpga

26.04.2019 [21:55], Геннадий Детинич

Intel и Arrow провели первый в России совместный FPGA-семинар

На днях в России прошёл первый совместный семинар компаний Intel и Arrow Electronics — крупного дистрибьютора электронных компонентов. Формальное название мероприятия: «Intel FPGA Forum». Intel, как мы можем наблюдать, к теме продуктов с использованием программируемых матриц (ПЛИС) относится более чем серьёзно. Так, в начале апреля стало известно, что на смену семействам матриц Arria/Stratix идут 10-нм ПЛИС семейства Agilex. Новые решения станут более производительной и эффективной основой как для пограничных вычислений (IoT, умные вещи), так и для ЦОД (аналитика, ML и ИИ). Но всё богатство возможностей ничего не стоит без обучения и популяризации. Intel и Arrow намерены восполнить этот пробел и будут продолжать продвижение решений и платформ FPGA в дальнейшем.

В мероприятии приняли участие представители компаний-разработчиков решений на основе Intel FPGA: Molex, ReflexCES, Алмаз-СП (Euler project). Семинар сопровождался мини-выставкой продуктов и разработок участников мероприятия и партнёров. Ниже мы представим небольшой фотоотчёт со стендов семинара. Новое поколение FPGA Agilex в «кремнии» появится только через несколько месяцев, поэтому пока актуальными остаются решения преимущественно на предыдущих матрицах компании: Arria 10, Stratix 10 и Cyclone 10.

Помимо аппаратной части разговор шёл о программной поддержке разработчиков и платформ для проектирования: от создателей аппаратуры и RTL-программистов до разработки на языках высокого уровня. Речь шла о пакетах Intel Quartus Prime, Intel FPGA SDK для OpenCL, Intel DSP Builder и Intel High Level Synthesis Compiler. Основной фокус компании прежний — Intel хочет упростить разработку для FPGA в контексте давнего стремления унифицировать процесс создания и портирования ПО для многочисленных аппаратных платформ компании. В скором времени Intel сделает большой анонс на эту тему. 

Разработанные в России ускорители на базе Intel FPGA Arria 10 и специализированный обучающий курс для инженеров представила компания «Алмаз-СП» (Euler Project). Решения  «Алмаз-СП»используются отечественными компаниями: телеком-операторами, операторами дата-центров и облачными провайдерами. В частности, в рамках Selectel Lab доступны для тестирования карты Euler. 

Постоянный URL: http://servernews.ru/986550
02.04.2019 [20:00], Геннадий Детинич

Высокоточное оружие второго поколения: Intel представила 10-нм FPGA Agilex

Intel давно экспериментирует с интеграцией в процессоры и платформы программируемых матриц ПЛИС (FPGA). Но по-настоящему компания развернулась только после поглощения разработчика ПЛИС Altera в 2016 году. К сожалению для обеих компаний, выпуск первого поколения совместных продуктов семейства Stratix был задержан, поскольку Intel столкнулась с проблемами при освоении техпроцесса с нормами 14 нм. Техпроцесс с нормами 10 нм тоже сопровождался... шероховатостями, но свет в конце тоннеля уже виден. Спешит компания или нет, однако сегодня она решилась представить ПЛИС и продукты второго поколения FPGA — семейство 10-нм матриц Agilex.

Личный курс Intel и всей индустрии, связанной с обработкой массивов данных, представлен как движение в сторону мира, вращающегося вокруг обработки данных. Растущее разнообразие данных и видов их обработки означает, что вычислительные платформы общего назначения перестали удовлетворять требованиям со стороны заказчиков. Клиенты требуют целевого соответствия вычислительных ресурсов задачам всех рангов: от пограничных (edge) вычислений до центров обработки данных. Периферия должна максимально эффективно и с минимальными задержками обработать первичную (сырую) информацию широкого спектра, сетевые устройства обязаны по-умному распорядиться потоками данных, а ЦОД должны подстроиться под тип обрабатываемых данных. Без этого информационное цунами рано или поздно накроет всех и каждого. И не стоит относиться к этому, как к какой-то мелочи или издержкам. Отказ, потеря или невозможность своевременной обработки данных, например, могут привести к катастрофе с жертвами на производстве или на транспорте.

Для решения проблемы оптимизации «железа» под рабочие вычислительные нагрузки компания Intel в который раз предлагает сочетать в одном корпусе элементы заказных решений (ASIC) и массивы программируемых вентилей (ПЛИС). Для достижения максимальной гибкости аппаратной части в решение встраивается блок ПЛИС, а чтобы не тратить лишних вычислительных ресурсов и энергии на работу с периферией и на вычисления общего порядка в чип встраиваются заказные блоки ASIC. В новом семействе ПЛИС Intel Agilex все эти наработки подняты на новую высоту. Можно сказать, что это высокоточное оружие в мире обработки данных, которое заточено на выполнение той задачи, решить которую необходимо здесь и сейчас.

В основе ПЛИС Agilex лежит идея чиплетов ― конструктора из базовых и специализированных блоков Intel и партнёров. Массив ПЛИС выпускается по самому современному 10-нм техпроцессу, а чиплеты могут быть хоть 22-нм или даже выпущенные по более старому техпроцессу. По сравнению с ПЛИС предыдущего поколения компания Intel обещает до 40 % увеличение производительности, экономию потребления (до тех же 40 %) и производительность до 40 терафлопс.

Матрицы нового поколения подойдут для инфраструктуры связи 5-го поколения (5G), облачные услуги станут ещё гибче, производительнее и более ёмкими, пограничные вычисления встретят растущие требования к обработке сырых данных ― это радары (оборона), индустрия 4.0, обработка видео с камер наблюдения и другое, а крупный бизнес получит инструменты для анализа финансовых рисков в реальном времени. Не забыта и наука. Работа с геномом ― это наше всё.

В плане гибкости использования чиплетов компания Intel обещает не ограничивать фантазию разработчиков. В матрицы Agilex можно встроить всё, что пожелает заказчик. Между собой чиплеты и массив ПЛИС будут соединяться с помощью сравнительно простой в изготовлении технологии Intel EMIB (Embedded Multi-die Interconnect Bridge). 

Одной из самых интересных особенностей ПЛИС Agilex обещает стать технология когеретности кеша и памяти матриц и процессоров Intel Xeon. Нечто подобное есть у ARM и этот же принцип пытаются внедрить в новых спецификациях для отраслевых стандартов работы с ускорителями в различных платформах, например, в CCIX. Но пока кто-то обещает, Intel сделала.

Сетевая периферия и интерфейс для контроллеров тоже на высоте. Матрицы Agilex получат интерфейс для обмена данными на скорости до 112 Гбит/с. Для внешних устройств будут предлагаться блоки PCI Express 4.0 и 5.0, а также поддержка Compute Express Link (CXL). 

Конфигурируемые цифровые сигнальные процессоры (DSP) в составе матриц ПЛИС Agilex можно будет настроить на обработку данных в зависимости от типа, что обещает ускорить работу с разными моделями машинного обучения и ИИ. Настройка включает обработку с одинарной точностью вычислений (FP32), половинной (FP16), а также BFLOAT16 (когда данные FP32 фактически усекаются до последовательностей FP16 с ростом производительности без существенной потери в точности FP32). Наконец, поддерживается обработка INT8 и данных с промежуточной точностью: от INT2 до INT7.

Семейство ПЛИС Intel Agilex разделено на три категории продуктов. Самыми младшими будут матрицы серии F ― это решения для широкого спектра продукции. Серия I станет подспорьем для обработки массивных потоков данных с акцентом на сетевую инфраструктуру. Серия M ― это база для высокопроизводительных вычислительных нагрузок. Именно она получит весь спектр новейших технологий, куда войдут и работа с памятью HBM, и поддержка продуктов Intel Optane, и другое. Программные инструменты для работы с матрицами Agilex компания предоставит в текущем месяце, а поставки матриц начнутся в течение третьего квартала этого года.

К программным инструментам компания Intel относит пакет oneAPI. Разработка решений с его использованием обещает ускорить создание, тестирование и выпуск решений на базе платформы Agilex, куда также можно будет включать блоки партнёров, а не только самой Intel. Кроме того, Intel давно взяла курс на унификацию средств разработки, что позволит в итоге портировать один и тот же код без значительных модификаций на все вычислительные платформы компании. 

Матрицы Agilex представлены в рамках большого весеннего обновления решений Intel для ЦОД. Одновременно с ними компания представила две серии процессоров — Intel Xeon D 1600 и Intel Xeon Cascade Lake SP и AP — и 100GbE-решения Intel Ethernet 800 Series.

Кликните по изображению продукта для перехода в соответствующий раздел/материал
Постоянный URL: http://servernews.ru/985043
22.11.2018 [20:30], Андрей Созинов

Xilinx показала новые ускорители вычислений и «умные» SSD на чипах FPGA

На выставке SC18, которая на прошлой неделе состоялась в Далласе, штат Техас, было показано множество продуктов, использующих FPGA-матрицы от компании Xilinx. Среди них оказались фирменные ускорители вычислений и системы на их основе, а также новые «умные» твердотельные накопители SmartSSD.

На своём собственном стенде Xilinx продемонстрировала новейший ускоритель вычислений Alveo U280. Он построен на 16-нм FPGA-матрице с архитектурой Xilinx UltraScale. Её дополняет 8 Гбайт памяти HBM2 с пропускной способностью 460 Гбайт/с и два модуля памяти DDR4 по 16 Гбайт каждый. Также отметим использование интерфейса PCI Express 4.0 x8 и поддержку CCIX.

Напомним, что платформа CCIX разрабатывается для обеспечения связи между абсолютно всеми компонентами системы, которые не сочетаются напрямую. И теперь она получила реализацию в кремнии. Также отметим, что сейчас консорциум CCIX активно продвигает свой стандарт, и на многих стендах SC18 были замечены решения, использующие его.

Как и другие ускорители серии Alveo, новый Alveo U280 предназначен для центров обработки данных. По словам производителя, ускорители на FPGA способны наилучшим образом подстраиваться под те задачи, выполнение которых на него возложено, что в результате делает их универсальным решением. Здесь сразу стоит отметить, что Xilinx сейчас активно работает над средствами разработки и стремится сделать их как можно проще, чтобы облегчить работу с её ускорителями, дав возможность сборки кода  C/C++/OpenCL для FPGA. Это один из главных моментов в борьбе с Intel, которая давно занимается аналогичными компиляторами для продуктов Altera. 

Возможно, в том числе и по этой причине ускорители на базе FPGA от Xilinx получают всё большее распространение. В том числе в облаках: у Amazon уже есть Ryft, а Microsoft планирует внедрить продукты компании в Azure. На SC18 оказалось непривычно много решений с платами Alveo, которые производители готовы предлагать заказчикам в составе своих систем наряду с Altera или даже в качестве альтернативы NVIDIA, так как последние решения компании оптимизированы и для работы с ИИ. 

Главной новинкой на стенде Xilinx стали так называемые SmartSSD, созданные совместно с Samsung. Данные «умные» накопители сочетают в себе однокристальную платформу с FPGA под названием Xilinx ZU19EG MPSoC, а также оперативную память (DDR или HBM), ну и, конечно же, саму твердотельную память V-NAND от Samsung. Ключевое отличие от обычных SSD в том, что SmartSSD сам частично занят вычислениями и обработкой данных, так сказать, не отходя от кассы. Такой подход обсуждается годами, но только сейчас получил хорошую реализацию в «железе».  

Строго говоря, это не первая попытка совместить SSD и FPGA в «одном флаконе» — такие решения ещё два года назад демонстрировала компания Smart IOPS, но они были ориентированы скорее на оптимизацию потоков данных, обращений к накопителю и предварительной выборке. Понятно, что полностью всю обработку данных переложить на плечи SmartSSD нельзя, но вполне стандартные операции шифрования, архивирирования, дедупликации ему под силам. Кроме того, разработчики упоминают ещё и (де)кодирование видео или работу с ИИ. В любом случае важно то, что таким образом можно существенно снизить обмен между накопителем и остальной системой, так как передаваться будут уже предобработанные данные + значительно сокращается путь самих данных в сравнении с установленными порознь SSD и FPGA. 

На стенде с этим SmartSSD свои решения демонстировала компания Bigstream, которая занимается акселерацией работы с базами данных и BigData-системами с помощью FPGA и GPU. Конкретный пример — значительное ускорение комплексной выборки данных из Spark за счёт обработки записей на FPGA. Отдельно отмечается, что для конечных пользователей всё это происходит прозрачно, так как слой оффлоада задач лежит ниже, на уровне фреймворка или драйвера БД. Похожие решения для гетерогенных вычислений, в том числе в облаках, совместно с Xilinx предлагает и BLACKLYNX. К слову, обратите внимание на слайд выше. С накопителем Samsung PM983 мы уже знакомы — это «линеечный» SSD формата NF-1. А вот PM983F, похоже, тот же SSD, но с FPGA на борту. 

Были показаны также и «умные» сетевые адаптеры, оснащённые FPGA-матрицами Xilinx. Например, решение от Mellanox Technologies под названием Innova-2, которое было впервые представлено ещё год назад. Затея, в целом, та же, что у SmartSSD: переконфигурируемость и предварительная обработка данных на лету. 

Huawei также создаёт ускорители на FPGA от Xilinx

Huawei также создаёт ускорители на FPGA от Xilinx

Как и говорилось в самом начале, на выставке было показано множество продуктов, использующих FPGA-матрицы Xilinx. Отдельного внимания заслуживает сотрудничество AMD и Xilinx, которое началось не так давно, но уже в следующем году может принести довольно интересные плоды.

На стенде AMD была показана разрабатываемая платформа на базе процессора EPYC «Rome» и ускорителей Xilinx Alveo с интерфейсом PCIe 4.0. Также эта платформа может иметь твердотельные накопители Samsung с NVMe PCIe 4.0, InfiniBand-карту Mellanox с пропускной способностью 200 Гбит/с и сетевой адаптер Ethernet Broadcom Thor, также со скоростью 200 Гбит/с. Отдельно стоит обратить внимание, что здесь нет компонентов от Intel и NVIDIA: CPU, накопителей, интерконнекта и ускорителей. Кроме того, AMD может предложить и собственные Instinct'ы для вычислений. 

Постоянный URL: http://servernews.ru/978525
14.11.2018 [15:29], Геннадий Детинич

Micron и Achronix сообщили о разработке первых в мире ПЛИС с поддержкой GDDR6

Относительно небольшой игрок на рынке программируемых матриц FPGA американская компания Achronix сообщила о планах представить первые в индустрии матрицы ПЛИС с поддержкой памяти GDDR6. Поскольку сегодня единственным производителем GDDR6 в коммерческих объёмах является компания Micron, то выбор стратегического партнёра для Achronix был очевиден. Компании выпустили совместный пресс-релиз, в котором объявили о создании доступной по цене альтернативы матрицам ПЛИС с поддержкой памяти HBM.

Матрицы ПЛИС с поддержкой памяти HBM и HBM2 уже выпускают лидеры отрасли компании Altera (Intel) и Xilinx. Интересно, что актуальные матрицы Achronix Speedster22i тоже выпускает компания Intel (с использованием техпроцесса 22 нм). Но уже матрицы Achronix следующего поколения будут выпускаться на линиях компании TSMC с использованием 7-нм техпроцесса, что добавит немного негатива как контрактному производству Intel, так и конкурирующим ПЛИС-разработкам Altera.

Будущие 7-нм матрицы Achronix в зависимости от решаемых задач будут поддерживать от 1 до 8 чипов памяти GDDR6. Тем самым адресуемый объём памяти для каждой из этих матриц составит от 8 Гбит (1 Гбайт) до 128 Гбит (16 Гбайт). С учётом пропускной способности актуальных серийных образцов памяти GDDR6 компании Micron на уровне 16 Гбит/с, совокупная скорость интерфейса памяти у новых матриц Achronix будет достигать 4 Тбит/с. Это всего лишь вполовину меньше, чем в случае работы интерфейса HBM2 в наборе из четырёх 8-Гбайт стеков (чипов).

Тем самым Achronix намерена представить доступную по цене альтернативу памяти HBM в платформах для задач с машинным обучением, искусственным интеллектом, для обработки больших данных и многого другого, включая оснащение бортовых систем автомобилей с автопилотами производительными и менее дорогими решениями. К тому же, матрицы ПЛИС с памятью HBM сами по себе дороже в производстве, поскольку требуют установки на общий мост-подложку с памятью. В такой ситуации предложение Achronix способно найти горячую поддержку среди производителей «когнитивного» оборудования разного уровня сложности. Правда, Achronix не раскрывает, когда её новая продукция будет доступна для заказа.

Постоянный URL: http://servernews.ru/978176
26.09.2018 [12:14], Геннадий Детинич

Intel представила PCIe-ускорители на матрицах Stratix 10 SX

Компания Intel расширила предложение с продуктами ПЛИС для ускорения расчётов на платформах Xeon. На базе анонсированных год назад 14-нм матриц FPGA Stratix 10 SX бывшей компании Altera производитель процессоров анонсировал ускоритель в формфакторе add-on карты с интерфейсом PCI Express 3.0 x16. Новинка вышла в новой категории продуктов PAC или Programmable Acceleration Card (карты программируемого ускорителя).

PAC Stratix 10 SX

PAC Stratix 10 SX

Ранее в данной категории Intel выпускала адаптеры на ПЛИС Arria 10. Но если PAC Arria 10 FPGA были ориентированы на ускорение баз данных и обработку изображений, то PAC Stratix 10 SX — это продукты для обработки «тяжёлых» процессов непосредственно в памяти. Например, задач для ИИ. Для этого на борту PAC Stratix 10 SX предусмотрено четыре слота для памяти DDR4 с поддержкой ECC. Общее адресуемое пространство составляет 32 Гбайт. Непосредственно в матрицу встроены 4 ядра ARM и 2,7 млн программируемых вентилей. Тем самым решение может перепрограммироваться на необходимую нагрузку, поддерживаемую многочисленными IP-разработками партнёров Intel.

PAC Stratix 10 SX

PAC Stratix 10 SX

В целом Intel реализует поддержку PAC Stratix 10 SX так называемым стеком для ускорителей на платформах Xeon (Acceleration Stack for Intel Xeon CPU). Помимо самих ускорителей в виде адаптеров PAC или в другом виде, например, с матрицами, интегрированными непосредственно на flip-chip подложку процессора, в стек входят наборы инструментов, библиотеки и прочие решения, которые помогают создавать и управлять процессами на платформах Xeon с использованием ускорителей на ПЛИС Intel.

Acceleration Stack for Intel Xeon CPU

Acceleration Stack for Intel Xeon CPU

Первой компанией, которая начнёт поставлять на рынок платформы с ускорителями PAC Stratix 10 SX, станет Hewlett Packard Enterprise. По словам представителя HPE, вне зависимости от квалификации разработчиков новые решения обеспечат обязательный эффект от ускорения рабочих нагрузок на широком спектре задач и позволят клиентам компании легче управляться с новыми сложными нагрузками, возникающими в современных центрах по обработке данных.

Анатомия  PAC Stratix 10 SX

Анатомия PAC Stratix 10 SX

Постоянный URL: http://servernews.ru/975960
20.03.2018 [15:30], Геннадий Детинич

Xilinx предлагает покорять ИИ и «большие данные» с 7-нм гибридными матрицами FPGA

Компания Xilinx сделала достоянием гласности информацию о работе над проектом под кодовым именем «Project Everest». В рамках проекта создаётся платформа, которую назвали ACAP (Adaptive Compute Acceleration Platform; по-русски: платформа для ускорителей с поддержкой адаптивных вычислений). По замыслу Xilinx, аппаратные ускорители расчётов в центрах по обработке данных, будь то центральные процессоры или специализированные ускорители, должны автоматически адаптироваться к актуальной рабочей нагрузке подобно программному обеспечению.

Блок-схема гибридных FPGA матриц Xilinx Project Everest (Xilinx)

Блок-схема гибридных FPGA матриц Xilinx Project Everest (Xilinx)

Платформа Xilinx Project Everest будет сочетать высокопроизводительную логику компании нового поколения, прикладной процессор, процессор для обработки данных в реальном масштабе времени, один или два программируемых вычислительных «движка», блок для работы с радиочастотными компонентами, высокоскоростные преобразователи SerDes, программируемые интерфейсы ввода/вывода, контроллер памяти HBM и ряд других блоков и интерфейсов, и всё это будет связано внутренней высокоскоростной шиной.

На разработку платформы ACAP компания Xilinx потратила свыше $1 млрд. Проектом Everest в течение 4 лет занимались 1500 инженеров компании. Цифровой проект для передачи в производство будет готов позже в текущем году. Изготавливать чипы Project Everest будет компания TSMC в рамках 7-нм техпроцесса. Поставки намечены на 2019 год. Финальный чип будет представлять собой комбинацию из нескольких кристаллов на общей подложке с огромным даже по современным меркам числом транзисторов — свыше 50 млрд штук.

Преимущества платформы ACAP Xilinx (рост скорости расчётов на «новых» нагрузках до 100 крат)

Преимущества платформы ACAP Xilinx (рост скорости расчётов на «новых» нагрузках до 100 крат)

По словам разработчика, скорость перепрограммирования блоков платформы Project Everest будет на уровне миллисекунд. Это сделает ускорители на основе ACAP от 10 до 100 раз эффективнее по сравнению с центральными и графическими процессорами в случае обработки данных на таких новых направлениях, как «большие данные» и искусственный интеллект. Сюда же можно добавить машинное зрение, распознавание речи, поиск, принятие решений ИИ и многое другое, с чем процессоры общего назначения справляются с большими затратами ресурсов.

Программная поддержка платформы Xilinx ACAP

Программная поддержка платформы Xilinx ACAP

Кроме того, компания Xilinx обещает сделать программирование для гибридных матриц не сложнее, например, программирования для графических процессоров. Для ACAP будут доступны инструменты подобные C/C++, OpenCL и Python. Это понизит или сотрёт барьер между обычными программистами и специалистами по работе с матрицами FPGA. В Xilinx возлагают массу надежд на новую платформу, расценивая её как один из трёх важнейших направлений в развитии компании.

Постоянный URL: http://servernews.ru/967228
27.02.2018 [15:50], Геннадий Детинич

Intel FPGA Stratix 10 TX с трансиверами 58G прокладывают путь «терабитным» сетям

Компания Intel выпустила пресс-релиз, в котором сообщила о готовности поставлять новые продукты на базе программируемых матриц. Это то наследство, которое Intel получила после поглощения в 2016 году компании Altera. В частности, Intel смогла начать поставки таких продуктов, как Stratix 10 MX FPGA с интегрированной на подложку памятью HBM, Stratix 10 SX FPGA с встроенными в модуль четырьмя ядрами ARM и Stratix 10 GX FPGA с трансиверами 28G. Новинка — FPGA Stratix 10 TX — вооружена приёмопередатчиками с поддержкой стандарта 58G и может по каждой линии передавать данные со скоростью до 58 Гбит/с.

В зависимости от модели FPGA Stratix 10 TX может нести от 600 тыс. до 2,5 млн программируемых вентилей. В максимальной конфигурации с пятью блоками приёмопередатчиков число линий 58G достигает 144 штук. Это открывает путь к сетям с поддержкой стандартов 100G, 200G и 400G, а в пресс-релизе Intel мечтает о сетях с терабитной пропускной способностью. По замыслу Intel, помимо обычной сетевой инфраструктуры решения FPGA Stratix 10 TX помогут в развёртывании сетей для обслуживания базовых станций поколения 5G.

Добиться столь высокой интеграции — расположить на общей подложке в непосредственной близости семь разнородных кристаллов, выпущенных с использованием различного техпроцесса — компании помогла уникальная технология компоновки EMIB (Embedded Multi-die Interconnect Bridge). Технология EMIB стала альтернативой упаковке 3D без необходимости использовать дорогостоящие кремниевые подложки со сквозной металлизацией типа TSVs. В случае матриц FPGA Stratix 10 TX, например, в один чип собраны 14-нм кристаллы Intel FPGA и 16-нм трансиверы, выпущенные на линиях компании TSMC. У отношений Altera и TSMC давняя история и компании Intel так просто её не отменить.

Постоянный URL: http://servernews.ru/966268
06.10.2017 [17:00], Илья Коваль

Selectel Lab: бесплатно испытай новейшие серверные технологии Intel

21 сентября в Санкт-Петербурге прошла конференция SelectelTechDay #2, организованная компанией Selectel — крупнейшим в РФ IaaS-провайдером. Среди клиентов Selectel есть и частные лица, и международные корпорации. Для первых компания предлагает сервис VScale, а среди вторых наиболее знаком обывателю, пожалуй, «ВКонтакте ». За десять лет компания построила в РФ шесть крупных ЦОД и стала одним из лидеров этого рынка в стране. И ей есть, что рассказать и показать текущим и потенциальным заказчикам, партнёрам и даже конкурентам. Свои доклады представили Broadcom, Brocade, HGST, Juniper, Kingston, Microsemi, Supermicro и, конечно, Intel — ключевой партнёр Selectel. Сама же Selectel организовала экскурсию по дата-центру, рассказала о тенденциях развития рынка и, самое главное, представила проект Selectel Lab, который даёт уникальную возможность самостоятельно и, что важно, бесплатно опробовать в деле новейшее оборудование Intel. Selectel по итогам тестов получает обратную связь и лучше понимает задачи клиентов, чтобы в будущем предложить им именно то, что нужно.

Сейчас производители высокотехнологичного оборудования активно развивают свои продуктовые линейки, ежеквартально представляя новые решения. Вместе с тем новинки эти хоть и привлекательны, однако массово недоступны — либо просто дороги, либо вообще выпускаются крайне ограниченными партиями. Узость круга «избранных», которые всё-таки имеют к ним доступ, не позволяет достаточно полно оценить все недостатки и достоинства этих новинок. Естественно, что наугад вкладывать большие деньги в недостаточно изученные решения, а потом ещё и ждать их поставок никому не хочется. Но в таком случае все эти новые технологии так и могут остаться неизвестными и неизученными.

Selectel Lab как раз и создан для преодоления этой проблемы. Одним из ключевых продуктов, доступ к которому предоставляется участникам проекта, является новейшая серверная платформа Intel Purley. Машины на её базе появились в Selectel буквально через неделю после официального запуска — компания до сих пор остаётся единственным в РФ сервис-провайдером, предлагающим клиентам серверы с новыми CPU Intel Xeon Skylake-SP. Подробнее об этих процессорах и платформе написано здесь, а тут отметим лишь самые важные её особенности: процессоры с числом ядер до 28 (56 потоков) и возможностью создания 8-сокетных машин, поддержка до 1,5 Тбайт RAM на каждый CPU, встроенный в CPU адаптер Intel Omni-Path, поддержка AVX-512, аппаратные ускорения компрессии и шифрования, 40-Гбит контроллер Ethernet с поддержкой iWARP RDMA и целый ряд новых функций и технологий, обеспечивающих высокую скорость вычислений в сочетании с безопасностью.

Серверы на базе процессоров Intel Xeon Platinum, Gold и Silver можно протестировать бесплатно. В Selectel Lab доступен один из самых мощных CPU нового поколения: Intel Xeon Platinum 8170. Двухсокетная машина на базе этого процессора входит в TOP-10 аналогичных систем в рейтинге GeekBench. Кроме того, в рамках Selectel Lab доступные и другие уникальные процессоры Intel — Xeon Phi Knights Landing (KNL). Эти CPU имеют до 72 привычных x86-64 ядер (исполнение до 288 потоков) и также поддерживают технологии AVX-512 и Intel Omni-Path. Обычно такие процессоры используются в суперкомпьютерах или мощных рабочих станциях, но теперь они доступны и всем остальным. Использование массивно-параллельной архитектуры Xeon Phi позволяет значительно ускорить исполнение целого ряда задач, причём подготовка кода для них требует минимальных затрат, особенно в сравнении с некоторыми другими ускорителями.

То же самое можно сказать и про другой продукт, доступный в Selectel Lab — универсальный FPGA-ускоритель серии Эйлер, сделанный на базе чипсета Intel Arria 10GX. Устройство имеет производительность на уровне 1,5 Тфлопс при этом потребляет не более 50 Вт. Оно оснащено собственной памятью DDR4 4 Гбайт и обладает тремя встроенными сетевыми интерфейсами со скоростью 1, 10 и 40 Гбит/с. Ускорение расчётов на некоторых задачах может достигать 50-200 раз. Причём для того, чтобы эффективно использовать всю эту мощь, не требуется долгое обучение (есть SDK для OpenCL), а специалисты Selectel помогут в этом деле. Сама плата ускорителя и ПО для него разработаны в России компанией «Алмаз-СП».

Наконец, последнее по счёту, но не по важности решение, доступное участникам Selectel Lab — это инновационные модули памяти Intel Optane на базе технологии 3D XPoint. Мы уже знакомились с этой технологией на примере модулей для ПК. По производительности 3D XPoint находится между оперативной памятью и твердотельными накопителями, при этом Intel Optane значительно дешевле DRAM и в то же время значительно надёжнее любого SSD. В Selectel Lab можно испытать Intel Optane P4800X и в качестве отдельного накопителя (например, для работы базы данных), и в качестве интеллектуального посредника между RAM и обычными накопителями в режиме Intel Memory Drive  — в этом случае работа Intel Optane абсолютно прозрачна для системы и не требует никакого дополнительного управления данными.

Все эти новейшие серверные технологии Intel можно совершенно бесплатно протестировать в Selectel Lab — достаточно оставить заявку на сайте проекта. 

Постоянный URL: http://servernews.ru/959456
12.09.2017 [14:47], Константин Ходаковский

Xilinx, ARM, Cadence и TSMC создадут тестовый 7-нм чип

Компании Xilinx, ARM, Cadence Design Systems и TSMC сообщили о сотрудничестве с целью создания в 2018 году первого тестового CCIX-чипа на базе 7-нм FinFET норм TSMC. Этот чип будет призван продемонстрировать возможности платформы CCIX (Cache Coherent Interconnect for Accelerators) в деле эффективного взаимодействия многоядерных высокопроизводительных процессоров ARM с FPGA-ускорителями, находящимися за пределами основного кристалла.

Тестовый чип будет основан на последней технологии внутрисистемного соединения ARM DynamIQ и использовать шину CMN-600. Cadence предоставит ключевые блоки ввода-вывода и подсистемы памяти, включая CCIX-решение (контроллер и PHY), PCI Express 4.0/3.0 (контроллер и PHY), DDR4 PHY, периферийные блоки вроде I2C, SPI и QSPI, а также драйверы. Инструменты проектирования Cadence будут применены и при создании тестового чипа, который чип объединит CPU ARM с 16-нм FPGA-чипами Virtex UltraScale+ от Xilinx через протокол связи CCIX.

Согласно совместному заявлению компаний, финальной стадии разработки Tape-out чип должен достичь в первой четверти 2018 года, а полноценные кристаллы будут выпущены во второй половине того же года. Этот дизайн призван продемонстрировать, как последние процессоры ARM могут эффективно взаимодействовать с когерентными многочиповыми ускорителями в масштабе ЦОД, а также решить проблему быстрого и простого доступа к данным.

Подобные решения помогут в будущем создать высокопроизводительные и при этом эффективные платформы для центров обработки данных. TSMC отметила, что 7-нм нормы FinFET — самый совершенный техпроцесс компании, который позволит добиться преимуществ как с точки зрения роста производительности, так и энергоэффективности.

Постоянный URL: http://servernews.ru/958375
23.08.2017 [18:28], Геннадий Детинич

Microsoft Brainwave: решение задач ИИ в реальном времени

На конференции Hot Chips компания Microsoft раскрыла детали проекта «Brainwave». Слухи и даже некоторая официальная информация об этой разработке ходили давно. Речь идёт об аппаратной платформе для решения задач, связанных с искусственным интеллектом и глубоким машинным обучением. Для этого Microsoft выбрала программируемые матрицы компании Intel (Altera). На базе 14-нм матриц Intel Stratix 10 создан ускоритель, который обещает значительно изменить ландшафт услуг, связанных с интеллектуальной обработкой видео, распознаванием голоса, автопилотами и многими другими сферами, где важны скорость ответа.

Подчеркнём, в компании Microsoft не стали использовать фиксированные решения подобно Google TPU (Tensor Processing Units), NVIDIA Volta или Intel Lake Crest. Выбор был сделан в пользу FPGA-матриц с неизменным мощным процессорным ядром и программируемой областью, архитектуру которой можно менять по необходимости. Это позволяет перепрограммировать ускорители на новый тип данных или на новые алгоритмы обработки данных не меняя «железо» в составе серверов. На весь процесс уйдёт неделя без каких-либо дополнительных затрат на оборудование. В итоге, уверены в Microsoft, на старте можно проиграть конкурентам в пиковой производительности платформы, но в длительной перспективе её подход окажется более выгодным вложением средств.

Ускоритель Microsoft Brainwave

Ускоритель Microsoft Brainwave

Впрочем, проект Microsoft Brainwave интересен другим — это заявленная возможность обрабатывать запросы для ИИ в реальном масштабе времени. Альтернативные платформы для наиболее эффективной работы нейронных сетей требуют пакетной (накопительной) передачи данных. Платформа Microsoft Brainwave эффективно работает в потоковом режиме по мере поступления одиночных запросов и не требует сложной тренировки. Большую модель GRU (Gated Recurrent Unit) Microsoft Brainwave без пакетирования обрабатывает в пять раз быстрее, чем архитектура ResNet-50. Демонстрация опирается на собственный формат Microsoft ms-fp8, который не теряет точности для широкого спектра моделей. Полученная на ускорителе Stratix 10 устоявшаяся производительность достигает 39,5 терафлопс с временем запроса менее одной миллисекунды.

Матрица FPGA Intel Stratix 10

Матрица FPGA Intel Stratix 10

Сейчас специалисты Microsoft разворачивают системы ИИ на базе Brainwave для использования в облачном сервисе Azure. Системы помогут пользователям и партнёрам компании использовать сервис как для обработки запросов, так и для запуска своих моделей нейронных сетей для глубокого обучения, благо ускорители изначально спроектированы с учётом возможности последующей перенастройки.

Постоянный URL: http://servernews.ru/957451
Система Orphus