Материалы по тегу: fpga

12.03.2020 [19:44], Алексей Степин

Xilinx Versal Premium: сверхмощная гетерогенная платформа для сетей нового поколения

Компания Xilinx, один из ведущих разработчиков программируемых логических схем (ПЛИС), анонсировала третье поколение адаптивных сетевых процессоров Versal — Versal Premium. Новинка является наиболее производительной в серии и предназначена для использования в высокоскоростных сетях нового поколения.

Компания называет Versal «адаптивной платформой для ускорения вычислений» (adaptive compute acceleration, ACAP).

И действительно, архитектура Versal достаточно уникальна. По своей структуре она гетерогенна и включает в себя самые различные блоки — так, Versal Premium имеет в своём составе два ядра ARM Cortex-A72, два ядра ARM Cortex-R5F для приложений реального времени, набор движков DSP, набор криптографических движков, способных работать со скоростями до 400 Гбит/с, интерфейсы Ethernet со скоростями от 100 до 600 Гбит/с, контроллеры периферийных шин, а также набор программируемой логики, являющийся сердцем чипа.

Новый чип разработан с применением 7-нм технологического процесса TSMC и, по словам Xilinx, втрое превосходит другие ПЛИС, когда речь идёт о пропускной способности сетевых подсистем. Versal Premium должен стать новым словом в разработке однокристальных сетевых процессоров классов 400G и 800G. Полностью технические характеристики приведены на сайте компании-разработчика. Отметим только, что в старшем варианте Versal Premium будет иметь более 14 тысяч DSP-движков, 7352 ячейки системной логики и свыше 3,3 миллионов LUTs.

В сравнении с предыдущими чипами Versal, версия Premium получила трансиверы PAM4 со скоростью 112 Гбит/с, поддержку сетевого проткола Interlaken, высокоскоростные криптографические движки и реализацию PCI Express 5.0. В комплекте с платформами разработки Vitis и Vivado Design Suite это наиболее мощное на сегодня решение для разработчиков аппаратного и программного сетевого обеспечения нового поколения.

Плата VMK180 из комплекта разработчика Versal Prime Series

Плата VMK180 из комплекта разработчика Versal Prime Series

Пока речь идёт лишь об анонсе новой платформы. Поставки образцов Versal Premium избранным клиентам Xilinx начнутся в первой половине следующего года. Но документация уже доступна и разработчики могут приступить к прототипированию новых устройств, используя комплект Versal Prime Evaluation Kit.

Постоянный URL: http://servernews.ru/1005810
11.03.2020 [18:27], Андрей Галадей

TornadoVM: ускорение Java и Node.js на GPU и FPGA

На QCon London доктор Хуан Фумеро (Juan Fumero) из Университета Манчестера представил демонстрацию реальной работы TornadoVM, ВМ для гетерогенных систем. Это плагин к OpenJDK и GraalVM, позволяющий запускать Java-приложения на GPU и FPGA. Демонстрация показала, что такой подход позволяет в сотни раз ускорять работу приложений.

Отметим, что TornadoVM позволяет запускать приложения, написанные на Java и Node.js, за счёт распараллеливания и выполнения расчётов на разных типах оборудования.

Фумеро показал это на примере макбука, где код выполнялся на CPU, интегрированном GPU и графическом процессоре NVIDIA. Также поддерживаются решения AMD и Intel FPGA. А вот Tensor Processing Units (TPU) пока не поддерживаются, но по словам разработчика, здесь всё упирается в поддержку OpenCL. Создать же дополнительный бэкэнд к TornadoVM — не проблема.

Пока что разработчики не готовы к коммерческому внедрению TornadoVM, хотя система уже используется для ускорения машинного обучения. Эти решения используются для работы с данными о здравоохранении. При этом из-за ограничений в базовой модели программирования, TornadoVM не поддерживает объекты (за исключением тривиальных случаев), рекурсию, динамическое выделение памяти или исключения.

Слайды с демонстрации и исходный код уже доступны для изучения.  

Постоянный URL: http://servernews.ru/1005698
07.03.2020 [14:54], Алексей Степин

Xilinx Alveo U25: полку «умных» сетевых карт прибыло

Рынок так называемых «умных» сетевых адаптеров в последние годы активно развивается, поскольку растут и сами сети. Оптимальным решением всё чаще становится выбор сетевого адаптера, не отнимающего ценные вычислительные ресурсы у центральных процессоров.

Столь лакомый кусок рынка, составляющий по разным оценкам, от 10 до 12 миллионов серверов, не мог не привлечь внимания компании Xilinx, которая представила новые экономичные, но при этом весьма производительные сетевые ускорители Alveo U25.

Единого, устоявшегося подхода к реализации ускорения сетевых функций нет. Свои преимущества и недостатки имеет каждый из трёх встречающихся сегодня вариантов — на базе специализированного кремния (ASIC), на базе процессоров общего назначения и на базе ПЛИС (FPGA).

Самым гибким является третий путь, но он же до недавнего времени оставался и самым сложным с точки зрения программирования. Ускорители Xilinx Alveo U25 должны это изменить. Во многом они базируются на наработках Solarflare, компании, стоящей у истоков высокоскоростных сетевых карт с минимальными задержками и выкупленной Xilinx прошлым летом за $400 миллионов.

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

По словам представителя Xilinx, Alveo U25 — первый по-настоящему универсальный «умный» сетевой адаптер, позволяющий развёртывать различные сценарии ускорения практически так же быстро, как и карты на базе процессоров общего назначения. Но при этом он обладает несопоставимо более высоким уровнем производительности при энергопотреблении в районе 40 ‒ 50 Ватт. В этот пакет можно уместить 8 или даже 16-ядерный ЦП с архитектурой ARM, что позволяет достичь скорости обработки порядка 32 миллионов сетевых пакетов в секунду на частоте 2 ГГц.

В то же время Alveo U25 может обработать 300 миллионов пакетов в секунду при частоте всего 300 МГц, что позволяет либо на порядок увеличить производительность в заданном диапазоне энергопотребления, либо на порядок сократить само энергопотребление при сохранении уровня производительности.

Рынок «умных» сетевых решений весьма широк

Рынок «умных» сетевых решений весьма широк

Всё дело в развитом параллелизме, который можно синтезировать с помощью FPGA. 8 или даже 16 фиксированных ядер ARM не позволяют достичь такого же уровня параллелизма, как тысячи одновременно работающих обработчиков, синтезированных из ресурсов FPGA. В Alveo U25 используется матрица из серии Zynq, XCU25 с 520 тысячами LUT; в ней также интегрировано 4 ядра ARM Cortex-A53. Объём оперативной памяти DDR4 составляет 6 Гбайт. Два порта SFP28 обеспечивают скорость 25 Гбит/с.

Для минимизации задержки в Alveo U25 реализована технология Solarflare Onload, позволяющая карте работать напрямую с пользовательскими приложениями, минуя уровень ядра операционной системы и её стека TCP/IP. Помимо стандартных сценариев разгрузки, новинка Xilinx поддерживает сценарии машинного обучения и аналитики данных и даже транскодирования видеопотоков на лету, что наверняка найдёт своё применение в активно развивающейся сфере периферийных вычислений.

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Ускорители Alveo U25 поддерживают среду разработки Xilinx Vitis, содержащую все необходимые библиотеки, компиляторы и отладчики. Поддерживаются популярные фреймворки TensorFlow и FFmpeg, а также приложения сторонних разработчиков, написанные на языках Python, C, C++ или P4. Компания Xilinx уже поставляет опытные партии Alveo U25 избранным клиентам, массовые поставки новых «умных» сетевых карт должны начаться в третьем квартале.

Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Отметим, что крупные веб-провайдеры используют решения собственной разработки: так, Microsoft применяет порядка миллиона карт серии Catapult, Amazon Web Services располагает примерно таким же количеством ARM-адаптеров Nitro, а китайская Alibaba Group активно экспериментирует с сетевыми процессорами X-Dragon.

Но, как уже было отмечено в начале, поле для игры очень широкое: на долю всех остальных поставщиков услуг приходится гораздо больше серверов, от 12 до 14 миллионов, и из них лишь 2 или 3 миллиона уже оснащены сетевыми ускорителями. Ни Baidu, ни Tencent в активном внедрении «умных» сетевых карт пока не замечены, так что у Xilinx c Alveo U25 есть серьёзные шансы на успех.

Правда, конкуренция предстоит жёсткая: в этот же сектор метят такие опытные разработчики, как Mellanox и Broadcom, не дремлют Marvell и Silicom, и весьма агрессивно продвигают свои разработки молодые компании, такие, как Fungible или Pensando.

Постоянный URL: http://servernews.ru/1005284
12.02.2020 [22:44], Алексей Степин

Swarm64 продемонстрировала PostgreSQL-ускоритель на базе FPGA Intel Arria 10

Ускорители на базе ПЛИС продолжают осваивать рынок. На конференции PgConf.Russia 2020 компания Swarm64 представила в России свою разработку, ускоритель для СУБД PostgreSQL — решение HTAP (Hybrid Transaction Acceleration Processing) базируется на FPGA Intel Arria 10.

Принцип работы ускорителя Swarm64

ПЛИС ускорителя HTAP сконфигурирована разработчиками Swarm64 для ускорения структуризация массивов данных, операций комплексных вычислений, обработки поисковых запросов. Новинка показала весьма впечатляющие результаты — в популярном бенчмарке TPC-H она продемонстрировала ускорение в 25 — 80 раз, в зависимости от задачи.

Этот набор тестов имитирует «тяжёлые» сценарии работы с СУБД вроде обработки множества одновременных запросов. Именно на этой задаче (обработка запросов класса Q6) выигрыш составил до 80х в сравнении с системой на базе двух 24-ядерных Xeon Gold 8268 с 384 Гбайт оперативной памяти и 1,536 Тбайт памяти в модулях Optane DCPMM в режиме App Direct.

На операциях записи выигрыш был скромнее и составил 25 ‒ 35 раз. Использование ускорителя Swarm64 позволило тестовой системе продемонстрировать производительность на уровне 12 миллионов транзакций в минуту и 5 тысяч аналитических решений в секунду.

Решения Swarm64 также доступны и для ПЛИС Xilinx, а для тех, кто хочет оценить возможности ускорителя, компания предлагает воспользоваться FPGA-инстансами AWS F1

Постоянный URL: http://servernews.ru/1003566
19.12.2019 [21:34], Алексей Степин

Napatech представила «умные» 200GbE-адаптеры Link NT200A02 с FPGA-ускорителем

Растущие скорости сетей требуют от сетевых адаптеров всё большего «разума» и компании-разработчики таких решений отвечают на вызовы технологии и рынка.

Компания Napatech, разработчик реконфигурируемых вычислительных платформ, объявила о доступности новых программируемых сетевых адаптеров Link.

Как правило, «умные» сетевые адаптеры делятся на три категории — ASIC, FPGA (ПЛИС) и «процессорные». Новые решения Napatech относятся ко второму типу, наиболее дорогостоящему, но и демонстрирующему наилучшие результаты в плане производительности на специфических задачах. Программируются такие карты также весьма сложно, но благодаря поддержке стандарта Xilinx Vivaldo эта задача облегчается. Базируются новинки на высокопроизводительной ПЛИС-платформе Xilinx Viretx UltraScale+.

Архитектура новинки

Архитектура новинки

Анонсированная модель, Link NT200A02, базируется на дизайне модуля XCVU5P, но будут доступны и более производительные варианты на базе XCVU7P или XCVU9P. Доступен соответствующий комплект разработчика.

Плата имеет два разъёма QSFP28 с поддержкой скоростей от 1 до 100 Гбит/с и обычный разъём RJ45 (1000Base-T). Поддерживается работа в режиме PCIe x16 3.0, имеется начальная поддержка PCIe 4.0 (в режиме 2×8). Несколько Link NT200A02 могут общаться друг с другом посредством специальной системы межсоединений с пропускной способностью 675 Гбит/с. Кроме того, есть отдельный интерфейс для синхронизации времени с наносекундной точностью. 

Доступна версия с пассивным охлаждением

Доступна версия с пассивным охлаждением

Позиционируется новый продукт в качестве решений для сетевых систем, требующих высокой вычислительной производительности или критичных ко времени отклика: машинного зрения, кодирования видео в реальном времени, высокочастотной торговли, шифрования/дешифровки трафика, обработки данных, получаемых со спутников и других подобного рода задач.

Link NT200A02 имеет сертификацию PCI-SIG, гарантирующую совместную работу в единой системе восьми и более таких карт, что, по мнению компании, позволяет получить вычислительную мощность уровня небольшого кластера в объёмах одного сервера. Мощная ПЛИС означает высокий тепловой пакет, и он у новинки действительно достигает 120 Ватт. Доступны варианты как с собственной активной системой охлаждения, так и оснащённые только пассивным радиатором и полагающиеся на систему охлаждения сервера.

Постоянный URL: http://servernews.ru/1000110
17.12.2019 [21:12], Алексей Степин

Открытый SDR-стек OpenWiFi работает на платформе ПЛИС под управлением Linux

Технология Wi-Fi очень распространена в наши дни, но это не означает, что она избавлена от всех проблем.

Целый сегмент таких проблем связан с тем, что часть прошивки некоторых устройств поставляется исключительно в закрытом бинарном виде. Обойти это ограничение планируют создатели проекта OpenWiFi.

Стек OpenWiFi. Жёлтым цветом отмечены компоненты разработчиков проекта, белым - компоненты Linux

Стек OpenWiFi. Жёлтым цветом отмечены компоненты разработчиков проекта, белым - компоненты Linux

Желание разработчиков защитить свою интеллектуальную собственность или обеспечить уверенность в том, что пользователи не нарушат регуляции FCC, вполне понятно. Но можно понять и пользователей, не уверенных в том, что бинарные компоненты прошивки не содержат закладок и бэкдоров.

Проект OpenWiFi ставит своей целью создание полностью открытой реализации Wi-Fi, совместимой с операционными системами семейства Linux. Хотя сама реализация и относится к классу «программно определяемого радио» (Software Defined Radio, SDR), радиочастотный фронт-энд в OpenWiFi реализуется с помощью ПЛИС. Выбор вполне логичный, поскольку именно программируемые матрицы сочетают максимальную гибкость конфигурации с необходимым для целей разработчиков проекта уровнем производительности.

ZC706 Evaluation Board обладает весьма развитыми возможностями для запуска OpenWiFi

ZC706 Evaluation Board обладает весьма развитыми возможностями для запуска OpenWiFi

В текущей реализации радиочастотный трансивер создан на базе комплекта разработчика Xilinx Zynq-7000 (ZC706). Его основой служит достаточно мощная ПЛИС XC7Z045 FFG900, имеющая в своём составе не только логические ячейки и DSP-слайсы, но и пару процессорных ядер ARM Cortex-A9.

Уже реализована поддержка протоколов 802.11a/g и 802.11n и модуляций MCS c 0 по 7, ширина радиоканала составляет 20 МГц с шагом 2 МГц для 802.11ah или 10 МГц для 802.11p.

Демонстрация работоспособности OpenWiFi

OpenWiFi находится в начале пути, поэтому говорить о запредельных скоростях уровня, предлагаемого современными устройствами 802.11ac/ax, пока не приходится. Пока разработчикам удалось добиться 30,6 Мбит/с для нисходящего и 17 Мбит/с для восходящего трафика TCP (для UDP показатели несколько выше ‒ 38,8 и 21,5 Мбит/с соответственно). В планах OpenWiFi значится реализация поддержки 802.11ax WiFi 6, а также расширение спектра используемых ПЛИС-платформ.

Все ресурсы можно найти в соответствующем репозитории на Github; доступно два типа лицензирования — полностью открытое AGPLv3 и закрытое. Существует также руководство по запуску ZYNQ SDR с Linux. Создатели OpenWiFi планируют представить свой проект на встрече европейских разработчиков открытого ПО FOSDEM 2020, которая откроется 1 февраля следующего года.

Постоянный URL: http://servernews.ru/999938
17.12.2019 [11:21], Владимир Романченко

Cisco объявила о поглощении Exablaze, разработчика сетевых решений с ультранизкими задержками

Cisco Systems намерена купить австралийскую частную компанию Exablaze, которая специализируется на разработке и производстве сетевых устройств. Об этом в корпоративном блоге написал Роб Сальваньо (Rob Salvagno), вице-президент Cisco по корпоративному развитию и инвестициям. Помимо записи в блоге Сальваньо, о предстоящей сделке стало известно из заявления Грега Робинсона (Greg Robinson), соучредителя и председателя совета директоров Exablaze, а также из официального пресс-релиза Cisco.

Среди причин и целей слияния, в частности, указываются планы по интеграции продуктов и технологий Exablaze в портфолио Cisco. Ключевым интеллектуальным ресурсом австралийской компании в Cisco называют технологии использования программируемых вентильных матриц (FPGA) для обеспечения программируемости и гибкости будущей сетевой продукции.

Список перспективных сетевых продуктов Cisco на базе FPGA Exablaze со сверхнизкими задержками и технологией пикосекундной синхронизации включает коммутаторы и сетевые карты (NIC).

Среди ключевых рынков, на которые ориентированы сетевые устройства Exablaze, указан финансовый сектор, компании высокочастотного (алгоритмического) трейдинга (High-frequency trading, HFT), приложения искусственного интеллекта, машинного обучения, суперкомпьютеры, ЦОДы, облачные и пограничные вычисления.

Компания Exablaze была создана в 2013 году и сегодня имеет офисы в Сиднее, Нью-Йорке, Шанхае и Лондоне. Помимо приложений финансового сектора, продукция компании традиционно ориентирована на аналитику больших данных, высокопроизводительные вычисления и телекоммуникации.

Ожидается, что слияние объединение Exablaze и Cisco будет завершено в третьем квартале финансового 2020 года. Финансовая сторона сделки и дальнейшие планы касательно сотрудников Exablaze пока не разглашаются. 

Постоянный URL: http://servernews.ru/999872
12.12.2019 [14:14], Геннадий Детинич

Lattice представила первые ПЛИС CrossLink-NX на пластинах FD-SOI

Американская компания Lattice Semiconductor, которую пару лет назад пытались купить китайцы, и чему помешал специальный указ Дональда Трампа, представила уникальные и первые на рынке по комбинации возможностей FPGA. Это программируемые матрицы для маломощных решений с высочайшей энергоэффективностью.

Это качество достигается за счёт 28-нм техпроцесса на пластинах с изолятором из полностью обеднённого кремния (FD-SOI, fully depleted silicon-on-insulator). Производством матриц занимается компания Samsung.

Технология FD-SOI решает два вопроса. Во-первых, снижаются паразитные токи утечки. Во-вторых, поскольку транзисторный канал очень небольшой (помечен оранжевым цветом на картинке выше), то так называемые мягкие ошибки оказывают меньше влияния на работу транзисторов. Это ошибки, вызванные бомбардировкой чипов высокоэнергетическими частицами. Например, из космоса. В исполнении матриц Lattice на FD-SOI уровень «мягких» ошибок снижен примерно на два порядка, что важно для использования матриц компании в транспортной и промышленной электронике.

Первой продукцией Lattice на пластинах FD-SOI стали ПЛИС CrossLink-NX (новая платформа Nexus). По сравнению с конкурирующими решениями энергопотребление CrossLink-NX на 25 % меньше без снижения производительности. Это свойство будет востребовано для создания на базе ПЛИС Lattice компактных решений для периферийных ИИ и самообучающихся платформ по управлению массивами датчиков и для видеонаблюдения.

Область использования матриц CrossLink-NX охватывает ПЛИС с числом логических ячеек от 10 тыс. до 200 тыс. В дальнейшем компания планирует расширить ассортимент FPGA-продукции на основе 28-нм FD-SOI-процесса Samsung, чему поможет продуманное масштабирование проекта.

Матрицы CrossLink-NX на платформе Nexus поставляются в двух версиях: с 17К логических программируемых вентилей и с 40К вентилями. Размер матрицы с вентилями на кристалле составляет всего 6 × 6 мм. Пропускная способность встроенного интерфейса MIPI достигает 2,5 Гбит/с. Подобные решения оптимальны для систем видеонаблюдения со встроенными блоками для обработки потокового видео. Кроме перепрограммируемых вентилей в состав ПЛИС входят также универсальные цифровые сигнальные процессоры.

Типичное потребление матриц CrossLink-NX при максимальной рабочей температуре 85 °C составляет около 35 мВт. Кроме видеонаблюдения новые матрицы Lattice будут использоваться для управления датчиками, обеспечения безопасности оборудования, инфраструктуры 5G и приложений промышленной автоматизации.

Постоянный URL: http://servernews.ru/999604
06.11.2019 [23:10], Андрей Созинов

Intel Stratix 10 GX 10M: самая большая в мире ПЛИС с 10 млн элементов

Компания Intel представила Stratix 10 GX 10M — самую большую в мире программируемую интегральную схему (FPGA). Новинка выполнена по 14-нм техпроцессу и насчитывает 43,3 млрд транзисторов. Заметим, что предыдущим рекордсменом была ПЛИС  Xilinx Virtex VU19P, обладающая 35 млрд транзисторов. 

Новая матрица Stratix 10 GX 10M насчитывает 10,2 млн логических элементов, на что как раз и указывает сокращение «10М» в её названии. Логика разместилась на двух кристаллах, соединённых между собой вмонтированным в подложку полупроводниковым мостом EMIB (Embedded Multi-Die Interconnect Bridge).

Помимо кристаллов с логикой на подложке Stratix 10 GX 10M расположилось четыре кристалла, на которых в сумме расположилось 48 трансиверов, которые способны обеспечить общую пропускную способность до 0,85 Тбит/с (17,5 Гбит/с каждый). Трансиверы подключены к кристаллам с логикой также посредством интерфейса EMIB.

Всего новинка обладает 25 920 соединениям EMIB, что обеспечивает пропускную способность в 6,5 Тбит/с между всеми кристаллами, из которых состоит Stratix 10 GX 10M. Так что EMIB вряд ли станет узким местом новинки.

Ещё одной важной особенностью рекордной ПЛИС является наличие 2304 контактов ввода/вывода, доступных пользователю. Это позволит создавать самые разнообразные системы с большим количеством внешних интерфейсов. Есть у Stratix 10 GX 10M и 308 Мбит набортной памяти.

По словам Intel, новинка потребляет на 40 % меньше энергии, нежели её прежняя самая большая ПЛИС Stratix 10 GX 2800. Также новая Stratix 10 GX 10M обладает в 3,7 раза более высокой плотностью размещения транзисторов и вдвое большим числом контактов ввода/вывода.

Постоянный URL: http://servernews.ru/997101
01.11.2019 [21:42], Алексей Степин

ВКонтакте осваивает Intel Optane DCPMM и FPGA Arria 10 GX

«ВКонтакте» имеет 97 млн активных пользователей в месяц. Каждый день они просматривают 9 млрд постов, ставят 1 млрд лайков, пишут 10 млрд сообщений, 650 млн раз просматривают видео и генерируют трафик 3,5 Тбит/с. Общий объём пользовательских данных достиг 1,1 экзабайта. 

За всем этим стоит немалая IT-инфрастуктура: 19 тыс. серверов, 3 связанных между собой ЦОД, 30 CDN-узлов и дополнительных точек присутствия по всему миру. Малейшая возможность повысить их эффективность выливается в миллионы долларов экономии ежегодно. На мероприятии Intel Experience Day 2019 VK рассказала о такой возможности. 

До недавних пор имелись два основных типа машин: 1U-сервер приложений на базе пары Intel Xeon 2660v4 и четырёх HDD + 4U-сервер хранения данных с двумя Xeon 2620v4 и 36 HDD. То есть фактически было лишь два уровня хранения информации: DRAM и жёсткие диски. Разделение между «горячими» и «холодными» данными простое, но далеко не самое эффективное, так как с ростом объёма информации итоговая производительность падает, а стоимость хранения, напротив, растёт день ото дня. 

В результате проведённых экспериментов было принято решение по изменению серверной инфраструктуры с учётом новых технологий хранения данных, имеющихся на рынке. Это снижает стоимость владения инфраструктурой на величину от 65% до 90%.

Проект получился комплексный: число уровней хранения информации выросло до четырёх, не считая DRAM. Для наиболее «горячих» данных используются модули Intel Optane DC Persistent Memory (DCPMM) объёмом 1 Тбайт (8 × 128 Гбайт) в сочетании с PCIe-накопителями Intel Optane P4800X ёмкостью 750 Гбайт. Использование DCPMM и DRAM вместо одной только оперативной памяти снизило капитальные затраты в два раза. 

Появился новый уровень, «тёплый», где данные хранятся на 8 SSD Intel P4320 с интерфейсом NVMe (QLC 7,68 Тбайт). Так что все эти 1U-сервера работают исключительно с твердотельными накопителями. Лишь на самом «холодном» уровне по-прежнему используются традиционные HDD. Но и тут плотность размещения резко возросла — в 4U-шасси с вертикальной загрузкой теперь помещается 102 жёстких диска. 

Но даже при новой системе разделения слоёв содержание более 1 экзабайта данных стоит очень дорого. Компания решила провести опыт по оптимизации хранения изображений, которых на серверах VK хранится несколько сотен петабайт, причём часто в нескольких форматах и разрешениях. 

Наилучшим решением проблемы стало использование серверов с восемью ускорителями Intel на базе ПЛИС Arria 10 GX, производящих при отдаче контента преобразование изображений на лету в нужную пользователю форму. По итогу удалось уменьшить объём хранимых изображений на 20%, сэкономив десятки петабайт места. В настоящее время компания рассматривает возможность применения FPGA для других типов нагрузок. 

Все новые серверы построены на базе двух процессоров Intel Xeon Gold 6230  (20/40, 2,1/3,9 ГГц, 27,5 Мбайт, 125 Вт), так что вычислительные мощности существенно возросли. Сеть подверглась модернизации c 10GbE на 25GbE. Пересмотр структуры хранения и передачи данных позволил увеличить среднюю плотность размещения в три раза, что положительно сказывается на затратах на содержание. 

Постоянный URL: http://servernews.ru/996764
Система Orphus