Материалы по тегу: процессоры

21.08.2017 [07:55], Алексей Степин

AMD EPYC наступает: новое видео демонстрирует преимущество в STREAM и Fluent

Долгое время о компании AMD было ничего не слышно в серверном сегменте: имевшиеся в распоряжении «красных» процессоры Opteron уступали конкурирующим решениям «синих», да и разработчики кластерных систем класса HPC предпочитали проверенные временем процессоры. Но с появлением EPYC всё пошло иначе: «красные» активно напирают именно в серверном сегменте, и на этом фронте у них есть заметные успехи. Не столь давно AMD опубликовала видеоролик, в котором система на базе чипов EPYC опередила аналогичную по классу систему с процессорами Intel Xeon v4 (Broadwell-EP) в тестах STREAM и ANSYS Fluent.

Платформа «красных» была оснащена двумя 32-ядерными чипами EPYC 7601 (32C/64T, 2,2/2,7 ГГц, 64 Мбайт L3), а соперник выставил двухпроцессорную систему на базе Intel Xeon E5-2699 v4 (22C/44T, 2,2/3,6 ГГц, 55 Мбайт L3). Назвать их равными определённо нельзя, если опираться только на количество ядер — здесь у AMD преимущество. Но надо учесть, что в целом, удельная производительность на ядро выше именно у Intel. Несмотря на архитектуру MCM, в тесте STREAM AMD победила с разгромным счётом: 266 Гбайт/с против 116 Гбайт/с; AMD заявила, что данный тест является неплохой оценкой производительности для систем, работающих с задачами класса HPC.

Грамотное использование Infinity Fabric сводит на нет все недостатки компоновки МСМ

Грамотное использование Infinity Fabric сводит на нет все недостатки компоновки МСМ

В симуляторе поведения жидкостей и газов Fluent «красные» также опередили «синих», выигрыш составил примерно 78 %. В задаче обсчитывалось поведение 14 миллионов частиц при различных аэродинамических эффектах, возникающих в полёте реактивного лайнера. Здесь сыграли свою роль как более высокая пропускная способность подсистемы памяти, так и «чистое» количество ядер. По словам Скотта Эйлора (Scott Aylor), главы отдела бизнес-решений AMD, компания не просто вернулась в сектор HPC с одним продуктом, она намеревается остаться там надолго и предложить своим клиентам уверенность в будущем: по мере развития серии EPYC партнёры AMD могут быть уверены: их не бросят наедине с несовместимой ни с чем платформой, а предложат планомерное обновление до более высокого уровня производительности.

Постоянный URL: http://servernews.ru/957223
18.08.2017 [18:25], Сергей Карасёв

Intel раскрыла характеристики процессоров Atom C3000

Корпорация Intel опубликовала на своём сайте информацию о технических характеристиках процессоров Atom C3000, пробные поставки которых были начаты в феврале нынешнего года.

Чипы рассчитаны на использование в серверном и сетевом оборудовании, массивах хранения данных и устройствах Интернета вещей. Изделия производятся с применением 14-нанометровой технологии. Заявлена поддержка оперативной памяти DDR4 ECC ёмкостью до 256 Гбайт, до четырёх портов 10Gb Ethernet, интерфейсов USB 3.0 и Serial ATA 3.0.

Говорится о реализации технологии Intel QuickAssist (Intel QAT), которая позволяет ускорить выполнение ресурсоемких вычислительных операций. Система оптимизирует производительность платформ и приложений. Технология позволяет использовать симметричное шифрование и аутентификацию, асимметричное шифрование, цифровые подписи, RSA, DH, ECC и сжатие данных без потерь.

На сегодняшний день в семейство Atom C3000 входят пятнадцать процессоров. Они насчитывают от двух до шестнадцати вычислительных ядер. Тактовая частота варьируется от 1,5 до 2,2 ГГц, максимальное значение рассеиваемой тепловой энергии — от 8,5 до 32 Вт.

Среди прочего стоит выделить поддержку средств виртуализации Intel Virtualization Technology (Intel VT). Диапазон рабочих температур для семейства Atom C3000 простирается от минус 40 до плюс 85 градусов Цельсия. 

Постоянный URL: http://servernews.ru/957182
12.08.2017 [22:00], Алексей Степин

Новые продукты Broadcom: адаптеры NVMe over FC и сетевые процессоры с поддержкой 100G

Вычислительные мощности постоянно растут, и вместе с ними растут требования к сетевой инфраструктуре. Если для домашнего пользователя стандартом давно стал проводной Gigabit Ethernet, который в последнее время активно теснит распространение беспроводных устройств формата 802.11ac, то в серверных и кластерных системах, а также суперкомпьютерах остро стоит вопрос производительности сетевой среды. Скоростями в районе 10‒40 Гбит/с уже никого не удивишь, и индустрия активно осваивает новые стандарты, такие, как 100G. Компания Broadcom, известная в числе прочего и своими сетевыми процессорами, представила новое поколение чипов с поддержкой скорости 100 Гбит/с.

Новые чипы серии Smart NIC NetXtreme BCM588xx являются первыми в мире полностью программируемыми сетевыми процессорами с поддержкой стандарта 100G. В их основе лежит кластер из 8 ядер ARMv8 (Cortex-A72) с частотой 3 ГГц, оптимизированный с учётом использования в сценариях типа NVMe over Fabric. Чипы производятся с использованием 16-нм техпроцесса FinFET+ и поддерживают интерфейс PCI Express 3.0. Также в них интегрирован трёхканальный контроллер памяти DDR4 — опция, абсолютно необходимая при построении эффективных сетей с такими скоростями. Имеется криптографический движок с производительностью 90 Гбит/с и средства разгрузки при работе с массивами RAID. В настоящее время Broadcom уже поставляет образцы новых сетевых платформ как в виде платы расширения PCIe 3.0 формата HHHL (BCM58802), так и в виде платы формата ATX (BCM58808). Полностью с характеристиками нового семейства можно ознакомиться на сайте компании-разработчика.

Адаптер Emulex Fibre Channel шестого поколения (3,2 Гбайт/с)

Адаптер Emulex Fibre Channel шестого поколения (3,2 Гбайт/с)

Также Broadcom анонсировала новые решения класса NVMe over Fibre Channel — эта физическая среда часто используется для подключения вычислительных узлов к системам хранения данных, и полноценная поддержка набирающего популярность протокола NVMe приходится тут как нельзя более кстати. Этот протокол оптимизирован с учётом особенности твердотельных накопителей, которые в последнее время активно вытесняют традиционные механические жёсткие диски из СХД, особенно там, где требуется высокая производительность на случайных операциях. Новые адаптеры, выпускаемые под брендом Emulex, прошли квалификационное тестирование на соответствие стандарту NVMe over FC (Gen 6, 3,2 Гбайт/с) и совместимость с продуктами других производителей, в частности, коммутаторами Brocade X6 Director, G620 и серией Cisco MDS 9000.

Постоянный URL: http://servernews.ru/956875
26.07.2017 [13:02], Сергей Карасёв

Новые процессоры Intel Atom нацелены на коммуникационное и сетевое оборудование

Корпорация Intel пополнила семейство процессоров Atom моделями C2316 и C2516 поколения Rangeley, которые предназначены для использования в сетевых и коммуникационных устройствах.

Модель Atom C2316 наделена двумя вычислительными ядрами Silvermont с тактовой частотой 1,5 ГГц и 1 Мбайт кеш-памяти второго уровня. Максимальное значение рассеиваемой тепловой энергии (TDP) составляет 7 Вт.

Чип Atom C2516, в свою очередь, содержит четыре вычислительных ядра с тактовой частотой 1,4 ГГц. Объём кеша второго уровня равен 2 Мбайт. Изделие характеризуется показателем TDP в 10 Вт.

Процессоры могут работать с памятью DDR3-1333. Технологии Hyper-Threading и Turbo Boost не поддерживаются. Среди доступных интерфейсов можно упомянуть PCI-Express 2.0, USB 2.0, SATA 3.0 и Gigabit Ethernet.

Процессоры выпускаются в упаковке типа BGA. Цена изделий Atom C2316 и Atom C2516 составляет соответственно 39 и 64 доллара США. 

Постоянный URL: http://servernews.ru/956014
24.07.2017 [22:55], Алексей Степин

Fujitsu разрабатывает специализированный процессор для систем ИИ

Глубокое машинное обучение и системы искусственного интеллекта в наше время являются очень популярными направлениями. Но современные процессорные архитектуры для задач подобного рода подходят далеко не лучшим образом, поэтому всё больше и больше разработчиков микроэлектроники обращаются к альтернативным и специализированным дизайнам. В гонку за искусственным интеллектом включился и такой японский гигант как Fujitsu — компания объявила о том, что ведёт работы над созданием специализированного процессора. Проект носит кодовое имя DLU (Deep Learning Unit), что в полной мере раскрывает его предназначение. Основной целью проекта является достижение десятикратного преимущества над конкурирующими решениями по соотношению «производительность на ватт». В разработке DLU находится с 2015 года, но лишь в этом году стали известны некоторые подробности об архитектуре нового процессора Fujitsu.

Глава отдела разработок ИИ, Такуми Маруяма (Takumi Maruyama), отметил, что архитектура DLU активно использует вычисления со сравнительно низкой точностью, как это делают и многие другие чипы, предназначенные для глубокого машинного обучения. Это позволяет добиться оптимального соотношения производительности и потребляемой мощности. Чип DLU поддерживает форматы FP32, FP16 INT16 и INT8, и компания продемонстрировала, что даже целочисленные 8 и 16-битные форматы могут эффективно использоваться в ряде задач машинного обучения без серьёзных проблем, вызванных низкой точностью вычислений. Архитектура Fujitsu DLU спроектирована таким образом, чтобы быть полностью управляемой со стороны программного обеспечения. Процессор разбит на блоки DPU (Deep Learning Processing Units), их общее количество может быть разным, но каждый блок DPU состоит из 16 более простых блоков DPE (Deep Learning Processing Elements).

В свою очередь, каждый DPE состоит из восьми блоков исполнения SIMD-инструкций и большого набора регистров. Последний, в отличие от традиционных кешей, полностью управляем программно. В состав чипа также входит некоторый объём памяти HBM2, которая выступает в роли кеша, а также интерфейсы межпроцессорной шины Tofu. Последняя позволяет объединять массив DLU в единую сеть с развитой топологией. Структура этой сети приведена на слайде выше. Как обычно, специализированные процессоры, к числу которых относится и Fujitsu DLU, работают в тандеме с процессорами общего назначения. В данном случае компания планирует использование чипов с архитектурой SPARC, что неудивительно — именно Такуми Маруяма принимал самое активное участие в разработке этой архитектуры начиная с 1993 года. Первый выход DLU на рынок запланирован на 2018 год, именно в виде сопроцессора, но у Fujitsu имеются и планы по интеграции данной архитектуры в ЦП общего назначения с архитектурой SPARC. Соперниками новинки будут чипы Intel Lake Crest, ускорители Radeon Instinct, а также чипы NVIDIA. Последняя имеет неплохую фору в сфере машинного обучения и конкурировать с ней будет непросто.

Постоянный URL: http://servernews.ru/955927
19.07.2017 [11:08], Сергей Карасёв

Семейство процессоров Intel Xeon D пополнили пять моделей

Компания Intel, по сообщениям сетевых источников, без особой шумихи представила сразу пять новых процессоров в семействе Xeon D.

Чипы Xeon D рассчитаны на применение в микросерверах, встраиваемых устройствах и сетевом оборудовании. Процессоры сочетают такие характеристики, как довольно высокий уровень производительности, солидный набор возможностей и относительная экономичность.

Итак, дебютировали чипы Xeon D-1513N, D-1523N, D-1533N, D-1543N и D-1553N. Они выполнены на микроархитектуре Broadwell. Количество ядер в зависимости от модификации (см. таблицу ниже) составляет от четырёх до восьми, объём кеша третьего уровня — от 6 до 12 Мбайт. Максимальное значение рассеиваемой тепловой энергии — 35, 45 или 65 Вт.

Все изделия поддерживают технологию многопоточности Hyper-Threading. Говорится о возможности использования оперативной памяти DDR3 и DDR4. Интегрированного графического контроллера нет.

Среди прочего можно выделить поддержку технологий Turbo Boost, VT-x/VT-d virtualization, Trusted Execution и QuickAssist, а также интерфейсов PCI Express 3.0, SATA, USB 2.0/3.0 и 10 Gb Ethernet. 

Постоянный URL: http://servernews.ru/955680
18.07.2017 [11:39], Алексей Степин

Российские учёные разработали модулярно-логарифмический сопроцессор

Как известно, классические процессорные архитектуры проявляют себя хорошо при решении определённого круга задач, но в ряде особых случаев разработчики вынуждены применять специализированные сопроцессоры, поскольку эффективность обычных ЦП в этих случаях низкая, и они решают задачу, что называется, в лоб — количественным методом, затрачивая на это чудовищное количество системных ресурсов. Сопроцессоры же способны решать такие задачи гораздо быстрее. Простейшим примером могут послужить вычисления с плавающей запятой: сейчас блоки FPU интегрированы в основной кристалл, но когда-то они были отдельными чипами — Intel 8087/80287/80387 или других производителей, таких, как Weitek. В качестве современного примера можно привести векторные процессоры NEC Aurora, о которых мы рассказывали читателям ранее.

Похожего класса разработки имеются и у российских учёных: так, в лабораториях ВНИИЭФ разработан уникальный модулярно-логарифмический сопроцессор, первый научный доклад о котором прозвучал на суперкомпьютерном форуме НСКФ-2016. Глава команды разработчиков, Илья Осинин, заявил, что благодаря использованию нетрадиционной логарифмической системы счисления удалось добиться десятикратного ускорения производительности на операциях умножения и стократного — на операциях деления. И это не только теория: сопроцессор был проверен в работе и аппаратно. Для прототипирования были использованы чипы ПЛИС производства Altera — так поступают практически все разработчики сложных вычислительных устройств, когда им нужно проверить свои теории на практике. Данной разработкой заинтересовались сразу три российских разработчика: АО «МЦСТ», Baikal Electronics и НИСИ РАН.

Внимание со стороны МЦСТ вполне логично: у этой команды уже налажен выпуск восьмиядерных 64-битных процессоров Эльбрус-8С, на основе которых планируется строить не только серверы и рабочие станции, но также и кластерные системы и суперкомпьютеры, в которых сопроцессор Осинина может принести немало пользы. По данным разработчиков, этот чип в 1000 раз быстрее Intel Xeon E5-2697 v3 (Haswell-EP, 14С/28T, 2,6 ГГц, 35 Мбайт L3, 145 ватт) при вычислении логарифмов и в три раза быстрее при обработке сложных полиномов. Интересно, что архитектура у новой разработки гибкая и имеет возможность реконфигурации на лету, что, в числе прочего, позволяет заменять отказавшие вычислительные блоки не прерывая вычислений. Это наверняка оценят как учёные, так и военные. Имеющийся прототип, выполняющий 4 операции за такт, оценивается в 9,2 миллиона транзисторов, что весьма немного по меркам современной индустрии.

При увеличении количества вычислительных блоков до 32 возможности модулярно-логарифмического сопроцессора сравняются с блоком AVX-512, реализованном в процессорах Intel Xeon Phi семейства Knights Landing, но транзисторный бюджет составит всего 73,6 миллиона транзисторов против 86 миллионов у Intel —  налицо 17 % экономия, а значит, и более низкая себестоимость. Помимо этого, группировка ядер в новой архитектуре позволяет выполнять 1024-разрядные операции за один такт, чего не умеет блок расширений AVX-512, ограниченный 512 разрядами за такт. О полной победе над Intel говорить рано, поскольку образец пока работает лишь на частоте 100 МГц — в 26 меньше, чем у решения Intel. Речь идёт о финальной версии с аналогичной частотой 2,6 ГГц, что вполне достижимо в финальной версии с собственным кремнием. Совместим новый сопроцессор не только с решениями МЦСТ, но и практически с любым другим процессором. Из отечественных решений названы чипы Байкал-М и KOMDIV-64.

Постоянный URL: http://servernews.ru/955609
26.06.2017 [18:07], Алексей Степин

ISC 2017: CPU SunWay Micro — китайская экзотика

В проектировании суперкомпьютеров нет единого стандарта и архитектуры: строятся системы как на базе x86-совместимых процессоров, но активно используются и уникальные решения, такие как векторные процессоры NEC. Идёт своим путём и Китай, разрабатывая специально для этой цели серию процессоров Sunway (ShenWei). За разработку отвечает Национальный центр по проектированию высокопроизводительных интегральных схем, расположенный в Шанхае.

Исторически эти процессоры родились как ответ на запрос военных из НОАК, считается что основой послужили знаменитые в своё время чипы DEC Alpha. Последнее поколение Sunway, 260-ядерные процессоры SW26010 стали «сердцами» для одного из самых мощных суперкомпьютеров в мире — TaihuLight, который по-прежнему возглавляет список TOP500 по состоянию на июнь 2017 года. Архитектурно эти процессоры чем-то напоминают современные GPU, так как содержат внутри четыре кластера, в каждом из которых организована матрица 8 × 8 из относительно простых вычислительных элементов, а за управление отвечает приставленное к каждому кластеру ядро с более традиционной архитектурой.

Каждый кластер имеет свой контроллер памяти и использует собственное адресное пространство. Вычислительные блоки имеют по 64 Кбайт кеша данных и 16 Кбайт кеша инструкций, но традиционная иерархия кешей на этом заканчивается и объединены эти блоки единой сетью класса NoC (network-on-chip); управляющие ядра, впрочем, построены более привычным образом — каждое из них располагает 256 Кбайт собственного кеша L2. Судя по экспозиции на ISC 2017, разработчики серии Sunway решили продвигать свои решения и в другие, не столь масштабные сферы. Были продемонстрированы новые системные платы Sunway Micro с двумя процессорами SW26010 на каждой, причём они изначально ориентированы на жидкостное охлаждение, на что явно указывают не лишённые китайского изящества водоблоки.

Речь, скорее, о модуле, нежели о системной плате в полном смысле этого слова, поскольку оперативная память распаяна в виде набора чипов, а не установлена модулями DIMM. В зависимости от конфигурации, её объем может составлять от 64 до 256 Гбайт на плату. Производительность такой платы составляет 6 терафлопс, она может нести на борту до 12 Тбайт дискового пространства. Эффективность SW26010 высока: каждый вычислительный блок может выполнять 8 операций над числами с плавающей запятой. Тактовая частота невысока, она составляет всего 1,45 ГГц, но для 260-ядерного процессора это серьёзное значение.

Новинки предназначаются для использования в науке и инженерии для моделирования различных процессов, подходят они и для набирающих популярность систем глубинного машинного обучения (deep learning). Аккуратное шасси с двумя иероглифами на передней панели напоминает шкафы TaihuLight, но, разумеется, занимает намного меньше места. Оно может вместить в себя несколько плат Sunway Micro и представляет собой суперкомпьютер в миниатюре.

Аппаратное обеспечение, особенно такое уникальное, как Sunway, требует программной поддержки, и она у китайских разработчиков есть: потенциальным партнёрам будут доступны всевозможные средства и среды разработки, базирующиеся на языках C/C++ и Fortran, отладочные механизмы, а также средства многопоточной оптимизации и автоматической векторизации кода. В этом платформа Sunway Micro ничуть не уступает японской NEC Vector Engine.

Постоянный URL: http://servernews.ru/954505
26.06.2017 [17:58], Алексей Степин

ISC 2107: кластерные системы NEC Aurora с векторной архитектурой

В мире супервычислений всё обстоит не так, как привыкли обычные пользователи — для последних обычной и чуть ли не единственной является архитектура x86, а вот в сверхмощных вычислительных системах широко применяются уникальные архитектуры и технологии. В качестве одного из примеров можно назвать векторные процессоры NEC и суперкомпьютеры на их основе. Они имеют давнюю историю, а в качестве наиболее известного проекта NEC можно назвать «Симулятор Земли» (Earth Simulator Project) — суперкомпьютер, предназначенный специально для отработки климатических моделей. Он был самой быстрой вычислительной системой на нашей планете с 2002 по 2004 годы.

Но игнорировать развитие x86 не стоит никому; не стала делать этого и NEC, представившая на ISC 2017 гибридные системы нового поколения, сочетающие в себе достоинства проверенной временем архитектуры с уникальными наработками компании в области векторных вычислений. Проект получил название Aurora и развивается он сразу в нескольких направления — от обычных рабочих станций в башенном форм-факторе и серверных модулей в 19-дюймовых корпусах до огромных сверхмощных суперкомпьютеров и кластерных систем.

В первом варианте векторный процессор NEC выполнен в форме обычной платы расширения, вроде Intel Xeon Phi или NVIDIA Tesla. Это представляет определённый интерес, но архитектура NEC интересна высокой пропускной способностью подсистемы памяти, а в этом случае ограничивающим фактором является шина PCI Express. Стоечный вариант интереснее: он представляет собой стандартный серверный корпус высотой 1U с креплениями для 19-дюймовой стойки. Процессоров в этой системе три: один традиционный Intel Xeon Skylake-EP (а в будущем, возможно, и AMD EPYC) и два векторных процессора NEC Vector Engine.

Общаются они также посредством PCI Express 3.0, и, что интересно, основная задача выполняется исключительно на этих процессорах, а подсистема x86 выполняет только обслуживающие роли (примерно так же работают многие ускорители в версии PCIe-адаптера). К сожалению, данных о самих чипах очень мало, есть лишь куцые сведения о производительности Vector Engine — более 150 гигафлопс FP64 на одно векторное ядро, более 150 Гбайт/с ПСП в пересчёте на ядро же, суммарная скорость обмена данными достигает 1,5 Тбайт/с.

Количество ядер может достигать 32, теплопакет, по имеющимся сведениям, при этом лежит в пределах 300 ватт. А вот как организована подсистема памяти у NEC Aurora, мы не знаем. Следует полагать, что разработчики позаботились об отсутствии «бутылочного горлышка» в этом месте. Судя по всему, каждый векторный процессор располагает весьмы существенным объёмом высокоскоростной памяти (возможно, HBM2). В рамках кластера роль объединяющей среды выполняет InfiniBand.

С программной же поддержкой у NEC всё хорошо: можно использовать наработанные решения, созданные для суперкомпьютеров серии SX, поддерживаются стандартные средства программирования C/C++ и Fortran, имеется проверенный временем векторный компилятор и развитые средства автоматической «векторизации» кода. В качестве основной операционной системы используется дистрибутив x86 Linux, дополненный специфическим ПО для работы с векторными процессорами. Выглядит новая платформа многообещающе, но как она покажет себя в сравнении с решениями типа GPGPU, ещё предстоит узнать.

Постоянный URL: http://servernews.ru/954503
25.06.2017 [16:04], Алексей Степин

ISC 2017: решения на базе процессоров Cavium ThunderX2

Процессорная архитектура ARM прочно заняла своё место в различных мобильных устройствах — смартфонах и планшетах, широко представлена она в домашних маршрутизаторах и ТВ-приставках, но о заметном проникновении на рынок серверных решений, пожалуй, можно говорить лишь сейчас, хотя разговоры об этом велись уже давно. Ранее такие разработчики, как Applied Micro и Cavium уже показывали процессоры X-Gene и ThunderX соответственно.

Производители серверов проявили интерес, поскольку вопросы энергоэффективности в крупных ЦОД и суперкомпьютерных системах стоят остро, но широкому внедрению ARM мешала относительно слабая программная поддержка. С тех пор ситуация изменилась в лучшую сторону и Cavium, а также такие компании, как Bull, привезли на ISC 2017 свои решения на базе новейших процессоров ThunderX2.

В сравнении с первым поколением ThunderX новые чипы сделали громадный шаг вперёд: теперь производительность в однопоточном режиме серьёзно выросла, а также подросли тактовые частоты. Каждый процессор ThunderX2 может содержать до 54 ядер на базе оригинальной версии архитектуры ARMv8-A, поддерживающей внеочередное исполнение команд. Тактовая частота может достигать 3 ГГц, что находится вполне на уровне решений с архитектурой x86. Изначально говорилось о 2,5‒2,6 ГГц, но разработчикам, похоже, удалось справиться и с более высокими частотами.

Каждое ядро располагает 64 Кбайт кеша инструкций и 40 Кбайт кеша данных, объём общего разделяемого кеша может достигать 32 Мбайт. Новые процессоры Cavium получили шестиканальный контроллер DDR4 и не страдают от нехватки пропускной способности подсистемы памяти; производитель говорит о двух-трёхкратном приросте производительности в сравнении с ThunderX, и, скорее всего, эти данные вполне правдивы. Точных данных о тепловыделении нет, но для 54 ядер встречается цифра 95 ватт, что весьма немного в сравнении с Xeon, Opteron и EPYC.

Если решения на базе x86, как правило, требуют дополнительной, и, порой, весьма непростой логики для поддержки дисковых подсистем и сетевых соединений, то ThunderX2 в такой логике не нуждаются: они не только имеют встроенный контроллер PCI Express 3.0 (16 линий на процессор), чем в наши дни никого не удивишь, но также располагают интегрированными контроллерами SATA (до 24 устройств на платформу) и несколькими сетевыми контроллерами Ethernet с поддержкой скоростей 10, 25, 40, 50 и 100 Гбит/с.

Последнее существенно облегчает задачу построения кластерных систем на базе новых процессоров Cavium. Применение продвинутого 14-нм техпроцесса класса FinFET ставит ThunderX2 в один ряд с новейшими разработками Intel и AMD, а компания-разработчик уже планирует выпуск ThunderX3, которые получат поддержку новейшей шины PCI Express 4.0 и протокола NVMe. А пока серия ThunderX2 будет выпускаться в четырёх вариантах: CP для облачных применений, ST для больших баз данных и параллельных вычислений, SC для веб-сферы и систем безопасности и NT для медиа-серверов и серверов приложений.

Как видно из снимков, на конференции ISC 2017 процессоры Cavium Thunder X2 были представлены весьма широко: в основном, в виде одно- и двухпроцессорных решений как в обычном форм-факторе, так и компактном лезвийном — последний в наши дни применяется всё шире. Устанавливаются новые чипы точно так же, как и обычные процессоры Xeon и EPYC, в разъём типа LGA, что облегчает задачу модернизации систем на их основе, но пока не ясно, устоялся ли определённый тип разъёма для серверных процессоров с архитектурой ARM. Появление единого разъёма сыграло бы этой архитектуре лишь на руку.

Отдельного внимания заслуживают решения французской фирмы Bull — давнего игрока на компьютерном рынке. Она продемонстрировала вычислительные модули Sequana X1310, а также ряд других решений. Вычислительные модули весьма интересны: каждый из них, занимая стандартный корпус формата 1U, имеет внутри три системные платы с двумя процессорами ThunderX2 на каждой. На 6 процессоров приходится 48 слотов DDR4 (8 слотов на чип), а тепло отводится с помощью специализированной системы жидкостного охлаждения.

Обратим внимание: каждая системная плата с двумя разъёмами под процессоры Cavium ThunderX2 очень проста: по сути, кроме процессоров, модулей DIMM и стабилизаторов питания на ней ничего нет. Можно отметить два слота PCIe x16 (по слоту на процессор), батарейку, поддерживающую настройки firmware, а также традиционный модуль удалённого управления ASpeed, который встречается практически на любой серверной плате для процессоров x86. Такая простота означает низкую себестоимость, а компактность и модульность позволяют составлять из этих «строительных блоков» систему практически любой производительности, ограниченную лишь мощностью подсистемы питания и охлаждения в ЦОД.

Похожие системы представила и компания Penguin Computing, которая специализируется на разработке, постройке и поддержке высокопроизводительных вычислительных систем на базе открытых архитектур и решений. Она принимает активное участие в проекте OpenPOWER, но не прошла и мимо нового процессора Cavium. Её система Tundra ES интересна тем, что использует ещё более компактные вычислительные модули, нежели Bull Sequana X1000. Охлаждаться они могут как традиционными вентиляторами, так и централизованной жидкостной системой охлаждения.

Сами модули могут использовать различные архитектуры, но в данном контексте интерес представляют прототипы под названием Valkre, которые существуют также и в традиционном 19-дюймовом формате. Интересно, что в экспозиции замечены как минимум две разновидности системных плат: в Valkre 1030c (с воздушным охлаждением) используется плата с синей паяльной маской производства GIGABYTE, а вот в другой системе цвет печатной платы зелёный, а разработчик неизвестен. Компоновка обеих плат проста, что ещё раз подтверждает преимущества, реализованные Cavium в процессорах ThunderX2. Рост популярности ARM в серверной сфере налицо: если такие крупные производители, как Bull, обратили внимание на эту архитектуру, значит у неё определённо есть будущее.

Постоянный URL: http://servernews.ru/954474