Материалы по тегу: power

20.10.2021 [18:27], Андрей Галадей

IBM представила компиляторы Open XL для C/C++ и Fortran на базе LLVM

В феврале прошлого года IBM объявила о намерении задействовать открытую инфраструктуру LLVM в следующем поколении компиляторов XL. Обещание компания сдержала, и вслед за анонсом первых POWER10-решений объявила о выходе IBM Open XL C/C++ for AIX и IBM Open XL Fortran for AIX. Новинки, содержащие теперь слово Open в названии, сочетают наработки LLVM с лучшими, по мнению компании, в отрасли оптимизациями.

Компания ожидаемо заявила, что компиляторы отлично подходят для разработки как локальных приложений, так и решений для гибридного облака. Новинки позволяют полностью задействовать все преимущества архитектуры POWER10 благодаря оптимизированной кодогенерации, поддержке всех новых функций (включая ИИ) и наличию готовых библиотек. А использование LLVM позволило получить доступ к современным технологиям и инновациям — поддержке новых стандартов C/C++, готовым оптимизациям от разработчиков LLVM и совместимости с GCC.

Кроме того, ускорился и сам процесс компиляции, что позволит сократить цикл разработки и развёртывания критически важных для бизнеса приложений. Наконец, ещё одним плюсом IBM Open XL является гибкое лицензирование. Предлагаются как ежемесячные лицензии (расчёт идёт по числу vCPU), что важно при переходе в облако, так и традиционные варианты с оплатой за каждого пользователя.

Постоянный URL: http://servernews.ru/1051704
08.09.2021 [17:40], Владимир Мироненко

IBM представила серверы E1080: 16 CPU POWER10, 240 ядер, 1920 потоков, 64 Тбайт RAM и 224 PCIe-слота в одной системе

IBM объявила о выходе нового поколения серверов IBM POWER E1080 на базе 7-нм чипа POWER10. Это первая коммерческая система на новых процессорах IBM, представленных на прошлогодней конференции Hot Chips и использующих архитектуру POWER v3.1. IBM POWER E1080 предназначен для удовлетворения спроса на надёжные гибридные облачные среды.

E1080 представляет собой четырёхсокетный сервер с процессорами POWER10. На текущий момент компания предлагает CPU c 10, 12 или 15 ядрами (ещё одно «запасное» ядро отключено), тогда как у POWER9 число ядер не превышало 12. На каждое ядро приходится 2 Мбайт L2-кеша и 8 Мбайт — L3 (до 120 Мбайт общего кеша на CPU). Для систем на базе E1080 поддерживается масштабирование до четырёх узлов, то есть можно получить 16 процессоров, 240 ядер, 1920 потоков, 64 Тбайт RAM и 224 PCIe-слота.

IBM POWER E1080

IBM POWER E1080

Отличительной чертой новинок является поддержка SMT8, то есть обработка до 120 потоков на процессор. По сравнению с POWER9 производительность новых CPU выросла на 20% на поток и на 30% на ядро, а в пересчёте на Вт она выросла трёхкратно. А четыре 512-бит матричных движка и восемь 128-бит SIMD-блоков повысили скорость INT8-операций в 20 и более раз.

Память тоже новая — буферизированная OMI DDR4 DDIMM, которая, по словам компании, отличается повышенной надёжностью и отказоустойчивостью в сравнении с традиционными DDIMM. На один сервер приходится 64 слота с поддержкой до 16 Тбайт RAM с поддержкой технологии прозрачного шифрования памяти (Transparent Secure Memory Encryption, TSME), которая в 2,5 раза быстрее по сравнению с IBM POWER9. Заявленная пропускная способность составляет 409 Гбайт/с на ядро.

И для OMI, и для OpenCAPI используется шина PowerAXON (1 Тбайт/с), которая позволяет подключать к системе различные типы памяти (можно адресовать до 2048 Тбайт в рамках одного кластера), накопители, ускорители и т.д. Также в самой системе доступно четыре слота для NVMe SSD и 8 слотов PCIe 5.0. К E1080 можно подключить до четырёх полок расширения с 12 слотами PCIe 5.0 в каждой.

По данным IBM, благодаря E1080 установлен «мировой рекорд производительности: это первая система, достигшая 955 000 SAPS (SAP Application Performance Standard, в стандартном тесте приложений SAP SD в восьмипроцессорной системе — значительно больше, чем у альтернативной архитектуры x86, 2x на сокет (и) до 4 раз больше возможностей на ядро с E1080 (по сравнению с Intel)».

IBM заявила, что повышение производительности на ядро и увеличение количества ядер в системе означает значительное сокращение занимаемой серверами площади и энергопотребления. В тематическом исследовании неназванного клиента компания сообщила, что 126 серверов на чипах Intel, обслуживающих СУБД Oracle, были заменены тремя E980 на базе POWER9 и, по прогнозам, их можно будет заменить на два E1080. В результате потребляемая мощность упадёт со 102 до 20 кВт, а количество требуемых лицензий сократится с 891 (для системы Intel) до 263 (для E1080).

Новинка имеет в 4,1 раза более высокую по сравнению с x86-серверами пропускную способность контейнеризированных приложений OpenShift, а также целостность архитектуры и гибкость в гибридной облачной среде для повышения универсальности и снижения расходов без рефакторинга приложений. А по сравнению с IBM POWER E980v рост производительности и масштабируемости составил до 50% с одновременным снижением энергопотребления.

Кроме того, E1080 предлагает новые функции RAS для расширенного восстановления, самовосстановления и диагностики, а также усовершенствования для гибридного облака, включая первый в индустрии поминутный контроль использования ПО Red Hat, в том числе OpenShift и Red Hat Enterprise Linux. У IBM POWER E1080 также имеется возможность мгновенного масштабирования с помощью POWER Private Cloud with Dynamic Capacity, что позволит платить только за использованные ресурсы.

Среди прочих преимуществ своего решения IBM отмечает наличие надёжной экосистемы независимых поставщиков ПО, бизнес-партнёров и поддержки для E1080. Кроме того, IBM анонсировала многоуровневый сервис POWER Expert Care, призванный обеспечить защиту от продвинутых киберугроз, а также согласованное функционирование аппаратного и программного обеспечения и более высокую эксплуатационную готовность систем.

Постоянный URL: http://servernews.ru/1048584
12.05.2021 [19:34], Андрей Галадей

OpenPOWER представила LibreBMC, первый полностью открытый  контроллер BMC

Контроллеры BMC (Baseboard Management Сontroller) есть на всех серверных платах. Они обеспечивают управление платформой, мониторинг и защиту, а также зачастую предлагают удалённый доступ к системе. Однако до сих пор в массе своей они представляют собой полностью проприетарные решения. Разработчики из OpenPOWER Foundation намерены изменить это.

В организации сообщили о создании новой рабочей группы для разработки LibreBMC, первого в истории контроллера с полностью открытыми программным и аппаратным обеспечением, а также средствами разработки. Новинка будет основана на архитектуре POWER и программном обеспечении OpenBMC от Linux Foundation. В проекте принимают участие специалисты OpenPOWER Foundation, Google, Antmicro, Yadro, IBM и Raptor Computing Systems.

Antmicro разрабатывает одну из первых карт LibreBMC на базе FPGA Lattice ECP5 и Xilinx Artix-7, которая к тому же будет совместима со спецификациями OCP DC-SCM (Datacenter Secure Control Module). Чему в OCP рады — гиперскейлеры вроде Facebook и Microsoft заинтересованы в «независимых» и универсальных BMC для своих серверов, так как в проприетарных BMC неоднократно находили уязвимости, потенциально позволяющие получить несанкционированный доступ к серверам.

Постоянный URL: http://servernews.ru/1039409
24.03.2021 [18:55], Андрей Галадей

OpenPOWER-ядро Microwatt позволит упростить и удешевить создание open source чипов

Ядро Microwatt на базе архитектуры OpenPOWER было выбрано для включения в программу Efabless Open MPW Shuttle. Это снизит барьер для входа в сферу производства микросхем, что позволит небольшим компаниям разрабатывать и выпускать свои решения без оглядки на крупные производственные компании, причём с использованием open source решений от начала до конца.

Программа Efabless Open MPW Shuttle призвана обеспечить изготовление открытых аппаратных решений. Её спонсирует Google, позволяя дизайнерам экспериментировать и тестировать инновационные разработки с меньшими рисками и затратами на изготовление. Для работы используется SkyWater Open Source PDK. В OpenPOWER Foundation уже заявили, что рады участвовать в этой программе, поскольку такой подход позволит изменить индустрию полупроводникового производства, уменьшить затраты на тестирование и повысить безопасность.

«Изготовление микросхем, по сути, всегда производилось в закрытых средах, с невероятно высокими затратами и рисками. SKY130 — это первый в отрасли комплект для проектирования процессов литейного производства с открытым исходным кодом, а изготовление процессора с полностью открытым исходным кодом, такого как Microwatt, демонстрирует, насколько мы продвинулись в разработке оборудования с открытым исходным кодом», — отметил Тим Анселл (Tim Ansell), инженер-программист Google. Он, кроме прочего, разработал, в том числе вышеупомянутый SkyWater Open Source PDK.

Все данные по Microwatt открыты, что позволяет проверить их безопасность. Microwatt представляет собой относительно простое ядро CPU с поддержкой Micropython, Zephyr и Linux. 

Постоянный URL: http://servernews.ru/1035599
10.02.2021 [16:01], Алексей Степин

IBM представила частное облако Private Cloud Rack на базе процессоров POWER

Многие облачные провайдеры и крупные вендоры уже давно предлагают различные варианты как гибридного, так и частного локального облака. Теперь к ним присоединилась IBM, анонсировав решение на базе POWER-систем и сопутствующей обвязки.

Новая платформа, получившая название IBM Power Private Cloud Rack, базируется на уже не новых, но проверенных серверах Power System S922. Эта модель высотой 2U может иметь на борту 1 или 2 процессора POWER9, поддерживает PCI Express 4.0 и оснащена сервисным процессором для диагностики и мониторинга. В составе Power Private Cloud Rack должно быть не менее трёх таких серверов. Каждый из них имеет не мене 20 ядер, 256 Гбайт RAM и 3,2 Тбайт NVMe SSD.

Узловой компонент новой облачной платформы IBM, сервер Power System S922

Узловой компонент новой облачной платформы IBM, сервер Power System S922

Серверы облачных приложений будут работать с общей, анонсированной на днях All-Flash СХД IBM FlashSystem 5200. Общение с серверным кластером построено на базе Fibre Channel, для чего в составе стойки предусмотрена пара коммутаторов IBM Storage Networking SAN24B-6 c портами 32GFC. Опционально может быть установлен и коммутатор Ethernet. Впрочем, компания предлагает также конфигурацию Starter, включающую единственный сервер без СХД и коммутаторов. В любом случае заказчику поставляется готовое, заранее сконфигурированное решение.

Коммутатор Storage Networking SAN24B-6 поддерживает скорость Fibre Channel 32 Гбит/с

Коммутатор Storage Networking SAN24B-6 поддерживает скорость Fibre Channel 32 Гбит/с

Важной частью таких «мини-облаков» является программная составляющая. Новая платформа способна работать как под управлением фирменной ОС и сервисов AIX, но предпочтительным вариантом будет использование Red Hat Enterprise Linux 8, которая установлена по умолчанию вместе с IBM PowerVM Enterprise Edition, Cloud PowerVC Manager, ПО Red Hat OpenShift Containter Platform и OpenShift Container Storage. Опционально доступны решения IBM Spectrum Scale.

Данные для нового «мини-облака» будут храниться в СХД FlashSystem 5200

Данные для нового «мини-облака» будут храниться в СХД FlashSystem 5200

IBM Power Private Cloud Rack отличается высокой степенью автоматизации. Компания утверждает, что развёртывание инфраструктуры можно осуществить всего за 8 часов, тогда как ранее для систем сопоставимой сложности это могло занять неделю. При этом производительность обеспечивается вдвое большая, нежели у x86-систем, а плотность в пересчёте на контейнеры в 3,2 раза выше, в том числе за счёт поддержки процессорами SMT4. Это же позволяет сэкономить на лицензиях.

IBM предлагает перевод существующей инфраструктуры приложений AIX и IBM i в облачную среду посредством контейнеризации в Red Hat OpenShift. Таким образом, можно сказать, что архитектура POWER жива и IBM не собирается прощаться с ней, а напротив, активно развивает. Подробности о новой платформе можно узнать на сайте IBM.

Постоянный URL: http://servernews.ru/1032345
01.02.2021 [22:16], Алексей Степин

Cделка IBM и Inspur, похоже, спасает архитектуру POWER от вымирания

Когда говорят о противостоянии серверных процессоров, как правило, называют AMD и Intel, а с недавних пор ещё и ARM. Некогда крупный игрок, IBM со своими процессорами серии POWER, упоминается существенно реже, и на то есть причины — за прошедшее десятилетие дела у компании шли не слишком хорошо. Но, если верить аналитикам IT Jungle, ситуация с POWER не так проста и не так плоха.

Если верить отчётам самой IBM, доходы снизились на рекордную величину за последние пять лет, упали даже продажи мейнфреймов. Доходы в сегменте аппаратного обеспечения за прошедший год у IBM упали на 18% относительно 2019 года, а у подразделения Power Systems называют даже цифру 43,3%. Однако как считают некоторые аналитики, дела в секторе серверов на базе процессоров POWER могут обстоять не так плохо, как это может показаться на первый взгляд.

Платформа IBM POWER самобытна и весьма интересна сама по себе: так, уже не новые процессоры POWER9 поддерживают четыре потока на ядро против традиционных двух у x86, а в некоторых вариантах способны работать даже в режиме SMT8. Более новые POWER10 также поддерживают восьмипоточный режим; кроме того, они работают с прогрессивным форматом оперативной памяти OMI и имеют контроллер PCI Express 5.0.

Планы развития архитектуры POWER

Планы развития архитектуры POWER

Здесь следует немного углубиться в историю. Китайская компания Inspur, один из крупнейших среднеазиатских производителей серверного оборудования, всегда мечтала о «большом железе». В 2014 году ей удалось добиться договорённости с IBM о праве запускать фирменное ПО последней (в частности, базы данных DB2 и сервер приложений WebSphere) на 32-процессорных Itanium-системах. А месяцем позднее Inspur присоединилась к консорциуму OpenPower с целью создания серверов уже на базе архитектуры POWER.

В 2017 начинается «война санкций», при этом приличного самостоятельного открытого клона POWER-процессора консорциум так и не создал. Известно, что китайская Suzhou PowerCore Technology, входящая в OpenPower, занималась адаптацией POWER под более «толстые» техпроцессы. Сейчас компания активно нанимает сотрудников и открывает новое подразделение в США. Однако чем именно она занимается и связан ли этот рост с полным открытием POWER ISA, не до конца ясно.

Структура продаж POWER-систем по мнению ресурса IT Jungle

Структура продаж POWER-систем по мнению ресурса IT Jungle

До ввода санкций IBM и Inspur успевают создать совместное предприятие (51% Inspur + 49% IBM), которое, что интересно, тоже называется IBM — Inspur Business Machines. Цель новой компании, в которую вложили порядка 1 млрд юаней ($150 млн) — создание мощных серверных систем на базе архитектуры POWER для крупного бизнеса. Поставками же POWER-процессоров для Inspur занималась, в частности, всё та же Suzhou.

Судя по косвенным данным, сделка для Inspur оказалась весьма успешна. Кроме того, компания вообще чувствует себя отлично, поставляя также x86-серверы как малому и среднему бизнесу, так и китайским гигинтам Alibaba, Baidu и Tencent. К сентябрю 2020 года продажи Inspur составят $7,71 млрд, что на 43% больше, нежели у IBM с её $5,4 млрд.

С учётом поставок Inspur общий объём продаж POWER-серверов может выглядеть так

С учётом поставок Inspur общий объём продаж POWER-серверов может выглядеть так по мнению IT Jungle

К настоящему моменту IBM публикует только свои цифры продаж систем на базе POWER, и графики выглядят достаточно удручающе. Из-за санкций IBM не может продавать POWER-системы в КНР напрямую, а Inspur Business Machines — может. Из $8 млрд продаж Inspur примерно 10-12% может приходиться на системы с процессорами POWER, а это от $800 до $960 млн, и эти цифры сопоставимы с продажами серверов самой IBM.

Иными словами, платформа POWER, скорее всего, отнюдь не находится в процессе вымирания. Более того, после неудачных 2016 и 2017 годов объёмы продаж таких серверов могли, как минимум, вернуться к показателям 2015 года. Также вполне вероятно, что и Google производит для себя серверы на базе POWER — соответствующие предложения появились в Google Cloud уже достаточно давно. Похожее решение есть и в Microsoft Azure.

Постоянный URL: http://servernews.ru/1031600
16.09.2020 [13:23], Алексей Степин

IBM открыла ядро POWER A2O и ПО Open Cognitive Environment

Открытые архитектуры часто побеждают в долгосрочной перспективе, и это доказала система IBM PC, вариациями которой мы пользуемся и сейчас, спустя почти 40 лет после появления первых IBM PC и PC XT. Про POWER-системы этого сказать пока нельзя, но архитектура продолжает развиваться и существуют даже рабочие станции на её основе. IBM сделала POWER открытой в августе 2019 года и продолжает активно вкладываться в проект OpenPOWER Foundation, на этот раз она отдала в его распоряжение процессорного ядра A2O и программное обеспечение для машинного обучения Open Cognitive Environment.

Ранее на саммите Linux Foundation Open Source компания анонсировала открытое ядро A2I, однако оно не имело внеочередного исполнения и предназначалось для малых систем типа SoC, например, для встраиваемых приложений. На этот раз на OpenPOWER Summit 2020 представлено ядро A2O и, как нетрудно понять из названия, поддержка внеочередного исполнения (out of order) в нём имеется. Как следствие, A2O гораздо лучше подходит там, где требуется повышенная однопоточная производительность. В основе лежит 64-битный набор инструкций PowerISA v2.07 Book III-E.

В ядре реализована поддержка SMT, но не такая развитая, как у A2I — два потока на ядро против четырёх. Предсказание ветвлений построено на базе GSHARE. Объёмы кешей первого уровня составляют 32 Кбайт для инструкций и данных, имеется MMU, а также блок AXU (Auxiliary Execution Unit), облегчающий построение модульных дизайнов SoC на базе этого ядра. Основное предназначение A2I не слишком отличается от A2O — это всё так же кастомные системы-на-чипе и встраиваемые приложения. Площадь одного ядра в 7-нм исполнении оценивается в 0,31 мм2, при частоте 3 ГГц потребление должно составлять не более 0,25 Ватт, и даже с 4,2 ГГц оно не выйдет за пределы 1 Ватта.

Помимо A2O компания открыла для использования инструментарий Open Cognitive Environment, изначально развивавшийся в рамках проекта IBM PowerAI. Его назначение — упростить и облегчить пользование базовыми средствами машинного обучения и построить удобный мост между различными компонентами, такими как TensorFlow, PyTorch и другими фреймворками и библиотеками. По сути, Open-CE представляет собой набор мультиархитектурных «рецептов», скриптов, кода интеграции для Kubernetes, позволяющий быстро и удобно проектировать и развёртывать ИИ-системы.

Другой член проекта OpenPOWER, Орегонский университет (OSU) объявил о поддержке Open-CE и заявил, что планирует создать бинарные файлы для всех версий этого проекта. При этом планируется поддержка нескольких архитектур, в частности, Power PC версий little и big endian, как с поддержкой NVIDIA CUDA, так и без оной.

Модуль памяти OMI

Модуль памяти OMI

Также на OpenPOWER Summit 2020 была отмечена прогрессивная роль нового стандарта памяти OMI, использующего подключение OpenCAPI и чип-конвертер, расположенный прямо на модулях памяти. Накладные расходы в плане латентности, как отметил технический директор OpenCAPI, составляют менее 10 наносекунд, при этом пропускная способность OMI в 4 раза выше, чем у DDR4 и в 1,2 раза выше, нежели у HBM2. По параметру «memory depth» OMI в 2,3 раза превосходит DDR4 и в 116 раз — HBM2, и это делает новый стандарт очевидным выбором для индустрии серверов и супервычислений.

Постоянный URL: http://servernews.ru/1020756
17.08.2020 [15:32], Алексей Степин

Подробности о процессорах IBM POWER10: SMT8, OMI DDR5, PCIe 5.0 и PowerAXON 2.0

Мы внимательно следим за судьбой и развитием архитектуры POWER, которая наряду с ARM представляет определённую угрозу для x86 в сфере серверов и суперкомпьютеров — недаром одна из самых мощных в мире HPC систем, суперкомпьютер Ок-Риджской национальной лаборатории Summit, использует процессоры POWER9.

Ранее ожидалось что по ряду причин выход следующей в семействе архитектуры, POWER10, откладывается до 2021 года, хотя IBM и продвигала активно новые решения вроде универсального стандарта оперативной памяти OMI. Однако официальный анонс IBM POWER10 состоялся сегодня, а немецкий портал Hardwareluxx выложил слайды презентации компании.

Как компания уже отмечала ранее, она делает упор на большие системы и гибридные облака. С учётом этих тенденций и были разработаны новые процессоры. Поскольку в крупных облачных ЦОД упаковка вычислительных плотностей достигает уже невиданного ранее уровня, всё острее встаёт вопрос с энергоэффективностью и отводом тепла. Но именно здесь, как считает IBM, POWER10 и должен показать себя с наилучшей стороны — новые процессоры производятся с использованием 7-нм техпроцесса и могут демонстрировать трёхкратное преимущество в энергоэффективности в сравнении с POWER9.

POWER10 — первый коммерческий процессор IBM, использующий нормы производства 7 нм; любопытно, что теперь Intel отстаёт не только от AMD, которая стала пионером в использовании столь тонкого техпроцесса в «крупных» серверных процессорах, но и от IBM. В отличие от AMD EPYC, производимых на мощностях TSMC, новинки IBM «куются» в полупроводниковых кузнях Samsung. Площадь кристалла, состоящего из 18 миллиардов транзисторов, у новых процессоров достигает 602 мм2, что меньше, чем у новейших графических ядер, но всё равно цифра довольно солидная.

Техпроцесс POWER10 является совместной разработкой Samsung и IBM. В нём реализованы некие особенности, которые, предположительно, должны позитивно сказаться на характеристиках отдельных транзисторов. Не забыта и мода на установку нескольких кристаллов в один корпус: POWER10 доступны как в классическом варианте (SCM), так и в виде сборки из двух кристаллов (DCM), так что для каждого сценария использования можно выбрать подходящий вариант. В варианте SCM тактовая частота ядер составляет 4 ГГц, количество процессорных разъёмов в системе может достигать 16. В версии DCM частота снижена до 3,5 ГГц.

Базовый кристалл POWER10 имеет 16 вычислительных ядер, хотя используется из них только 15, каждое ядро дополнено 2 Мбайт кеша L2, а общий объём кеша L3 может достигать внушительных 120 Мбайт. Степень параллелизма была увеличена с SMT4 до SMT8, так что процессор может исполнять одновременно до 120 потоков, хотя, естественно, не в любой задаче такое распараллеливание ресурсов ядер будет эффективным. Производительность блоков SIMD была существенно увеличена, они вдвое быстрее аналогичных блоков POWER9, а на матричных операциях — быстрее в четыре раза.

За общение процессора с «внешним миром» отвечают интерфейсы PowerAXON 2.0 и PCI Express 5.0, в первом случае поддерживается открытый стандарт OpenCAPI, во втором реализовано 64 линии со скоростью 32 ГТ/с на линию, как и предписано стандартом. Компоновка связей у DCM и SCM разная. В первом случае сокетов может быть только 4, зато используется топология «каждый с каждым», а вот в 16-сокетном варианте SCM «по диагонали» между собой процессоры напрямую не общаются.

Интерфейс PowerAXON универсален, он использовался, в числе прочего, для реализации протокола NVLink для подключения ускорителей на базе графических процессоров NVIDIA. Проблем с пропускной способностью быть не должно, у каждого процессора в системе PowerAXON обеспечивает до 1 Тбайт/с. Кроме подключения ускорителей и общения процессоров между собой, у PowerAXON есть и ещё одно интересное и важное применение, о котором ниже.

О преимуществах унифицированного интерфейса OMI, позволяющего «малой кровью» модернизировать подсистему памяти, мы уже рассказывали читателям ранее. В новом процессоре эти возможности задействованы полностью. Каждый базовый кристалл POWER10 имеет 16 линков OMI x8, общая пропускная способность достигает 1 Тбайт/с. Латентность, разумеется, возросла, поскольку контроллер DDR у OMI, по сути, внешний, но прирост небольшой и составляет менее 10 наносекунд.

Универсальность и возможность модернизации этот недостаток искупают с лихвой. В текущем варианте пиковая пропускная способность достигает 410 Гбайт/с на разъём, объём — 4 Тбайт на разъём, однако с внедрением более быстрых типов памяти (DDR5, GDDR или даже HBM) может быть достигнута цифра 800 Гбайт/с на разъём. Отдельно упоминается возможность работы с SCM, но без конкретики. На данный момент такая память массово представлена только 3D XPoint в виде Intel Optane DCPMM.

Любопытна технология Memory Clustering. С помощью PowerAXON система может обращаться к оперативной памяти в другой системе, как к собственной. Латентность при этом составляет 50 ‒ 100 нс, для систем типа NUMA совсем немного. Общий объем на одну систему POWER10 может достигать 2 Пбайт; с учётом применения систем IBM для запуска таких «пожирателей памяти», как SAP HANA такие объемы очень к месту.

Следуя текущей моде на машинное обучение, разработчики реализовали в POWER10 развитую поддержку форматов вычислений, отличных от традиционных FP32/64. Блок плавающих вычислений в новом процессоре носит название Matrix Math Accelerator. В сравнении с POWER9 он быстрее в 10, 15 и 20 раз в режимах FP32, BFloat16 и INT8 соответственно. Иными словами, именно для инференс-систем POWER10 станет хорошим выбором.

Поскольку одним из применений POWER10 компания видит облачные комплексы, серьёзное внимание уделено обеспечению безопасности. Новые процессоры поддерживают полное шифрование содержимого оперативной памяти, а для ускорения криптографических процедур в их составе есть соответствующие аппаратные блоки, причём не только для широко распространённого стандарта AES. Они достаточно гибки, чтобы поддерживать и шифрование будущего класса quantum safe. Также поддерживается защита и изоляция контейнеров на аппаратном уровне. Успешная атака на один контейнер в пределах машины не означает и успеха с другими контейнерами.

В качестве программной основы IBM предлагает Red Hat OpenShift, и архитектура POWER10 была соответствующим образом оптимизирована, чтобы показывать наилучшие результаты именно с этой средой. В целом, можно уверенно сказать: новые процессоры Голубого Гиганта получились интересными и весьма достойно выглядящими решениями даже на фоне успеха AMD EPYC.

Официальный анонс состоялся сегодня, но развёртывание массового производства должно занять определённое время, так что появления первых серверов на базе IBM POWER10 стоит ожидать не ранее начала следующего, 2021 года. А планы компании говорят о том, что POWER11 уже находится в разработке.

Постоянный URL: http://servernews.ru/1018413
01.07.2020 [20:50], Алексей Степин

IBM открыла ядро своих POWER-процессоров для суперкомпьютеров BlueGene/Q

Господству x86, пожалуй, куда больше угрожает семейство архитектур ARM, нежели POWER, однако в рамках проекта OpenPOWER экосистему можно назвать живой, тем более что среди активных вкладчиков есть европейская лаборатория открытых компьютерных архитектур. Архитектура POWER по решению IBM стала открытой ещё в августе прошлого года и сейчас плоды этого решения начинают появляться.

На проходящем сейчас саммите Linux Foundation Open Source было анонсировано новое открытое процессорное ядро A2I, базирующееся на этой архитектуре. Новая разработка предназначена для заказных и встраиваемых систем-на-чипе (SoC) сравнительно небольшой мощности.

A2I не поддерживает внеочередного исполнения инструкций, но мультипоточность в нём реализована, а главный упор сделан на увеличение пропускной способности по всем каналам передачи данных, что немаловажно для активно растущего сегмента периферийных вычислений.

В основу дизайна A2I легло ядро Edge-of-Network под названием PowerEN, которое использовалось в процессорах общего назначения POWER-A2 в составе HPC-систем и суперкомпьютеров серии IBM BlueGene/Q. Что удивительно, данное ядро не поддерживает спекулятивное исполнение команд, то есть оно не подвержено уязвимостям класса Spectre/Meltdown.

Сам дизайн A2I является модульным, что позволяет создавать оптимизированные под конкретную задачу SoC. Процессор может быть дополнен «вспомогательным исполнительным блоком» (Auxiliary Execution Unit), тесно связанным с основным ядром. Набор инструкций соответствует спецификациям PowerISA v2.06 в 64-битном варианте.

Порядок байт в системах Big Endian и Little Endian

Порядок байт в системах Big Endian и Little Endian

Изначально ядро данной серии разрабатывалось под 45-нм техпроцесс, но даже тогда оно имело площадь всего 2,9 мм2 и при частоте 2,3 ГГц укладывалось в теплопакет менее 1 Ватта; ожидается, что применение современных 7-нм производственных норм позволит довести эти показатели до 0,17 мм2 и 0,5 Ватта при частоте 4,2 ГГц. Четырёхъядерный чип с поддержкой SMT4 может уложиться в 2 Ватта.

Предусмотрены кеши инструкций и данных объёмом 16 Кбайт каждый, объём кешей других уровней, по-видимому, оставлен на усмотрение разработчика. Имеется встроенный MMU, способный адресовать до 4 Тбайт физической памяти. Процессор может работать в обоих режимах endian: big и little. Ядро A2I стало полностью открытым, и вся информация о нём содержится в соответствующем репозитории GitHub.

При этом надо понимать, что открыто только ядро, а не процессор POWER-A2 целиком. Последний состоял из 18 ядер, одно из которых было служебным, а ещё одно — запасным. L1-кеш был представлен SRAM, а L2 состоял из eDRAM. Помимо обычных ядер в нём имелись отдельные акселераторы для работы с XML, шифрования, компресии и обработки регулярных выражений, а также 4 канала 10GbE. По отзывам тех лет, процессор был невероятно сложным, но, как показала практика, в конечном итоге достаточно эффективным.

Постоянный URL: http://servernews.ru/1014711
14.05.2020 [22:07], Алексей Степин

Серверы ASUS лидируют в рейтинге энергоэффективности SPECpower

Если для обычных ПК и рабочих станций энергоэффективность не является определяющим параметром, то для крупных ЦОД и серверных ферм этот показатель может стать решающим, ведь десятки и сотни ватт легко складываются в десятки и сотни киловатт и мегаватт.

Производители серверного оборудования это учитывают и стараются минимизировать энергопотребление своих продуктов при сохранении высокой производительности. Серьёзную заявку на лидерство в этой области сделала компания ASUS.

ASUS RS720-E9-RS8 (справа) и RS500A-E10-PS4

ASUS RS720-E9-RS8 (справа) и RS500A-E10-PS4

Существуют стандартизированные тесты и методики определения энергоэффективности вычислительных устройств: в частности, для этого используется тест SPECpower, являющийся частью широко используемого набора бенчмарков SPEC, разрабатываемых одноимённой некоммерческой организацией. ASUS опубликовала анонс, в котором говорится о достижении лидирующих позиций в рейтинге SPECpower на момент публикации наиболее свежих данных, датированных 16 апреля 2020 года.

Верхние строки рейтинга заняли серверы ASUS RS720-E9-RS8 и RS500A-E10-PS4 на базе процессоров Xeon Scalable и AMD EPYC. Первая система довольно обычна: она имеет форм-фактор 2U и поддерживает установку до шести ускорителей PCI Express. Вторая является компактным однопроцессорным 1U-сервером.

Thermal Radar не только экономит энергию, но и повышает эффективность охлаждения

Технология ASUS Thermal Radar не только экономит энергию, но и повышает эффективность охлаждения

За победу в тестировании и занятие лидирующей позиции в рейтинге SPECpower ответственны две фирменные технологии ASUS — Thermal Radar 2.0 и Power Balancer. Суть первой заключается в интеллектуальном управлении системами охлаждения сервера. Конечно, в сравнении с процессорами и платами ускорителей вентиляторы потребляют немного, но в масштабах достаточно крупного ЦОД итоговая цифра может оказаться солидной.

Для того, чтобы минимизировать затраты энергии, Thermal Radar 2.0 отслеживает показания многочисленных датчиков, число которых может достигать 56. Они располагаются во всех ключевых элементах системы — от процессорных разъёмов до подсистемы памяти и даже внешней панели сервера. Благодаря этим датчикам, вентиляторы системы охлаждения всегда работают на минимально возможных скоростях и разгоняются только тогда, когда это действительно нужно. Экономия может достигать 36% в сравнении с менее «умными» системами охлаждения.

Верхушка рейтинга SPECpower_ssj2008 (нажмите для увеличения)

Технология Power Balancer служит для управления энергопотреблением процессоров. Она также работает на основе поступающих в реальном времени данных. Если верить заявлениям ASUS, использование Power Balancer позволяет снизить энергопотребление на 14%: если при загрузке 80% этот показатель составлял 130 Ватт, то с применением данной технологии он понизился до 111,8 Ватт. При большом количестве серверов выигрыш в плане экономии электроэнергии может быть весьма ощутимым.

Результаты SPECpower доступны на сайте проекта. Стоит отметить, что по состоянию на 11 мая текущего года, первые два места в рейтинге также принадлежат ASUS, хотя и другой системе — двухпроцессорной RS700A-E9-RS4V2 на базе EPYC 7742.

Постоянный URL: http://servernews.ru/1010969
Система Orphus