Открытые архитектуры часто побеждают в долгосрочной перспективе, и это доказала система IBM PC, вариациями которой мы пользуемся и сейчас, спустя почти 40 лет после появления первых IBM PC и PC XT. Про POWER-системы этого сказать пока нельзя, но архитектура продолжает развиваться и существуют даже рабочие станции на её основе. IBM сделала POWER открытой в августе 2019 года и продолжает активно вкладываться в проект OpenPOWER Foundation, на этот раз она отдала в его распоряжение процессорного ядра A2O и программное обеспечение для машинного обучения Open Cognitive Environment.

Ранее на саммите Linux Foundation Open Source компания анонсировала открытое ядро A2I, однако оно не имело внеочередного исполнения и предназначалось для малых систем типа SoC, например, для встраиваемых приложений. На этот раз на OpenPOWER Summit 2020 представлено ядро A2O и, как нетрудно понять из названия, поддержка внеочередного исполнения (out of order) в нём имеется. Как следствие, A2O гораздо лучше подходит там, где требуется повышенная однопоточная производительность. В основе лежит 64-битный набор инструкций PowerISA v2.07 Book III-E.
В ядре реализована поддержка SMT, но не такая развитая, как у A2I — два потока на ядро против четырёх. Предсказание ветвлений построено на базе GSHARE. Объёмы кешей первого уровня составляют 32 Кбайт для инструкций и данных, имеется MMU, а также блок AXU (Auxiliary Execution Unit), облегчающий построение модульных дизайнов SoC на базе этого ядра. Основное предназначение A2I не слишком отличается от A2O — это всё так же кастомные системы-на-чипе и встраиваемые приложения. Площадь одного ядра в 7-нм исполнении оценивается в 0,31 мм2, при частоте 3 ГГц потребление должно составлять не более 0,25 Ватт, и даже с 4,2 ГГц оно не выйдет за пределы 1 Ватта.

Помимо A2O компания открыла для использования инструментарий Open Cognitive Environment, изначально развивавшийся в рамках проекта IBM PowerAI. Его назначение — упростить и облегчить пользование базовыми средствами машинного обучения и построить удобный мост между различными компонентами, такими как TensorFlow, PyTorch и другими фреймворками и библиотеками. По сути, Open-CE представляет собой набор мультиархитектурных «рецептов», скриптов, кода интеграции для Kubernetes, позволяющий быстро и удобно проектировать и развёртывать ИИ-системы.
Другой член проекта OpenPOWER, Орегонский университет (OSU) объявил о поддержке Open-CE и заявил, что планирует создать бинарные файлы для всех версий этого проекта. При этом планируется поддержка нескольких архитектур, в частности, Power PC версий little и big endian, как с поддержкой NVIDIA CUDA, так и без оной.
Также на OpenPOWER Summit 2020 была отмечена прогрессивная роль нового стандарта памяти OMI, использующего подключение OpenCAPI и чип-конвертер, расположенный прямо на модулях памяти. Накладные расходы в плане латентности, как отметил технический директор OpenCAPI, составляют менее 10 наносекунд, при этом пропускная способность OMI в 4 раза выше, чем у DDR4 и в 1,2 раза выше, нежели у HBM2. По параметру «memory depth» OMI в 2,3 раза превосходит DDR4 и в 116 раз — HBM2, и это делает новый стандарт очевидным выбором для индустрии серверов и супервычислений.
Источник: