Хотя слово «мейнфрейм» и может вызвать ассоциации с катушками магнитной ленты и зелёными символами на экране терминала, системы такого класса продолжают оставаться ключевыми для крупного бизнеса: 71 % компаний из списка Fortune 500 используют для критических задач именно мейнфреймы.
Объём рынка мейнфреймов в прошлом году составил $5,3 млрд, так что это весьма лакомый кусок, упускать который главный производитель этих систем, компания IBM, не собирается. Сегодня она анонсировала мейнфреймы z17 — они идут на смену поколению z16 и обладают куда большей производительностью в актуальных на сегодня ИИ-сценариях.
В основе новой платформы лежат анонсированные осенью прошлого года процессоры Telum II с архитектурой z/Architecture. Это поколение чипов использует техпроцесс Samsung 5HPP и включает в себя восемь улучшенных ядер Telum с частотой 5,5 ГГц с переработанной и существенно усиленной подсистемой кеширования.
Новые веяния в полной мере коснулись Telum II: каждый процессор получил поддержку форматов INT8/FP16, а также ИИ-сопроцессор с производительностью 25 Топс (768 Топс для полностью сконфигурированного мейнфрейма). По нынешним меркам эти цифры не выглядят слишком высокими, однако в составе z17 процессоры Telum II будут работать совместно с 32-ядерными ИИ-ускорителями Spyre.
На момент анонса речь идёт о 48 чипах Spyre в составе каждого мейнфрейма z17, что при 300 Топс на ускоритель суммарно даёт 14,4 Попс (петаопс), но в течение года планируется нарастить этот показатель вдвое — до 96 ускорителей на мейнфрейм, что с учётом возможностей самих Telum II даст уже 30 Попс. Переварить объёмы данных, характерные для современных ИИ-моделей платформе поможет интегрированный в Telum II блок DPU.
Согласно анонсу, z17 может обработать за день до 450 млрд. инференс-операций, что на 50 % больше показателей предыдущегоz16. При проектировании z17 IBM потратила более 2 тыс. часов, исследуя отклики от более чем сотни клиентов. Компания считает новинку универсальным решением с более чем 250 вариантами использования в ИИ-задачах, в том числе в качестве платформы для генеративного ИИ.

Первые поставки z17 начнутся 18 июня, однако пока без плат ускорителей Spyre — последние дебютируют позднее, в IV квартале. Для новой платформы IBM готовит и новую операционную систему z/OS 3.2, которая должна дебютировать в III квартале. В ней появится родная поддержка аппаратных ускорителей ИИ, а также ИИ-элементы управления самой системой. Кроме того, в z/OS 3.2 будет реализована поддержка новых типов доступа к данным, баз данных типа NoSQL, а также гибридных облачных вычислений.
Источники: