Материалы по тегу: мейнфрейм

08.05.2025 [19:20], Сергей Карасёв

IBM представила сервер LinuxONE Emperor 5 на платформе Telum II для ИИ-задач

Компания IBM анонсировала сервер LinuxONE Emperor 5, который, как утверждается, обеспечивает высокие показатели производительности, безопасности и масштабируемости. Новинка ориентирована на работу с ИИ-приложениями и нагрузками, для которых требуется интенсивное использование данных.

В основу LinuxONE Emperor 5 положена фирменная аппаратная платформа Telum II. Этот процессор содержит восемь ядер с фиксированной рабочей частотой 5,5 ГГц, а также ИИ-блок с производительностью 24 TOPS. Система может объединять до четырёх узлов (drawer) на базе Telum II. Максимальный объём памяти составляет 64 Тбайт.

 Источник изображения: IBM

Источник изображения: IBM

Модель LinuxONE Emperor 5 спроектирована с прицелом на экономию энергопотребления, финансовых затрат и занимаемой площади в дата-центре. По заявлениям IBM, благодаря консолидации рабочих нагрузок система обеспечивает снижение общей стоимости владения до 44 % за пятилетний период лет по сравнению с сопоставимыми по классу x86-серверами. При этом заявлена высокая надёжность: доступность достигает 99,999999 %, что эквивалентно всего 315 мс простоя в течение года.

«Организации могут сэкономить до 94 % затрат на программное обеспечение за пять лет, переместив облачные контейнерные рабочие нагрузки с платформ x86 на LinuxONE Emperor 5», — заявляет IBM.

В IV квартале текущего года для LinuxONE Emperor 5 станут доступны ИИ-ускорители IBM Spyre Accelerator, выполненные в виде карт расширения PCIe. Они оптимизированы специально для генеративного ИИ. Для машины сертифицировано использование Red Hat Enterprise Linux, SUSE Enterprise Linux и Ubuntu Linux.

Постоянный URL: http://servernews.ru/1122485
09.04.2025 [17:48], Руслан Авдеев

ИИ Google Gemini поможет переписать приложения для мейнфреймов и перенести их в облако

Незадолго до анонса новых мейнфреймов IBM z17 компания Google анонсировала новые ИИ-инструменты на основе моделей Gemini и других технологий для модернизации инфраструктуры и переносу нагрузок с в облако Google Cloud.

Google Cloud Mainframe Assessment Tool (MAT) на основе ИИ-моделей Gemini уже доступен. Инструмент позволяет оценить и проанализировать общее состояние мейнфреймов, включая приложения и данные. Это даст возможность принимать информированные решения по оптимальной модернизации. MAT обеспечивает глубокий анализ кода, генерирует чёткие объяснения его работы, автоматизирует создание документации и др. Это позволяет ускорить понимание кода мейнфреймов и стимулирует процесс модернизации.

Google Cloud Mainframe Rewrite на основе моделей Gemini позволяет модернизировать приложения для мейнфреймов (инструмент доступен в превью-режиме). Он помогает разработчикам переосмыслить и преобразовать код для мейнфреймов, переписав его на современные языки программирования вроде Java и C#. Mainframe Rewrite предлагает IDE для модернизации кода, тестирования и развёртывания модернизированных приложений в Google Cloud.

 Источник изображения: Ant Rozetsky / Unsplash

Источник изображения: Ant Rozetsky / Unsplash

Наконец, чтобы снизить риски, возникающие при модернизации, предлагается инструмент Google Cloud Dual Run для глубокого тестирования, сертификации и оценки модернизированных приложений. Инструмент позволяет проверить корректность, полноту и производительность модернизированного кода в ходе миграции и до того, как новое приложение заменит старое. Dual Run сравнивает данные, выдаваемые старой и новой системами, для поиска отличий.

Имеются и дополнительные инструменты, разработанные партнёрами Google. Так, Mechanical Orchard предлагает платформу для быстро переписывания приложений на COBOL на современные языки, включая Java, Python и др., без изменения бизнес-логики. Решение позволяет «пошагово» переписывать фрагменты приложений с помощью систем генеративного ИИ с сохранением функциональности и тестировать корректность их работы. Основная цель — создать для облака функциональный эквивалент устаревших решений.

 Источник изображения: Google Cloud

Источник изображения: Google Cloud

Кроме того, в рамках новой программы Google Mainframe Modernization with Gen AI Accelerator компания привлекла Accenture, EPAM и Thoughtworks, которые помогут организациям мигрировать с мейнфреймов. На первом этапе производится анализ кода с помощью MAT и Gemini. На втором реализуется пилотный проект с проверкой работоспособности нового кода. На третьем осуществляется полномасштабная миграция в облако. Первые клиенты могут бесплатно (без учёта расходов на Google Cloud) оценить решения в течение 4-8 недель.

Мейнфреймы ещё рано списывать со счетов. Согласно данным опроса Kyndryl 500 топ-менеджеров ИТ-индустрии, многие организации интегрируют мейнфреймы с публичными и частными облачными платформами и совершенствуют свои программы модернизации, перемещая некоторые рабочие нагрузки с мейнфреймов или обновляя их.

Постоянный URL: http://servernews.ru/1120943
08.04.2025 [17:41], Алексей Степин

Мейнфрейм для ИИ: IBM представила платформу z17 с восьмиядерными процессорами Telum II и ускорителями Spyre

Хотя слово «мейнфрейм» и может вызвать ассоциации с катушками магнитной ленты и зелёными символами на экране терминала, системы такого класса продолжают оставаться ключевыми для крупного бизнеса: 71 % компаний из списка Fortune 500 используют для критических задач именно мейнфреймы.

Объём рынка мейнфреймов в прошлом году составил $5,3 млрд, так что это весьма лакомый кусок, упускать который главный производитель этих систем, компания IBM, не собирается. Сегодня она анонсировала мейнфреймы z17 — они идут на смену поколению z16 и обладают куда большей производительностью в актуальных на сегодня ИИ-сценариях.

 Источник изображений: IBM

Источник изображений: IBM

В основе новой платформы лежат анонсированные осенью прошлого года процессоры Telum II с архитектурой z/Architecture. Это поколение чипов использует техпроцесс Samsung 5HPP и включает в себя восемь улучшенных ядер Telum с частотой 5,5 ГГц с переработанной и существенно усиленной подсистемой кеширования.

Новые веяния в полной мере коснулись Telum II: каждый процессор получил поддержку форматов INT8/FP16, а также ИИ-сопроцессор с производительностью 25 Топс (768 Топс для полностью сконфигурированного мейнфрейма). По нынешним меркам эти цифры не выглядят слишком высокими, однако в составе z17 процессоры Telum II будут работать совместно с 32-ядерными ИИ-ускорителями Spyre.

На момент анонса речь идёт о 48 чипах Spyre в составе каждого мейнфрейма z17, что при 300 Топс на ускоритель суммарно даёт 14,4 Попс (петаопс), но в течение года планируется нарастить этот показатель вдвое — до 96 ускорителей на мейнфрейм, что с учётом возможностей самих Telum II даст уже 30 Попс. Переварить объёмы данных, характерные для современных ИИ-моделей платформе поможет интегрированный в Telum II блок DPU.

Согласно анонсу, z17 может обработать за день до 450 млрд. инференс-операций, что на 50 % больше показателей предыдущегоz16. При проектировании z17 IBM потратила более 2 тыс. часов, исследуя отклики от более чем сотни клиентов. Компания считает новинку универсальным решением с более чем 250 вариантами использования в ИИ-задачах, в том числе в качестве платформы для генеративного ИИ.

Первые поставки z17 начнутся 18 июня, однако пока без плат ускорителей Spyre — последние дебютируют позднее, в IV квартале. Для новой платформы IBM готовит и новую операционную систему z/OS 3.2, которая должна дебютировать в III квартале. В ней появится родная поддержка аппаратных ускорителей ИИ, а также ИИ-элементы управления самой системой. Кроме того, в z/OS 3.2 будет реализована поддержка новых типов доступа к данным, баз данных типа NoSQL, а также гибридных облачных вычислений.

Постоянный URL: http://servernews.ru/1120962
11.03.2025 [16:08], Руслан Авдеев

IBM засудила разработчика эмулятора мейнфреймов LzLabs

Компания IBM одержала победу в лондонском суде над LzLabs, разработавшей эмулятор Software Defined Mainframe (SDM) для запуска приложений для мейнфреймов на обычных x86-серверах под управлением Linux. По мнению IBM, LzLabs фактически украла её интеллектуальную собственность и теперь представляет угрозу её бизнесу, сообщает Datacenter Dynamics.

IBM подала в суд на LzLabs и связанные компании несколько лет назад. IT-гигант заявил, что Winsopia — дочерняя структура LzLabs — приобрела у IBM мейнфрейм и сопутствующую лицензию в 2013 году. Позже компания использовала полученные продукты для реверс-инжиниринга — фактически она декомпилировала ПО IBM. В вынесенном в понедельник Высоким судом Лондона вердикте говорится, что швейцарская LzLabs и её владелец Джон Мурс (John Moores) нарушили условия лицензирования, чтобы разработать собственное программное обеспечение для создания относительно недорогой альтернативы мейнфреймам IBM.

По мнению суда, Winsopia нарушила условия лицензирования, а LzLabs и Мурс незаконно способствовали этому. Последний является основателем компании BMC Software, а также контролирует фонд JMI Equity, инвестирующий в IT-бизнесы. Ответчики утверждали, что программное обеспечение их компании разрабатывалось более десяти лет без влияния технологий IBM. LzLabs основали в 2011 году, первый продукт появился в 2016-м. Речь шла о платформе, позволявшей переносить рабочие нагрузки с мейнфреймов (COBOL или PL/I) на x86-серверы под управлением Linux, в том числе в облаках.

С тех пор компания добавила поддержки контейнеризированных рабочих нагрузок, что упрощает перенос приложений с мейнфреймов на современные облачные платформы. Так, швейцарская телеком-компания Swisscom перенесла свои приложения на платформу LzLabs SDM, развёрнутую в облаке, без перекомпиляции исходного кода. Другими словами, LzLabs стала конкурентом IBM в сфере мейнфреймов.

 Источник изображения: IBM

Источник изображения: IBM

Сама IBM «в восторге» от решения британского суда, который признал, что ответчики шли на нарушения систематически и намеренно для получения критически важных технологий IBM для мейнфреймов. При этом IBM вложила в соответствующие решения миллиарды долларов. Дальнейшие слушания состоятся в текущем году — предстоит выяснить, какую компенсацию может получить IBM. Претензии к ещё одной британской дочерней структуре, LzLabs Limited, а также к действующему и бывшему генеральным директорам компании-ответчика отклонены. IBM подала отдельный иск против LzLabs в Техасе в 2022 году, обвинив последнюю в нарушении патентного законодательства. В данном случае IBM требует компенсации ущерба и судебного запрета на использование её интеллектуальной собственности.

Тем временем в США не поддержали иск компании BMC Software к IBM на $1,6 млрд. IBM ещё в 2017 году обвиняли в том, что та незаконно заменила в мейнфреймах AT&T программное обеспечение BMC на собственное. Если в 2022 году суд в Техасе обязал IBM выплатить более миллиарда долларов, то недавно Верховный суд США отклонил это решение после успешной апелляции в 2024 году, постановив, что AT&T по собственному желанию заменила одно ПО на другое и что это не противоречит условиям контракта. Верховный суд отказался рассматривать очередную апелляцию BMC, фактически подтвердив прежнее решение суда.

Постоянный URL: http://servernews.ru/1119534
31.01.2025 [08:46], Владимир Мироненко

Почти половина бизнеса IBM теперь приходится на ПО — компания делает ставку на ИИ и open source

Инвесторы поддержали стратегию развития IBM направления, касающегося развёртывания технологий ИИ, что нашло выражение в росте акций после публикации компанией отчёта за IV квартал и 2024 финансовый год, завершившийся 31 декабря, пишет газета The Wall Street Journal. Также свою роль сыграло то, что основные показатели IBM превысили прошлогодние результаты и прогнозы Уолл-стрит.

Ранее IBM объявила, что приняла подход открытых инноваций к ИИ, открыв исходный код своих решений. В мае компания выпустила открытые модели Granite Foundation, а до этого она вместе с NASA сделала открытой базовую ИИ-модель для анализа спутниковых данных и выложила её на Hugging Face. Финансовый директор IBM Джеймс Кавано (James Kavanaugh) отметил, что стратегия open source делает технологию более экономически эффективной и более простой в масштабировании. Это соответствует подходу китайского стартапа DeepSeek, ИИ-модели которого вызвали шок на рынке.

Общая выручка IBM за IV квартал увеличилась на 1 % до $17,6 млрд, что соответствует ожиданиям аналитиков, опрошенных LSEG. При этом скорректированная прибыль на разведённую акцию (Non-GAAP) составила $3,92 при прогнозе аналитиков $3,75. Чистая прибыль (GAAP) IBM за квартал составила $2,92 млрд или $3,09 на разведённую акцию, тогда как годом ранее эти показатели равнялись $3,29 млрд и $3,55 на акцию.

 Источник изображений: IBM

Источник изображений: IBM

Подразделение ПО увеличило выручку в годовом исчислении на 10 % до $7,92 млрд, чему способствовал рост выручки Red Hat на 16 %. Платформа OpenShift обеспечила почти половину этого объёма. Выручка подразделения по автоматизации увеличилась на 15 %, подразделения по обработке данных и ИИ — на 4 %. Компания отметила, что объём бизнеса в сфере генеративного ИИ теперь составляет более $5 млрд, что почти на $2 млрд больше, чем кварталом ранее. Гендиректор IBM Арвинд Кришна (Arvind Krishna) сообщил, что на ПО теперь приходится около 45 % бизнеса IBM с годовым оборотом более $15 млрд и двузначным ростом.

Продажи консалтингового подразделения IBM снижаются четвёртый квартал подряд, на это раз на 2 % до $5,18 млрд. Клиенты продолжают перенаправлять средства из традиционных консалтинговых проектов в проекты, ориентированные на ИИ, сообщил Кавано, отметив, что скорее всего, это временно. «Мы завершили год с самым высоким в истории зафиксированным количеством заказов за квартал, рост — на 23 %, — сказал он. — Мы по-прежнему имеем дело с очень динамичной средой вокруг того, как клиенты расставляют приоритеты в расходах». Около 80 % заказов поступает от консалтингового подразделения, а остальное — от подразделения ПО.

Выручка инфраструктурного подразделения снизилась в отчётном квартале на 7,6 % до $4,26 млрд, что отражает приближающееся окончание трёхлетнего жизненного цикла мейнфреймов z16, продажи которых упали на 21 %. Ожидается, что следующее поколение z17 выйдет в середине года, что обеспечит рост доходов во II полугодии 2025-го.

За весь 2024 финансовый год выручка IBM составила $62,8 млрд, превысив показатель 2023 финансового года на 1 %. Подразделение ПО увеличило выручку на 8 %, а у консалтингового подразделения этот показатель снизился на 1 %. У инфраструктурного подразделения выручка упала больше — на 4 %.

В 2025 году IBM ожидает рост выручки не менее чем на 5 %. После публикации финансового отчёта акции компании выросли на внебиржевых торгах на 9 %, сообщил ресурс SiliconANGLE. За последние 12 месяцев цена акции IBM увеличилась на 22 %. Как отмечает The Register, компания сэкономила $3,5 млрд на операционных расходах в прошлом году и намеревается сэкономить столько же в 2025-м, что косвенно указывает на новую волну увольнений. В 2024 году их было как минимум две. Сведения о размере штата компания не обновляла уже больше года.

Постоянный URL: http://servernews.ru/1117523
27.10.2024 [13:15], Владимир Мироненко

IBM разочаровала инвесторов слабой выручкой — мейнфреймы z16 завершают цикл, зато Red Hat показала рост

IBM сообщила финансовые результаты III квартала 2024 года, завершившегося 30 сентября. После объявления результатов акции компании упали с $233 до $216 за шт., после чего отыграли до $255, поскольку выручка оказалась ниже ожиданий Уолл-стрит.

Выручка IBM составила $14,97 млрд, что на 1,5 % больше результата аналогичного квартала годом ранее, но ниже консенсус-прогноза аналитиков, опрошенных LSEG, равного $15,07 млрд. При этом скорректированная прибыль на акцию (Non-GAAP) оказалась немного выше прогноза аналитиков $2,30 против $2,23. По GAAP у IBM были чистые убытки $330 млн (36 центов на акцию) по сравнению с чистой прибылью в $1,70 млрд ($1,84 на акцию) в аналогичном квартале годом ранее. Убытки образовались из-за единовременного платежа по пенсионному расчету в рамках соглашения со страховой компанией Prudential.

 Источник изображений: IBM

Источник изображений: IBM

ПО принесло IBM $6,52 млрд выручки, превысив прошлогодний результат на 9,7 %, а также консенсус-прогноз аналитиков, опрошенных StreetAccount, равный $6,37 млрд. Выручка Red Hat выросла год к году на 14 %, тогда как во II квартале рост составил 7 %. Джим Кавано (Jim Kavanaugh), финансовый директор IBM, отметил в ходе телефонной конференции с аналитиками, что это был самый успешный квартал по подпискам с момента приобретения Red Hat в 2019 году, а также то, что бизнес Red Hat удвоился с момента приобретения.

Выручка подразделения по автоматизации увеличилась на 13 %, подразделения по обработке данных и ИИ — на 5 %. Валовая прибыль от продаж ПО составила 83 %, что выше, чем у других сегментов. Также отмечено, что доля выручки от ПО в общем объёме выручки составила 45 %. Генеральный директор Арвинд Кришна сообщил, что в августе была первая годовщина с момента приобретения Apptio, которая достигла «сильной синергии с нашими возможностями автоматизации и более широким портфелем программного обеспечения». Он добавил, что ожидаемое приобретение HashiCorp укрепит позиции IBM в сфере автоматизации инфраструктуры.

Хотя выручка подразделения по обработке данных и ИИ выросла на 5 %, Кришна заявил, что бизнес IBM в области генеративного ИИ теперь составляет около $3 млрд в заказах, что больше, чем $2 млрд в последнем квартале. Старший аналитик Forrester Research Inc. Дарио Маисто (Dario Maisto) выразил мнение, что IBM хорошо продвигается в области ИИ, отметив её решение сделать открытыми ИИ-модели Granite Foundation. До этого IBM и NASA сделали открытой базовую ИИ-модели для анализа спутниковых данных и выложили её на Hugging Face.

Самым большим разочарованием, как пишет ресурс SiliconANGLE, стал консалтинговый бизнес IBM, который остаётся на прежнем уровне из года в год, отражая то, что Кавано назвал «динамичной рыночной средой», когда предприятия тратят деньги с большой осторожностью. Консалтинговое подразделение принесло компании $5,2 млрд (снижение на 0,5 %).

Инфраструктурное подразделение получило $3,65 млрд выручки (снижение на 7,0 %). При этом продажи в сегменте мейнфреймов IBM z упали на 19 %. Мейнфреймы z16 были выпущены в 2022 году, а это означает, что это поколение доступно уже 10-й квартал и его цикл подходит к концу. Арвинд Кришна отметил, что поколение z16 превзошло своих предшественников, и что ситуация улучшится, когда дебютирует поколение z17.

Что касается прогноза, то в текущем квартале IBM ожидает рост выручки на уровне III квартала, драйвером которого будет ПО. Несмотря на нынешнее падение акций IBM, их рост с начала года составил 35 %.

Постоянный URL: http://servernews.ru/1113084
18.09.2024 [11:23], Владимир Мироненко

Генеративный ИИ «оживляет» мейнфреймы

Мейнфреймы по-прежнему сохраняют актуальность, несмотря бурное развитие ИИ-технологий и облачных сервисов, пишет The Register со ссылкой на новое исследование State of Mainframe Modernization компании Kyndryl.

Согласно данным опроса 500 топ-менеджеров ИТ-индустрии, многие организации интегрируют свои мейнфреймы с публичными и частными облачными платформами и совершенствуют свои программы модернизации, перемещая некоторые рабочие нагрузки с мейнфрейма и обновляя другие на месте, чтобы продолжать пользоваться такими преимуществами мейнфреймов, как безопасность и надёжность.

Kyndryl сообщила, что 86 % респондентов развёртывают или планируют развёртывать инструменты и приложения генеративного ИИ в своей среде мейнфреймов. Исходя из этого Kyndryl назвала 2024 год «годом внедрения ИИ на мейнфреймах». Сама IBM заявила, что генеративный ИИ стал движущей силой в её бизнесе мейнфреймов, проносящим больше выручки в последние кварталы.

 Источник изображения: IBM

Источник изображения: IBM

Большая часть участников опроса (80 %) всё ещё находится на стадии изучения возможностей генеративного ИИ, но вместе с тем 41 % респондентов надеется использовать его для ускорения операций и снижения их подверженности человеческим ошибкам. Между тем, 33 % респондентов нацелены на улучшение клиентского опыта, например, за счёт повышения персонализации, а также разблокировании критически важных данных и преобразование неструктурированных данных в полезную информацию, в то время как треть участников опроса планирует использовать генеративный ИИ для извлечения бизнес-информации из своих данных, управляемых мейнфреймами, чтобы помочь в разработке новых продуктов или услуг.

Согласно Kyndryl, генеративный ИИ также может помочь в модернизации, «проливая свет на внутреннюю работу монолитных приложений», что, как утверждается, может компенсировать нехватку навыков работы с мейнфреймами у нынешних сотрудников. Вместе с тем меньшая часть респондентов, чьи компании применяют мейнфреймы, не планирует использовать генеративный ИИ в какой-либо форме, ссылаясь на проблемы безопасности и регулирования в качестве причины своего нежелания или говоря о наличии других приоритетов.

Опрос показал, что компании, продолжающие эксплуатировать мейнфреймы, стремятся использовать их с максимальной эффективностью, но также и пользоваться гибкостью облачных сервисов. Хотя 96 % респондентов заявили, что перемещают некоторые рабочие нагрузки с мейнфреймов (около трети), 89 % согласились, что эти системы по-прежнему чрезвычайно или очень важны для их бизнес-операций.

В отчёте Kyndryl выделено три основных варианта модернизации мейнфреймов, причём большинство организаций использует их сочетания. Один из них — миграция, перенос некоторых или всех приложений и данных в облако или на локальную альтернативу. Второй вариант — интеграция данных и приложений мейнфрейма с другими платформами, что позволяет, например, новым облачным приложениям получать к ним доступ. Как ожидается, эта модель будет использоваться чаще с продолжающейся эволюцией генеративного ИИ, сообщила Kyndryl. Третий вариант — модернизация рабочих нагрузок на мейнфрейме, определение того, какие приложения следует сохранить, заменить или удалить, что подразумевает модернизацию исходного кода приложений или использование более современных языков, а также использование новых технологий, таких как ИИ и контейнеризация.

Это уже второе исследование State of Mainframe Modernization компании Kyndryl, и в этом году больше респондентов заявили, что они сосредоточены в первую очередь на модернизации или интеграции с облаком, в то время как меньшее количество выбрали в качестве первоочередной задачи перенос рабочих нагрузок с мейнфрейма.

Около 53 % респондентов заявили о росте использования мейнфреймов в этом году, а 49 % сообщили, что ожидают дальнейшего роста использования в течение следующих 12 месяцев. По словам Kyndryl, окупаемость инвестиций в проекты модернизации мейнфреймов составляет от 114 до 225 %.

Что также важно, 66 % респондентов заявили, что уровень безопасности, предлагаемый мэйнфреймами, является для них самым важным фактором, и почти половина опрошенных назвала обеспечение безопасности основной причиной инвестиций в модернизацию.

Один из руководителей ИТ-отдела оптовой компании в США сообщил, что был принят гибридный облачный подход, поскольку он позволяет хранить конфиденциальные данные в защищённой среде мейнфрейма, используя облако для менее важных рабочих нагрузок.

Также в исследовании сообщается о сохранении проблемы с нехваткой персонала с соответствующим опытом работы с мейнфреймами. 18 % респондентов из компаний, интегрирующих мейнфреймы с другими платформами, заявили, что недостаточный опыт был основным препятствием для успеха проекта, в то время как более четверти участников опроса выразили обеспокоенность тем, что их организациям не хватает необходимого уровня навыков для эффективной модернизации мейнфреймов. IBM пытается решить проблему с кадрами, представив в начале этого года пару инициатив по решению проблемы нехватки инженеров.

Также отмечено, что что 43 % респондентов указали, что у них нет навыков использования возможностей ИИ и генеративного ИИ, что заставляет всё больше организаций обращаться к внешним поставщикам, таким как Kyndryl, для реализации своих проектов модернизации. Подводя итоги, Kyndryl сделала вывод о том, что мейнфрейм остаётся важнейшей ИТ-средой для многих предприятий и даже становится всё более актуальным благодаря своей безопасности, надёжности и производительности.

Постоянный URL: http://servernews.ru/1111119
31.08.2024 [00:39], Алексей Степин

Новые мейнфреймы IBM z получат ИИ-ускорители Spyre

Вместе с процессорами Telum II для систем z17 компания IBM представила и собственные ускорители Spyre, ещё больше расширяющие возможности будущих мейнфреймов в области обработки ИИ-нагрузок. Они станут дополнением к встроенным в Telum ИИ-блокам.

 Источник изображений: IBM

Источник изображений: IBM

Spyre представляет собой плату расширения с интерфейсом PCIe 5.0 x16 и теплопакетом 75 Вт. Помимо самого нейропроцессора IBM на ней установлено 128 Гбайт памяти LPDDR5, а производительность в ИИ-задачах оценивается производителем в более чем 300 Топс, т.е. новинки подходят для инференса крупных моделей. Сам чип приозводится с использованием 5-нм техпроцесса Samsung 5LPE и содержит 26 млрд транзисторов, а площадь его кристалла составляет 330 мм2.

Spyre включает 32 ядра, каждое из которых дополнено 2 Мбайт быстрой скрэтч-памяти. Отдельно отмечено, что последняя не является кешем. При этом заявлена эффективность использования доступных вычислительных ресурсов — свыше 55 % на ядро. Каждое ядро содержит 78 матричных блоков и раздельные FP16-аккумуляторы, по восемь на «вход» и «выход». Интересно, что ядра Spyre и скрэтч-память используют отдельные кольцевые двунаправленные шины разной разрядности (32 и 128 бит соответственно), причём с оперативной памятью на скорости 200 Гбайт/с соединена именно вторая.

Каждый узел (drawer) на базе Telum II способен вместить восемь плат Spyre, которые формируют логический кластер, располагающий 1 Тбайт памяти с совокупной ПСП 1,6 Тбайт/с, но, разумеется, каждая плата будет ограничена 128 Гбайт/с из-за интерфейса PCIe 5.0 x16. Spyre создан с упором на предиктивный и генеративный ИИ, благо в полной комплектации новые мейнфреймы могут нести 96 таких ускорителей и развивать до 30 ПОпс (Петаопс).

Новинки рассчитаны на работу в средах zCX или Linux on Z, сопровождаются оптимизированным набором библиотек и совместимы с популярными фреймворками Pytoch, TensorFlow и ONNX. Они станут частью программных платформ IBM watsonx и Red Hat OpenShift. Новые мейнфреймы IBM z17 должны дебютировать на рынке в 2025 году. А в собственном облаке IBM будет также полагаться и на Intel Gaudi 3.

Постоянный URL: http://servernews.ru/1110080
30.08.2024 [23:53], Алексей Степин

IBM представила процессор Telum II: 8 × 5,5 ГГц, 2,88 Гбайт L4-кеш, улучшенный ИИ-ускоритель и встроенный DPU

Несмотря на доминирование архитектур x86 и Arm, а также растущую популярность RISC-V, востребованность классических мейнфреймов IBM на базе z/Architecture по-прежнему остаётся высокой, и компания продолжает активно развивать данное направление. На этой неделе IBM представила наследника Telum — процессор Telum II, в котором не только получили развитие заложенные ранее идеи, но и были реализованы достаточно серьёзные нововведения.

Telum II будет выпускаться Samsung по 5-нм техпроцессу 5HPP (43 млрд транзисторов, 600 мм2). Он по-прежнему имеет восемь ядер с фиксированной рабочей частотой 5,5 ГГц. Сами ядра подверглись усовершенствованию, пусть и достаточно минорному: повышена точность предсказания ветвлений, улучшены механизмы сквозной записи и трансляции адресов. Это должно обеспечить новинке 20 % преимущества в пересчёте на процессорный разъём в сравнении с предшественником. Также благодаря новому техпроцессу удалось снизить площадь ядра на 20 %, а энергопотребление — на 15 %. Для поддержания постоянной тактовой частоты в Telum II используется новый блок управления напряжениями.

 Источник изображений: IBM

Источник изображений: IBM

Серьёзно улучшена подсистема кешей: объём кеш-памяти подрос на 40 %, всего разделов L2-кеша десять. Каждый из них имеет объём 36 Мбайт, а латентность не превышает 3,6 нс. Объёмы виртуальных кешей L3 (11,5 нс) и L4 (48,5 нс) выросли до 360 Мбайт (на процессор) и 2,88 Гбайт (на узел) соответственно. Сама технология виртуального кеширования такова, что текущее свободное место в L2 может использоваться для любой задачи, где может быть востребовано. На 30 % повышена пропускная способность связи чипа с внешним миром, а общение на межузловом уровне теперь шифруется.

Встроенный ИИ-блок в Telum II в сравнении с предыдущим поколением стал вчетверо быстрее — 24 Топс. Сам сопроцессор имеет архитектуру, оптимальную для работы с LLM и нагрузками, в которых активно используется сравнительный анализ структурных или текстовых массивов данных. Есть поддержка INT8/FP16. При этом любой ИИ-ускоритель Telum II может работать с любым из ядер в пределах узла (drawer), что в предельной конфигурации даёт производительность на уровне 192 Топс, а для полностью сконфигурированной системы этот показатель равен 768 Топс. «Снаружи» ИИ-ускоритель доступен в виде набора CISC-инструкций.

А вот блок DPU дебютировал в Telum II впервые. Что интересно, архитектурно он не располагается «позади» PCI Express, как это бывает в системах на базе x86 или Arm, а имеет когерентное подключение к кешу L2 процессорных ядер, и при этом имеет свою подсистему кешей. Применение DPU, по словам IBM, позволило снизить энергозатраты на обслуживание операций ввода-вывода на 70 %. DPU жизненно необходим, поскольку на мейнфреймах будут работать тысячи инстансов, а самим системам теперь полагается и внешний ИИ-ускоритель Spyre.

Всего в состав DPU входит четыре кластера по по восемь программируемых микроядер, каждое из которых имеет кеш L1 объёмом 32+32 Кбайт и работает под управлением кастомных протоколов, разработанных IBM. DPU предоставляет шину PCI Express 5.0 и в полной конфигурации c 32 процессорами и 12 модулями расширения по 16 слотов x16 в каждом система на базе Telum II может работать со 192 адаптерами PCIe.

Компания-производитель позиционирует новые системы, как enterpise-решения широкого спектра для сценариев с использованием ИИ, в том числе, в режиме Ensemble AI, в котором одновременно над задачей могут работать модели разного размера и сложности. В этом режиме малая модель выявления мошеннических атак может работать как быстрое средство, а для отдельных, особенно важных транзакций в работу включается более сложная, но и более эффективная модель класса LLM.

Процессоры Telum II станут основой как новых мейнфреймов IBM Z, работающих под управлением классической z/OS, так и Linux. Ожидается, что платформы IBM z17 на базе Telum II будут доступны уже в следующем году.

Постоянный URL: http://servernews.ru/1110065
05.05.2024 [22:44], Владимир Мироненко

Не бывать дешёвым мейнфреймам: IBM подала второй иск к LzLabs, предлагающей доступную облачную альтернативу её «железу»

На этой неделе, как сообщает ресурс The Stack, прошло первое заседание в Высоком суде Великобритании по иску IBM UK, обвинившей швейцарскую фирму LzLabs в использовании своей британской «дочки» Winsopia для покупки ПО IBM для мейнфреймов с целью реверс-инжиниринга и разработки платформы Software Defined Mainframe (SDM).

По словам IBM, платформа SDM, являющаяся по сути эмулятором, позволяет клиентам использовать приложения для мейнфреймов IBM на x86-серверах под управлением Linux, в том числе облачных, без необходимости изменения исходного кода или пересборки. В иске IBM утверждается, что LzLabs нарушила условия лицензионного соглашения, которым запрещается обратная разработка программных продуктов. Иск был подан в Высокий суд ещё в сентябре 2021 года и получил впоследствии целый ряд правок. IBM требует возместить убытки, признать незаконными методы разработки SDM и запретить продажу SDM.

 Источник изображения: qimono/Pixabay

Источник изображения: qimono/Pixabay

Платформа SDM была представлена LzLabs в 2016 году. Компания поставила платформу таким клиентам, как Rogers Communications, MAN Truck & Bus и Swisscom. LzLabs заявляет, что SDM разработана в соответствии с законами Европы и Великобритании, которые способствуют инновациям и конкуренции в технологических отраслях. По словам LzLabs, платформа была создана после многих лет наблюдения, изучения и тестирования основных принципов взаимодействия клиентских приложений с мейнфреймом IBM. В связи с этим LzLabs обвинила IBM в попытке задушить конкуренцию, отметив, что Winsopia не нарушала условий лицензирования.

В ответ IBM заявила, что дело не имеет ничего общего с ограничением конкуренции. «Проблема заключается в незаконном использовании технологий, требующем инвестиций в миллиарды долларов, и IBM UK будет решительно защищать себя от действий Winsopia и LzLabs», — указано в сообщении корпорации. Аналогичный иск против LzLabs и её «дочки» Texas Wormhole был подан IBM в суд Западного округа Техаса в марте 2022 года. Как ожидается, рассмотрение иска начнётся в конце этого или начале следующего года.

Противостояние между IBM и разработчиками LzLabs длится уже порядка 15 лет. Так, в 2009 году компания Neon Enterprise Software, которая создала комплекс ПО zPrime, имевший схожую c SDM функциональность, сама подала иск к IBM, но в результате ответного иска от IBM была вынуждена закрыться. IBM не без оснований считает, что за LzLabs стоят те же люди, что работали в Neon. В 2022 году IBM также подала иск против Micro Focus, утверждая, что та скопировала и провела реверс-инжиниринг сервисов CICS для разработки конкурирующего продукта — Micro Focus Enterprise Server.

Постоянный URL: http://servernews.ru/1104332
Система Orphus