Лента новостей

02.09.2024 [08:38], Владимир Мироненко

Квартальные результаты Pure Storage, NetApp и Nutanix превысили прогнозы Уолл-стрит, но акции выросли только у последней

Акции поставщиков решений для хранения данных Pure Storage Inc. и NetApp Inc. упали в ходе расширенных торгов после подведения квартальных итогов несмотря на то, что их прибыль и выручка превзошли ожидания аналитиков. У Nutanix Inc. , наоборот, акции выросли, поскольку ей удалось добиться наилучших результатов, пишет ресурс SiliconANGLE.

Nutanix превзошла прогнозы Уолл-стрит, благодаря чему её акции выросли более чем на 15 % после закрытия торгов. Акции Pure Storage упали более чем на 16 %, а у NetApp — более чем на 5 % после того, как обе компании предупредили о более длительных циклах продаж.

Pure Storage сообщила о скорректированной прибыли (non-GAAP) на акцию за II квартал, закончившийся 4 августа, в размере $0.44 при выручке в размере $763,8 млн (рост год к году на 11 %), в то время как аналитики ожидали прибыль в $0,37 на акцию при выручке в размере $756 млн. В целом компания получила чистую прибыль в размере $35,6 млн, в то время как год назад у неё были убытки в размере $7,1 млн.

 Источник изображения: Pure Storage

Источник изображения: Pure Storage

В свою очередь, NetApp получила скорректированную прибыль (non-GAAP) за I квартал 2025 финансового года, завершившийся 26 июля, в размере $1,56 на акцию (годом ранее — $1,15) при общем объёме продаж в $1,54 млрд (рост 8 %) и также превзошла ожидания аналитиков Уолл-стрит, прогнозировавших прибыль (non-GAAP) в размере $1,45 на акцию при продажах в $1,53 млрд. Чистая прибыль (GAAP) за этот период составила $248 млн, превысив показатель годичной давности в $149 млн.

Из трёх компаний наилучшие результаты показала Nutanix, получившая скорректированную прибыль (Non-GAAP) в размере $0,27 на акцию в IV квартале 2024 финансового года, завершившегося 31 июля 2024 года, при продажах в $548 млн, что на 10 % больше, чем годом ранее. Прогноз Уолл-стрит по прибыли (Non-GAAP) был равен $0,20 на акцию при продажах в $537,7 млн.

 Источник изображения: Pure Storage

Источник изображения: Pure Storage

Причиной падения акций Pure Storage стал её прогноз. Компания заявила, что снижает свой годовой прогноз по продажам подписок до $500 млн по сравнению с предыдущим прогнозом почти в $600 млн. Вместе с тем компания сохранила свой общий прогноз продаж в размере $3,1 млрд.

При этом у Pure Storage выросла на 25 % год к году выручка от подписок до $361,2 млн. Последние пару лет компания подталкивает клиентов к переходу с разовых покупок оборудования на платформы хранения на основе подписки, чтобы обеспечить более регулярный доход. Аналитик NAND Research Inc. Стив Макдауэлл (Steve McDowell) рассказал SiliconANGLE, что рост продаж подписок стал основной причиной ее высоких показателей. «Неудивительно, что клиенты так активно реагируют на предложения подписки Pure», — говорит он.

 Источник изображения: Pure Storage

Источник изображения: Pure Storage

Председатель правления и главный исполнительный директор Pure Storage Чарльз Джанкарло (Charles Giancarlo) сообщил об «удлинении» переговоров по более крупным подписным сделкам. Тем не менее, компания дала прогноз на текущий квартал по выручке в размере $815 млн при оценке Уолл-стрит в размере $811 млн. Макдауэлл заявил, что снижение цены акций Pure Storage стало прямым следствием этих удлинённых циклов продаж, которые являются причиной её более низких краткосрочных прогнозов.

Аналитик также охарактеризовал распространение продуктов компании на QLC SSD высокой плотности, таких как FlashArray//E и FlashBlade//E, как повод для оптимизма. «Эти продукты напрямую конкурируют с традиционными системами на основе жёстких дисков Nearline для хранения и показывают, что предприятия начинают выбирать флеш-память вместо HDD по мере наступления циклов замены», — пояснил он. Отметим, что с начала года акции Pure Storage выросли более чем на 70 %.

 Источник изображения: NetApp

Источник изображения: NetApp

NetApp, специализирующаяся на разработке решений для хранения и управления данными, также сообщила о значительном увеличении продаж по подписке, отметив, что её годовой регулярный доход (ARR) от массивов хранения All-Flash вырос на 21 % с $2,8 млрд год назад до $3,4 млрд в конце квартала.

 Источник изображения: NetApp

Источник изображения: NetApp

Компания сообщила, что на конец квартал было выставлено счетов на $1,45 млрд при $1,3 млрд годом ранее. Счета — ключевой показатель эффективности, который приблизительно отражает суммы, которые компания выставила клиентам в квартале, но которые ещё не были оплачены. То есть он отражает будущий доход от услуг на основе подписки.

 Источник изображения: NetApp

Источник изображения: NetApp

NetApp получила доход от гибридного облака в размере $1,38 млрд, что больше дохода в $1,28 млрд годом ранее. Доход от публичного облака составил $159 млн, немного превысив доход в $154 млн годом ранее.

 Источник изображения: NetApp

Источник изображения: NetApp

В текущем квартале NetApp ожидает выручку в размере $1,565–1,715 млрд — $1,64 млрд в середине прогнозного диапазона, что немного выше оценки аналитиков Уолл-стрит в размере $1,63 млрд. Компания также повысила свой годовой прогноз выручки до $6,58 млрд, что выше более раннего прогноза в $6,55 млрд. С начала 2024 года акции NetApp выросли более чем на 50 % до нынешнего спада.

Рост акций Nutanix объясняется не только хорошими результатами, но и оптимистичным прогнозом на весь год. Компания ожидает в 2025 финансовом году выручку в размере от $2,435 до $2,465 млрд, что немного выше в серединном диапазоне целевого показателя Уолл-стрит в размере $2,43 млрд.

 Источник изображения: Nutanix

Источник изображения: Nutanix

Гендиректор Nutanix Раджив Рамасвами (Rajiv Ramaswamy) сообщил ресурсу SiliconANGLE, что, по его мнению, 2025 финансовый год станет хорошим годом для обеспечения устойчивого роста и прибыльности, добавив, что все основные показатели эффективности компании демонстрируют улучшение по сравнению с прошлым годом. С начала года стоимость акций Nutanix увеличились на 11 % до нынешнего роста.

Постоянный URL: https://servernews.ru/1110308
01.09.2024 [20:15], Сергей Карасёв

Для облаков и ИИ: QCT представила серверы на процессорах Intel Xeon 6

Компания Quanta Cloud Technology (QCT) анонсировала серверы на процессорах Intel Xeon 6, ориентированные на поставщиков облачных услуг, телекоммуникационных провайдеров и операторов ЦОД. Дебютировали решения серий QuantaGrid и QuantaPlex для различных рабочих нагрузок, включая задачи ИИ и НРС.

Отмечается, что серверы QCT построены с применением модульных компонентов, для монтажа которых не требуются инструменты. Доступны варианты с воздушным и жидкостным охлаждением, различной компоновкой подсистемы хранения данных, поддержкой ускорителей одинарной и двойной ширины. Реализована возможность горячей замены отдельных узлов, таких как блоки питания и вентиляторы.

Представлены модели QuantaGrid D55X-1U и QuantaGrid D55Q-2U типоразмера 1U и 2U соответственно. Они допускают установку двух чипов Xeon 6700E (Sierra Forest) с TDP до 350 Вт. Возможна установка 32 модулей DDR5-6400 RDIMM или 16 модулей MRDIMM (до 8000 МГц). У 1U-версии конфигурация подсистемы хранения в зависимости от исполнения включает: 12 × SFF NVMe/SATA/SAS SSD, 16 × E1.S NVMe SSD, 20 × E3.S 1T NVMe или 4 × E3.S 1T NVMe + 8 × E3.S 2T CXL. Карты расширения могут монтироваться по схеме 2 × PCIe 5.0 x16 FHHL, 2 × PCIe 5.0 x16 OCP 3.0 SFF и 1 × DC-SCM или 3 × PCIe 5.0 x16 HHHL, 2 × PCIe 5.0 x16 OCP 3.0 SFF и 1 × DC-SCM.

 Источник изображений: QCT

Источник изображений: QCT

Для сервера формата 2U предусмотрены варианты с поддержкой следующих накопителей: 12 × LFF SATA/SAS HDD или 12 × SFF NVMe, 24 × SFF NVMe/SATA/SAS или 12 × E3.S 1T NVMe + 12 × E3.S 2T CXL. Допускаются различные варианты монтажа карт PCIe 5.0 x8 FHHL, PCIe 5.0 x16 FHFL и PCIe 5.0 x8 HHHL. Серверы комплектуются двумя блоками питания с сертификатом 80 Plus Titanium (до 2700 и 3200 Вт соответственно).

Кроме того, анонсированы модели QuantaGrid S55R-1U и QuantaGrid S55J-2U формата 1U и 2U с поддержкой чипов Xeon 6700 с производительными P-ядрами (Granite Rapids). Раскрываются характеристики только 1U-сервера: один процессор с TDP до 350 Вт, 16 слотов для модулей DDR5-5200 RDIMM, 12 посадочных мест для SFF-накопителей NVMe/SATA/SAS SSD, два слота PCIe 5.0 x16 FHHL + слот OCP 3.0 NIC SFF, два коннектора M.2 2230/2280 PCIe 5.0, два блока питания 80 Plus Titanium мощностью до 2000 Вт.

Дебютировали также серверы QuantaPlex S25Z-2U и QuantaPlex S45Z-2U типоразмера 2U с двумя и четырьмя узлами. Каждый узел рассчитан на один процессор Xeon 6700 с TDP до 350 Вт, 16 модулей DDR5-6400 RDIMM, а также два SSD M.2. Двухузловая версия поддерживает до трёх карт расширения PCIe 5.0 и два SFF-накопителя NVMe/SATA SSD на узел. У четырёхузловой модификации возможна установка одной карты PCIe 5.0, а также двух накопителей E1.S NVMe SSD или трёх устройств SFF NVMe SSD на узел.

Вышел 7U-сервер QuantaGrid D74H-7U для ресурсоёмких нагрузок НРС и ИИ. Он допускает установку двух процессоров Intel Xeon Emerald Rapids или Sapphire Rapids с показателем TDP до 350 Вт. Есть 32 слота для модулей памяти DDR5-5600 RDIMM суммарным объёмом до 8 Тбайт. Предусмотрены отсеки для 18 SFF-накопителей NVMe SSD. Возможна установка восьми ускорителей NVIDIA H100 (SXM5). Слоты расширения выполнены по схеме 2 × PCIe 5.0 x16 OCP 3.0 SFF и 10 × PCIe 5.0 x16 OCP 3.0 TSFF. Применены шесть блоков питания 80 Plus Titanium на 4000 Вт.

Наконец, представлен высокопроизводительный сервер QuantaGrid D75E-4U  формата 4U, который, как утверждается, обеспечивает максимальную гибкость при работе с LLM, ИИ и HPC. Он оснащён двумя процессорами Intel Xeon 6 с TDP до 350 Вт и поддерживает до восьми GPU-ускорителей PCIe следующего поколения с воздушным охлаждением и TDP до 600 Вт.

Постоянный URL: https://servernews.ru/1110296
01.09.2024 [20:08], Сергей Карасёв

QR-код для BSOD, но в Linux: ядро 6.12 при сбоях сможет показывать подробное описание проблемы

В ядре Linux Kernel 6.12, по сообщению ресурса Phoronix, появится функция отображения QR-кода во время критических сбоев ядра (kernel panic). Идея заключается в том, чтобы предоставлять пользователям максимально подробную информацию о причинах появления «экрана смерти» и возможных способах устранения проблемы.

Как отмечает Tom's Hardware, попытки интеграции информационных QR-кодов в Linux осуществлялись и раньше. Так, возможность внедрения данного инструмента обсуждалась в 2014 году. А в декабре 2023-го состоялся релиз systemd 255 с модулем systemd-bsod, который в случае сбоя отображает «синий экран смерти» и QR-код с ошибкой.

 Источник изображения: Phoronix

Источник изображения: Phoronix

Аналогичный инструмент интегрируется непосредственно в ядро Linux 6.12, поэтому даже если произойдет полный сбой операционной системы, пользователь всё равно увидит QR-код с описанием проблемы. QR-код — достаточно мощный и важный инструмент для выяснения причины критического сбоя, особенно с учётом того, что обычно вывод о причинах неполадок обрезан. Поддержка новой функции реализована в виде Rust-модуля. Работа инструмента контролируется параметром DRM_PANIC_SCREEN_QR_CODE.

Нужно отметить, что Microsoft добавила QR-код к «синему экрану смерти» Windows в 2016 году. Но при его сканировании пользователь попадает лишь на общую страницу поддержки, не получая никаких дополнительных подробностей. Вместо этого предлагается перезапустить компьютер, открыть приложение Get Help и затем ввести «Troubleshoot BSOD error». Однако такой подход бесполезен, если «экран смерти» возникает при каждом включении ПК.

Постоянный URL: https://servernews.ru/1110294
31.08.2024 [22:02], Владимир Мироненко

Продажи серверов Dell взлетели на 80 % — компания переманивает крупных заказчиков ИИ-систем у Supermicro

Dell Technologies объявила финансовые результаты II квартала 2025 финансового года, завершившегося 2 августа 2024 года. Выручка компании составила $25,03 млрд, превысив на 9 % результат аналогичного квартала предыдущего финансового года, а также консенсус-прогноз аналитиков, опрошенных LSEG, в размере $24,53 млрд.

Чистая прибыль увеличилась на 85 % до $841 млн с $455 млн годом ранее. Прибыль на акцию выросла на 86 % с $0,63 до $1,17. Скорректированная чистая прибыль (Non-GAAP) на акцию увеличилась на 9 % с $1,74 до $1,89 при консенсус-прогнозе $1,71.

 Фото: Michael Dell

Фото: Michael Dell

Наибольший рост по выручке показало подразделение Infrastructure Solutions Group (ISG), производящее серверы, СХД и другое оборудование для ЦОД, которое принесло доход в размере $11,65 млрд, превысив на 38 % показатель годичной давности, а также прогноз аналитиков Уолл-стрит в размере $10,44 млрд.

При этом сегмент Servers and Networking, ответственный за поставку ИИ-серверов на базе ускорителей NVIDIA и AMD, а также традиционных серверов, увеличил продажи год к году на 80 % — с $4,27 до $7,67 млрд. Dell заявила, что $3,1 млрд из этой суммы приходится на продажи ИИ-платформ, реализация которых в предыдущем квартале составила $1,7 млрд. По словам главного операционного директора Dell Джеффа Кларка (Jeff Clarke) у компании растёт портфель заказов на ИИ-серверы, которые предстоит выполнить. В настоящее их объём составляет около $3,8 млрд.

 Источник изображений: Dell

Источник изображений: Dell

Финансовые результаты Dell были объявлены всего через несколько часов после публикации отчёта американской инвестиционной исследовательской компании Hindenburg Research LLC, согласно которому Dell всё активнее переманивает клиентов у конкурентов на рынке серверов, таких как Supermicro Computer Inc.

«Tesla закупала свои серверы исключительно у Supermicro, сообщается в отчёте Hindenburg. — Но недавние отчёты в мае 2024 года и сообщения Илона Маска показывают, что Dell теперь выиграла крупные контракты с Tesla и xAI, что подрывает эксклюзивность Supermicro». В отчёте также цитируется пост самого основателя Dell Майкла Делла (Michael Dell) в соцсети X о том, что он помогает фирме Маска обучать и поддерживать её популярный чат-бот Grok.

Ресурс SiliconANGLE отметил, что Dell извлекла выгоду из заявления гендиректора NVIDIA Дженсена Хуанга (Jensen Huang), сделанное в начале этого года, когда тот сказал, что, если собрались купить серверные системы, содержащие самые мощные чипы его компании, лучше всего поговорить с Майклом Деллом.

Вместе с тем продажи СХД подразделения ISG упали на 5 % до $3,97 млрд. Также было зафиксировано падение выручки группы Dell Client Solutions Group, которая специализируется на персональных компьютерах и ноутбуках, на 4 % до $12,41 млрд.

В текущем квартале Dell прогнозирует выручку в пределах от $24 до $25 млрд, что близко к прогнозу аналитиков StreetAccount, равному $24,6 млрд. Компания также пересмотрела прогноз по выручке на весь 2025 финансовый год. Теперь он составляет $95,5–$98,5 млрд, тогда как раньше он составлял $93,5–$97,5 млрд. Однако средняя точка всё же ниже прогноза Уолл-стрит в $96,34 млрд.

После объявления квартальных результатов акции Dell выросли на 3 %. До этого события их рост с начала года составил 48 % с учётом падения на 34 % с момента оглашения предыдущего квартального отчёта.

Постоянный URL: https://servernews.ru/1110293
31.08.2024 [14:12], Сергей Карасёв

Cerebras Systems запустила «самую мощную в мире» ИИ-платформу для инференса

Американский стартап Cerebras Systems, занимающийся разработкой чипов для систем машинного обучения и других ресурсоёмких задач, объявил о запуске, как утверждается, самой производительной в мире ИИ-платформы для инференса — Cerebras Inference. Ожидается, что она составит серьёзную конкуренцию решениям на основе ускорителей NVIDIA.

В основу облачной системы Cerebras Inference положены ускорители WSE-3. Эти гигантские изделия, выполненные с применением 5-нм техпроцесса TSMC, содержат 4 трлн транзисторов, 900 тыс. ядер и 44 Гбайт SRAM. Суммарная пропускная способность встроенной памяти достигает 21 Пбайт/с, а внутреннего интерконнекта — 214 Пбит/с. Для сравнения: один чип HBM3e в составе NVIDIA H200 может похвастаться пропускной способностью «только» 4,8 Тбайт/с.

 Источник изображений: Cerebras

Источник изображений: Cerebras

По заявлениям Cerebras, новая инференс-платформа обеспечивает до 20 раз более высокую производительность по сравнению с сопоставимыми по классу решениями на чипах NVIDIA в сервисах гиперскейлеров. В частности, быстродействие составляет до 1800 токенов в секунду на пользователя для ИИ-модели Llama3.1 8B и до 450 токенов в секунду для Llama3.1 70B. Для сравнения, у AWS эти значения равны соответственно 93 и 50. Речь идёт об FP16-операциях. Cerebras заявляет, что лучший результат для кластеров на основе NVIDIA H100 в случае Llama3.1 70B составляет 128 токенов в секунду.

«В отличие от альтернативных подходов, которые жертвуют точностью ради быстродействия, Cerebras предлагает самую высокую производительность, сохраняя при этом точность на уровне 16 бит для всего процесса инференса», — заявляет компания.

При этом услуги Cerebras Inference стоят в несколько раз меньше по сравнению с конкурирующими предложениями: $0,1 за 1 млн токенов для Llama 3.1 8B и $0,6 за 1 млн токенов для Llama 3.1 70B. Оплата взимается по мере использования. Cerebras планирует предоставлять инференс-услуги через API, совместимый с OpenAI. Преимущество такого подхода заключается в том, что разработчикам, которые уже создали приложения на основе GPT-4, Claude, Mistral или других облачных ИИ-моделей, не придётся полностью менять код для переноса нагрузок на платформу Cerebras Inference.

Для крупных предприятий предлагается план обслуживания Enterprise Tier, который предусматривает тонко настроенные модели, индивидуальные условия и специализированную поддержку. Стандартный пакет Developer Tier предполагает подписку по цене от $0,1 за 1 млн токенов. Кроме того, имеется бесплатный доступ начального уровня Free Tier с ограничениями. Cerebras говорит, что запуск платформы откроет качественно новые возможности для внедрения генеративного ИИ в различных сферах.

Постоянный URL: https://servernews.ru/1110276
31.08.2024 [14:01], Сергей Карасёв

Softline с партнёрами предложили альтернативы зарубежным облачным сервисам, ушедшим из РФ

ГК Softline назвала ряд отечественных облачных сервисов, которые могут стать альтернативой зарубежным платформам, прекратившим обслуживать российских пользователей в условиях сформировавшейся геополитической обстановки. Речь идёт о компаниях Amazon, Microsoft и Google.

Напомним, Amazon и Microsoft начали ограничивать доступ к своим облачным продуктам на территории России с 20 марта 2024 года. Впоследствии Microsoft начала веерные остановки подписок на облачные сервисы для российских корпоративных клиентов. А Google предупредила об отключении облачного сервиса BigQuery в РФ с 9 сентября.

 Источник изображения: softline.ru

Источник изображения: softline.ru

Softline предлагает пять альтернативных продуктов отечественных разработчиков:

  • Р7-Офис. Возможен переход на «Корпоративный сервер 2024» — профессиональные онлайн- и офлайн-инструменты для работы с документами и контентом. Доступны корпоративная и открытая программы лицензирования, бесплатный доступ для средних и дошкольных образовательных учреждений, скидки для других образовательных учреждений и крупных заказчиков.
  • «ВКУРСЕ». Это отечественный разработчик защищенной онлайн-платформы для проведения совещаний, видеоконференций, обучения, вебинаров и крупных конференций. Может стать заменой для Microsoft Teams, Zoom, Google Meet. Предоставляются скидки и экспертное обучение для пользователей заказчика.
  • «Автограф». Специальное предложение от компании ООО «Графические технологии» («ГрафТех») для клиентов Softline с целью перехода с платформы Microsoft Visio. В частности, «ГрафТех» предоставляет бесплатные лицензии на «Автограф» на период до 90 дней с последующей покупкой.
  • Yandex Cloud. В рамках специального предложения при заключение контракта через Softline Yandex Cloud предлагает грант на двукратную сумму от текущего месячного потребления в Microsoft Azure, Google Cloud и AWS (но не более 1 млн руб.). Кроме того, доступно двухмесячное тестирование Yandex Cloud на двукратную сумму от месячного потребления зарубежных услуг.
  • VK WorkSpace. Решение предназначено для совместной работы команд. Доступны быстрая миграция и три месяца бесплатного использования облачной версии сервисов VK WorkSpace при переходе с Microsoft и Google и заключении контракта через Softline.
Постоянный URL: https://servernews.ru/1110280
31.08.2024 [13:42], Андрей Крупин

ОС «МСВСфера» получила сертификат ФСТЭК России по 4-му уровню доверия

Российский поставщик оборудования и ПО для IT-инфраструктуры и информационной безопасности «Инферит» (входит в группу компаний Softline) сообщил о получении сертификата Федеральной службы по техническому и экспортному контролю на операционную систему «МСВСфера».

Платформа «МСВСфера» построена на базе ядра Linux, зарегистрирована в реестре отечественного программного обеспечения Минцифры и является альтернативой зарубежным ОС уровня Enterprise Linux. Операционная система представлена в редакциях для рабочих станций и серверов и подходит для использования как в государственных, так и в коммерческих организациях. Продукт содержит встроенные инструменты миграции с Red Hat Enterprise Linux, CentOS, AlmaLinux, Rocky Linux, Oracle Enterprise Linux и поддерживается производителем в рамках десятилетнего жизненного цикла, включая выпуск обновлений и исправлений безопасности, что гарантирует стабильность и защищённость IT-инфраструктуры клиента.

 Операционная система «МСВСфера» (источник изображения: inferit.ru/products/os)

Операционная система «МСВСфера» (источник изображения: inferit.ru/products/os)

Выданный ФСТЭК России сертификат подтверждает соответствие «МСВСфера» требованиям по безопасности информации, установленным в документах «Требования по безопасности информации, устанавливающие уровни доверия к средствам технической защиты информации и средствам обеспечения безопасности информационных технологий» (Требования доверия) — по 4 уровню доверия, «Требования безопасности информации к операционным системам» и «Профиль защиты операционных систем типа А четвёртого класса защиты. ИТ.ОС.А4.ПЗ».

«МСВСфера» может использоваться при построении государственных информационных систем (ГИС) до I класса защищённости включительно, информационных систем для обработки персональных данных (ИСПДн) до I уровня защищённости включительно, автоматизированных систем управления производственными и технологическими процессами (АСУ ТП) до I класса защищённости включительно, информационных систем общего пользования (ИСОП) до II класса защищённости и объектов критических информационных инфраструктур (КИИ) до I категории значимости.

Постоянный URL: https://servernews.ru/1110285
31.08.2024 [00:39], Алексей Степин

Новые мейнфреймы IBM z получат ИИ-ускорители Spyre

Вместе с процессорами Telum II для систем z17 компания IBM представила и собственные ускорители Spyre, ещё больше расширяющие возможности будущих мейнфреймов в области обработки ИИ-нагрузок. Они станут дополнением к встроенным в Telum ИИ-блокам.

 Источник изображений: IBM

Источник изображений: IBM

Spyre представляет собой плату расширения с интерфейсом PCIe 5.0 x16 и теплопакетом 75 Вт. Помимо самого нейропроцессора IBM на ней установлено 128 Гбайт памяти LPDDR5, а производительность в ИИ-задачах оценивается производителем в более чем 300 Топс, т.е. новинки подходят для инференса крупных моделей. Сам чип приозводится с использованием 5-нм техпроцесса Samsung 5LPE и содержит 26 млрд транзисторов, а площадь его кристалла составляет 330 мм2.

Spyre включает 32 ядра, каждое из которых дополнено 2 Мбайт быстрой скрэтч-памяти. Отдельно отмечено, что последняя не является кешем. При этом заявлена эффективность использования доступных вычислительных ресурсов — свыше 55 % на ядро. Каждое ядро содержит 78 матричных блоков и раздельные FP16-аккумуляторы, по восемь на «вход» и «выход». Интересно, что ядра Spyre и скрэтч-память используют отдельные кольцевые двунаправленные шины разной разрядности (32 и 128 бит соответственно), причём с оперативной памятью на скорости 200 Гбайт/с соединена именно вторая.

Каждый узел (drawer) на базе Telum II способен вместить восемь плат Spyre, которые формируют логический кластер, располагающий 1 Тбайт памяти с совокупной ПСП 1,6 Тбайт/с, но, разумеется, каждая плата будет ограничена 128 Гбайт/с из-за интерфейса PCIe 5.0 x16. Spyre создан с упором на предиктивный и генеративный ИИ, благо в полной комплектации новые мейнфреймы могут нести 96 таких ускорителей и развивать до 30 ПОпс (Петаопс).

Новинки рассчитаны на работу в средах zCX или Linux on Z, сопровождаются оптимизированным набором библиотек и совместимы с популярными фреймворками Pytoch, TensorFlow и ONNX. Они станут частью программных платформ IBM watsonx и Red Hat OpenShift. Новые мейнфреймы IBM z17 должны дебютировать на рынке в 2025 году. А в собственном облаке IBM будет также полагаться и на Intel Gaudi 3.

Постоянный URL: https://servernews.ru/1110080
30.08.2024 [23:53], Алексей Степин

IBM представила процессор Telum II: 8 × 5,5 ГГц, 2,88 Гбайт L4-кеш, улучшенный ИИ-ускоритель и встроенный DPU

Несмотря на доминирование архитектур x86 и Arm, а также растущую популярность RISC-V, востребованность классических мейнфреймов IBM на базе z/Architecture по-прежнему остаётся высокой, и компания продолжает активно развивать данное направление. На этой неделе IBM представила наследника Telum — процессор Telum II, в котором не только получили развитие заложенные ранее идеи, но и были реализованы достаточно серьёзные нововведения.

Telum II будет выпускаться Samsung по 5-нм техпроцессу 5HPP (43 млрд транзисторов, 600 мм2). Он по-прежнему имеет восемь ядер с фиксированной рабочей частотой 5,5 ГГц. Сами ядра подверглись усовершенствованию, пусть и достаточно минорному: повышена точность предсказания ветвлений, улучшены механизмы сквозной записи и трансляции адресов. Это должно обеспечить новинке 20 % преимущества в пересчёте на процессорный разъём в сравнении с предшественником. Также благодаря новому техпроцессу удалось снизить площадь ядра на 20 %, а энергопотребление — на 15 %. Для поддержания постоянной тактовой частоты в Telum II используется новый блок управления напряжениями.

 Источник изображений: IBM

Источник изображений: IBM

Серьёзно улучшена подсистема кешей: объём кеш-памяти подрос на 40 %, всего разделов L2-кеша десять. Каждый из них имеет объём 36 Мбайт, а латентность не превышает 3,6 нс. Объёмы виртуальных кешей L3 (11,5 нс) и L4 (48,5 нс) выросли до 360 Мбайт (на процессор) и 2,88 Гбайт (на узел) соответственно. Сама технология виртуального кеширования такова, что текущее свободное место в L2 может использоваться для любой задачи, где может быть востребовано. На 30 % повышена пропускная способность связи чипа с внешним миром, а общение на межузловом уровне теперь шифруется.

Встроенный ИИ-блок в Telum II в сравнении с предыдущим поколением стал вчетверо быстрее — 24 Топс. Сам сопроцессор имеет архитектуру, оптимальную для работы с LLM и нагрузками, в которых активно используется сравнительный анализ структурных или текстовых массивов данных. Есть поддержка INT8/FP16. При этом любой ИИ-ускоритель Telum II может работать с любым из ядер в пределах узла (drawer), что в предельной конфигурации даёт производительность на уровне 192 Топс, а для полностью сконфигурированной системы этот показатель равен 768 Топс. «Снаружи» ИИ-ускоритель доступен в виде набора CISC-инструкций.

А вот блок DPU дебютировал в Telum II впервые. Что интересно, архитектурно он не располагается «позади» PCI Express, как это бывает в системах на базе x86 или Arm, а имеет когерентное подключение к кешу L2 процессорных ядер, и при этом имеет свою подсистему кешей. Применение DPU, по словам IBM, позволило снизить энергозатраты на обслуживание операций ввода-вывода на 70 %. DPU жизненно необходим, поскольку на мейнфреймах будут работать тысячи инстансов, а самим системам теперь полагается и внешний ИИ-ускоритель Spyre.

Всего в состав DPU входит четыре кластера по по восемь программируемых микроядер, каждое из которых имеет кеш L1 объёмом 32+32 Кбайт и работает под управлением кастомных протоколов, разработанных IBM. DPU предоставляет шину PCI Express 5.0 и в полной конфигурации c 32 процессорами и 12 модулями расширения по 16 слотов x16 в каждом система на базе Telum II может работать со 192 адаптерами PCIe.

Компания-производитель позиционирует новые системы, как enterpise-решения широкого спектра для сценариев с использованием ИИ, в том числе, в режиме Ensemble AI, в котором одновременно над задачей могут работать модели разного размера и сложности. В этом режиме малая модель выявления мошеннических атак может работать как быстрое средство, а для отдельных, особенно важных транзакций в работу включается более сложная, но и более эффективная модель класса LLM.

Процессоры Telum II станут основой как новых мейнфреймов IBM Z, работающих под управлением классической z/OS, так и Linux. Ожидается, что платформы IBM z17 на базе Telum II будут доступны уже в следующем году.

Постоянный URL: https://servernews.ru/1110065
30.08.2024 [17:07], Владимир Мироненко

Массовый переход на российские системы виртуализации случится в 2025–2027 гг.

Согласно исследованию «ТМТ Консалтинг», в 2023 году объём российского рынка систем виртуализации, включая серверную виртуализацию и VDI on-premise, составил порядка 8,32 млрд руб., превысив показатель предыдущего года на 16 %. В этом году ожидаются такие же темпы роста, так что рынок может вырасти 9,64 млрд руб. Примерно 75 % рынка составляет более зрелый рынок серверной виртуализации, в то время как сегмент VDI пока находится на этапе формирования.

В 2023 году на рынке виртуализации наибольшей популярностью пользовались решения компаний «Базис» (36 %), OrionSoft (14 %), ITGLOBAL (13 %), «Группа Астра» (12 %). Как ожидают в «ТМТ Консалтинг», в ближайшие три года нарастание тренда на консолидацию на рынке может привести к тому, что останется 4–6 заметных игроков с наиболее зрелым предложением, которые могут совокупно занять более 75 % рынка. Сейчас, по словам экспертов, есть порядка 35 российских платформ виртуализации, часть из них разрабатывается для внутренних нужд.

 Источник изображений: «ТМТ Консалтинг»

Источник изображений: «ТМТ Консалтинг»

Ключевым фактором развития рынка в «ТМТ Консалтинг» назвали импортозамещение. В 2022 году рынок просел из-за ухода западных компаний и — VMware, Microsoft и Citrix совокупно занимали более 75 % рынка. С их уходом и ужесточением требований регуляторов, в частности, отзыва лицензий ФСТЭК, вырос спрос на отечественные системы виртуализации. Также на ускорение импортозамещения повлиял указ о переводе критической информационной инфраструктуры (КИИ) на отечественное ПО до 1 января 2025 года.

По данным Strategy Partners, передают «Ведомости», объём российского рынка систем виртуализации в 2022 г. составлял 7,3 млрд руб., причём его большая часть приходилась на зарубежные решения. По словам экспертов, оценить реальный уровень проникновения российских продуктов, поскольку даже при закупке отечественных систем виртуализации многие продолжают использовать зарубежные продукты.

В числе основных трендов на российском рынке виртуализации в «ТМТ Консалтинг» назвали усиление требований заказчиков к российским решениям, в частности к их функциональности, развитие инициатив по наращиванию компетенций, усилению внутренних команд российских вендоров, развитие технологических партнёрств между поставщиками с целью обеспечения совместимости продуктов, а также развитие направления обучения с целью повышения компетенций по работе со своими продуктами как партнёров, так и других игроков рынка.

В «ТМТ Консалтинг» ожидают в этом году наращивание процесса миграции на отечественные системы виртуализации, с массовым переходом на них в 2025–2027 гг. По оценкам аналитиков, темпы роста сегмента серверной виртуализации в РФ (CAGR) за 2023–2027 гг. составят 14 %, сегмента VDI — 17 %. Объём рынка виртуализации приблизится в 2027 году к 11 млрд руб. и 4 млрд руб. соответственно.

Постоянный URL: https://servernews.ru/1110247
Система Orphus