Материалы по тегу:

29.05.2026 [21:36], Владимир Мироненко

FuriosaAI и Broadcom создадут ИИ-ускоритель для платформы инференса для агентной эры

Южнокорейский стартап FuriosaAI объявил о заключении соглашения о стратегическом партнёрстве с Broadcom для разработки тензорного (TCP) ИИ-ускорителя третьего поколения в качестве основы масштабируемой платформы инференса, предназначенной для обслуживания передовых агентных систем гиперскейлеров.

Стартап намерен объединить передовые возможности Broadcom по упаковке, позволяющие интегрировать несколько кремниевых кристаллов в ИИ-ускоритель, и её достижения в масштабируемых сетевых решениях для ИИ со своей ИИ-архитектурой и программным стеком для создания платформы инференса в масштабе стойки

По словам FuriosaAI, в результате сотрудничества с Broadcom архитектура процессора Tensor Contraction Processor (TCP) «превратится в многокристальную систему», которая лучше подходит для «высокопроизводительных требований к токенам» рабочих нагрузок инференса и агентного ИИ, пишет DataCenter Dynamics.

FuriosaAI отметила, что эта архитектура сделает чипы более подходящими для «реальных рабочих ИИ-нагрузок» и что, сосредоточившись на высокоскоростной передаче данных, а не на управлении потоками вычислений, ускорители обеспечат более высокую производительность на ватт и большую «плотность» токенов, чем «передовые GPU».

 Источник изображения: FuriosaAI

Источник изображения: FuriosaAI

Сообщается, что чип третьего поколения FuriosaAI будет включать вычислительный 2-нм кристалл, выделенный IO-кристалл SUE-интерконнекта и двуслойную память HBM4/4E. Благодаря интеграции Scale-Up Ethernet (SUE) и PCIe-решений Broadcom, система будет обеспечивать низкую задержку и высокую пропускную способность интерконнекта All-to-All между сотнями чипов в масштабе стойки. Существующие системы могут объединять не более восьми ИИ-ускорителей RNGD.

Как отметил президент группы полупроводниковых решений Broadcom, производительность инференса больше не определяется исключительно вычислительными ресурсами. Она всё больше зависит от повторного использования данных и эффективности обмена данными между серверами и стойками: «Сочетая архитектуру TCP FuriosaAI с ведущей на рынке технологией XPU и IP-платформой Broadcom, масштабируемым Ethernet и коммутаторами сетевых фабрик, мы создаём платформу, которая решает ключевые проблемы крупномасштабного агентного ИИ», — заявил он.

«Объединение инфраструктурных возможностей Broadcom и архитектуры Tensor Contraction Processor от FuriosaAI, а также её определяющего отрасль программного стека, позволяет нам выйти за рамки уровня чипа и предложить комплексное решение для эпохи фабрик токенов», — отметил соучредитель и генеральный директор FuriosaAI.

 Источник изображения: Broadcom

Источник изображения: Broadcom

Хотя вычислительная мощность по-прежнему важна для рабочих ИИ-нагрузок, особенно на этапе предварительного заполнения, FuriosaAI сосредоточилась на перемещении данных между HBM и DRAM. «TCP ориентирован на высокоскоростную передачу данных и масштабные тензорные операции, а не на управление тысячами крошечных потоков. Он рассматривает доступ к памяти как первостепенную задачу, устраняя “обрыв” эффективности, с которым сталкиваются GPU, когда модели выходят за рамки жёстких иерархий кеша»,сообщается в блоге компании.

Аппаратное обеспечение FuriosaAI поддерживается программным стеком, который позволяет разработчикам быстро развёртывать приложения, а также легко переключаться на новые модели и новые методы оптимизации. В то время как устаревшие платформы требуют обширной ручной настройки ядер для каждой новой модели, SDK FuriosaAI использует универсальный компилятор, который автоматически сопоставляет высокоуровневый код PyTorch с полупроводниковой архитектурой. Для разработчиков, которым требуется более детальный контроль, виртуальная архитектура набора команд FuriosaAI предлагает декларативную модель программирования, которая обеспечивает управление оборудованием без недетерминированной сложности традиционного программирования для GPU, отметила компания.

Ранее сообщалось, что Broadcom продлила сотрудничество с Meta для разработки нескольких поколений кастомных ИИ-чипов. Также она расширила контракт с Google по снабжению её новыми поколениями ИИ-чипов. Создаёт Broadcom специализированные чипы и для OpenAI. Всего у компании в разработке порядка десяти кастомных ASIC.

Постоянный URL: http://servernews.ru/1142619
29.05.2026 [20:30], Руслан Авдеев

Gartner: большинство кастомных ИИ-моделей и проектов генеративного ИИ ожидает провал

По мнению Gartner, не менее половины всех проектов в сфере генеративного ИИ и создателей большинства ИИ-моделей ожидает неудача. Расходы на проекты будут выше планируемого из-за неудачных архитектурных решений и недостатка ноу-хау, а разработчики собственных моделей столкнутся с высокими затратами и другими сложностями, сообщает The Register.

В докладе «Цикл хайпа вокруг генеративного ИИ» (Hype Cycle for Generative AI), в котором эксперты рассмотрели 30 ИИ-технологий, сообщается, что ни одна из них не достигла т.н. «плато производительности». На этом этапе продукты и технологии уже пережили два или три этапа эволюции, стабильны и приносят ощутимые выгоды. До достижения этого плато ИИ-технологии в своём развитии поднимаются до «Пика завышенных ожиданий» (Peak of Inflated Expectations), после чего следует спад в «Долину разочарований» (Trough of Disillusionment) и медленный подъём по «Склону просветления» (Slope of Enlightenment).

По мнению Gartner, в областях вроде здравоохранения, финансов, юриспруденции и др. будут обеспечивать лучшие результаты модели, специально созданные «с нуля» под конкретную тематику, либо специально доработанные — в сравнении с универсальными моделями «общего назначения». Впрочем, подчёркивается, что создание специальных моделей требует значительных вычислительных ресурсов, специальных знаний и постоянного обслуживания. На достижение достаточной зрелости для массового применения таким моделям потребуется минимум 2–5 лет.

 Источник изображения: Gartner

Источник изображения: Gartner

Безусловный успех, по мнению Gartner, ожидает лишь ИИ-приложения вроде помощников в подготовке программного кода, создании графики и видео, а также обобщения контента. Впрочем, из-за проблем с интеллектуальной собственностью и склонностью ИИ к ошибкам, нишу ожидают некоторые проблемы. Тем не менее, Gartner уверена, что такие приложени довольно зрелые и они уже освоили более половины целевого рынка. Наименее зрелыми называются протоколы связи ИИ-агентов друг с другом и окружающей средой. Впрочем, этот сегмент довольно быстро развивается и даже уже имеется пара фаворитов.

Наибольший потенциал по мнению экспертов имеют технологии защиты от дезинформации (Disinformation Security) и «Модели мира» (World Models). Технологии Disinformation Security помогают распознавать дипфейки, случаи кражи личности и создание другого фейкового контента, направленного на дискредитацию людей и организаций, а также на создание контента для кибератак и совершения других преступлений. По оценкам Gartner, до достижения зрелости этим технологиям ещё 5–10 лет.

Модели мира позволяют ИИ выполнять сложные задачи прогнозирования и планирования, имитируя и понимая динамику окружающей среды. Это позволяет принимать обоснованные решения даже в условиях недостатка информации и непредвиденных обстоятельств. Такие инструменты также полезны для навигации робототехники в человеческом мире или создания видеоконтента с реалистичным отображением физики.

Также Gartner считает, что организации, намеренные создавать ИИ-системы на основе открытых моделей, не получат доступ к самым передовым технологиям… если не готовы применять китайские разработки. Утверждается, что коммерциализация открытых LLM оказалась весьма сложной для их разработчиков. Многие западные технологические компании избирательно делают модели открытыми, благодаря чему все инновации в данной сфере пока сосредоточены в КНР, хотя развитие идёт и за пределами Китая.

Постоянный URL: http://servernews.ru/1142596
29.05.2026 [16:44], Руслан Авдеев

Союзные ЦОДы: российские дата-центры пригласили в Беларусь

В условиях борьбы с энергодефицитом белорусские генерирующие мощности готовы обеспечить электричеством дата-центры российских компаний, заявил глава белорусской Ассоциации высоких технологий и цифровой инфраструктуры Алексей Свентицкий. Вместе с президентом российской Ассоциации участников отрасли ЦОД Игорем Дорофеевым будут подготовлены предложения для рабочих групп обеих стран, сообщают «Ведомости».

По словам Свентицкого, ранее уже обсуждался вопрос возможного строительства ЦОД «Москва – Минск» в приграничной зоне. По словам Дорофеева, после введения запрета на строительство новых ЦОД в Москве альтернативой для компаний, готовых мигрировать целыми кластерами, могут стать Санкт-Петербург, восточные и западные территории, а также белорусское приграничье. Вместе с тем эксперты отмечают, что для таких объектов потребуются высокоскоростные каналы связи с малой задержкой, чтобы комфортно обслуживать российских пользователей, а также единое правовое поле в сфере ЦОД.

 Источник изображения: Pavol Svantner/unsplash.com

Источник изображения: Pavol Svantner/unsplash.com

Как считают отраслевые эксперты, дефицит энергии в России будет только расти, и не только в столице, поэтому белорусский энергетический профицит стоит использовать для энергоснабжения. По данным «Системного оператора Единой энергетической системы» (АО «СО ЕЭС»), в 2025 году в России мощность ЦОД и майнинговых ферм в энергосистеме составила 4,2 ГВт, рост составил 33,3 % г/г, а общая доля ЦОД в российском энергопотреблении составила 2,2 %. Прогнозируется, что в 2026 году она увеличится до 2,4 %, а в ближайшие пять лет — до 15,3 ГВт.

Ранее стало известно, в Москве и пригородах энергетические мощности для ЦОД уже закончились. Ввод новых генерирующих мощностей ожидается не ранее 2027–2030 гг., а новые ЛЭП должны построить только в 2030–2032 гг. Тем временем далеко в провинции отмечается избыток энергомощностей, но спрос на них значительно ниже, поскольку точки обмена трафиком тоже расположены далеко. Власти могут разрешить строительство новых дата-центров в энергодефицитных регионах, если те сами обеспечат себя генерирующими мощностями.

Постоянный URL: http://servernews.ru/1142601
29.05.2026 [16:19], Руслан Авдеев

Project Lightwell: IBM и Red Hat предложили корпорациям скинуться на патчи безопасности для open source ПО и сами вложат $5 млрд

IBM и Red Hat объявили о начале реализации Project Lightwell, в рамках которого компании инвестируют $5 млрд в развитие ПО с открытым исходным кодом. Проект станет опираться на передовые ИИ-возможности и команду из более 20 тыс. разработчиков со всего мира. Это позволит задать новую модель работы корпоративных пользователей с open source — от разработки до промышленной эксплуатации.

В рамках Project Lightwell создадут доверенный «клиринговый» информационный центр, а международная сеть разработчиков поможет в устранении уязвимостей. Эта платформа станет «координационным уровнем» для обеспечения безопасности, использующим передовые ИИ-возможности для проверки и тестирования патчей для огромных объёмов открытого исходного кода. Возможности будут доступны в рамках платных подписок, что позволит корпоративным клиентам интегрировать обновления безопасности в существующие цепочки поставок ПО. При этом им будет доступен корпоративный уровень валидации и управления жизненным циклом ПО.

IBM и Red Hat подчеркнули, что именно open source лежит в основе современной IT-инфраструктуры, открытый код используют более 90 % компаний из списка Fortune 500. При этом развитие передовых ИИ-технологий ускоряет как поиск, так и использование уязвимостей. Например, специальная модель Mythos Preview компании Anthropic выявила в ПО open source почти 3,9 тыс. уязвимостей высокого и критического уровней.

IBM и Red Hat начали сотрудничать с Bank of America, BNY, Citi, Goldman Sachs, JPMorganChase, Mastercard, Morgan Stanley, Royal Bank of Canada, State Street, Visa и Wells Fargo — одними из первых участников Project Lightwell. Предполагается, что опыт этих структур поможет сформировать протоколы обнаружения, проверки и устранения уязвимостей в сложных цепочках поставок открытого ПО.

 Источник изображения: IBM

Источник изображения: IBM

Проект опирается на уже имеющиеся компетенции IBM и Red Hat в сфере open source, корпоративных ИИ-продуктов и кибербезопасности. Также на вооружение берётся опыт инициатив вроде Anthropic Project Glasswing и OpenAI Trust Access for Cyber. В частности, проект предусматривает использование агентных ИИ-инструментов для защиты основных компонентов open source, лежащих в основе современных корпоративных и ИИ-систем.

Ключевым элементом станет создание «клирингового» центра для обеспечения безопасности open source. Модели открытого ПО компаний IBM и Red Hat расширяются за пределы их собственных платформ. IBM уже использует более 62 тыс. пакетов open source, а также имеет большой опыт, связанный с 10 тыс. из них. Компании оперируют одними из крупнейших в отрасли открытых экосистем, управляя жизненными циклами, валидацией и выпуском патчей для их компонентов, применяя технологии на базе Linux, Java, Kubernetes, Kafka, Ansible, Terraform, Flink, Cassandra и др.

Теперь предполагается применять аналогичный подход при работе с открытым исходным кодом из независимых источников. Клиенты смогут сообщать об уязвимостях в активных версиях ПО для их устранения с помощью доверенного посреднического механизма, получать проверенные патчи для решений Red Hat и независимого кода, координировать раскрытие информации об устранении уязвимостей. Пока многие компании используют ИИ для сокращения своего персонала, IBM и Red Hat делают ставку на использование базы из более 20 тыс. разработчиков, усиленной ИИ-инструментами.

В задачи этой международной команды войдёт сопровождение продуктов вместе с лидерами open source сообществ; анализ, сортировка и построение иерархии уязвимостей; разработка обновлений безопасности и релиз-инжиниринг. Заявлено, что Project Lightwell поддерживает государственные (естественно, американские) приоритеты по защите цифровой инфраструктуры, критически важных систем и повышению устойчивости экосистем open source в целом.

Примечательно, что ещё в январе сообщалось о том, что Евросоюз делает ставку на open source, чтобы избавиться от зависимости от IT-гигантов из США. Теперь получается, что блок в некоторой степени может попасть в зависимость, но уже от других американских IT-гигантов.

Постоянный URL: http://servernews.ru/1142584
29.05.2026 [13:36], Руслан Авдеев

Meta✴ раздумывает, не потягаться ли с AWS и другими облаками

Meta, вероятно, попытается выйти на рынок облачных вычислений, составив конкуренцию таким опытными игроками как AWS, Microsoft Azure и Google Cloud, сообщает Datacenter Dynamics. По данным CNBC, информацию подтвердил в ходе ежегодного собрания акционеров глава компании Марк Цукерберг (Mark Zuckerberg), объявив, что руководство техногиганта «определённо обсуждает» выход на новый рынок.

По его словам, почти еженедельно компания сталкивается с запросами со стороны бизнесов относительно возможной доступности API-сервисов для клиентов и вычислительных мощностей в аренду. Пока Meta не предлагает никому со стороны облачные сервисы, хотя капитальные затраты на вычислительные мощности сопоставимы с аналогичными расходами известных облачных провайдеров. Во время последнего финансового отчёта Meta сообщала, что прогнозы по капзатратам на год выросли до $120–135 млрд. Это связано с ожиданиями роста цен на комплектующие в текущем году и, в меньшей мере, дополнительными затратами для поддержки мощностей ЦОД в будущем году. Дополнительно заключено соглашение с Nebius на $27 млрд и с CoreWeave — на $21 млрд. Есть и многомиллиардное соглашение с AWS касательно Arm-процессоров Graviton5.

 Истчоник изображения: ***

Истчоник изображения: Meta

Дополнительно планируется сократить многих сотрудников, высвободив средства для инвестиций в ИИ ЦОД. Ранее компания уже заявила, что намерена уволить 10 % персонала, после чего без работы останутся порядка 8 тыс. человек. Дополнительно компания отказалась от найма 6 тыс. человек, а ещё 7 тыс. будут вынуждены сменить профиль деятельности для участия в новых ИИ-инициативах.

В начале года Meta сформировала подразделение Meta Compute, занимающееся наращиванием мощностей своих дата-центров. По словам Цукерберга, в текущем десятилетии компания намерена построить десятки гигаватт, а в будущем — сотни гигаватт или даже более. Впрочем, по словам Цукерберга, сейчас компания не занимается подготовкой облачных решений, а выход на рынок станет актуальным лишь тогда, когда у Meta появится избыток мощностей — отчасти именно это якобы вселяет в топ-менеджмент уверенность при принятии решений об инвестициях в новые ЦОД.

Постоянный URL: http://servernews.ru/1142572
29.05.2026 [12:29], Сергей Карасёв

QNAP выпустила управляемые L2-коммутаторы QSW-M2130 с поддержкой 10GbE и PoE++

QNAP анонсировала управляемые L2-коммутаторы серии QSW-M2130 для предприятий малого и среднего бизнеса. Устройства, рассчитанные на монтаж в стойку, поддерживают такие функции, как LACP, QoS, VLAN и IGMP Snooping.

Новинки объединяют возможности коммутатора доступа и агрегации в одном устройстве. Они оснащены 24 портами 2.5GbE RJ45 для подключения рабочих станций, NAS и прочего оборудования, а также портами 10GbE для агрегации трафика в основную сеть. При этом модель QSW-M2130-4C2S24T получила четыре комбинированных разъёма 10GbE RJ45/SFP+ и два порта 10GbE SFP+, а модификация QSW-M2130P-2C2S26T — по два разъёма 10GbE SFP+ и 10GbE RJ45, а также два комбинированных порта 10GbE RJ45/SFP+.

Оба коммутатора располагают консольным портом RJ45. Версия QSW-M2130P-2C2S26T поддерживает технологию PoE++ (на 28 портах RJ45) с бюджетом мощности 375 Вт. Это позволяет напрямую подавать питание на такие устройства, как IP-камеры видеонаблюдения формата 4К, беспроводные точки доступа, IP-телефоны и пр.

 Источник изображения: QNAP

Источник изображения: QNAP

Общая неблокируемая пропускная способность новинок составляет 120 Гбит/с, коммутационная способность — 240 Гбит/с. Предусмотрен встроенный блок питания. У базовой версии максимальное энергопотребление заявлено на уровне 70 Вт, а у варианта PoE++ оно достигает 455 Вт. Габариты составляют 44 × 440 × 205 мм, масса — 3,06 и 3,54 кг соответственно. Диапазон рабочих температур простирается от 0 до +50 °C.

Постоянный URL: http://servernews.ru/1142568
29.05.2026 [10:52], Сергей Карасёв

Curator нейтрализовал несколько атак на маркетплейс цифровых товаров YooMarket

На фоне продолжающегося роста интенсивности DDoS-атак и усиливающейся миграции российских интернет-сервисов с зарубежных инфраструктурных решений маркетплейс цифровых товаров YooMarket сообщил об успешной нейтрализации терабитной атаки после перехода с инфраструктуры Cloudflare на защиту отечественного провайдера Curator. Этот кейс стал показательным для отечественного ИБ-рынка, когда тема устойчивости онлайн-платформ вновь оказалась в центре внимания на фоне серии крупных сбоев и роста активности ботнетов.

YooMarket, специализирующийся на продаже игровых предметов, ключей активации и программного обеспечения, перешёл на облачную защиту Curator в 2025 году. Причиной стали проблемы с доступностью платформы для части пользователей, возникавшие при использовании зарубежной инфраструктуры в условиях меняющейся сетевой среды и ограничений.

Как сообщили в компании, миграция была проведена без изменений архитектуры и без влияния на работу платформы. Уже спустя несколько месяцев новая инфраструктура столкнулась с серьёзной проверкой: зимой 2026 года YooMarket подвергся новой атаке.

 Источник изображения: Curator

Источник изображения: Curator

По данным Curator, злоумышленники использовали комбинированный сценарий атаки мощностью свыше 1 Тбит/с. Одновременно применялись UDP и TCP flood на сетевом уровне, а также HTTP flood на уровне приложений с интенсивностью более 500 тыс. запросов в секунду. Ботнет был распределён преимущественно по странам Латинской Америки, около 40% IP-адресов пришлось на Бразилию.

Сетевая часть атаки была нейтрализована практически мгновенно, прикладная — в течение нескольких минут. В течение всего инцидента маркетплейс продолжал работать в штатном режиме.

Всего с начала сотрудничества с Curator инфраструктура YooMarket пережила семь крупных DDoS-атак.

По данным Curator, только за первый квартал текущего года специалисты компании зафиксировали уже четыре атаки мощностью свыше 1 Тбит/с, тогда как годом ранее подобных инцидентов за аналогичный период не наблюдалось вовсе. На фоне роста масштабов атак и усложнения ботнетов устойчивость инфраструктуры становится для e-commerce и цифровых платформ уже не конкурентным преимуществом, а базовым условием непрерывности бизнеса.

Постоянный URL: http://servernews.ru/1142535
29.05.2026 [09:30], Руслан Авдеев

Cisco: агентный ИИ трансформирует структуру интернет-коммуникаций, а через 10 лет на него придётся четверть трафика

Хотя сегодня на пользовательский ИИ-трафик приходится лишь малая доля от общего объёма, распространение агентного ИИ существенно изменит его структуру. В отчёте AI Impact on Wide Area Networks (WAN) компания Cisco прогнозирует, что именно ИИ станет главным драйвером роста сетевого трафика, а потребительский трафик к середине 2030-х гг. вырастет приблизительно в 6,6 раза, сообщает блог IEEE ComSoc.

По оценкам Cisco, ИИ обеспечит около 63 % дополнительного роста трафика, если сравнивать со сценарием без учёта ИИ. Исследование уделяет основное внимание именно WAN-сетям (без ЦОД и кластеров) и даёт рекомендации по проектированию сетей и планированию пропускной способности.

Потребительский ИИ-трафик в основном по-прежнему состоит из коротких текстовых диалогов, но ситуация меняется с переходом к агентному ИИ и мультимодальным взаимодействиям. Пока же, по данным Comcast, 97,1 % ИИ-трафика приходилось на текст, 2,6 % на изображения и 0,3 % на видео. И хотя на инференс приходится лишь «незначительная» доля трафика, Cisco полагает, что к 2035 году на него будет приходиться приблизительно 25 % всего трафика Сети.

 Истчоник изображения: Robin Pierre/unsplash.com

Истчоник изображения: Robin Pierre/unsplash.com

Важно, что инференс-трафик вдвое продолжительнее типичных веб-взаимодействий и к тому же интенсивнее, поскольку генерируется роботом. При выполнении некоторых задач агентами может использоваться до 450 % больше трафика на задачу, чем человеком, а около 9 % инференс-потоков обеспечивают больше исходящего трафика (upstream), чем входящего, тогда как у обычного веб-трафика на upstream приходится всего 0,5 %, и это уже серьёзный сдвиг в поведении Сети, который с ростом использования агентных ИИ будет только расти.

Использование ИИ гораздо чувствительнее к задержкам, чем при большинстве обычных сетевых сценариев, поскольку коммуникация пользователя с ИИ часто идёт в виде разговора в интерактивном режиме, и ожидаются почти мгновенные ответы. По мнению Cisco, даже небольшие задержки становятся критичными для качества сервиса. В то же время растут и объёмы ИИ-трафика, поскольку увеличиваются мультимодальные промпты/загрузки и использование агентов.

 Источник изображения: Cisco

Источник изображения: Cisco

Изменения структуры трафика потребуют и изменений физической инфраструктуры. Оптоволоконные сети уже обеспечивают относительно симметричные потоки данных и низкую задержку, но операторы DOCSIS вынуждены бороться за снижение задержки и выделять больше полос для исходящего трафика в ущерб входящему.

Теперь для ШПД-сетей одной из ключевых задач становится пропускная способность upstream-каналов, задержки и т.п., а не просто общий объём пропускаемых данных. Повышение симметричности upstream- и downstream-каналов, а также возможность обеспечения низкой задержки становится чрезвычайно важным, особенно по мере роста мультимодального и агентного использования ИИ.

Постоянный URL: http://servernews.ru/1142525
28.05.2026 [23:48], Владимир Мироненко

Yandex B2B Tech, Selectel и MetaMentor представили ИИ ПАК по подписке

Yandex B2B Tech совместно с Selectel и MetaMentor представила AIaaS (AI-as-a-Service) ПАК для on-premise развёртывания по подписке платформы Yandex AI Studio. Рещение позволит компаниям быстро развернуть ИИ-проект с размещением инфраструктуры в собственном контуре и соблюдением регуляторных требований и внутренних политик. ПАК включает три компонента: ИИ-платформу Yandex AI Studio, GPU-серверы Selectel и услуги MetaMentor по внедрению, настройке и интеграции решения в ИТ-контур компании.

Как сообщается в пресс-релизе, в новом формате доступны все основные возможности Yandex AI Studio: генеративные модели, инструменты для работы с данными и файлами, файловый поиск и визуальные интерфейсы для создания ИИ-агентов даже без навыков программирования. Также в решение могут быть включены ИИ-инструменты для офисной работы. Selectel предоставляет в аренду GPU-инфраструктуру с размещением на площадке заказчика и обязательством по обслуживанию и обновлению оборудования. В частности, доступны платформы NVIDIA HGX A100/B200/B300, RTX PRO 6000 и др., а также ИИ-сервер собственной разработки Selectel. На подготовку и доставку оборудования клиенту уйдёт до пяти рабочих дней.

 Источник изображения: Selectel

Источник изображения: Selectel

На MetaMentor лежит задача помочь подготовить решение к запуску, включая интеграцию платформы с корпоративными системами заказчика и помощь в создании ИИ-агентов под его задачи. В дальнейшем MetaMentor продолжит системно сопровождать проект, оказывая техническую и клиентскую поддержку по всем вопросам, а также обновляя ПО.

Yandex Cloud, Selectel и MetaMentor выводят новый продукт на рынок on-premises платформенного ПО на базе ИИ, который, по данным совместного исследования Yandex Cloud и AHD, составил в России в 2025 году около 16 млрд руб. Значительная часть компаний уже развёртывает ИИ в локальном контуре, поэтому новое решение может вызвать интерес среди заказчиков.

Постоянный URL: http://servernews.ru/1142556
28.05.2026 [16:41], Руслан Авдеев

SB Energy подаст заявку на IPO в США, а сама SoftBank готовит японское GPU-облако AI Data Center GPU Cloud

Дочерняя структура SoftBank — компания SB Energy планирует подать заявку на IPO в США. Тем временем сама SoftBank. запускает с октября 2026 года облачное решение AI Data Center GPU Cloud, сообщает Datacenter Dynamics.

По данным SB Energy, дочерняя структура намерена подать на IPO на фоне растущего спроса инвесторов на вложения в компании, строящие энергетическую инфраструктуру, особенно для рынка ИИ ЦОД. Компания уже привлекла более $1,8 млрд на строительство инфраструктуры, в том числе от OpenAI.

Изначально SB Energy основали в 2021 году как застройщика солнечных электростанций и аккумуляторных энергохранилищ. Так, в октябре 2024 года она заключила серию «солнечных» контрактов в Техасе для энергоснабжения дата-центров Google в формате PPA (Power Purchase Agreement). Головная SB Energy Global основана в 2015 году и ориентирована на проекты за пределами Японии. Недавно SB Energy диверсифицировала свои энергетические и инфраструктурные предложения, начав предлагать решения на природном газе и поддерживать строительство цифровой инфраструктуры для ЦОД.

Например, в январе она подписала договор о строительстве кампуса Stargate в округе Майлам (Milam County) в Техасе мощностью 1,2 ГВт и управлении им. В марте SoftBank объявила о планах строительства многогигаваттного кампуса ЦОД на федеральной земле в Огайо. В частности, SB Energy должна построить 10 ГВт новых генерирующих мощностей, включая 9,2 ГВт на природном газе. Энергией будет обеспечиваться 10-ГВт ЦОД на площадке Portsmouth Site в округе Пайк (Pike County). Строительство должно начаться до конца 2026 года.

 Источник изображения: Jakub Żerdzicki/unsplash.com

Источник изображения: Jakub Żerdzicki/unsplash.com

Тем временем SoftBank Corp. намерена запустить в Японии облачный проект AI Data Center GPU Cloud в октябре 2026 года. Он станет частью неооблачного бизнеса SoftBank и будет основано на стеке Infrinia AI Cloud OS, бета-версия уже доступна. ИИ-облако будет работать на ИИ-инфраструктуре SoftBank в дата-центрах в Японии, в т.ч. решениях NVIDIA GB200 NVL72, хотя компания не уточняла, какие ЦОД она будет использовать. При этом Infrinia AI Cloud OS обеспечит сервисы Kubernetes-as-a-Service и Inference-as-a-Service.

Сегодня SoftBank управляет ЦОД с помощью дочернего подразделения IDC Frontier. В апреле 2025 года компания начала строительство 1-ГВт кампуса в Томакомай (Tomakomai) на о. Хоккайдо. Также у неё имеются дата-центры в Токийской агломерации, в регионе Тохоку (Tohoku), Кансай (Kansai) и на острове Кюсю. Также компания намерена построить 150-МВт ЦОД на территории недавно закрытого LCD-завода Sharp.

SoftBank представила Infrinia AI Cloud OS в январе 2026 года. Компания утверждает, что ПО максимизирует производительность ИИ-ускорителей, в то же время обеспечивая лёгкое внедрение облачных сервисов. Также SoftBank предлагает в Японии облачный сервис с использованием платформы Oracle Alloy. Получивший название Cloud PF Type A сервис также будет базироваться в дата-центрах SoftBank, с площадками как на востоке, так и на западе Японии. В Японии есть и другая альтернатива американским гиперскейлерам — в 2025 году alt и Highreso запустили в стране собственное GPU-облако.

Постоянный URL: http://servernews.ru/1142511

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;