Лента новостей

01.06.2026 [10:00], Руслан Авдеев

Ampere Computing: экстремальная жара в мире потребует больше энергии, повышения эффективности вычислений и сокращения количества ЦОД

Наступившее лето обещает быть чрезвычайно жарким, похожим на прошлогоднее, когда среднемировая температура достигла исторического максимума. Жара и засухи вынуждают индустрию и власти принимать трудные решения на фоне растущего расширения ЦОД, сообщил директор по продуктам Ampere Computing Джефф Виттич (Jeff Wittich).

Согласно прогнозу AccuWeather на 2026 год, счета за электричество могут взлететь текущим летом из-за вероятной повсеместной жары по всей территории США. По оценкам отвечающей за надёжность электроснабжения в стране North American Electric Reliability Corporation, летний пиковый спрос на энергию вырастет на 224 ГВт за следующие 10 лет. Это более чем на 69 % выше прогноза 2024 года и на 24 % — пикового спроса 2025-го.

В первую очередь ожидаемый рост спроса обусловлен потреблением электричества новыми ЦОД. В 2023 году в США дата-центры потребляли 4,4 % всей электроэнергии, а к 2028 году будут потреблять 12 %. Из-за роста спроса на электричество многим странам пришлось ужесточить правила для снижения нагрузки на энергосистемы и население. Во многом проблема в том, что энергосистемы не справляются с колебаниями энергопотребления в связи с экстремальной погодой. В июле прошлого года сообщалось, что аномальная жара привела к сбоям в лондонских дата-центрах Google и Oracle. Более того, согласно исследованию Rest of World, около 80 % всех дата-центров в мире построены в не особенно подходящих для них климатических условиях.

Так, в 2025 году в США было внесено более 200 законопроектов, направленных на регулирование работы ЦОД, и по меньшей мере в 18 штатах предложены специальные тарифы для крупных потребителей электричества, а в Мэне предпринята пока не увенчавшаяся успехом попытка вовсе запретить строительство новых ЦОД. В некоторых законопроектах от желающих строить ЦОД требуют инвестиций в модернизацию инфраструктуры и обеспечение преимуществ для рядовых потребителей энергии.

 Источник изображения: Ant Rozetsky/unsplash.com

Источник изображения: Ant Rozetsky/unsplash.com

В 2025 году в Амстердаме продлили мораторий на строительство новых ЦОД и расширение в столичном муниципалитете уже действующих. Приоритет отдан жилью, а новые дата-центры появятся не раньше 2030 года. Во Франкфурте на ЦОД приходится до 40 % от всего потребления городской агломерации, что создаёт непосильную нагрузку местной энергосистеме. В некоторых районах введены временные моратории на подключение новых «индустриальных» объектов, строительство новых не ожидают до II квартала 2027 года.

В условиях развития ИИ-проектов дефицит ресурсов будет всё ощутимее. Поддержать этот рост без ущерба окружающей среде можно, повысив эффективность вычислений каждого отдельного ЦОД. Это позволит строить меньше дата-центров для удовлетворения спроса на вычисления или уменьшать их сами по себе, чтобы снизить энергопотребление. Кроме того, потребуется модернизация систем охлаждения. Пока же бум ИИ подталкивает отрасль к экстенсивному развитию, тогда как необходимо максимизировать реальную производительность не только на уровне чипов, но и на остальных уровнях тоже.

Для этого необходимы более энергоэффективные чипы, чем сейчас. Виттич подчёркивает, что мощные ИИ-ускорители на основе GPU стоит использовать только там, где это действительно необходимо. Если для обучения и масштабного инференса без них не обойтись, то для многих других задач они избыточны. Оптимизируя вычисления для каждой задачи, следует использовать энергоёмкую инфраструктуру только там, где это действительно необходимо.

 Источник изображения: Peter Herrmann/unsplash.com

Источник изображения: Peter Herrmann/unsplash.com

Более эффективные системы охлаждения необходимо использовать независимо от снижения энергопотребления. При этом рекомендуется сочетать разные варианты охлаждения. Например, жидкостное всё чаще используется с энергоёмким ИИ-оборудованием. К сожалению для операторов ЦОД, модернизация систем охлаждения требует серьёзного изменения инфраструктуры, а на старых объектах модернизация сложна и дорога или вовсе невозможна. В существующих ЦОД нередко выгоднее использовать маломощные чипы с воздушным охлаждениями, размещая новые компоненты только там, где они действительно нужны.

Фактически это означает переосмысление вычислительных архитектур для получения максимальной производительности на ватт за счёт использования современных чипов. Кроме того, придётся перераспределить рабочие нагрузки и проектировать системы, в которых производительность соответствует требованиям к допустимому тепловыделению и энергосбережению. В конечном итоге, чем больше вычислительных возможностей можно «извлечь» из каждого Вт и м2, тем меньше ЦОД нужно будет строить в будущем. Чем меньше ЦОД придётся строить, тем ниже нагрузка на водные и энергетические ресурсы в конкретных локациях.

По словам представителя Ampere, для удовлетворения растущих энергетических потребностей потребуется не просто расширять инфраструктуру, но и оптимизировать её, начиная с вычислительных мощностей. И хотя Виттич прямо об этом не говорит, Ampere видит себя как раз-таки поставщиком энергоэффективных чипов, в том числе CPU для инференса. Однако на практике компания задержала выпуск AmpereOne M, была продана SoftBank и рискует лишиться одного из крупнейших заказчиков в лице Oracle, которая весьма заинтересована в NVIDIA Vera. Ей же приходится конкурировать с собственными Arm-процессорами AWS, Google, Microsoft и Alibaba, а также теперь уже и с самой Arm, Fujitsu и Qualcomm.

Постоянный URL: https://servernews.ru/1142682
01.06.2026 [10:00], Сергей Карасёв

РТК-ЦОД разворачивает в своих дата-центрах высокоскоростной защищенный Wi-Fi от «Ростелеком»

IT-сервис-провайдер полного цикла РТК-ЦОД приступил к оснащению своих дата-центров защищённой сети Wi-Fi с высокой пропускной способностью. Беспроводной доступ уже появился на флагманской московской площадке «Медведково-2», которая входит в реестр ЦОД Минцифры России.

Организация Wi-Fi в дата-центрах РТК-ЦОД позволит их сотрудникам и клиентам решать рабочие задачи в режиме реального времени из любой точки на территории объектов. При этом предусмотрено наличие двух беспроводных сетей — защищённой служебной и открытой гостевой. Первая ориентирована на работников и заказчиков, тогда как вторая будет доступна всем посетителям. При этом сеть не предназначена для передачи данных клиентских сервисов.

 Источник изображения: unsplash.com / Dreamlike Street

Источник изображения: unsplash.com / Dreamlike Street

В качестве аппаратной основы используется российское оборудование компании «Элтекс». Программная составляющая включает облачную платформу собственной разработки «Ростелекома», которая входит в реестр отечественного программного обеспечения. Она в числе прочего обеспечивает работу системы авторизации с полным соблюдением современных стандартов информационной безопасности. Все компоненты Wi-Fi-платформы развёрнуты во внутреннем контуре «Ростелекома» на инфраструктуре «Турбо Облака» — B2B-облачного провайдера, входящего в ГК РТК-ЦОД. Подчёркивается, что беспроводная сеть базируется исключительно на отечественных решениях.

«Запущенная сеть Wi-Fi обеспечивает простую авторизацию и высокую скорость — общая пропускная способность каналов связи до объектов составляет 1,71 Гбит/с. Это высокопроизводительный защищённый Wi-Fi от "Ростелекома", построенный на полностью импортозамещенной платформе», — говорит Алексей Суравикин, директор продуктового офиса «Перспективные продукты» РТК-ЦОД.

На текущий момент в «Медведково-2» смонтированы более 200 точек доступа Wi-Fi. До конца нынешнего года в других дата-центрах РТК-ЦОД по всей стране будут установлены свыше 1500 точек. При этом планируется расширение перечня услуг, оказываемых на базе беспроводной сети.

«Оснащение дата-центров РТК-ЦОД защищёнными беспроводными сетями на базе импортозамещенной платформы "Ростелекома" — это пример синергии компетенций внутри группы. Наше решение позволяет гибко управлять сервисом и оперативно внедрять новые функции, а клиентам РТК-ЦОД предоставляет доступ к высокоскоростному безопасному Wi-Fi с простой авторизацией», — заявил Григорий Южаков, директор продуктового офиса Wi-Fi ПАО «Ростелеком».

Постоянный URL: https://servernews.ru/1142613
01.06.2026 [08:41], Руслан Авдеев

Наш SQL: фанаты MySQL основали фонд OurSQL Foundation, чтобы давить на Oracle

Сообщество, выступающее от имени пользователей и разработчиков СУБД MySQL, основало фонд с говорящим названием OurSQL Foundation. Он призван помочь выступить единым фронтом против Oracle, владеющей интеллектуальной собственностью, связанной с MySQL и open source, сообщает The Register.

Новая НКО намерена помочь сообществу разработчиков и пользователей MySQL получать доступ к знаниям и обеспечить прозрачную обратную связь по будущим разработкам. Организация поддержит использование MySQL как СУБД с откытым исходным кодом и рассчитывает сотрудничать со всеми участниками рынка, включая Oracle, чтобы обеспечить успех ПО на рынке. Меры вызваны опасениями того, что СУБД теряет популярность и рыночную долю в сравнении с конкурентом — PostgreSQL. Кроме того, MariaDB от автора MySQL также пользуется популярностью.

 Источник изображения: Rod Long/unsplash.com

Источник изображения: Rod Long/unsplash.com

В открытом письме энтузиасты отметили, что после перехода MySQL под контроль Oracle после покупки Sun Microsystems в 2009 году разработка ведётся без необходимой прозрачности, доработки осуществляются «за закрытыми дверями», а информация о планах развития ПО и процессе принятия решений ограничена. В марте Oracle предложила новый подход к привлечению разработчиков и обещала добавить функции, обеспечивающие векторный поиск, объявив, что MySQL имеет приоритетное значение для компании.

По словам представителя Percona — одной из компаний, стоящих за OurSQL Foundation, речь не идёт о попытке противостоять Oracle. В состав совета директоров также вошли представители PlanetScale, PingCAP, VillageSQL и Alibaba. Кроме того, в совет входит и независимый эксперт — Жан-Франсуа Ганье (Jean-François Gagné).

Постоянный URL: https://servernews.ru/1142679
31.05.2026 [11:43], Сергей Карасёв

AAEON выпустила mini-ITX-плату MIX-PTLWV1 на базе Intel Panther Lake с поддержкой четырёх 4K-дисплеев

Компания AAEON анонсировала индустриальную плату MIX-PTLWV1 в форм-факторе mini-ITX. В качестве аппаратной платформы применяется процессор Intel Core Ultra Series 3 семейства Panther Lake с графикой Intel Xe LPG, а для программной части заявлена совместимость с Windows 11 и Ubuntu 24.04.

Решение имеет размеры 170 × 170 мм. Доступны два слота C/SO-DIMM для модулей оперативной памяти DDR5-6400/7200 суммарным объёмом до 128 Гбайт. Предусмотрены коннектор M.2 2280 M-Key для SSD с интерфейсом PCIe 4.0 x4 (NVMe), разъём M.2 2230 E-Key (PCIe 4.0 x1/USB 2.0/CNVi) для комбинированного адаптера Wi/Fi/Bluetooth и слот M.2 3042/3052 B-Key (PCIe x1/USB 3.0; nano-SIM) для модема 4G/5G.

Допускается вывод изображения одновременно на четыре независимых дисплея 4К (4096 × 2160; 60 Гц) через интерфейсы DisplayPort 1.4. Есть четыре порта USB 3.0 Type-A и 20-контактная колодка с возможностью использования ещё двух портов USB 3.0. Кроме того, могут быть задействованы до шести последовательных портов (1 × RS-232/422/485 и 5 × RS-232). Присутствуют звуковой кодек Realtek ALC897 HD с 3,5-мм аудиогнездом, слот PCIe 5.0 x8, а также чип Infineon SLB9672 TPM 2.0 и контроллер ввода/вывода Nuvoton NCT6126D.

 Источник изображения: AAEON

Источник изображения: AAEON

Новинка располагает двумя сетевыми портами 2.5GbE RJ45 на основе контроллеров Intel I226-V и Intel I226-LM. Модификация MIX-PTLWV1-A10-4L также получила два порта 10GbE на базе Intel E610-XAT2. Питание (12–24 В) подаётся через 4-контактный коннектор. Диапазон рабочих температур простирается от 0 до +60 °C. Упомянут 4-контактный разъём для вентилятора охлаждения.

Постоянный URL: https://servernews.ru/1142674
31.05.2026 [11:41], Сергей Карасёв

AMD выпустила адаптивные SoC серии Versal Prime Gen 2

Компания AMD анонсировала новые адаптивные SoC семейства Versal Prime Gen 2: 2VM3454, 2VM3254 и 2VM3104. Они ориентированы на профессиональное аудиовизуальное оборудование, системы вещания и устройства для промышленного интернета вещей (IIoT).

В состав решений входят четыре вычислительных ядра Arm Cortex-A78AE с 64 Кбайт кеша L1 (ECC) и 512 Кбайт кеша L2, тогда как суммарный кеш L3 составляет 2 Мбайт. Кроме того, имеется процессор реального времени с шестью ядами Arm Cortex-R52. Предусмотрен одноядерный графический ускоритель Arm Mali-G78AE. Версии 2VM3254 и 2VM3454 также получили VCU-блок с поддержкой HEVC и AVC (вплоть до 4K60). Объём встроенной памяти — 1 Мбайт (ECC).

 Источник изображения: AMD

Источник изображения: AMD

Программируемая часть 2VM3104 включает 225 400 логических ячеек и 103 040 LUT, а количество движков DSP составляет 420. У версии 2VM3254 эти значения равны соответственно 302 680, 138 368 и 564, у модификации 2VM3454 — 564 760, 258 176 и 1140. Количество трансиверов GTYP — 4, 8 и 16. Может использоваться оперативная память DDR5-6400 и LPDDR5X-8533 с максимальной пропускной способностью 102 Гбайт/с. Общий размер памяти программируемой логики (PL Memory) — до 45,4 Мбит. Реализована поддержка флеш-накопителей UFS 3.1, интерфейсов DisplayPort 1.4, USB 3.2 и USB 2.0, а также 1GbE, 10GbE и 100GbE (1 × 2VM3104/2VM3254 и 2 × 2VM3454). У двух старших версий также имеется контроллер PCIe 5.0 x4. Модель 2VM3454 располагает высокопроизводительным криптомодулем.

Изделия 2VM3104 и 2VM3254 имеют размеры 23 × 23 мм, вариант 2VM3454 — 29 × 29 мм. Разработчики смогут использовать пакет AMD Vivado Design Suite для проектирования аппаратного обеспечения и платформу AMD Vitis для создания софта. Поставки 2VM3454 начнутся позднее в текущем году, а чипы 2VM3254 и 2VM3104 появятся в 2027-м.

Постоянный URL: https://servernews.ru/1142672
31.05.2026 [00:34], Владимир Мироненко

Snowflake потратит $6 млрд на чипы AWS, в том числе на Arm-процессоры Graviton

Компания Snowflake, специализирующаяся на облачных решениях для обработки данных с использованием ИИ, объявила о заключении пятилетнего соглашения о стратегическом сотрудничестве (SCA) с AWS, в рамках которого обязалась потратить $6 млрд на многолетние инфраструктурные проекты, включая использование серверных Arm-процессоров Amazon Graviton, а также ИИ-ускорителей. Компании не раскрывают, о каком поколении Graviton идёт речь, сообщает The Next Web.

Для оценки, насколько крупной является сделка для компаний, ненамного больше — около $7 млрд — Snowflake получила выручки от своих сервисов через AWS Marketplace с момента основания компании в 2012 году. В 2020 году Snowflake объявила о пятилетнем облачном контракте с AWS на сумму $1,2 млрд, который впоследствии был увеличен до $2,5 млрд в 2023 году. Эта эволюция иллюстрирует растущую важность облачной инфраструктуры в развитии ИИ. Только в 2025 году расходы Snowflake на услуги AWS составили $2 млрд.

За последние несколько лет Snowflake перевела большую часть вычислительных ресурсов с процессоров Intel и AMD на инстансы на базе Graviton, отметил The Register. Согласно соглашению, Snowflake будет запускать и обучать свои модели и сервисы генеративного ИИ, используя комбинацию ускорителей, работающих в AWS, и Graviton.

 Источник изображения: AWS

Источник изображения: AWS

Сделка также отражает собственный рост Snowflake: в среду компания опубликовала финансовые результаты за I квартал 2027 финансового года, закончившийся 30 апреля, которые значительно превзошли прогнозы Уолл-стрит. Компания сообщила о скорректированной прибыли в 39 центов на акцию при выручке в $1,39 млрд (+33 % г/г). Аналитики, опрошенные LSEG, прогнозировали 32 цента на акцию прибыли и выручку в $1,32 млрд (по данным CNBC). Прогноз компании на текущий квартал также был оптимистичным. Snowflake прогнозирует во II финансовом квартале скорректированную операционную маржу на уровне 12,5 % при выручке в размере от $1,415 до $1,420 млрд. Прогноз аналитиков, опрошенных StreetAccount, по операционной марже составляет 11,9 %, по выручке от продажи продуктов — $1,37 млрд. После объявления о финансовых результатах и сделке с AWS акции Snowflake подскочили примерно на 38 %.

Обязательство Snowflake запускать свои облачные рабочие нагрузки на Graviton в масштабе является важным подтверждением жизнеспособности концепции Arm-серверов, которая незаметно меняет экономику облачной инфраструктуры уже пять лет, отметил The Next Web. Сделка подчёркивает растущую роль Arm-процессоров в ЦОД. IDC считает, что инвестиции Snowflake в AWS отражают то, как быстро корпоративные рабочие нагрузки ИИ адаптируются к потребностям долгосрочной инфраструктуры, пишет Data Center Knowledge. В ISG отмечают, что соглашение указывает на более широкий переход от экспериментальных развертываний ИИ к более долгосрочному спросу на инфраструктуру.

 Источник изображения: AWS

Источник изображения: AWS

Соглашение предоставляет Snowflake доступ к чипам AWS Graviton в то время, когда вычислительные мощности для ИИ ограничены, отметил ресурс GuruFocus. Оно также приближает инструменты Snowflake для хранения данных, аналитики и ИИ к AWS, где многие из её клиентов уже запускают свои рабочие нагрузки. Это важно для Snowflake, поскольку инвесторы опасались, что ИИ может навредить бизнесу традиционных компаний-разработчикой ПО, а не помочь им. Это обновление изменило ситуацию на Уолл-стрит. Snowflake заявила, что растёт спрос на такие инструменты, как Cortex Code и Snowpark, которые помогают компаниям создавать приложения ИИ и модели машинного обучения, используя собственные данные. Например, предлагаемая уже несколько лет Snowflake платформа Cortex AI может преобразовывать естественный язык в SQL-запросы, обобщать данные и проводить анализ настроений.

Что касается AWS, то сделка с Snowflake продолжила серию крупных инвестиций в ИИ-инфраструктуру. Anthropic взяла на себя крупные многолетние обязательства перед AWS; OpenAI в начале этого года подписала значимое соглашение с AWS, несмотря на продолжающееся сотрудничество с её конкурентом Microsoft Azure. В прошлом месяце AWS заключила соглашение с Meta о поставке миллионов чипов Graviton для удовлетворения растущих потребностей компании в вычислительных мощностях для ИИ. Это стало большой победой для AWS, поскольку несколькими месяцами ранее Meta заключила сделку с Google Cloud на $10 млрд.

Постоянный URL: https://servernews.ru/1142663
30.05.2026 [14:25], Сергей Карасёв

Lightmatter представила лазерную сетевую карту Guide DR для CPO-платформ

Компания Lightmatter, специализирующаяся на фотонных вычислениях и интерконнекте, анонсировала сетевую карту Guide DR на основе лазера (Laser Network Interface Card, LNIC), предназначенную для масштабирования инфраструктур нового поколения с технологией CPO (Co-Packaged Optics — интегрированная оптика).

Новинка спроектирована специально для организации оптического интерконнекта с высокой пропускной способностью, в том числе на базе собственного решения Lightmatter Passage L200. Карта ориентирована прежде всего на дата-центры, поддерживающие ресурсоёмкие приложения ИИ с интенсивным обменом данными.

Guide DR соответствует стандарту OCP NIC 3.0. Разработчик утверждает, что это изделие обеспечивает повышение плотности оптической мощности в четыре раза по сравнению с обычными модулями малого форм-фактора ELSFP (External Laser Small Form Factor Pluggable). Совокупная пропускная способность CPO или NPO достигает 51,2 Тбит/с.

 Источник изображения: Lightmatter

Источник изображения: Lightmatter

Для новинки предусмотрено применение жидкостного охлаждения. При этом четыре карты Guide DR могут быть объединены в одном коммутационном блоке типоразмера 1U, что обеспечит суммарную скорость передачи данных до 204,8 Тбит/с. В целом, как отмечается, Guide DR позволяет решить проблему недостаточной масштабируемости оптики путём переноса источника света с внешней части коммутационного оборудования внутрь корпуса. Среди преимуществ предложенного решения названы модульная конструкция, высокая надёжность и производительность. Пробные поставки Guide DR LNIC компания Lightmatter планирует организовать в IV квартале нынешнего года.

Постоянный URL: https://servernews.ru/1142644
30.05.2026 [14:18], Сергей Карасёв

Microchip представила RoT-контроллеры для постквантовой криптографии

Компания Microchip Technology анонсировала новые решения Trust Shield для устройств с поддержкой постквантовой криптографии. В частности, дебютировали контроллеры TS1800, TS500 и TS501, которые доступны в составе предварительно сконфигурированной платформы TrustFLEX, что помогает ускорить вывод конечных продуктов на рынок.

Изделие TS1800 — это внешний контроллер Root of Trust (RoT), отвечающий за безопасную загрузку устройства, безопасные обновления прошивки, аттестацию и обработку сертификатов с использованием аппаратного ускорения алгоритмов постквантовой криптографии. Говорится о поддержке таких решений Национального института стандартов и технологий США (NIST), как ML-DSA (Module Lattice‑Based Digital Signature Algorithm), LMS (Leighton–Micali Signature) и ML-KEM (Module Lattice-Based Key Encapsulation Mechanism).

В основу контроллера TS1800 положено ядро Arm Cortex-M4F, функционирующее на тактовой частоте до 192 МГц. Достигается двукратный прирост производительности по сравнению с RoT-контроллерами Microchip предыдущего поколения. Кроме того, улучшена энергетическая эффективность. Реализована поддержка интерфейса USB 2.0 и расширенных функций безопасности, предусмотренных стандартами OCP.

 Источник изображения: Microchip Technology

Источник изображения: Microchip Technology

В свою очередь, изделия TS50x предназначены для обеспечения безопасной загрузки. Они ориентированы на оборудование, которому не требуется полный набор функций RoT, доступный в микросхеме TS1800. При этом в дополнение к алгоритмам постквантовой криптографии поддерживаются традиционные инструменты, в частности, Elliptic Curve Cryptography (ECC) P-384. Поставки контроллеров TS1800 и TS50x уже начались.

Постоянный URL: https://servernews.ru/1142647
29.05.2026 [21:36], Владимир Мироненко

FuriosaAI и Broadcom создадут ИИ-ускоритель для платформы инференса для агентной эры

Южнокорейский стартап FuriosaAI объявил о заключении соглашения о стратегическом партнёрстве с Broadcom для разработки тензорного (TCP) ИИ-ускорителя третьего поколения в качестве основы масштабируемой платформы инференса, предназначенной для обслуживания передовых агентных систем гиперскейлеров.

Стартап намерен объединить передовые возможности Broadcom по упаковке, позволяющие интегрировать несколько кремниевых кристаллов в ИИ-ускоритель, и её достижения в масштабируемых сетевых решениях для ИИ со своей ИИ-архитектурой и программным стеком для создания платформы инференса в масштабе стойки

По словам FuriosaAI, в результате сотрудничества с Broadcom архитектура процессора Tensor Contraction Processor (TCP) «превратится в многокристальную систему», которая лучше подходит для «высокопроизводительных требований к токенам» рабочих нагрузок инференса и агентного ИИ, пишет DataCenter Dynamics.

FuriosaAI отметила, что эта архитектура сделает чипы более подходящими для «реальных рабочих ИИ-нагрузок» и что, сосредоточившись на высокоскоростной передаче данных, а не на управлении потоками вычислений, ускорители обеспечат более высокую производительность на ватт и большую «плотность» токенов, чем «передовые GPU».

 Источник изображения: FuriosaAI

Источник изображения: FuriosaAI

Сообщается, что чип третьего поколения FuriosaAI будет включать вычислительный 2-нм кристалл, выделенный IO-кристалл SUE-интерконнекта и двуслойную память HBM4/4E. Благодаря интеграции Scale-Up Ethernet (SUE) и PCIe-решений Broadcom, система будет обеспечивать низкую задержку и высокую пропускную способность интерконнекта All-to-All между сотнями чипов в масштабе стойки. Существующие системы могут объединять не более восьми ИИ-ускорителей RNGD.

Как отметил президент группы полупроводниковых решений Broadcom, производительность инференса больше не определяется исключительно вычислительными ресурсами. Она всё больше зависит от повторного использования данных и эффективности обмена данными между серверами и стойками: «Сочетая архитектуру TCP FuriosaAI с ведущей на рынке технологией XPU и IP-платформой Broadcom, масштабируемым Ethernet и коммутаторами сетевых фабрик, мы создаём платформу, которая решает ключевые проблемы крупномасштабного агентного ИИ», — заявил он.

«Объединение инфраструктурных возможностей Broadcom и архитектуры Tensor Contraction Processor от FuriosaAI, а также её определяющего отрасль программного стека, позволяет нам выйти за рамки уровня чипа и предложить комплексное решение для эпохи фабрик токенов», — отметил соучредитель и генеральный директор FuriosaAI.

 Источник изображения: Broadcom

Источник изображения: Broadcom

Хотя вычислительная мощность по-прежнему важна для рабочих ИИ-нагрузок, особенно на этапе предварительного заполнения, FuriosaAI сосредоточилась на перемещении данных между HBM и DRAM. «TCP ориентирован на высокоскоростную передачу данных и масштабные тензорные операции, а не на управление тысячами крошечных потоков. Он рассматривает доступ к памяти как первостепенную задачу, устраняя “обрыв” эффективности, с которым сталкиваются GPU, когда модели выходят за рамки жёстких иерархий кеша»,сообщается в блоге компании.

Аппаратное обеспечение FuriosaAI поддерживается программным стеком, который позволяет разработчикам быстро развёртывать приложения, а также легко переключаться на новые модели и новые методы оптимизации. В то время как устаревшие платформы требуют обширной ручной настройки ядер для каждой новой модели, SDK FuriosaAI использует универсальный компилятор, который автоматически сопоставляет высокоуровневый код PyTorch с полупроводниковой архитектурой. Для разработчиков, которым требуется более детальный контроль, виртуальная архитектура набора команд FuriosaAI предлагает декларативную модель программирования, которая обеспечивает управление оборудованием без недетерминированной сложности традиционного программирования для GPU, отметила компания.

Ранее сообщалось, что Broadcom продлила сотрудничество с Meta для разработки нескольких поколений кастомных ИИ-чипов. Также она расширила контракт с Google по снабжению её новыми поколениями ИИ-чипов. Создаёт Broadcom специализированные чипы и для OpenAI. Всего у компании в разработке порядка десяти кастомных ASIC.

Постоянный URL: https://servernews.ru/1142619
29.05.2026 [20:30], Руслан Авдеев

Gartner: большинство кастомных ИИ-моделей и проектов генеративного ИИ ожидает провал

По мнению Gartner, не менее половины всех проектов в сфере генеративного ИИ и создателей большинства ИИ-моделей ожидает неудача. Расходы на проекты будут выше планируемого из-за неудачных архитектурных решений и недостатка ноу-хау, а разработчики собственных моделей столкнутся с высокими затратами и другими сложностями, сообщает The Register.

В докладе «Цикл хайпа вокруг генеративного ИИ» (Hype Cycle for Generative AI), в котором эксперты рассмотрели 30 ИИ-технологий, сообщается, что ни одна из них не достигла т.н. «плато производительности». На этом этапе продукты и технологии уже пережили два или три этапа эволюции, стабильны и приносят ощутимые выгоды. До достижения этого плато ИИ-технологии в своём развитии поднимаются до «Пика завышенных ожиданий» (Peak of Inflated Expectations), после чего следует спад в «Долину разочарований» (Trough of Disillusionment) и медленный подъём по «Склону просветления» (Slope of Enlightenment).

По мнению Gartner, в областях вроде здравоохранения, финансов, юриспруденции и др. будут обеспечивать лучшие результаты модели, специально созданные «с нуля» под конкретную тематику, либо специально доработанные — в сравнении с универсальными моделями «общего назначения». Впрочем, подчёркивается, что создание специальных моделей требует значительных вычислительных ресурсов, специальных знаний и постоянного обслуживания. На достижение достаточной зрелости для массового применения таким моделям потребуется минимум 2–5 лет.

 Источник изображения: Gartner

Источник изображения: Gartner

Безусловный успех, по мнению Gartner, ожидает лишь ИИ-приложения вроде помощников в подготовке программного кода, создании графики и видео, а также обобщения контента. Впрочем, из-за проблем с интеллектуальной собственностью и склонностью ИИ к ошибкам, нишу ожидают некоторые проблемы. Тем не менее, Gartner уверена, что такие приложени довольно зрелые и они уже освоили более половины целевого рынка. Наименее зрелыми называются протоколы связи ИИ-агентов друг с другом и окружающей средой. Впрочем, этот сегмент довольно быстро развивается и даже уже имеется пара фаворитов.

Наибольший потенциал по мнению экспертов имеют технологии защиты от дезинформации (Disinformation Security) и «Модели мира» (World Models). Технологии Disinformation Security помогают распознавать дипфейки, случаи кражи личности и создание другого фейкового контента, направленного на дискредитацию людей и организаций, а также на создание контента для кибератак и совершения других преступлений. По оценкам Gartner, до достижения зрелости этим технологиям ещё 5–10 лет.

Модели мира позволяют ИИ выполнять сложные задачи прогнозирования и планирования, имитируя и понимая динамику окружающей среды. Это позволяет принимать обоснованные решения даже в условиях недостатка информации и непредвиденных обстоятельств. Такие инструменты также полезны для навигации робототехники в человеческом мире или создания видеоконтента с реалистичным отображением физики.

Также Gartner считает, что организации, намеренные создавать ИИ-системы на основе открытых моделей, не получат доступ к самым передовым технологиям… если не готовы применять китайские разработки. Утверждается, что коммерциализация открытых LLM оказалась весьма сложной для их разработчиков. Многие западные технологические компании избирательно делают модели открытыми, благодаря чему все инновации в данной сфере пока сосредоточены в КНР, хотя развитие идёт и за пределами Китая.

Постоянный URL: https://servernews.ru/1142596

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;