Материалы по тегу: ии
|
02.06.2026 [01:04], Владимир Мироненко
ИИ-ускоритель Intel Crescent Island получит до 480 Гбайт LPDDR5XIntel сообщила новые подробности о своём будущем ИИ-ускорителе для ЦОД с кодовым именем Crescent Island, который был анонсирован в прошлом году. Новый GPU основан на архитектуре Xe3P, представляющей усовершенствованную версию Xe3, которая используется в процессорах Core Ultra 300 семейства Panther Lake. Ожидается, что Xe3P также будет использоваться в GPU Intel серии Arc-C для клиентских устройств. Компания отметила, что чип разработан специально для рабочих нагрузок агентного ИИ. В то время как традиционные ИИ-ускорители от NVIDIA и AMD полагаются на дорогую память HBM, в новом чипе Intel используется LPDDR5X, и он предназначен для работы в серверах с воздушным охлаждением, а не с жидкостным. Crescent Island будет поддерживать до 480 Гбайт памяти LPDDR5X, хотя базовая эталонная конфигурация рассчитана на 160 Гбайт. Intel заявила, что Crescent Island оптимизирован по производительности на Вт — до TDP 350 Вт в версии с воздушным охлаждением и интерфейсом PCIe. Сообщается, что GPU будет поддерживать широкий спектр форматов данных от FP4 до FP64, а также полностью открытый программный стек oneAPI, что идеально подходит для поставщиков услуг «токены как услуга» и сценариев использования для инференса. Intel уже оценивает свой открытый унифицированный программный стек для гетерогенных систем ИИ с помощью существующей линейки Arc Pro B-серии, поэтому будущие версии чипов получат доступ к этим оптимизациям на ранних этапах. Intel планирует начать тестирование GPU Crescent Island для клиентов во II половине 2026 года с общей доступностью в 2027 году.
01.06.2026 [16:41], Руслан Авдеев
SoftBank намерена вложить €75 млрд в 5 ГВт ИИ ЦОД и совместное производство с Schneider Electric во ФранцииЯпонская SoftBank Group обнародовала планы строительства и эксплуатации во Франции ИИ ЦОД совокупной мощностью 5 ГВт. Это одна из крупнейших из объявленных инвестиций в европейскую ИИ-инфраструктуру на сегодня. Проект предполагает инвестиции в объёме €75 млрд ($81 млрд), сообщает Converge Digest. На первом этапе планируется потратить €45 млрд ($48,6 млрд) на постройку в О-де-Франс (Hauts-de-France) 3,1 ГВт мощностей ЦОД. Новый проект подчёркивает стремление Франции стать стратегически важным европейским хабом в сфере ИИ, цифровой инфраструктуры и промышленного производства. Первоначально будут развёрнуты площадки в Дюнкерке (Dunkirk, район Лун-Плаж), Боскеле (Bosquel) и Бушене (Bouchain). Полное завершение проекта запланировано на 2031 год. По данным SoftBank, проект должен будет способствовать локализации цепочек поставок для ИИ ЦОД в Европе, а то же время ускорятся циклы развёртывания ИИ-объектов следующего поколения. По словам SoftBank, инфраструктура будет соответствовать потребностям ИИ-разработчиков, облачных гиперскейлеров, исследовательских институтов, организаций государственного сектора — всем кому необходимы масштабные вычисления. В рамках проекта будут использоваться преимущества Франции — доступ к низкоуглеродному электричеству АЭС, землям промышленного назначения, а также близость к ключевым европейским экономическим маршрутам, связывающим Париж, Брюссель, Амстердам, Лондон и Франкфурт.
Источник изображения: Pascal Bernardon/unsplash.com В основе стратегии SoftBank лежит промышленное взаимодействие со Schneider Electric для создания крупного производственного кластера в порту Дюнкерка. Там разместится предприятие SoftBank для выпуска готовых модулей для ЦОД, а Schneider Electric займётся интеграцией сборных силовых модулей для ИИ-инфраструктуры. Отдельно SoftBank совместно с французской Sesterce, специализирующейся на ИИ-инфраструктуре, подтвердили планы создания кампуса ИИ ЦОД мощностью 1 ГВт в Боскеле в рамках «расширенного проекта» на 5 ГВт. Для Европы проект может стать очередным шагом по обеспечению цифрового суверенитета, причём Франция нередко позиционирует себя как оптимальное место для строительства ИИ-инфраструктуры благодаря наличию развитой атомной энергетики, зон промышленной реконструкции и поддержке стратегически важных вычислительных мощностей со стороны государства. Благодаря взаимодействию со Schneider Electric, SoftBank расширяет инвестиции за пределы вычислительных мощностей, включаясь и в физическую цепочку поставок, лежащую в основе ИИ-инфраструктуры. Пока неизвестно, хватит ли у SoftBank средств на вложение €75 млрд в Европе наряду с гигантскими инвестициями в США, в т.ч. в OpenAI. Эксперты полагают, что собственных средств у компании недостаточно. Её чистая прибыль значительно выросла в последние годы, но сама компания обычно располагает всего около $30 млрд ликвидных денежных средств. Почти наверняка её придётся создать новый фонд для их сбора или привлекать заёмные деньги и партнёров. Впрочем, компания и не думает останавливаться в своей экспансии на рынке ИИ. На днях сообщалось о вероятном выходе дочерней структуры — SB Energy на IPO в США, а сама SoftBank готовит японское GPU-облако AI Data Center GPU Cloud. Кроме того, недавно сообщалось, что в США при участии SoftBank намерены построить 10-ГВт кампус ЦОД.
01.06.2026 [16:04], Руслан Авдеев
США принимают меры, чтобы заблокировать поставки ИИ-чипов NVIDIA китайским компаниямМинистерство торговли США в воскресенье приняло меры, чтобы закрыть потенциальную лазейку, потенциально позволяющую экспортировать компаниям передовые чипы NVIDIA подразделениям китайских техногигантов, находящимся за пределами КНР, сообщает Reuters. Предполагается, что лучшие американские чипы поступали филиалам китайских компаний, расположенным в странах вроде Малайзии, Индонезии и даже Японии. Новое руководство опубликовали на сайте Министерства торговли, после того как, по данным источников, в Вашингтоне появился документ, посвящённый данной лазейке. В документе, пока не имеющем авторства, сообщается, что «шлюзы незаметно открылись». Другими словами, постепенно снизилась эффективность ограничений. Пока нет данных, как много чипов экспортировали в год, когда, как пишет Reuters, «администрация Трампа оставила дверь открытой» Один из осведомлённых отраслевых источников сообщил, что речь идёт о сотнях тысяч ускорителей. В руководстве Бюро промышленности и безопасности (BIS) сообщило, что обеспечит обязательное лицензирование для структур со штаб-квартирами в Китае, даже если их подразделения расположены за его пределами. Фактически, как сообщает бюро, руководство разъясняет требования к лицензированию, действующие с 2023 года. Представитель NVIDIA заявил, что новое руководство ничего не изменит для компании, добавив, что не может поставлять чипы, поскольку Министерство торговли недвусмысленно установило в своём документе лицензионные ограничения для компании. Фактически Министерство торговли само создало лазейку, когда объявило в мае 2025 года, что не будет соблюдать правило AI Diffusion Rule, принятое в последние дни прошлой администрации США — оно фактически делило мир на страны, которым можно продавать ИИ-ускорители без ограничений и те, которым можно, но с оговорками или вовсе нельзя. По словам экспертов, оставленная лазейка позволяла зарубежным подразделениям китайских компаний покупать чипы NVIDIA Blackwell безо всяких лицензий. В результате китайские компании покупают эти чипы и, похоже, в больших масштабах. Эксперты уверены, что новое руководство закроет лазейку, но останется другая. В частности, к TSMC и другим контрактным производителям отсутствуют требования проверять, что заказываемые у них передовые ИИ-чипы не предназначены для подставных структур, работающих на китайских покупателей. Сообщается, что в новом руководстве этот недочёт по-прежнему не устранен. Кроме того, если чипы уже установлены, новый документ не требует от операторов ЦОД прекратить использование таких чипов или остановить обслуживание передового оборудования вроде серверов. Ранее сообщалось, что Китай довольно активно прибегает к контрабанде ИИ-ускорителей, а также пользуется услугами компаний за рубежом, чтобы обойти американские санкции. Кроме того, страна наращивает производство собственных ускорителей и достигла соглашения с США о поставках относительно устаревших NVIDIA H200.
01.06.2026 [12:35], Сергей Карасёв
Двухтонный ИИ: Dell начала поставки первых стоек NVIDIA Vera Rubin NVL72Компания Dell Technologies поставила свою первую стойку NVIDIA Vera Rubin NVL72. Получателем системы стала компания CoreWeave — неоооблачный провайдер, который активно расширяет инфраструктуру для ресурсоёмких нагрузок ИИ. Стойка содержит 72 ускорителя Rubin и 36 процессоров Vera на архитектуре Arm. Суммарный объём памяти HBM4 составляет 20,7 Тбайт, системной памяти LPDDR5X — 54 Тбайт. Реализовано жидкостное охлаждение горячей водой (+45 °C). Сама стойка в собранном виде весит около 1,8 т и потребляет до 230 кВт. Заявленная ИИ-производительность достигает 3,6 Эфлопс в режиме NVFP4 при инференсе, что примерно в пять раз превышает показатель Blackwell. На задачах обучения быстродействие NVFP4 составляет 2,5 Эфлопс. Отмечается, что Dell успешно провела все необходимые диагностические тесты Vera Rubin NVL72, по результатам которых система готова к дальнейшему развёртыванию на площадке заказчика. CoreWeave намерена использовать новый кластер для расширения своей инфраструктуры НРС. Масштабный вывод платформы на рынок намечен на II половину текущего года. Между тем сама NVIDIA объявила о начале массового производства решений поколения Vera Rubin. В числе партнёров, объявивших о поддержке этих систем, названы Dell Technologies, HPE, Lenovo и Supermicro, а также AIC, Aivres, ASRock Rack, ASUS, Cloudian, Compal, DDN, Everpure, Foxconn, GIGABYTE, Hitachi Vantara, Hyve Solutions, IBM, Inventec, MinIO, MiTAC Computing, MSI, NetApp, Nutanix, Pegatron, Quanta Cloud Technology (QCT), VAST Data, WEKA, Wistron и Wiwynn. Вместе с тем CoreWeave, а также Lambda и Oracle Cloud Infrastructure одними из первых начнут развёртывание стоек Vera Rubin в своих ИИ-инфраструктурах.
01.06.2026 [12:20], Сергей Карасёв
Hyperion Research: объём мирового рынка НРС в 2025 году превысил $70 млрд, но темп роста замедлилсяПо оценкам компании Hyperion Research, глобальные расходы в области ИИ и НРС в 2025 году превысили $70 млрд, что примерно на $10 млрд больше по сравнению с предыдущим годом. Однако темпы роста замедлились до 16,9 % против 23,5 % в 2024-м, когда этот показатель оказался самым высоким за последние три десятилетия. Аналитики учитывают затраты на серверы, хранилища данных, программное обеспечение, услуги и облачные ресурсы, связанные с ИИ и НРС. В частности, в 2025 году на локальные серверы были потрачены $29,4 млрд, что на 16,7 % больше, чем годом ранее, когда продажи такого оборудования оценивались в $25,2 млрд при росте 23,4 % в годовом исчислении. В сегменте HPC-решений для локального развёртывания на долю HPE пришлось около 22,1 % продаж — $6,5 млрд против $7,2 млрд в 2024 году. У Dell отгрузки в денежном выражении за год поднялись с $3,9 млрд до $5,3 млрд, в результате чего доля составила 18,2 %. Lenovo и Inspur получили $1,8 млрд и $1,2 млрд соответственно. Далее в рейтинге ведущих игроков указанного сегмента находятся Sugon, Penguin, Atos, IBM, Fujitsu и NEC.
Источник изображения: Hyperion Research Системы хранения данных в 2025 году принесли поставщикам около $12,8 млрд — плюс 27,5 % по отношению к предыдущему году. Расходы в облачном сегменте оцениваются в $12,4 млрд, что на 29,7 % больше, чем в 2024-м. Приложения обеспечили $9,3 млрд, связующее ПО — $3,2 млрд, услуги — $3,5 млрд. Отмечается, что в 2021 году во всём мире были отгружены примерно 2,2 млн НРС-узлов. В 2024-м и 2025 годах показатель снизился до 500 тыс. узлов. При этом выручка в пересчёте на один узел резко возросла: в среднем с $10 тыс. до более чем $50 тыс. По прогнозам, общие затраты на локальные серверы составят около $32 млрд в 2026 году и достигнут примерно $54 млрд к 2030-му.
01.06.2026 [12:15], Сергей Карасёв
ADATA представила решение TRUSTA AI Scaler Extended Memory Solution для расширения памяти в ИИ-системахБренд TRUSTA, принадлежащий компании ADATA Technology, анонсировал программно-аппаратную платформу AI Scaler Extended Memory Solution. Она нацелена на решение проблемы нехватки памяти в ускорителях на базе GPU в таких сценариях, как ИИ-инференс и точная настройка больших языковых моделей (LLM). По оценкам аналитиков, мировой рынок ИИ-инфраструктур будет расти в среднем на 26 % в год до 2034-го. Причём ИИ-нагрузки всё чаще переносятся из традиционных облаков в локальный контур и на периферию. При таких подходах компаниям приходится решать вопросы, связанные с конфиденциальностью данных, соответствием нормативным требованиям и оптимизацией затрат. Новая архитектура TRUSTA призвана помочь организациям уменьшить расходы при внедрении ИИ в собственной среде. В отличие от традиционных ИИ-систем, которые полностью полагаются на память GPU-ускорителей, платформа TRUSTA AI Scaler Extended Memory Solution, как и Phison aiDAPTIV+, предполагает распределение нагрузки между памятью GPU, DRAM и SSD-накопителями, что позволяет более эффективно использовать доступные ресурсы. Утверждается, что задачи инференса, которые обычно требуют наличия нескольких GPU-карт, могут быть оптимизированы для работы на одном ускорителе в сочетании с использованием других типов памяти. При этом нагрузки динамически перераспределяются между высокоскоростной памятью GPU, оперативной памятью и твердотельными накопителями. В результате, как отмечается, затраты на развёртывание ИИ могут быть снижены более чем на 50 % по сравнению с обычными инфраструктурами.
Источник изображения: ADATA Для новой программно-аппаратной платформы создан набор инструментов TRUSTA AI Scaler Toolkit. Это бесплатный продукт с открытым исходным кодом, не привязанный к конкретным аппаратным конфигурациям. С его помощью компании, исследовательские организации и независимые разработчики смогут настраивать ресурсы в соответствии со своими потребностями и выполняемыми задачами. Заявлена совместимость с такими LLM, как Llama, Qwen, Mistral, Mixtral, GPT-OSS, DeepSeek, Phi и Gemma, а дальнейшем список будет расширяться. Кроме того, поддерживаются различные приложения для ИИ-агентов, включая OpenClaw, NemoClaw и Hermes Agentic. Набор инструментов TRUSTA AI Scaler Toolkit уже доступен для загрузки. Кроме того, TRUSTA представила SSD корпоративного класса TD7P51 ECO с интерфейсом PCIe 5.0. Он имеет вместимость до 15,36 Тбайт. Заказчикам будут предлагаться варианты в трёх форм-факторах — U.2, E1.S и E3.S.
01.06.2026 [10:00], Руслан Авдеев
Ampere Computing: экстремальная жара в мире потребует больше энергии, повышения эффективности вычислений и сокращения количества ЦОД
ampere
arm
hardware
дефицит
ии
инференс
метео
охлаждение
прогноз
цод
экология
энергетика
энергоэффективность
Наступившее лето обещает быть чрезвычайно жарким, похожим на прошлогоднее, когда среднемировая температура достигла исторического максимума. Жара и засухи вынуждают индустрию и власти принимать трудные решения на фоне растущего расширения ЦОД, сообщил директор по продуктам Ampere Computing Джефф Виттич (Jeff Wittich). Согласно прогнозу AccuWeather на 2026 год, счета за электричество могут взлететь текущим летом из-за вероятной повсеместной жары по всей территории США. По оценкам отвечающей за надёжность электроснабжения в стране North American Electric Reliability Corporation, летний пиковый спрос на энергию вырастет на 224 ГВт за следующие 10 лет. Это более чем на 69 % выше прогноза 2024 года и на 24 % — пикового спроса 2025-го. В первую очередь ожидаемый рост спроса обусловлен потреблением электричества новыми ЦОД. В 2023 году в США дата-центры потребляли 4,4 % всей электроэнергии, а к 2028 году будут потреблять 12 %. Из-за роста спроса на электричество многим странам пришлось ужесточить правила для снижения нагрузки на энергосистемы и население. Во многом проблема в том, что энергосистемы не справляются с колебаниями энергопотребления в связи с экстремальной погодой. В июле прошлого года сообщалось, что аномальная жара привела к сбоям в лондонских дата-центрах Google и Oracle. Более того, согласно исследованию Rest of World, около 80 % всех дата-центров в мире построены в не особенно подходящих для них климатических условиях. Так, в 2025 году в США было внесено более 200 законопроектов, направленных на регулирование работы ЦОД, и по меньшей мере в 18 штатах предложены специальные тарифы для крупных потребителей электричества, а в Мэне предпринята пока не увенчавшаяся успехом попытка вовсе запретить строительство новых ЦОД. В некоторых законопроектах от желающих строить ЦОД требуют инвестиций в модернизацию инфраструктуры и обеспечение преимуществ для рядовых потребителей энергии.
Источник изображения: Ant Rozetsky/unsplash.com В 2025 году в Амстердаме продлили мораторий на строительство новых ЦОД и расширение в столичном муниципалитете уже действующих. Приоритет отдан жилью, а новые дата-центры появятся не раньше 2030 года. Во Франкфурте на ЦОД приходится до 40 % от всего потребления городской агломерации, что создаёт непосильную нагрузку местной энергосистеме. В некоторых районах введены временные моратории на подключение новых «индустриальных» объектов, строительство новых не ожидают до II квартала 2027 года. В условиях развития ИИ-проектов дефицит ресурсов будет всё ощутимее. Поддержать этот рост без ущерба окружающей среде можно, повысив эффективность вычислений каждого отдельного ЦОД. Это позволит строить меньше дата-центров для удовлетворения спроса на вычисления или уменьшать их сами по себе, чтобы снизить энергопотребление. Кроме того, потребуется модернизация систем охлаждения. Пока же бум ИИ подталкивает отрасль к экстенсивному развитию, тогда как необходимо максимизировать реальную производительность не только на уровне чипов, но и на остальных уровнях тоже. Для этого необходимы более энергоэффективные чипы, чем сейчас. Виттич подчёркивает, что мощные ИИ-ускорители на основе GPU стоит использовать только там, где это действительно необходимо. Если для обучения и масштабного инференса без них не обойтись, то для многих других задач они избыточны. Оптимизируя вычисления для каждой задачи, следует использовать энергоёмкую инфраструктуру только там, где это действительно необходимо.
Источник изображения: Peter Herrmann/unsplash.com Более эффективные системы охлаждения необходимо использовать независимо от снижения энергопотребления. При этом рекомендуется сочетать разные варианты охлаждения. Например, жидкостное всё чаще используется с энергоёмким ИИ-оборудованием. К сожалению для операторов ЦОД, модернизация систем охлаждения требует серьёзного изменения инфраструктуры, а на старых объектах модернизация сложна и дорога или вовсе невозможна. В существующих ЦОД нередко выгоднее использовать маломощные чипы с воздушным охлаждениями, размещая новые компоненты только там, где они действительно нужны. Фактически это означает переосмысление вычислительных архитектур для получения максимальной производительности на ватт за счёт использования современных чипов. Кроме того, придётся перераспределить рабочие нагрузки и проектировать системы, в которых производительность соответствует требованиям к допустимому тепловыделению и энергосбережению. В конечном итоге, чем больше вычислительных возможностей можно «извлечь» из каждого Вт и м2, тем меньше ЦОД нужно будет строить в будущем. Чем меньше ЦОД придётся строить, тем ниже нагрузка на водные и энергетические ресурсы в конкретных локациях. По словам представителя Ampere, для удовлетворения растущих энергетических потребностей потребуется не просто расширять инфраструктуру, но и оптимизировать её, начиная с вычислительных мощностей. И хотя Виттич прямо об этом не говорит, Ampere видит себя как раз-таки поставщиком энергоэффективных чипов, в том числе CPU для инференса. Однако на практике компания задержала выпуск AmpereOne M, была продана SoftBank и рискует лишиться одного из крупнейших заказчиков в лице Oracle, которая весьма заинтересована в NVIDIA Vera. Ей же приходится конкурировать с собственными Arm-процессорами AWS, Google, Microsoft и Alibaba, а также теперь уже и с самой Arm, Fujitsu и Qualcomm.
31.05.2026 [00:34], Владимир Мироненко
Snowflake потратит $6 млрд на чипы AWS, в том числе на Arm-процессоры GravitonКомпания Snowflake, специализирующаяся на облачных решениях для обработки данных с использованием ИИ, объявила о заключении пятилетнего соглашения о стратегическом сотрудничестве (SCA) с AWS, в рамках которого обязалась потратить $6 млрд на многолетние инфраструктурные проекты, включая использование серверных Arm-процессоров Amazon Graviton, а также ИИ-ускорителей. Компании не раскрывают, о каком поколении Graviton идёт речь, сообщает The Next Web. Для оценки, насколько крупной является сделка для компаний, ненамного больше — около $7 млрд — Snowflake получила выручки от своих сервисов через AWS Marketplace с момента основания компании в 2012 году. В 2020 году Snowflake объявила о пятилетнем облачном контракте с AWS на сумму $1,2 млрд, который впоследствии был увеличен до $2,5 млрд в 2023 году. Эта эволюция иллюстрирует растущую важность облачной инфраструктуры в развитии ИИ. Только в 2025 году расходы Snowflake на услуги AWS составили $2 млрд. За последние несколько лет Snowflake перевела большую часть вычислительных ресурсов с процессоров Intel и AMD на инстансы на базе Graviton, отметил The Register. Согласно соглашению, Snowflake будет запускать и обучать свои модели и сервисы генеративного ИИ, используя комбинацию ускорителей, работающих в AWS, и Graviton. Сделка также отражает собственный рост Snowflake: в среду компания опубликовала финансовые результаты за I квартал 2027 финансового года, закончившийся 30 апреля, которые значительно превзошли прогнозы Уолл-стрит. Компания сообщила о скорректированной прибыли в 39 центов на акцию при выручке в $1,39 млрд (+33 % г/г). Аналитики, опрошенные LSEG, прогнозировали 32 цента на акцию прибыли и выручку в $1,32 млрд (по данным CNBC). Прогноз компании на текущий квартал также был оптимистичным. Snowflake прогнозирует во II финансовом квартале скорректированную операционную маржу на уровне 12,5 % при выручке в размере от $1,415 до $1,420 млрд. Прогноз аналитиков, опрошенных StreetAccount, по операционной марже составляет 11,9 %, по выручке от продажи продуктов — $1,37 млрд. После объявления о финансовых результатах и сделке с AWS акции Snowflake подскочили примерно на 38 %. Обязательство Snowflake запускать свои облачные рабочие нагрузки на Graviton в масштабе является важным подтверждением жизнеспособности концепции Arm-серверов, которая незаметно меняет экономику облачной инфраструктуры уже пять лет, отметил The Next Web. Сделка подчёркивает растущую роль Arm-процессоров в ЦОД. IDC считает, что инвестиции Snowflake в AWS отражают то, как быстро корпоративные рабочие нагрузки ИИ адаптируются к потребностям долгосрочной инфраструктуры, пишет Data Center Knowledge. В ISG отмечают, что соглашение указывает на более широкий переход от экспериментальных развертываний ИИ к более долгосрочному спросу на инфраструктуру. Соглашение предоставляет Snowflake доступ к чипам AWS Graviton в то время, когда вычислительные мощности для ИИ ограничены, отметил ресурс GuruFocus. Оно также приближает инструменты Snowflake для хранения данных, аналитики и ИИ к AWS, где многие из её клиентов уже запускают свои рабочие нагрузки. Это важно для Snowflake, поскольку инвесторы опасались, что ИИ может навредить бизнесу традиционных компаний-разработчикой ПО, а не помочь им. Это обновление изменило ситуацию на Уолл-стрит. Snowflake заявила, что растёт спрос на такие инструменты, как Cortex Code и Snowpark, которые помогают компаниям создавать приложения ИИ и модели машинного обучения, используя собственные данные. Например, предлагаемая уже несколько лет Snowflake платформа Cortex AI может преобразовывать естественный язык в SQL-запросы, обобщать данные и проводить анализ настроений. Что касается AWS, то сделка с Snowflake продолжила серию крупных инвестиций в ИИ-инфраструктуру. Anthropic взяла на себя крупные многолетние обязательства перед AWS; OpenAI в начале этого года подписала значимое соглашение с AWS, несмотря на продолжающееся сотрудничество с её конкурентом Microsoft Azure. В прошлом месяце AWS заключила соглашение с Meta✴ о поставке миллионов чипов Graviton для удовлетворения растущих потребностей компании в вычислительных мощностях для ИИ. Это стало большой победой для AWS, поскольку несколькими месяцами ранее Meta✴ заключила сделку с Google Cloud на $10 млрд.
29.05.2026 [21:36], Владимир Мироненко
FuriosaAI и Broadcom создадут ИИ-ускоритель для платформы инференса для агентной эрыЮжнокорейский стартап FuriosaAI объявил о заключении соглашения о стратегическом партнёрстве с Broadcom для разработки тензорного (TCP) ИИ-ускорителя третьего поколения в качестве основы масштабируемой платформы инференса, предназначенной для обслуживания передовых агентных систем гиперскейлеров. Стартап намерен объединить передовые возможности Broadcom по упаковке, позволяющие интегрировать несколько кремниевых кристаллов в ИИ-ускоритель, и её достижения в масштабируемых сетевых решениях для ИИ со своей ИИ-архитектурой и программным стеком для создания платформы инференса в масштабе стойки По словам FuriosaAI, в результате сотрудничества с Broadcom архитектура процессора Tensor Contraction Processor (TCP) «превратится в многокристальную систему», которая лучше подходит для «высокопроизводительных требований к токенам» рабочих нагрузок инференса и агентного ИИ, пишет DataCenter Dynamics. FuriosaAI отметила, что эта архитектура сделает чипы более подходящими для «реальных рабочих ИИ-нагрузок» и что, сосредоточившись на высокоскоростной передаче данных, а не на управлении потоками вычислений, ускорители обеспечат более высокую производительность на ватт и большую «плотность» токенов, чем «передовые GPU». Сообщается, что чип третьего поколения FuriosaAI будет включать вычислительный 2-нм кристалл, выделенный IO-кристалл SUE-интерконнекта и двуслойную память HBM4/4E. Благодаря интеграции Scale-Up Ethernet (SUE) и PCIe-решений Broadcom, система будет обеспечивать низкую задержку и высокую пропускную способность интерконнекта All-to-All между сотнями чипов в масштабе стойки. Существующие системы могут объединять не более восьми ИИ-ускорителей RNGD. Как отметил президент группы полупроводниковых решений Broadcom, производительность инференса больше не определяется исключительно вычислительными ресурсами. Она всё больше зависит от повторного использования данных и эффективности обмена данными между серверами и стойками: «Сочетая архитектуру TCP FuriosaAI с ведущей на рынке технологией XPU и IP-платформой Broadcom, масштабируемым Ethernet и коммутаторами сетевых фабрик, мы создаём платформу, которая решает ключевые проблемы крупномасштабного агентного ИИ», — заявил он. «Объединение инфраструктурных возможностей Broadcom и архитектуры Tensor Contraction Processor от FuriosaAI, а также её определяющего отрасль программного стека, позволяет нам выйти за рамки уровня чипа и предложить комплексное решение для эпохи фабрик токенов», — отметил соучредитель и генеральный директор FuriosaAI. Хотя вычислительная мощность по-прежнему важна для рабочих ИИ-нагрузок, особенно на этапе предварительного заполнения, FuriosaAI сосредоточилась на перемещении данных между HBM и DRAM. «TCP ориентирован на высокоскоростную передачу данных и масштабные тензорные операции, а не на управление тысячами крошечных потоков. Он рассматривает доступ к памяти как первостепенную задачу, устраняя “обрыв” эффективности, с которым сталкиваются GPU, когда модели выходят за рамки жёстких иерархий кеша», — сообщается в блоге компании. Аппаратное обеспечение FuriosaAI поддерживается программным стеком, который позволяет разработчикам быстро развёртывать приложения, а также легко переключаться на новые модели и новые методы оптимизации. В то время как устаревшие платформы требуют обширной ручной настройки ядер для каждой новой модели, SDK FuriosaAI использует универсальный компилятор, который автоматически сопоставляет высокоуровневый код PyTorch с полупроводниковой архитектурой. Для разработчиков, которым требуется более детальный контроль, виртуальная архитектура набора команд FuriosaAI предлагает декларативную модель программирования, которая обеспечивает управление оборудованием без недетерминированной сложности традиционного программирования для GPU, отметила компания. Ранее сообщалось, что Broadcom продлила сотрудничество с Meta✴ для разработки нескольких поколений кастомных ИИ-чипов. Также она расширила контракт с Google по снабжению её новыми поколениями ИИ-чипов. Создаёт Broadcom специализированные чипы и для OpenAI. Всего у компании в разработке порядка десяти кастомных ASIC.
29.05.2026 [20:30], Руслан Авдеев
Gartner: большинство кастомных ИИ-моделей и проектов генеративного ИИ ожидает провалПо мнению Gartner, не менее половины всех проектов в сфере генеративного ИИ и создателей большинства ИИ-моделей ожидает неудача. Расходы на проекты будут выше планируемого из-за неудачных архитектурных решений и недостатка ноу-хау, а разработчики собственных моделей столкнутся с высокими затратами и другими сложностями, сообщает The Register. В докладе «Цикл хайпа вокруг генеративного ИИ» (Hype Cycle for Generative AI), в котором эксперты рассмотрели 30 ИИ-технологий, сообщается, что ни одна из них не достигла т.н. «плато производительности». На этом этапе продукты и технологии уже пережили два или три этапа эволюции, стабильны и приносят ощутимые выгоды. До достижения этого плато ИИ-технологии в своём развитии поднимаются до «Пика завышенных ожиданий» (Peak of Inflated Expectations), после чего следует спад в «Долину разочарований» (Trough of Disillusionment) и медленный подъём по «Склону просветления» (Slope of Enlightenment). По мнению Gartner, в областях вроде здравоохранения, финансов, юриспруденции и др. будут обеспечивать лучшие результаты модели, специально созданные «с нуля» под конкретную тематику, либо специально доработанные — в сравнении с универсальными моделями «общего назначения». Впрочем, подчёркивается, что создание специальных моделей требует значительных вычислительных ресурсов, специальных знаний и постоянного обслуживания. На достижение достаточной зрелости для массового применения таким моделям потребуется минимум 2–5 лет.
Источник изображения: Gartner Безусловный успех, по мнению Gartner, ожидает лишь ИИ-приложения вроде помощников в подготовке программного кода, создании графики и видео, а также обобщения контента. Впрочем, из-за проблем с интеллектуальной собственностью и склонностью ИИ к ошибкам, нишу ожидают некоторые проблемы. Тем не менее, Gartner уверена, что такие приложени довольно зрелые и они уже освоили более половины целевого рынка. Наименее зрелыми называются протоколы связи ИИ-агентов друг с другом и окружающей средой. Впрочем, этот сегмент довольно быстро развивается и даже уже имеется пара фаворитов. Наибольший потенциал по мнению экспертов имеют технологии защиты от дезинформации (Disinformation Security) и «Модели мира» (World Models). Технологии Disinformation Security помогают распознавать дипфейки, случаи кражи личности и создание другого фейкового контента, направленного на дискредитацию людей и организаций, а также на создание контента для кибератак и совершения других преступлений. По оценкам Gartner, до достижения зрелости этим технологиям ещё 5–10 лет. Модели мира позволяют ИИ выполнять сложные задачи прогнозирования и планирования, имитируя и понимая динамику окружающей среды. Это позволяет принимать обоснованные решения даже в условиях недостатка информации и непредвиденных обстоятельств. Такие инструменты также полезны для навигации робототехники в человеческом мире или создания видеоконтента с реалистичным отображением физики. Также Gartner считает, что организации, намеренные создавать ИИ-системы на основе открытых моделей, не получат доступ к самым передовым технологиям… если не готовы применять китайские разработки. Утверждается, что коммерциализация открытых LLM оказалась весьма сложной для их разработчиков. Многие западные технологические компании избирательно делают модели открытыми, благодаря чему все инновации в данной сфере пока сосредоточены в КНР, хотя развитие идёт и за пределами Китая. |
|
