Материалы по тегу: i
|
20.02.2026 [22:30], Владимир Мироненко
Не $100 млрд, а $30 млрд, и не выиграл, а переиграл — NVIDIA и OpenAI готовят новую инвестиционную сделкуМноголетняя сделка между NVIDIA и OpenAI, в рамках которой производитель ИИ-ускорителей обязался инвестировать в разработчика ИИ-моделей $100 млрд, так и не была подписана. Вместо неё компании готовят более простую схему с инвестициями NVIDIA в акционерный капитал OpenAI в размере $30 млрд в обмен на её акции, сообщил ресурс The Financial Times. По данным источников The Financial Times, переговоры по этому поводу находятся на завершающей стадии, решение может быть принято уже в эти выходные. Инвестиции NVIDIA в акционерный капитал OpenAI в размере $30 млрд являются частью более крупного раунда финансирования, который, как ожидается, позволит OpenAI привлечь более $100 млрд с оценкой её рыночной стоимости в $730 млрд, не считая новых средств, сообщили источники. OpenAI реинвестирует большую часть нового капитала в оборудование NVIDIA, но компании откажутся от прежней сделки на $100 млрд, о которой было объявлено в сентябре, добавили источники. По словам источников, это финансирование поддержит создание новых вычислительных мощностей и, вероятно, со временем приведет к заключению новых сделок. Как отметил ресурс eWeek, на практике ничего не поменяется: OpenAI по-прежнему нуждается в огромных вычислительных мощностях, а NVIDIA по-прежнему находится в центре цепочки поставок оборудования, обеспечивающей работу современной экономики ИИ. Меняется лишь то, как формируются риски, сроки и обязательства. Ранее руководители OpenAI и NVIDIA попытались развеять слухи об охлаждении отношений между их компаниями в связи с замораживанием сделки на $100 млрд. «Нам нравится работать с NVIDIA, и они производят лучшие в мире чипы для ИИ. Мы надеемся оставаться их ключевым клиентом очень долгое время», — заявил генеральный директор OpenAI Сэм Альтман (Sam Altman). Следом глава NVIDIA Дженсен Хуанг (Jensen Huang) заявил CNBC, что любые предположения о «спорах» — это «ерунда». «Нам нравится работать с OpenAI», — сказал он. Тем не менее, OpenAI подписала в начале года крупную сделку с Cerebras и уже начала использовать её царь-чипы. Кроме того, у OpenAI есть и сделка с AMD. По словам источников The Financial Times, OpenAI также находится на заключительном этапе переговоров с SoftBank по поводу инвестиций около $30 млрд, и Amazon, которая может инвестировать до $50 млрд в рамках более широкого партнёрства, предполагающего использование ИИ-моделей GPT. Ожидается, что MGX, государственный инвестиционный фонд Абу-Даби в сфере технологий, и Microsoft также инвестируют крупные суммы, а руководители OpenAI на этой неделе встречаются с венчурными капиталистами и другими инвесторами по поводу дальнейших инвестиционных проектов, добавили источники.
20.02.2026 [16:55], Руслан Авдеев
OpenAI и Tata договорились о строительстве 1 ГВт ИИ ЦОД в ИндииИндийские Tata Group, Tata Consultancy Services (TCS) и OpenAI анонсировали новое стратегическое партнёрство. Подразделение HyperVault компании TCS и OpenAI займутся строительством ИИ-инфраструктуры в Индии, сообщает Datacenter Dynamics. Многолетнее партнёрство предусматривает реализацию совместного проекта в несколько этапов. Для начала TCS построит ИИ-инфраструктуру на 100 МВт, в будущем возможно её масштабирование до 1 ГВт. По словам главы OpenAI Сэма Альтмана (Sam Altman), Индия уже является лидером по внедрению искусственного интеллекта. С её талантами, амбициями и сильной правительственной поддержкой у неё очень хорошие позиции для того, чтобы самой творить своё будущее. OpenAI при сотрудничестве с Tata Group работают над строительством инфраструктуры, подготовкой специалистов и заключением локальных соглашений для создания «ИИ с Индией, для Индии и в Индии» таким образом, что многие люди в стране смогут получить доступ к ИИ-инструментам и получать от этого выгоду. Создание ЦОД HyperVault анонсировали в ходе квартального отчёта в прошлом октябре. В планах значится постройка в стране дата-центров Stargate с жидкостным охлаждением общей мощностью 1 ГВт. В предприятие инвестировала частная инвестиционная компания TPG. Как заявляют в Tata, глубокое сотрудничество между OpenAI и Tata Group знаменует важную веху в планах Индии по превращению в глобального лидера в сфере искусственного интеллекта с подготовкой местной молодёжи для преуспевания в новую эру. Согласно договорённости, сотрудники Tata получат доступ к корпоративной версии бота OpenAI — Enterprise ChatGPT. Кроме того, компании будут совместно разрабатывать специальные ИИ-решения. Ранее HyperVault заявляла, что будет применять ускорители AMD на своих объектах, OpenAI также ранее обязалась внедрить оборудование на основе решений AMD. Помимо аренды больших облачных мощностей у гиперскейлеров, OpenAI строит и собственные дата-центры в разных локациях мира в рамках инициативы Stargate. Компания рассчитывает на объекты в многочисленных городах США, а также на локации в Норвегии, Великобритании, ОАЭ и Южной Корее. Имеются планы строительства ЦОД в Аргентине и Канаде. Слухи о том, что OpenAI рассматривает Индию для реализации своих проектов, появились в сентябре 2025 года.
19.02.2026 [17:07], Владимир Мироненко
Humain из Саудовской Аравии инвестировала $3 млрд в стартап xAI Илона МаскаКомпания Humain из Саудовской Аравии объявила об инвестициях в размере $3 млрд в стартап xAI Илона Маска (Elon Musk) в рамках раунда финансирования серии E на общую сумму в $20 млрд, который завершился незадолго до приобретения стартапа компанией SpaceX. Humain заявила, что в результате сделки стала «значительным миноритарным акционером» xAI. Её активы будут конвертированы в акции SpaceX — примерно 0,24 % в новой объединённой компании стоимостью $1,25 трлн, согласно оценкам Bloomberg. Humain отметила, что участие в раунде серии E укрепляет её роль как масштабного, долгосрочного стратегического инвестора, способного поддерживать компании на разных этапах роста, предоставляя при этом комплексные возможности ИИ в четырёх основных областях: дата-центры следующего поколения; высокопроизводительная инфраструктура и облачные платформы; передовые ИИ-модели; трансформационные решения в области ИИ. Инвестиции являются продолжением партнёрства, объявленного Humain и xAI в ноябре 2025 года, в рамках которого компании договорились о строительстве инфраструктуры ИИ-ЦОД мощностью 500 МВт. Ранее Humain создала совместное предприятие с AMD и Cisco для наращивания мощностей дата-центров в Саудовской Аравии. Также Humain заявила о партнёрстве с AWS с целью развёртывания в кампусе AI Zone в Эр-Рияде до 150 тыс. ИИ-ускорителей для предоставления в дальнейшем вычислительных мощностей и ИИ-сервисов из Саудовской Аравии клиентам со всего мира. Как отметил Bloomberg, суверенные фонды Кувейта, Катара, Саудовской Аравии и ОАЭ, контролирующие более $4 трлн, сделали ИИ центральным элементом диверсификации экономики своих стран, ставших ключевыми игроками в ИИ-отрасли, готовой изменить многие аспекты повседневной жизни.
12.02.2026 [12:59], Руслан Авдеев
Французская Mistral AI вложит €1,2 млрд в строительство шведского ИИ ЦОДФранцузский стартап Mistral AI инвестирует €1,2 млрд ($1,4 млрд) в строительство ИИ-инфраструктуры в Швеции. Компания намерена стать незаменимым поставщиком ИИ-решений для правительственных структур и крупных компаний в Евросоюзе, сообщает Bloomberg. По данным Mistral, ИИ ЦОД разместится в Бурлэнге (Borlänge) при содействии инфраструктурного провайдера EcoDataCenter AB. Объект вместит мощности, достаточные для обучения ИИ-моделей компании. Сообщается, что он должен начать работу в 2027 году. Это первая инвестиция Mistral в дата-центры за пределами Франции. Компания позиционирует создание ЦОД как меру по укреплению европейского технологического суверенитета. Поскольку политические связи с Вашингтоном ослабевают, правительства стран — участниц Евросоюза всё с большей опаской относятся к использованию облачных сервисов Amazon (AWS), Microsoft и Alphabet, пока доминирующих в сфере ИИ-инфраструктуры, хранения данных и облачных вычислений. Mistral, разрабатывающая ИИ-модели, по данным Bloomberg рассчитывает стать ответом Европы на деятельность OpenAI. С июня 2025 года компания управляет собственным облаком Mistral Compute, предоставляя полный ИИ-стек, включающий ИИ-ускорители, API и разнообразные сервисы, в том числе в формате PaaS. Утверждается, что клиентам предлагается «полностью европейский ИИ-стек» с обрабьоткой и хранением данных на месте.
Источник изображения: Mistral AI По словам главы Mistral Артура Меньша (Arthur Mensch), инвестиция — конкретный шаг на пути к строительству независимых мощностей в Европе, связанных с искусственным интеллектом. В 2025 году Mistral заявила, что намерена инвестировать в строительство дата-центра во Франции для того, чтобы отказаться от использования действующей в США инфраструктуры. После раунда финансирования сентября 2025 года, в ходе которого компания привлекла €1,7 млрд, её капитализация составила €11,7 млрд. Раунд возглавил нидерландский производитель литографического оборудования ASML Holding NV. В январе 2026 года Меньш заявил, что к концу 2026 года выручка компании долждна превысить $1 млрд. EcoDataCenter известна своими проектами высокоэкологичных ЦОД. Отношения Франции и США действительно переживают не лучшие времена. Например, в декабре 2025 года сообщалось, что Airbus перенесёт критически важные нагрузки в суверенное европейское облако. В январе 2026 года появилась информация, что французские власти пересадят госслужащих с с Zoom и Teams на суверенный видеочат Visio, а в феврале сообщили о том, что французская Capgemini продаст подразделение CGS, обслуживающее власти США.
10.02.2026 [13:16], Руслан Авдеев
Hitachi рассматривает продажу поставщика СХД Hitachi Vantara за $1,3 млрдЯпонский транснациональный конгломерат Hitachi намерен продать своё подразделение, предлагающее решения для хранения и анализа данных. Для Hitachi Vantara рассчитывают найти покупателя, готового выложить до ¥200 млрд ($1,3 млрд), сообщает Bloomberg. Компания уже наняла консультанта по продажам и передала материалы о бизнесе Hitachi Vantara заинтересованным сторонам, вероятным потенциальным покупателем называется какая-либо частная акционерная компания. По имеющимся данным, сама Hitachi намерена сосредоточиться на более маржинальном бизнесе, чем Hitachi Vantara, вроде инициатив, связанных с передачей энергии и цифровой трансформацией. Сегодня в сферу интересов Hitachi входит энергетика (атомные и иные системы генерации, а также системы передачи), транспорт (поезда и автомобильные платформы), промышленность (индустриальное оборудование), измерительные и аналитические системы, здравоохранение, системы для зданий — лифты и эскалаторы, а также многие бизнесы, связанные с цифровыми решениями. Конечно, попадает туда и бизнес, связанный с хранением и управлением данных, включая Hitachi Vantara.
Источник изображения: Hitachi Vantara Имеется два номинально независимых подразделения Hitachi Vantara — Hitachi Vantara Ltd. в Японии и Hitachi Vantara LLC в США. Выручка Hitachi в 2025 финансовом году включала ¥475 млрд от подразделения IT Products, рост составил 7 % год к году, к этим средствам относится и выручка, связанная с СХД. Показатель EBITDA подразделения IT Products составлял 4,4 %, против 14,8 % для «материнского» бизнеса Digital Systems and Services. По данным Westgrove Research, совокупная годовая выручка бизнеса Hitachi Vantara составила ¥300 млрд ($1,95 млрд). Корнями бизнес Hitachi Vantara уходит в 1989 год, когда Hitachi и EDS приобрели National Advanced Systems у National Semiconductor и назвали новый бизнес, связанный с хранением данных, Hitachi Data Systems (HDS). Hitachi выкупила EDS в 1999 году. В результате череды дальнейших изменений в 2017 году Hitachi организовала слияние HDS с купленной компанией Pentaho, занимавшейся бизнес-аналитикой и подразделением Hitachi Insight Group, занимавшимся преимущественно Интернетом вещей. В результате и появилась Hitachi Vantara. Её массивы хранения данных корпоративного уровня Virtual Storage Platform One (VSP One) имеют хорошую репутацию и ценятся за надёжность. Тем не менее, попытки закрепиться на рынках файловых NAS и объектных хранилищ особенным успехом не увенчались, так что компании не удалось пробиться дальше «второго эшелона». Кроме того, в значительной степени компания упустила возможность массовых поставок систем для ИИ, не сумев вовремя войти в число ключевых партнёров NVIDIA в нише систем хранения данных. Компании не удалось конвертировать свой опыт в сфере монолитных высокопроизводительных корпоративных хранилищ в успешные решения среднего уровня. Предпринимались попытки освоить рынок All-Flash хранилищ, компания даже разрабатывала собственное аппаратное обеспечение для него, но по мере развития массового производства SSD и ужесточения конкуренции, отстала от компаний уровня Dell EMC. Hitachi Consulting присоединилась к Hitachi Vantara в 2020 году. Результат оказался неудовлетворительным, и в 2023 году началась реорганизация в попытках оживить бизнес, в том числе путём найма новых топ-менеджеров. Для бренда VSP One были анонсированы новые продукты, связанные с хранением данных, анонсирована поддержка публичных облачных хранилищ. Как сообщает Blocks & Files, похоже, Hitachi Vantara продолжит обычные бизнес-операции. Слабость позиций компании некоторые эксперты оценивают как результат её подчинения японской Hitachi Ltd. — в результате старшие руководители «размыли» влияние потенциально более предприимчивых лидеров из Кремниевой долины в США. Такое отсутствие успехов в сфере хранения данных преследовало и другие японские конгломераты, включая коллег из Fujitsu и NEC.
07.02.2026 [14:07], Сергей Карасёв
Broadcom представила первые в отрасли решения Wi-Fi 8 для точек доступа и коммутаторов корпоративного классаКомпания Broadcom анонсировала изделия BCM49438 и Trident X3+ BCM56390. Это, как утверждается, первые в отрасли решения для точек доступа и коммутаторов Wi-Fi 8 корпоративного класса, построенные на единой кремниевой архитектуре. Они могут применяться в сетях, ориентированных на работу с ИИ. Broadcom BCM49438 — это чип APU (Accelerated Processing Unit), который объединяет вычислительные ресурсы, сетевые функции и ускорение ИИ-операций на периферии. Изделие содержит четыре ядра с архитектурой Armv8 и нейропроцессорный блок Broadcom Neural Engine (BNE). Реализована поддержка памяти DDR4-3200, LPDDR4-4267, DDR5-5600 и LPDDR5-5500, а также двух интерфейсов USB и двух интерфейсов 10Gb MACsec. Предусмотрены четыре контроллера PCIe. Новинка может использоваться в паре с радиочипами Broadcom BCM43840, BCM43844 и BCM43820 стандарта Wi-Fi 8. На основе этих компонентов производители оборудования смогут создавать точки доступа Wi-Fi 8 с возможностями оптимизации в реальном времени, функциями постквантовой криптографии (CNSA 2.0), развитыми средствами обеспечения безопасности и ускорением ИИ-операций.
Источник изображений: Broadcom В свою очередь, коммутационное решение Trident X3+ BCM56390 также оснащено четырьмя ядрами с архитектурой Armv8. Пропускная способность достигает 700 Гбит/с. Могут быть реализованы 48 портов на 5 Гбит/с и 16 портов на 25 Гбит/с или 28 портов на 25 Гбит/с. Платформа позволяет создавать программируемые L3-коммутаторы с поддержкой MACsec на всех портах. Реализован механизм безопасной загрузки. Trident X3+ BCM56390 может работать в связке с PHY-чипами Broadcom BCM84918, BCM54908 и BCM54908E, а также с чипами PoE PSE, обеспечивающими оптимальное энергопотребление и эффективность. ![]() В целом, новые изделия образуют единую архитектуру, которая обеспечивает максимальную производительность и безопасность корпоративных беспроводных сетей Wi-Fi 8. Эти чипы расширяют возможности сетевой телеметрии, предлагая глубокий анализ в реальном времени для управления с помощью ИИ. Пробные поставки устройств уже начались.
06.02.2026 [10:53], Владимир Мироненко
Без дефицитной HBM: Positron AI готовит ИИ-ускоритель Asimov с терабайтами LPDDR5xКомпания Positron AI сообщила о привлечении $230 млн инвестиций в рамках переподписанного раунда финансирования серии B, в результате которого оценка её рыночной стоимости превысила $1 млрд. Раунд возглавили ARENA Private Wealth, Jump Trading и Unless при участии новых инвесторов Qatar Investment Authority (QIA), Arm и Helena, а также существующих инвесторов Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures и 1517. Объявление было сделано на мероприятии Web Summit Qatar, что подчеркивает растущий международный авторитет компании, отметил ресурс eWeek. На то, чтобы перейти в категорию единорогов, Positron AI потребовалось 34 месяца. Positron AI отметила решение Jump Trading стать одним из лидеров раунда после того, как эта компания стала её клиентом. «Для рабочих нагрузок, которые нас интересуют, узкими местами всё чаще становятся память и энергопотребление, а не теоретические вычисления», — сказал технический директор Jump Trading. — В ходе наших тестов Positron Atlas показал примерно в три раза меньшую сквозную задержку, чем сопоставимая система на базе NVIDIA H100, при оценке рабочих нагрузок инференса, в готовом к производству корпусе с воздушным охлаждением и цепочкой поставок, которую мы можем спланировать». Полученные инвестиции позволят ускорить выход платформы следующего поколения Asimov, разработанной на заказ. Компания планирует завершить тестирование Asimov к концу III квартала, а пробные версии появятся в конце I квартала 2027 года. В Asimov будет использоваться память LPDDR (без HBM), но возможность приблизиться к теоретической пиковой пропускной способности памяти означает, что компании и не нужно полагаться на HBM для быстрой генерации токенов, сообщил ресурсу EE Times технический директор Positron. Вычислительные элементы Asimov — это эволюция блоков Atlas с добавлением ядер Arm и улучшенным интерконнектом. Расширить память LPDDR5x в Asimov можно с помощью CXL — с 864 Гбайт до 2,3 Тбайт на чип. Чип позволяет создать два независимых домена памяти, чтобы лучше утилизировать её. Хосит-интерфейс чипа — PCI 6.0 x32. Хотя LPDDR5x дешевле и ёмче HBM, она значительно уступает ей по пропускной способности. Если ускорители Rubin от NVIDIA оснащены 288 Гбайт памяти HBM4 с пиковой пропускной способностью 22 Тбайт/с, то для Asimov, по-видимому, потолок составляет около 3 Тбайт/с, пишет The Register (в спецификациях указано 2,76 Тбайт/с). По словам Positron, разница в том, что её чипы действительно могут использовать 90 % этой пропускной способности, в то время как GPU на базе HBM в реальных условиях едва достигают 30 % пиковой пропускной способности, хотя память Rubin даже в этом случае примерно в 2,4 раза быстрее, чем у Asimov. Компания сообщила, что 400-Вт чип оснащён систолической матрицей 512×512, работающей на частоте 2 ГГц и поддерживающей типы данных TF32, FP16/BF16, FP8, NVFP4 и INT4. Эта матрица управляется рядом ядер Armv9 и может быть переконфигурирована, например, в 128×512 (GEMV) или 512×128 (GEMM), в зависимости от того, какой вариант более выгоден для решения конкретной задачи. Четыре чипа Asimov образуют 4U-платформу Titan с воздушным охлаждением и пропускной способностью между чипами 16 Тбит/с. Компания отметила, что Asimov рассчитан на поддержку 2 Тбайт памяти на ускоритель и 8 Тбайт памяти на систему Titan с аналогичной пропускной способностью памяти, как у ускорителя NVIDIA Rubin. В масштабе стойки это означает объём памяти более 100 Тбайт. До 4096 систем Titan (16384 ускорителя) могут быть объединены в единый масштабируемый домен с более чем 32 Пбайт памяти. Это достигается с помощью чистого межчипового интерконнекта, а не коммутируемых масштабируемых сетей, как в стоечных архитектурах NVIDIA или AMD. Positron подчеркнула, что её архитектура, ориентированная на память, открывает доступ к высокоэффективным задачам инференса, включая большие языковые модели с длинным контекстом, агентные рабочие процессы и модели медиа и видео следующего поколения.
05.02.2026 [17:58], Сергей Карасёв
Из-за дефицита памяти у Raspberry Pi 4 появился версия со «сдвоенной» RAM, а 16-Гбайт версия Raspberry Pi 5 существенно подорожалаКомпания Raspberry Pi, по сообщению ресурса CNX Software, из-за дефицита чипов памяти, сформировавшегося на фоне бума ИИ, продолжает поднимать цены на свои одноплатные компьютеры. А в конструкцию отдельных моделей даже внесены изменения с целью обеспечения гибкости в цепочке поставок DRAM. Напомним, в конце прошлого года повысились цены на изделия Raspberry Pi 4 и Raspberry Pi 5: прирост составил от $5 до $25 в зависимости от модификации. Очередное изменение стоимости затронуло названные одноплатные компьютеры, а также вычислительные модули Raspberry Pi Compute Module 4 и Raspberry Pi Compute Module 5, несущие на борту 2 Гбайт оперативной памяти и более (модификации с 1 Гбайт ОЗУ предлагаются по прежней цене). Прибавка выглядит следующим образом:
Вместе с тем выпущен новый вариант Raspberry Pi 4 — изделие Raspberry Pi 4 v1.5 Dual RAM (маркировка «Raspberry Pi 4 Model B © Raspberry Pi 2025»). У такого одноплатного компьютера вместо одного чипа LPDDR4 используются два, которые расположены на лицевой и обратной сторонах. CNX Software отмечает, что на фоне нехватки компонентов DRAM может сложиться ситуация, когда два чипа памяти на 4 Гбайт будут стоить дешевле одного на 8 Гбайт. Кроме того, такая компоновка позволит решить проблему недоступности модулей LPDDR4 большой ёмкости: производитель сможет заменять их парой чипов вдвое меньшего объема.
05.02.2026 [09:16], Руслан Авдеев
ICE — не айс: французская Capgemini продаст подразделение CGS, обслуживающее власти СШАФранцузская группа Capgemini, специализирующаяся на технологических проектах, намерена продать подразделение Capgemini Government Solutions (CGS). Оно выполняет некоторые работы по заказу правительства США, в т.ч. в рамках проекта оказания помощи Службе иммиграции и таможенного контроля (ICE), вызывающей немало критики, сообщает The Register. Головная компания уже заявила, что правовые ограничения, касающиеся контрактов с федеральными ведомствами, осуществляющими секретную деятельность в США, не позволяют руководству группы осуществлять надлежащий контроль над некоторыми аспектами деятельности дочерней структуры, чтобы та действовала в соответствии с целями группы. Отдельные представители французских властей также выразили недовольство тем, что Capgemini участвует в делах Министерства внутренней безопасности США и ICE, заявив, что это неприемлемо. Capgemini пообещала немедленно инициировать процесс продажи активов, что не должно вызвать значительных затрат — CGS приносила лишь 0,4 % от выручки группы в мире и менее 2 % — в США. При этом главное руководство Capgemini не слишком довольно выигранным CGS контрактом на «услуги по расследованию и проверке личных данных» с подразделением «Контроля за соблюдением условий содержания под стражей и депортациями» (Detention Compliance And Removals). Контракт с Capgemini, судя по всему, способствует выполнению задач ICE, поэтому глава компании Айман Эззат (Aiman Ezzat) усомнился, что характер и масштаб работы CGS соответствуют тому, чем обычно занимается компания, работающая в сфере бизнеса и технологий. Также он подчеркнул, что в рамках специального соглашения о безопасности, дающего возможность выполнять засекреченные работы для правительства США, требуется отделение деятельности CGS от деятельности Capgemini в целом. Эззат подчеркнул, что это создаёт множество ограничений, поскольку группа Capgemini не имеет доступа к секретной информации, связанной с техническими операциями CGS в США в соответствии с американским законодательством. Пока нет данных о том, означает ли продажа CGS то, что организация не будет пользоваться интеллектуальной собственностью и другими активами Capgemini. Нет данных и о том, имеются ли покупатели на CGS и когда может состояться продажа. В 2024 финансовом году выручка Capgemini составила €22 млрд, поэтому, исходя из общедоступных данных, выручка CGS может составлять около €88 млн ($104 млн).
03.02.2026 [17:15], Руслан Авдеев
OpenAI не устроили чипы NVIDIA для инференса, теперь она ищет альтернативыПо данным многочисленных отраслевых источников, компания OpenAI недовольна некоторыми ИИ-чипами NVIDIA и с прошлого года ищет им альтернативы. Потенциально это усложнит отношения между крупнейшими игроками рынка на фоне бума ИИ, сообщает Reuters. Изменения стратегии OpenAI связаны с усилением акцента на инференсе. NVIDIA доминирует в нише ускорителей для обучения ИИ-моделей, но теперь инференс стал отдельным рынком с сильной конкуренцией. Решение OpenAI — вызов доминированию NVIDIA в сфере ИИ и препятствие $100-млрд сделки между компаниями, обеспечивающей разработчику чипов долю в ИИ-стартапе в обмен на доступ к передовым ускорителям. Предполагалось, что сделка будет закрыта за недели, но вместо этого переговоры ведутся месяцами. В то же время OpenAI заключила соглашение с AMD и Cerebras (её в своё время даже хотели купить) для получения «альтернативных» чипов, а также разрабатывает собственный ИИ-ускоритель при участии Broadcom. Amazon тоже не прочь предоставить OpenAI собственные ускорители, равно как и Google. Изменение планов OpenAI изменило и потребности в вычислительных мощностях и замедлило переговоры с NVIDIA. В минувшую субботу глава NVIDIA Дженсен Хуанг (Jensen Huang) опроверг слухи о проблемах с OpenAI, назвав их «чепухой» и подчеркнув, что клиенты продолжают выбирать NVIDIA для инференса, поскольку компания обеспечивает наилучшее соотношение производительности и совокупной стоимости владения, причём в больших масштабах. Отдельно представитель OpenAI заявлял, что компания полагается на NVIDIA для поставок большинства чипов для инференса, причём именно NVIDIA обеспечивает наилучшую производительность на каждый вложенный доллар. Глава OpenAI Сэм Альтман (Sam Altman) отметил, что NVIDIA выпускает «лучшие чипы в мире» и есть надежда, что OpenAI останется её «гигантским» клиентом очень долгое время. При этом, как сообщает Reuters со ссылкой на семь источников, OpenAI не удовлетворена производительностью инференса, на которую способны чипы NVIDIA. В частности, речь идёт о специализированных задачах вроде разработки ПО с помощью ИИ и коммуникаций ИИ с другим ПО. По данным одного из источников, компании понадобится новое аппаратное обеспечение, которое в конечном счёте обеспечит в будущем порядка 10 % вычислительных мощностей для инференса. OpenAI обсуждала возможности работы с ИИ-стартапами, включая Cerebras и Groq для обеспечения чипов с более быстрым инференсом, но NVIDIA фактически поглотила Groq на $20 млрд, что привело к прекращению переговоров с компанией. Хотя формально речь идёт неэксклюзивном лицензировании технологий Groq, что в теории позволяет сторонним компаниям получить доступ к решениям Groq, фактически все разработчики перешли в NVIDIA, а оставшаяся небольшая команда отвечает за выполнение облачных контрактов с имеющимися заказчиками. Чипы NVIDIA хорошо подходят для обработки больших объёмов данных при обучении больших ИИ-моделей вроде тех, что стоят за ChatGPT. Тем не менее прогресс требует массового использования уже обученных моделей для дальнейшего инференса и ИИ-рассуждений. Как сообщается, OpenAI с 2025 года ищет альтернативы ускорителям NVIDIA с упором на компании, создающие чипы с большими объёмами интегрированной SRAM. Maia 200 от Microsoft, по-видимому, компании не очень подходит. Инференс моделей более требователен к памяти, чем обучение, а вычислительная нагрузка, наоборот, не так велика. В тоге нередко на доступ к данным уходит больше времени, чем на расчёты. NVIDIA и AMD полагаются на внешнюю память, что замедляет соответствующие процессы общения с чат-ботами. В OpenAI проблемы отметили при эксплуатации системы Codex, активно продвигаемой компанией для создания кода. В компании считают, что некоторые слабости системы связаны именно с оборудованием NVIDIA. Конкуренты OpenAI полагаются на альтернативное оборудование. Anthropic активно использует AWS Trainium и Google TPU, а Google уже много лет использует свои TPU, которые с недавних пор готова отдавать на сторону. TPU оптимизированы в том числе для инференса и в некоторых отношениях более производительны, чем GPU общего назначения AMD и NVIDIA. Когда OpenAI недвусмысленно выразила отношение к технологиям NVIDIA, та предложила компаниям, создающим ускорители с упором на SRAM, включая Cerebras и Groq, купить их бизнес. Cerebras отказалась и заключила прямую сделку с OpenAI. Groq вела переговоры с OpenAI о предоставлении вычислительных мощностей, что вызвало интерес у инвесторов, оценивших капитализацию компании на уровне $14 млрд. |
|

