Материалы по тегу: ии

18.06.2026 [01:45], Владимир Мироненко

NVIDIA стала лидером во всех тестах MLPerf Training 6.0

Консорциум MLCommons опубликовал результаты тестирования различных аппаратных решений в бенчмарке MLPerf Training 6.0. В нём появилось два новых теста — DeepSeek V3 и GPT-OSS 20B, что подчёркивает общеотраслевой переход к разреженным вычислениям, примером которого является архитектура MoE (Mixture-of-Experts).

DeepSeek V3 — крупномасштабная MoE-модель c 671 млрд параметров, из которых 37 млрд активируются для генерации отдельного токена. Она предоставляет стандартизированную платформу для оценки эффективности обучения ведущей модели MoE с открытыми весами. GPT-OSS 20B — MoE-модель c 21 млрд параметров, из которых 3,6 млрд активируются для генерации одного токена. Она позволяет организациям оценивать сложную логику маршрутизации и шаблоны разреженных вычислений, характерные для архитектуры MoE, на аппаратных конфигурациях размером всего в один узел с восемью ускорителями.

Версия MLPerf Training 6.0 установила новые рекорды по разнообразию представленных систем. Участники выложили результаты 95 уникальных систем, использующих тринадцать различных аппаратных ускорителей, 19 различных хост-процессоров и несколько различных программных фреймворков. 60 % систем были многоузловыми. При этом количество представленных облачных систем более чем вдвое больше, чем в раунде 5.1.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

В раунде MLPerf Training v6.0 представлены заявки от 24 организаций: AMD, ASUSTeK, Azure, Cisco, CoreWeave, Dell, Fujitsu, GigaComputing, Google, HPE, Inventec, Krai, Lambda, MITAC, Nebius, Netweb Technologies India, NVIDIA, Oracle, Quanta Cloud Technologies, SCITIX, Supermicro, tinycorp, TTA и Vultr. «Мы особенно рады приветствовать участников, впервые представляющих свои результаты в MLPerf Training: Inventec, Netweb Technologies India, TTA и Vultr», — сообщил Дэвид Кантер (David Kanter), руководитель MLPerf в MLCommons.

NVIDIA вновь стала лидером в новом раунде MLPerf Training, причём во всех тестах, в очередной раз став единственной платформой, которая предоставила результаты по всем тестам. Также NVIDIA была единственной платформой, представившей результаты по новым тестам, при этом система NVIDIA GB300 NVL72 «установила планку производительности благодаря оптимизированным программным стекам NVIDIA и конструкции, объединяющей 72 GPU Blackwell Ultra и 36 CPU Grace с использованием NVLink и NVLink Switch».

В нескольких случаях партнёры NVIDIA масштабировали систему до 8192 ускорителей Blackwell, работающих согласованно в различных ЦОД. Эти результаты подтвердили реальную надёжность платформы Blackwell в масштабируемых кластерных средах, говорит NVIDIA.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Для достижения максимальной производительности таких моделей, как DeepSeek-V3, NVIDIA в этом раунде MLPerf Training применила несколько программных оптимизаций, включая использование итерационных графов CUDA для MoE без удаления токенов, применение CuTe DSL для продвинутых операций слияния ядер, алгоритм внимания MXFP8 для повышения производительности без ущерба для качества модели, оптимизацию маршрутизатора и оптимизацию схемы коммуникации 1F1B all-to-all overlap. Также NVIDIA оптимизировала компоновку и баланс параллельных этапов конвейера, минимизируя структурное простаивание.

Для обработки DeepSeek-V3 671B компания NVIDIA использовала до 8192 GPU в системах GB200 NVL72, что стало самым масштабным результатом на основе Blackwell в MLPerf Training на сегодняшний день. NVIDIA также представила результаты на 5120 GPU с системами NVIDIA GB200 NVL72 в Llama 3.1 405B, одной из самых крупных LLM плотной архитектуры в этом бенчмарке.

Результаты этого раунда также отражают тесное сотрудничество NVIDIA с компаниями-партнёрами в области системной архитектуры, сетей и ПО. Например, Microsoft Azure масштабировала обучение Llama 3.1 405B до 8192 GPU, используя системы GB200 NVL72, и достигла целевого эталонного значения за 7,07 мин., что является самым быстрым временем обучения для этого бенчмарка. А CoreWeave показала самое быстрое время обучения для DeepSeek-V3 671B, достигнув целевого качества за 2,02 мин. на 8192 GPU в составе GB300 NVL72, объединённых Spectrum-X Ethernet.

Постоянный URL: http://servernews.ru/1143702
17.06.2026 [11:53], Руслан Авдеев

Недовольные инвесторы подали иск против Microsoft, а GitHub не прочь обратиться к ресурсам AWS — всё из-за ИИ

Microsoft столкнулась со связанными с ИИ проблемами на разных фронтах. Во-первых, недовольные инвесторы подали иск в суд, поскольку компания, предположительно, ввела их в заблуждение относительно показателей Copilot, во-вторых, принадлежащая ей платформа GitHub столкнулась с проблемами масштабируемости, вызванными повсеместным внедрением ИИ и, возможно, обратится за облачными ресурсами к AWS, сообщает The Register.

Пенсионная система полиции и пожарной службы города Сент-Клер-Шорс (St. Clair Shores Police and Fire Retirement System) подала иск в федеральный окружной суд Сиэтла, в котором утверждает, что Microsoft, включая её главу Сатью Наделлу (Satya Nadella), сделали «в значительной степени ложные и/или вводящие в заблуждение» заявления относительно успехов внедрения технологии Copilot.

В иске утверждается, что собственная флагманское ИИ-решение компании в бенчмарках по многим параметрам оказалась значительно хуже конкурентов, и у Microsoft не получилось перевести на платную версию ИИ-помощника значимую часть пользователей коммерческого варианта Microsoft 365. При этом Copilot уступил долю рынка продуктам конкурентов, и соответствующая тенденция только усиливалась.

Некоторые организации всё же активно внедряют Copilot, но, как утверждается в иске, проблемы, связанные с разработкой и внедрением помощника Copilot и собственных ИИ-моделей недостаточно ясно раскрываются в документах, поданных в Комиссию по ценным бумагам и биржам США (SEC).

 Источник изображения: Sasun Bughdaryan/unsplash.com

Источник изображения: Sasun Bughdaryan/unsplash.com

В конце января Microsoft отчиталась о результатах II квартала своего финансового года. Выяснилось, что рост Azure замедлился, а число платных пользователей Microsoft 365 составило лишь 15 млн из 450 млн пользователей всего. В иске утверждается, что после публикации этих данных акции компании упали в цене более чем на $48, приблизительно на 10 %. В самой Microsoft назвали претензии необоснованными и намерены защищать свою позицию в суде.

Тем временем принадлежащей ей площадке GitHub, возможно, придётся обратиться за помощью к конкуренту — облачному гиганту AWS из-за проблем с надёжностью и масштабируемостью. Купленный в 2018 году сервис всё чаще испытывает проблемы с доступностью на фоне роста числа рабочих процессов, поддерживаемых ИИ. Уже была попытка GitHub перенести нагрузки в облако Azure, но проблемы с надёжностью сохраняются, тем более что у облака Microsoft в последнее время тоже есть проблемы с нехваткой вычислительных мощностей.

По некоторым данным, GitHub могут усилить за счёт облачных ресурсов AWS, хотя непонятно, идёт ли речь о временной мере для устранения экстренных проблем или о чём-то постоянном. По словам представителя GitHub, важно понимать контекст, поскольку сообщество растёт темпами, которые никогда раньше не наблюдались. Невероятный рост разработки агентных ИИ-решений с конца прошлого года оказал значительное давление на инфраструктуру компании. Чтобы удовлетворить спрос, происходит перенос сервисов в Azure, также изучается и мультиоблачная стратегия, позволяющая обеспечить мощности, необходимые в будущем.

Постоянный URL: http://servernews.ru/1143668
16.06.2026 [23:37], Владимир Мироненко

SpaceXAI купила Cursor за $60 млрд

Компания SpaceX/xAI подтвердила приобретение Anysphere, разработчика ИИ-инструмента для программирования Cursor, за $60 млрд, о котором договорилась в апреле. Тогда SpaceX получила опцион на покупку стартапа. Соглашение предусматривало выплату ему $10 млрд, если SpaceX решит отказаться от сделки.

О сделке SpaceX известила Комиссию по ценным бумагам и биржам США (SEC) спустя несколько дней после проведения первичного публичного размещения акций (IPO) на Nasdaq, в рамках которого она привлекла $85,7 млрд с оценкой её рыночной стоимости более чем в $2 трлн.

Как сообщает ресурс Investing.com, согласно соглашению о слиянии, подписанному 16 июня, дочерняя компания SpaceX под названием X67 Inc. объединится с Anysphere. Как ожидается, сделка будет завершена в сентябре, после чего Anysphere станет дочерней компанией SpaceX, находящейся в полной её собственности.

 Источник изображения: Fotis Fotopoulos/unsplash.com

Источник изображения: Fotis Fotopoulos/unsplash.com

Акционеры Anysphere получат обыкновенные акции класса А SpaceX в обмен на свои акции. Коэффициент конвертации будет основан на оценке стартапа в $60 млрд и средневзвешенной цене акций SpaceX за семь торговых дней до закрытия сделки. Как отметил ресурс CNBC, реализация сделки на этих условиях представляет собой размывание акционерного капитала на 3,4 % по сравнению с оценкой IPO.

Сделка позволит xAI, разработчику чат-бота Grok, с которым SpaceX объединилась в феврале, расширить свое присутствие на рынке программирования с использованием ИИ. Cursor используется крупными компаниями, включая Stripe, Adobe и NVIDIA. При этом глава NVIDIA Дженсен Хуанг (Jensen Huang), назвал его своим «любимым корпоративным сервисом ИИ».

Как сообщает Reuters, акции SpaceX выросли почти на 10 % на предрыночных торгах. В понедельник SpaceX с оценкой более $2,5 трлн вошла в число шести крупнейших компаний мира, опередив Broadcom, Saudi Aramco и Tesla, уступая лишь компании Amazon. А во вторник рыночная стоимость SpaceX превысила $2,7 трлн, что позволило ей опередить и Amazon.

Постоянный URL: http://servernews.ru/1143645
16.06.2026 [16:21], Сергей Карасёв

В Кембриджском университете запущен AMD-суперкомпьютер Zenith

В Кембриджском университете (University of Cambridge) в Великобритании состоялась церемония запуска высокопроизводительного вычислительного комплекса Zenith, предназначенного для научных исследований с использованием ИИ. Инвестиции в проект составили около £36 млн ($48,3 млн).

В создании суперкомпьютера приняли участие компании AMD и Dell Technologies. Полностью характеристики машины пока не раскрываются. Известно, что в её основу положены серверы PowerEdge, оборудованные процессорами AMD EPYC поколения Turin. Кроме того, задействованы ИИ-ускорители Instinct MI355X с 288 Гбайт памяти HBM3E (8 Тбайт/с).

Вместе с тем AMD, Dell и Кембриджский университет объявили о планах создания на территории Великобритании Лаборатории инноваций в области суверенного ИИ (Sovereign AI Innovation Lab — SAIL). Инициатива, как ожидается, позволит расширить доступ к передовой ИИ-инфраструктуре и НРС-ресурсам для исследователей, медицинских организаций, государственных учреждений и других участников отрасли.

На площадке SAIL компании смогут разрабатывать, оценивать и внедрять передовые технологии ИИ. Ключевой задачей SAIL названо формирование открытой ИИ-экосистемы на базе вычислительных платформ AMD, программного обеспечения AMD ROCm и облачных технологий. Отмечается, что благодаря появлению SAIL исследователи смогут масштабировать ИИ-решения с применением суверенной инфраструктуры, что ускорит инновации в таких областях, как здравоохранение, энергетика, экология, передовые инженерные разработки и пр.

 Источник изображения: University of Cambridge

Источник изображения: University of Cambridge

Одновременно AMD и Dell занимаются созданием ещё одного британского ИИ-суперкомпьютера — системы Sunrise. Этот проект финансируется Департаментом энергетической безопасности и достижения нулевого уровня выбросов (DESNZ) в составе Агентства по атомной энергии Великобритании (UKAEA).

Постоянный URL: http://servernews.ru/1143629
16.06.2026 [12:28], Руслан Авдеев

Турция вложится в ИИ, ЦОД, облака и обучение в рамках программы AI Action Plan

Президент Турции Реджеп Тайип Эрдоган (Recep Tayyip Erdoğan) анонсировал новую национальную программу развития ИИ в стране — AI Action Plan, сообщает Anadolu Agency (AA). В рамках нового плана Турция намерена привлечь не менее $10 млрд инвестиций, преимущественно частных, для развития индустрии ЦОД, облачных вычислений и ИИ-инфраструктуры. AI Action Plan держится на четырёх столпах: «изучать», «использовать», «создавать» и «управлять» ИИ. Каждое направление будет включать по четыре дополнительных комплекса мер.

Выступая на мероприятии Türkiye Artificial Intelligence Summit в Стамбуле, Эрдоган заявил, что Турция намерена увеличить установленные мощности национальных ЦОД не менее чем до 1 ГВт уже к 2030 году. По словам президента страны, на проекты, связанные с ИИ-индустрией, будет направлено не менее 2 % средств, выделяемых в Турции в рамках государственных инвестиционных программ.

 Источник изображения:  Enes Aktas/unsplash.com

Источник изображения: Enes Aktas/unsplash.com

Также президент анонсировал планы обеспечить гражданам доступ минимум к 2 тыс. датасетов при посредничестве Национальной библиотеки данных (National Data Library). В том числе речь идёт о наборах данных о здравоохранении, сельском хозяйстве, обороне и электронной коммерции. В рамках нового плана Турция обучит 10 тыс. высококвалифицированных ИИ-специалистов и 100 тыс. профессионалов по внедрению и использованию ИИ-решений. Во всей 81 провинции страны стартуют программы обучения ИИ-навыкам, в течении двух лет они помогут обучить 5 млн граждан. Новая программа рассчитана на то, чтобы правильное понимание ИИ получили люди всех возрастов и смогли безопасно использовать его.

Программы обучения ИИ весьма распространены в современном мире, правительства и отдельные корпорации активно вкладывают ресурсы в подготовку готовых к работе с искусственным интеллектом специалистов. Так, в апреле сообщалось, что японская NEC совместно при поддержке Anthropic займётся подготовкой ИИ-экспертов, в том же месяце появилась информация, что Meta бесплатно обучит американцев работе с ВОЛС для ускоренного развёртывания своих ЦОД.

В ноябре 2025 года сообщалось, что Google и Turkcell объединились для создания в Турции облачного региона и постройки первого ЦОД гиперскейл-класса.

Постоянный URL: http://servernews.ru/1143594
16.06.2026 [12:10], Руслан Авдеев

Австралийская SharonAI Holdings купит 40 тыс. ускорителей GB300 и поделится с NVIDIA выручкой от ИИ-облака

SharonAI Holdings заключила с NVIDIA стратегическое соглашение сроком на шесть лет для поддержки развёртывания ИИ-фабрики мощностью 72 МВт в Австралии. Договор позволяет SharonAI масштабировать свою облачную ИИ-платформу, использовав до 40 тыс. ускорителей NVIDIA GB300. Мощности рассчитаны на спрос со стороны корпоративных клиентов, ИИ-стартапов, университетов, госсектора и исследовательских структур, требующих суверенных вычислительных мощностей, сообщает Converge! Digest.

В основе сотрудничества — использование платформы для ИИ-фабрик NVIDIA DSX (на том же пакете технологий намерена строить ЦОД компания Helix Digital Infrastructure). Предусмотрено распределение средств, позволяющее ускорить развёртывание крупномасштабной ИИ-инфраструктуры. Sharon будет предоставлять облачные сервисы на основе продуктов NVIDIA, а последняя получит не только средства от продажи самих ускорителей и оборудования, но и долю «облачной» выручки. Это позволяет снизить капитальные затраты, одновременно расширяя доступ к передовым вычислительным ресурсам.

 Источник изображения: Jamie Davies/unsplash.com

Источник изображения: Jamie Davies/unsplash.com

По итогам соглашения общая мощность объектов Sharon AI вырастет до 132 МВт, 102 МВт уже законтрактованы будущими клиентами. Компания рассчитывает развернуть более 55 тыс. ускорителей NVIDIA к середине 2027 года. Она обладает статусом NVIDIA Cloud Partner и утверждает, что новое соглашение укрепит её позиции в формирующейся ИИ-экосистеме Австралии и поможет развитию ИИ-фабрик для коммерческих и государственных структур страны.

По словам Converge!, соглашение отражает растущий тренд, предусматривающий более тесную работу NVIDIA с облачными провайдерами и «неооблачными» компаниями для ускоренного развёртывания ИИ-инфраструктуры. Вместо того, чтобы просто полагаться на гиперскейлеров, NVIDIA всё чаще поддерживает проекты региональных ИИ-фабрик, создающихся для обеспечения суверенными мощностями правительств, коммерческих компаний, университетов и стартапов.

Примечателен масштаб планируемого проекта. Полностью укомплектованная экосистема на 40 тыс. GB300 может считаться одной из крупнейших в Азиатско-Тихоокеанском регионе. Более того, речь идёт об эволюции бизнес-моделей в сфере ИИ — поставщики оборудования стремятся участвовать в бизнесе, постоянно получая долю выручки от облачных сервисов, не ограничиваясь только продажей оборудования.

Постоянный URL: http://servernews.ru/1143588
16.06.2026 [10:00], SN Team

«Базис» и Т2 развернули первое в России импортонезависимое телеком-облако

«Базис», крупнейший российский разработчик ПО для управления динамической ИТ-инфраструктурой и Т2, российский оператор мобильной связи, запустили первое в стране телеком-облако отечественного производства. Теперь PCRF (функция правил политики тарификации) Т2 работает на базе отечественной платформы виртуализации Basis Dynamix.

Проект стартовал в середине 2025 года. Технические специалисты Т2 и «Базиса» интегрировали платформу Basis Dynamix с системами хранения данных и адаптировали гипервизор под кластерную архитектуру сетевых функций. Также команды оптимизировали ресурсоемкость решения: вместо стандартного развертывания выделенных модулей безопасности для каждого кластера, специалисты настроили единый узел защиты всего сайта. Это кратно снизило потребность Т2 в сетевом оборудовании.

После ухода с рынка иностранных вендоров рынок мобильных операторов лишился профильного инфраструктурного ПО. Т2 в течение нескольких лет проводила аудит рынка. При выборе решения оператор сделал ставку на производительность и отказоустойчивость ядра. Техническим фундаментом стала платформа Basis Dynamix. Гибкая архитектура решения позволила инженерам адаптировать процессы под требования телеком-инфраструктуры и напрямую интегрировать специфические механизмы управления трафиком, необходимые для стабильной работы мобильной сети.

 Источник изображения: «Базис» / Денис Насаев

Источник изображения: «Базис» / Денис Насаев

В 2026 году «Базис» завершит подготовку инфраструктуры еще в 10 вычислительных центрах Т2 — это позволит оператору масштабировать работу функции PCRF на все регионы присутствия. Созданная технологическая база даст возможность поэтапно перевести остальные сетевые компоненты на отечественное ПО в соответствии с требованиями регулятора.

«До старта этого проекта на российском рынке отсутствовал практический опыт применения отечественных enterprise-платформ в качестве телеком-облака. Требования операторов связи в корне отличаются от запросов корпоративного бизнеса. Нам пришлось обеспечить полное резервирование всех без исключения компонентов и интегрировать специализированные механизмы аппаратного ускорения трафика. Совместно с инженерами Т2 мы фактически переизобрели архитектуру развертывания нашей платформы, найдя баланс между строгими требованиями ИБ и необходимостью экономии аппаратных ресурсов под узлы управления», — прокомментировал коммерческий директор «Базиса» Иван Ермаков.

«Исторически мы решали инфраструктурные задачи покупкой комплексных узлов связи, но сегодня перешли к самостоятельному построению ИТ-ландшафта на базе независимых программных компонентов. Главным вызовом стала оптимизация нового программного стека: нам потребовалось достичь высоких показателей производительности сети при рациональном использовании аппаратных ресурсов. За несколько лет мы провели масштабную ревизию архитектурных стандартов и в ходе проекта совместно с вендором эффективно адаптировали платформу под нужды бизнеса. Успешный запуск в Санкт-Петербурге доказал надежность выбранного нами подхода», — отметил заместитель генерального директора по технической инфраструктуре Т2 Алексей Дмитриев.

Постоянный URL: http://servernews.ru/1143560
15.06.2026 [18:20], Андрей Крупин

МТС вложит 1 млрд рублей в модернизацию ядра сети ШПД и установку маршрутизаторов собственной разработки

Компания «Мобильные ТелеСистемы» инвестирует в 2026–2027 гг. 1 млрд руб. в проект модернизации и расширения ядра транспортной сети фиксированного интернета в России.

Реализуемый МТС проект предполагает постепенный вывод из эксплуатации иностранного сетевого оборудования и его замену сервисными маршрутизаторами МТС-BNG (Broadband Network Gateway) собственной разработки, построенными на базе архитектуры х86 и в зависимости от характеристик и конфигурации обеспечивающие пропускную способность от 40 до 200 Гбит/с. Решение устанавливается на ядре сети провайдера и выполняет функции аутентификации, авторизации и учёта (ААА) для пользователей широкополосного доступа в интернет, а также управляет трафиком и качеством обслуживания (QoS).

В начале 2025 года компания получила на свой сервисный маршрутизатор МТС-BNG сертификат соответствия в области связи и на сегодня вывела в эксплуатацию первые комплекты оборудования в 22 регионах России. Внутри МТС организована структура технической поддержки нового оборудования, обучены сотрудники служб развития и эксплуатации.

 Сервисный маршрутизатор МТС-BNG (источник изображения: bng.mts.ru)

Сервисный маршрутизатор МТС-BNG (источник изображения: bng.mts.ru)

На новом этапе проекта модернизации и расширения пропускной способности ядра сети ШПД и стыка между магистральной и фиксированными сетями МТС планирует установить до конца 2027 года собственные сервисные маршрутизаторы ещё в 26 регионах, включая партию устройств на сети инфраструктурного оператора МГТС, дочерней компании МТС.

Постоянный URL: http://servernews.ru/1143552
15.06.2026 [16:47], Владимир Мироненко

ByteDance ведёт переговоры о покупке китайских ИИ-ускорителей Iluvatar CoreX и Baidu

ByteDance, материнская компания TikTok, ведёт переговоры с шанхайской компанией Iluvatar CoreX о покупке ИИ-чипов, сообщило агентство Reuters со ссылкой на источники. В случае достижения договорённости, Iluvatar CoreX станет третьим крупным отечественным поставщиком GPU для ByteDance после Huawei и Cambricon, отметили источники агентства.

По их данным, в этом году Iluvatar CoreX поставит ByteDance не менее 50 тыс. чипов, и большая часть из них будет использоваться для задач инференса, поскольку ByteDance стремится расширить клиентскую базу своего ИИ-чат-бота Doubao. Впрочем, переговоры ещё не завершены и окончательные условия сделки могут измениться. Кроме того, по данным источников Reuters, ByteDance, также рассматривает возможность использования ускорителей Baidu Kunlunxin. Раннее стало известно о разработке ByteDance собственных ИИ-чипов и закупке миллионов ИИ ASIC Qualcomm.

По словам одного из источников, чипы Kunlunxin уже используются Tencent Cloud. Публикация агенства о возможных сделках в Китае свидетельствует о том, что выпуск китайскими производителями ИИ-чипов набирает обороты. Этому способствует поддержка властями использования разработанных на местном уровне чипов для повышения самодостаточности на фоне экспортного контроля США над передовыми чипами. Китайские производители GPU и чипов для ИИ в прошлом году заняли почти 41 % китайского рынка ИИ-серверов, на котором некогда доминировала NVIDIA. Рыночная доля американской компании в Китае, одном из важнейших для неё рынков, упала до нуля, утверждает глава NVIDIA Дженсен Хуанг (Jensen Huang).

 Источник изображения: Iluvatar CoreX

Источник изображения: Iluvatar CoreX

До сих пор Iluvatar CoreX в основном поставляла чипы для государственных закупок, сообщил один из источников. Поэтому сделка с ByteDance, одной из крупнейших китайских технологических компаний и крупным инвестором в ИИ-инфраструктуру, крайне важна для неё. Iluvatar CoreX вышла на Гонконгскую биржу в январе этого года.

Её выручка в 2025 году составила ¥1 млрд ($148 млн), причём около 90 % продаж пришлось на GPU. Согласно информации на сайте компании, чипы серии Tiangai предназначены для ИИ-обучения, а чипы серии Zhikai — для задач инференса. По прогнозам Huatai Securities, выручка Iluvatar CoreX в этом году достигнет ¥3,04 млрд ($449,8 млн), а общий объём поставок превысит 100 тыс. чипов (рост год к году — на 139 %). По оценкам аналитиков, средняя цена чипов Zhikai составляет ¥12 тыс. ($1775)/шт.

Постоянный URL: http://servernews.ru/1143549
15.06.2026 [13:47], Владимир Мироненко

Pinterest заключила с AWS самую крупную инфраструктурную сделку, планируя потратить $4 млрд на облачные сервисы, Graviton и Trainium

Фотохостинг Pinterest объявил о значительном расширении сотрудничества с AWS, начавшемся в 2010 году. Согласно новому соглашению, Pinterest выплатит AWS в период до 2031 года $4 млрд за использование её сервисов, что является крупнейшим инфраструктурным проектом в истории Pinterest.

В рамках расширенного соглашения Pinterest планирует диверсифицировать использование инфраструктуры AWS для поддержки растущих потребностей в ИИ, одновременно улучшая соотношение цены и производительности. В частности, компания планирует использовать ускорители AWS Trainium для размещения и запуска больших языковых моделей и моделей визуального и языкового анализа, которые обеспечивают персонализированный визуальный поиск и поиск с помощью ИИ. Также Pinterest намерена расширить использование Arm-процессоров Graviton, которые уже обеспечивают работу примерно трети её вычислительной инфраструктуры, для запуска большего количества систем, поддерживающих поиск контента для пользователей фотохостинга, ежемесячная аудитория которого превышает 600 млн.

 Источник изображения: Amazon

Источник изображения: Amazon

«Это расширенное соглашение с AWS дает нам гибкость в вычислениях, возможность выбора оборудования и эффективность инфраструктуры для ускорения нашего видения ИИ для следующего поколения визуального поиска в Pinterest», — сообщил Мэтт Мадригал (Matt Madrigal), технический директор Pinterest. В рамках соглашения Pinterest также планирует продолжить модернизацию инфраструктуры, переходя от традиционных сред на основе EC2 к архитектуре на основе Kubernetes в EKS. Это позволит повысить скорость разработки, а также операционную надёжность и эффективность инфраструктуры глобальной платформы Pinterest.

Ранее Amazon заключила соглашение о стратегическом партнёрстве с OpenAI, в рамках которого инвестирует в OpenAI $50 млрд. В свою очередь, OpenAI обязалась использовать около 2 ГВт мощностей на базе ускорителей Trainium, включая Trainium3 и чипы следующего поколения Trainium4, которые появятся в 2027 году. Ещё одно крупное соглашение подписано с Anthropic. Также у Amazon есть соглашение с Snowflake, которая планирует потратить в течение пяти лет $6 млрд на инфраструктурные проекты, в том числе на Graviton и ИИ-ускорители. Кроме того, Uber объявила этой весной о планах перенести определённые нагрузки на чипы Graviton и Trainium нового поколения, а Meta получит «десятки миллионов» ядер Graviton5.

Постоянный URL: http://servernews.ru/1143542

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;