Материалы по тегу: ии

19.06.2026 [19:34], Владимир Мироненко

«Логарифмический» ИИ-ускоритель Tensordyne Napier обещает выскоую производительность при минимальном энергопотреблении

ИИ-стартап Tensordyne (ранее Recogni) анонсировал платформу Tensordyne Napier (TDN) для ИИ-инференса, разработанную в партнёрстве с Broadcom и HPE Juniper Networks, которая «сочетает в себе инновационные логарифмические математические вычисления в области ИИ, тесно интегрированную архитектуру памяти и высокопроизводительный масштабируемый интерконнект, обеспечивая существенно более высокую пропускную способность, меньшее энергопотребление и улучшенную экономику инфраструктуры для крупномасштабных задач ИИ-инференса».

По словам Tensordyne, новый «логарифмический» чип позволит решить, как проблему скорости, так и стоимости ИИ-инференса. В нём компания заменила крупномасштабные операции умножения упрощёнными вычислениями на основе сложения, значительно повысив эффективность на Вт. Сумматоры меньше размером и как правило потребляют меньше энергии, чем умножители, поэтому их использование обеспечит больше полезной площади для SRAM и лучшую сбалансированность системы.

 Источник изображений: Tensordyne

Источник изображений: Tensordyne

Чип включает 138 млрд транзисторов и поддерживает обработку данных в режимах NVFP4, FP8 и FP16. Tensordyne сообщила о 2,1 Пфлопс в формате плотных вычислений FP8 на кристалл. Частота ядра ускорителя составляет 1,33 ГГц, поддерживающих ядер RISC-V — 1,5 ГГц. Чип получил четыре блока HBM4 (по данным ServeTheHome — HBM3E), каждый по 36 Гбайт (144 Гбайт в сумме) с пропускной способностью 4,7 Тбайт/с. Также на чипе размещено 256 Мбайт SRAM с суммарной пропускной способностью 40 Тбайт/с. Интеграция значительного объёма быстрой SRAM с HBM позволила минимизировать циклы простоя вычислений и обеспечить эффективную поддержку выполнения самых больших моделей в отрасли.

Как рассказал ресурсу The Next Platform Р.К. Ананд (RK Anand), сооснователь и директор по продуктам Tensordyne, ускоритель имеет 48 ядер, которые связаны с блоками обработки векторов. В векторном блоке тоже есть ALU, но он также может использовать таблицу поиска (LUT) и работать полностью параллельно. В целом доступны чередование операций и управляемый конвейер. По словам Ананд, Napier потребляет всего 300 Вт по сравнению с 1200-Вт NVIDIA B300, поскольку новый чип довольно компактен. Ананд не уточнил, состоит ли чип Napier из чиплетов или представляет собой монолитный кристалл.

Девять чипов TDN могут размещаться в 1U-узле, в котором установлен 40-ядерный процессор Xeon для управления хостом и выполнения некоторых задач декодирования, а также 8-Тбайт NVMe SSD. Узел имеет два 200GbE-порта QSFP, а на задней панели расположены шесть портов для фирменного интерконнекта TDNLink, используемого для соединения 72 чипов TDN. Узел обеспечивает 19 Пфлопс в режиме FP8, 1,3 Тбайт HBM и 2,25 Гбайт SRAM с агрегированной пропускной способностью 42 Тбайт/с и 360 Тбайт/с соответственно. Узлы Napier, подобно NVIDIA NVLink, соединены через объединительную плату посредством проприетарного интерконнекта TDNLink. Суперускоритель TDN72 объединяет 72 чипа TDN (восемь узлов), причём TDNLink способен обеспечить задержку менее микросекунды между чипами при пропускной способности 1 Тбайт/с.

TDN72 ориентирован на модели с количеством параметров от 10 до 20 трлн, для работы с которыми важны объём памяти и MoE-маршрутизация. «В каждом TDN72 у нас 320 ядер Xeon и 4608 ядер RISC-V», — отметил сооснователь и вице-президент Tensordyne Жиль Бакхус (Gilles Backhus). «Мы применяем двухуровневый подход к решению проблемы с CPU. Вся работа, выполняемая непосредственно вблизи вычислительных процессов ИИ в рамках цикла обработки токенов и авторегрессионного цикла LLM, в основном проводится на ядрах RISC-V. Здесь же осуществляется маршрутизация MoE, проверка по словарю для отбрасывания определённых токенов и т.д. Прочая обработка данных для инференса происходит на процессорах Intel Xeon».

Четыре TDN72 помещаются в стандартную 52U-стойку Tensordyne Napier, что даёт 608 Пфлопс (FP8), 42 Тбайт HBM, 74 Гбайт SRAM, 256 Тбайт NVMe SSD, 275-Тбайт/с соединение TDNLink и 64 порта 200GbE. При этом такая стойка потребляет всего 120 кВт и может обходиться воздушным охлаждением. Как сообщила компания, стойка Tensordyne Napier обеспечивает по сравнению с полноразмерной стойкой NVIDIA NVL72:

  • В 17 раз больше токенов на ватт;
  • В 13 раз больше токенов в секунду;
  • Дополнительный доход до $33 млн/год на стойку.

Система поддерживает дезагрегированное обслуживание и выполнение моделей с многотриллионными параметрами со скоростью более 1000 токенов в секунду на пользователя. Для достижения той же пропускной способности потребовалось бы как минимум девять стоек NVIDIA Rubin + Groq LPX, отметила Tensordyne.

Самой сложной составляющей запуска платформы может стать ПО. Tensordyne сообщила о выпуске на платформе Hugging Face центра моделей со своим SDK, прямой компиляцией моделей для PyTorch/Triton и кастомным eDSL для Python. Следует отметить, что одним из важных преимуществ ускорителей NVIDIA является экосистема CUDA — огромная база фреймворков, ядер, инструментов профилирования, шаблонов развёртывания и моделей поведения разработчиков. Любой новый ИИ-ускоритель должен сопровождаться достаточно простым ПО, чтобы клиенты захотели его внедрять в своих системах.

Постоянный URL: http://servernews.ru/1143813
19.06.2026 [14:01], Руслан Авдеев

Rackspace развернёт ИИ-оборудование AMD на 30 МВт в ЦОД по всему миру

Компании AMD и Rackspace Technology подписали соглашение, посвящённое внедрению первых 30 МВт ИИ-оборудования на основе чипов AMD. Оно будет использоваться в дата-центрах Rackspace по всему миру. Внедрение начнётся в конце текущего года и продлится до 2028-го. В рамках нового соглашения AMD становится стратегическим поставщиком чипов для реализации ИИ-стратегии Rackspace.

Для поддержки обучения ИИ-моделей, инференса и корпоративных нагрузок будут использоваться ИИ-ускорители AMD Instinct, включая модели MI355X, MI350P и чипы будущих поколений, а также серверные процессоры семейства AMD EPYC. Соглашение также предусматривает совместную деятельность по освоению рынков. Компании выделят маркетинговые ресурсы и персонал для разработки и продвижения предложений на базе инфраструктуры AMD — для клиентов из регулируемых отраслей.

После полного внедрения экосистема мощностью 30 МВт обеспечит вычислительные ресурсы для корпоративных пользователей, включая организации из сферы здравоохранения и прочие компании из регулируемых секторов. В Rackspace сообщают, что соответствующая инфраструктура необходима для поддержки масштабных ИИ-инициатив в медицине, для инференса и выполнения других задач, требующих администрирования, отчётности и операционного надзора.

 Источник изображения: AMD

Источник изображения: AMD

Компании рассчитывают интегрировать аппаратный стек AMD в архитектуру Enterprise AI Cloud компании Rackspace. Платформа будет автоматически подбирать вычислительные ресурсы под конкретные нагрузки, в то же время обеспечивая централизованное управление и оперативный учёт работы всей инфраструктуры.

По словам Rackspace, регулируемые отрасли требуют полностью управляемой инфраструктуры, а не подборки решений от независимых вендоров. Сотрудничество позволит объединить вычислительные мощности и операционные сервисы в одну управляемую экосистему, с ответственностью от аппаратного уровня до конечных бизнес-результатов. В AMD подчеркнули, что корпоративные проекты всё чаще требуют комбинации вычислительных ресурсов, использующих как классические аппаратные решения, так и ИИ-ускорители для разных типов нагрузок.

Предполагается, что проект ускорит запуск сервисов, предусмотренных меморандумом о взаимопонимании, подписанным ранее:

  • Enterprise AI Cloud — корпоративное облако для разработки, обучения и эксплуатации ИИ-систем в управляемой среде;
  • Enterprise Inference Engine — корпоративная платформа для инференса и обслуживания ИИ-моделей;
  • IaaS и Bare Metal с AMD Instinct.

В целом решения формируют управляемый инфраструктурный ИИ-стек от выделенных физических серверов до полностью обслуживаемых сервисов инференса. Компании позиционируют инициативу, как альтернативу традиционным «самоуправляемым» ИИ-кластерам на базе bare-metal серверов. Основная аудитория — компании, переходящие от пилотных ИИ-проектов к полномасштабному внедрению ИИ и агентных рабочих процессов в ключевые бизнес-системы.

Постоянный URL: http://servernews.ru/1143823
19.06.2026 [13:49], Владимир Мироненко

Amazon начала переговоры о продаже своих ИИ-ускорителей Trainium сторонним ЦОД

Amazon ведёт переговоры о продаже своих ИИ-ускорителей Trainium другим компаниям для использования в их ЦОД. Об этом сообщил Питер ДеСантис (Peter DeSantis), старший вице-президент по ИИ, разработке чипов и квантовым вычислениям Amazon, выступая на конференции VivaTech в Париже (Paris, Франция), о чём пишет Bloomberg. Он отказался назвать потенциальных клиентов, лишь отметив растущий за пределами США спрос на вычислительные ресурсы, управляемые локально.

Как сообщается, переговоры о продаже чипов находятся на ранней стадии. Начались они после ежегодного послания генерального директора Amazon Энди Джасси (Andy Jassy) акционерам в апреле, в котором он заявил, что Amazon рассматривает возможность продажи собственных ИИ-чипов сторонним компаниям, что усилит конкуренцию с NVIDIA и AMD. ДеСантис также рассказал, что решение о продаже чипов не вызывает у руководства Amazon опасений, что это ударит по доходам AWS от облачных сервисов. «В сфере ИИ наблюдается огромный дефицит ресурсов, — сказал он. — Меня это не беспокоит».

 Источник изображения: Amazon

Источник изображения: Amazon

Рост спроса, особенно в Европе, привёл к призывам уменьшить зависимость от американских технологий или полностью отказаться от них. Комментируя призывы, ДеСантис заявил, что бизнес AWS никак не пострадал от этой тенденции. По его словам, ускорители Trainium3, поставки которых начались в начале этого года, «в значительной степени распроданы», и уже есть большой интерес к новому поколению Trainium4, которое, как ожидается, дебютирует в следующем году.

ДеСантис также отметил высокий спрос на Arm-процессоры Graviton, которые в больших масштабах будут использовать Meta, Pinterest, Snowflake и Uber. За последние три года, по словам Десантиса, Amazon добавила в свои вычислительные системы больше процессоров Graviton, чем любого другого типа чипов. Что касается Trainium, то у Amazon есть очень крупные контракты с Anthropic и OpenAI. Вместе с тем в качестве альтернативы GPU NVIDIA компания будет предлагать не только свои ускорители, но и царь-чипы Cerebras.

 Источник изображения: Amazon

Источник изображения: Amazon

Как сообщает TechCrunch, AWS до сих пор не спешила с продажей своих ИИ-чипов по многим причинам. Самая главная заключается в том, что прибыль, которую она получает от них, имеет каскадный характер. Хотя AWS взимает плату с клиентов за токены ИИ, обрабатываемые этими чипами в её облаке, она также может взимать плату за множество других услуг, необходимых компаниям для их ИИ-приложений, включая хранение данных, безопасность, сетевые услуги и мониторинг.

Таким образом, число компаний, желающих занять долю рынка ИИ-ускорителей, на котором доминирует NVIDIA, продолжает увеличиваться. Напомним, что в апреле генеральный директор Alphabet Сундар Пичаи (Sundar Pichai) заявил, что Google начнёт поставлять TPU «избранной группе клиентов» для использования в их собственных ЦОД. Немалая часть из них достанется Anthropic. При этом важно отметить, что, как и в случае с AWS, Google является не только поставщиком, но и инвестором ИИ-стартапа.

Постоянный URL: http://servernews.ru/1143789
19.06.2026 [13:47], Руслан Авдеев

Alibaba Cloud делает ставку на развитие во Франции, а Европа желает получить больше контроля над ИИ-инфраструктурой

Пока Alibaba Cloud принимает меры по укреплению своих позиций на французском рынке, запуская в стране облачный регион, Евросоюз пытается расширить контроль над ИИ-инфраструктурой в регионе, сообщает Tech Republic. В Европе Alibaba Cloud действует с 2016 года. У компании есть мощности в Германии и Великобритании, но запуск во Франции дополнительно укрепляет присутствие китайского облачного гиганта на одном из крупнейших корпоративных рынков Евросоюза. Новый облачный регион увеличит глобальное присутствие компании до 105 зон доступности в 32 локациях.

Alibaba запустила свой первый облачный регион на территории Франции, организовав две зоны доступности в Париже для европейского бизнеса, нуждающегося в локальном размещении данных и цифровом суверенитете в сфере ИИ. Расширение китайского бизнеса обеспечит европейским структурам доступ к ещё одному облачному провайдеру в регионе — на фоне повышенного внимания местных регуляторов к обретению цифрового суверенитета, обеспечению кибербезопасности и устойчивости облачных систем.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Во II полугодии Alibaba Cloud намерена предложить европейским клиентам сервисы агентного ИИ, в том числе AgentRun, STAROps, ACS Agent Sandbox с аппаратной изоляцией агентов, Agent Security Center, AI Security Guardrails 2.0 и Agentic SOC (автоматизированный ответ на угрозы и аудит замкнутого цикла). Впрочем, и традиционные решения — вычисления, хранение данных, контейнеризация, сетевые сервисы, средства обеспечения безопасности, базы данных, инструменты для разработчиков и др. — не будут обойдены вниманием.

Компания позиционирует регион во Франции как решение, созданное с учётом европейских требований и стандартов. Ввод региона в эксплуатация совпадает с более широкими европейскими техническим инициативами. Так, 3 июня Еврокомиссия представила пакет мер по обеспечению технологического суверенитета, способствующий обеспечению цифровой независимости Евросоюза и укреплению его позиций в сфере ИИ. Кроме того, в рамках европейского закона Cloud and AI Development Act нехватака мощностей ЦОД называются одним из рисков для успешной цифровой трансформации Европы. В апреле Еврокомиссия выбрала поставщиков суверенных облачных услуг, которые разделят €180 млн.

Топ-менеджерам компаний, ответственным за IT-составляющую, предстоит выяснить, какая часть их инфраструктуры останется в пределах Европы, и какие поставщики сервисов соответствуют как техническим, так и нормативным требованиям. Запуск региона Alibaba Cloud расширяет выбор, но компаниям всё равно придётся уделить немало внимания вопросам управления, обеспечения безопасности и трансграничной передачи данных. Впрочем, смена американских гиперскейлеров на китайских вряд ли поможет укреплению суверенитета.

Постоянный URL: http://servernews.ru/1143809
18.06.2026 [13:26], Сергей Карасёв

В Италии запущены квантовые компьютеры Nox и Sol, которые дополнят суперкомпьютер Leonardo

Европейское совместное предприятие по развитию высокопроизводительных вычислений (EuroHPC JU) объявило о запуске квантового компьютера Sol, смонтированного на площадке суперкомпьютерного центра Cineca в Болонье (Италия). Система предоставит европейским пользователям новые инструменты для решения задач в области ИИ, НРС и квантовых технологий.

Компьютер Sol, спроектированный компанией Pasqal, основан на нейтральных атомах. На первом этапе система будет использовать как минимум 140 кубитов в аналоговом режиме. На 2027 год запланировано обновление комплекса, включающее переход на гибридную аналогово-цифровую модель: предполагается, что это расширит сферу применения устройства.

Квантовая платформа Sol интегрирована с итальянским суперкомпьютером Leonardo. Благодаря этому возможна организация квантово-классических вычислений для решения сложных задач, с которыми не в состоянии справиться традиционные суперкомпьютеры. При этом сама платформа Leonardo получила расширение LISA (Leonardo Improved Supercomputing Architecture) — это специальный раздел, оптимизированный для ИИ-нагрузок. Вычислительный блок, поставленный компанией Bull, объединяет 166 серверов, каждый из которых несёт на борту восемь ИИ-ускорителей на базе GPU (в сумме 1328 чипов).

 Источник изображения: Pasqal

Источник изображения: Pasqal

Кроме того, в Италии введён в строй квантовый компьютер Nox с 54 кубитами. Эта машина использует сверхпроводящую систему Radiance компании IQM. Как и Sol, комплекс Nox будет функционировать в связке с Leonardo, поддерживая гибридные квантово-классические вычисления.

Реализация проектов по развёртыванию новых систем осуществлялась при финансовой поддержке Министерства просвещения, университетов и научных исследований Италии (MUR), Национального исследовательского центра Италии в области высокопроизводительных вычислений, больших данных и квантовых вычислений (ICSC), а также Европейского союза (через EuroHPC JU).

Постоянный URL: http://servernews.ru/1143732
18.06.2026 [13:21], Руслан Авдеев

Боевой Grok: Минюст США попросил суд отклонить иск экологов к xAI, ссылаясь на угрозу национальной безопасности

Министерство юстиции США попросило федеральный суд отклонить иск, в котором утверждается, что дата-центры xAI загрязняют окрестности Мемфиса (Memphis, Теннесси), нанося ущерб местным жителям. Компанию обвиняют в нелегальном использовании десятков газовых турбин, сообщает Datacenter Dynamics.

Местная правозащитная организация NAACP и прочие группы утверждают, что компания, влившаяся в SpaceX, не смогла получить разрешение на эксплуатацию своей импровизированной электростанции. Тем временем Минюст США заявил, что она является «критически важной для экономики и вооружённых сил страны». В ходатайстве министерства заявляется, что NAACP угрожает национальной, экономической и энергетической безопасности США, пытаясь нарушить энергоснабжение инновационной ИИ-инфраструктуры, «поддерживающей военные операции Министерства войны».

Также, по словам представителя военных, дальнейшая работоспособность Grok — вопрос первостепенной национальной безопасности. Сообщается, что Grok Gov Model обеспечивает функции, «которых нет ни у одной иной передовой ИИ-модели». Кроме того, в ходе конфликта между США и Ираном якобы именно эта модель помогла в проведении атак.

xAI применяет турбины для питания кампусов ЦОД Colossus 1 и Colossus 2, последний используется для обеспечения работы Grok, а также некоторых сервисов Google, тогда как первый применяется компанией Anthropic, которую Пентагон уже называла «риском для цепочек поставок».

 Источник изображения: Jonathan Saleh/unsplash.com

Источник изображения: Jonathan Saleh/unsplash.com

В NAACP неоднократно заявляли, что газовая электростанция при Colossus выбрасывает загрязняющие вещества в значительных объёмах, в т.ч. оксиды азота (NOx) и формальдегид, повышающие риски астмы, респираторных заболеваний, сердечно-сосудистых болезней и некоторых видов рака. Негативно влияют на здоровье и мелкодисперсные частицы PM2.5. NCAAP говорит, что иски граждан являются фундаментальным механизмом привлечения к ответственности компаний, загрязняющих окружающую среду, и организация продолжит «защищать демократию и противостоять федеральному давлению и авторитаризму».

В своё время xAI воспользовалась лазейкой в законе Clean Air Act для запуска 35 турбин без разрешения на год, но в прошлом году местные регуляторы, наконец, разрешили эксплуатацию 15 турбин до 2027 года. Тем временем NAACP утверждает, что xAI незаконно установила и использует на объекте в Саутхейвене (Southaven) уже 57 турбин. В том же районе планируется и строительство третьего кампуса ЦОД.

По словам юристов агентства Earthjustice, представляющих интересы местных активистов, действия Министерства юстиции — отчаянная попытка защитить богатые технокомпании от необходимости соблюдать законы, призванные защищать людей от загрязнений окружающей среды. Заявляется, что компанию Илона Маска (Elon Musk) защищают от ответственности за незаконные загрязнения и ради этого хотят лишить полномочий местные сообщества, суды и даже Конгресс.

Datacenter Dynamics отмечает, что в ходе избирательной компании 2024 года Илон Маск потратил на поддержку президента США Дональда Трампа и связанных с ним членов Республиканской партии $288 млн. Он даже временно работал советником Белого дома в рамках инициативы DOGE. В июне Маск стал первым в мировой истории долларовым триллионером благодаря чрезвычайно удачному IPO SpaceX. Впрочем, последняя настаивает, что полностью соблюдает действующее законодательство.

Постоянный URL: http://servernews.ru/1143734
18.06.2026 [01:45], Владимир Мироненко

NVIDIA стала лидером во всех тестах MLPerf Training 6.0

Консорциум MLCommons опубликовал результаты тестирования различных аппаратных решений в бенчмарке MLPerf Training 6.0. В нём появилось два новых теста — DeepSeek V3 и GPT-OSS 20B, что подчёркивает общеотраслевой переход к разреженным вычислениям, примером которого является архитектура MoE (Mixture-of-Experts).

DeepSeek V3 — крупномасштабная MoE-модель c 671 млрд параметров, из которых 37 млрд активируются для генерации отдельного токена. Она предоставляет стандартизированную платформу для оценки эффективности обучения ведущей модели MoE с открытыми весами. GPT-OSS 20B — MoE-модель c 21 млрд параметров, из которых 3,6 млрд активируются для генерации одного токена. Она позволяет организациям оценивать сложную логику маршрутизации и шаблоны разреженных вычислений, характерные для архитектуры MoE, на аппаратных конфигурациях размером всего в один узел с восемью ускорителями.

Версия MLPerf Training 6.0 установила новые рекорды по разнообразию представленных систем. Участники выложили результаты 95 уникальных систем, использующих тринадцать различных аппаратных ускорителей, 19 различных хост-процессоров и несколько различных программных фреймворков. 60 % систем были многоузловыми. При этом количество представленных облачных систем более чем вдвое больше, чем в раунде 5.1.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

В раунде MLPerf Training v6.0 представлены заявки от 24 организаций: AMD, ASUSTeK, Azure, Cisco, CoreWeave, Dell, Fujitsu, GigaComputing, Google, HPE, Inventec, Krai, Lambda, MITAC, Nebius, Netweb Technologies India, NVIDIA, Oracle, Quanta Cloud Technologies, SCITIX, Supermicro, tinycorp, TTA и Vultr. «Мы особенно рады приветствовать участников, впервые представляющих свои результаты в MLPerf Training: Inventec, Netweb Technologies India, TTA и Vultr», — сообщил Дэвид Кантер (David Kanter), руководитель MLPerf в MLCommons.

NVIDIA вновь стала лидером в новом раунде MLPerf Training, причём во всех тестах, в очередной раз став единственной платформой, которая предоставила результаты по всем тестам. Также NVIDIA была единственной платформой, представившей результаты по новым тестам, при этом система NVIDIA GB300 NVL72 «установила планку производительности благодаря оптимизированным программным стекам NVIDIA и конструкции, объединяющей 72 GPU Blackwell Ultra и 36 CPU Grace с использованием NVLink и NVLink Switch».

В нескольких случаях партнёры NVIDIA масштабировали систему до 8192 ускорителей Blackwell, работающих согласованно в различных ЦОД. Эти результаты подтвердили реальную надёжность платформы Blackwell в масштабируемых кластерных средах, говорит NVIDIA.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Для достижения максимальной производительности таких моделей, как DeepSeek-V3, NVIDIA в этом раунде MLPerf Training применила несколько программных оптимизаций, включая использование итерационных графов CUDA для MoE без удаления токенов, применение CuTe DSL для продвинутых операций слияния ядер, алгоритм внимания MXFP8 для повышения производительности без ущерба для качества модели, оптимизацию маршрутизатора и оптимизацию схемы коммуникации 1F1B all-to-all overlap. Также NVIDIA оптимизировала компоновку и баланс параллельных этапов конвейера, минимизируя структурное простаивание.

Для обработки DeepSeek-V3 671B компания NVIDIA использовала до 8192 GPU в системах GB200 NVL72, что стало самым масштабным результатом на основе Blackwell в MLPerf Training на сегодняшний день. NVIDIA также представила результаты на 5120 GPU с системами NVIDIA GB200 NVL72 в Llama 3.1 405B, одной из самых крупных LLM плотной архитектуры в этом бенчмарке.

Результаты этого раунда также отражают тесное сотрудничество NVIDIA с компаниями-партнёрами в области системной архитектуры, сетей и ПО. Например, Microsoft Azure масштабировала обучение Llama 3.1 405B до 8192 GPU, используя системы GB200 NVL72, и достигла целевого эталонного значения за 7,07 мин., что является самым быстрым временем обучения для этого бенчмарка. А CoreWeave показала самое быстрое время обучения для DeepSeek-V3 671B, достигнув целевого качества за 2,02 мин. на 8192 GPU в составе GB300 NVL72, объединённых Spectrum-X Ethernet.

Постоянный URL: http://servernews.ru/1143702
17.06.2026 [11:53], Руслан Авдеев

Недовольные инвесторы подали иск против Microsoft, а GitHub не прочь обратиться к ресурсам AWS — всё из-за ИИ

Microsoft столкнулась со связанными с ИИ проблемами на разных фронтах. Во-первых, недовольные инвесторы подали иск в суд, поскольку компания, предположительно, ввела их в заблуждение относительно показателей Copilot, во-вторых, принадлежащая ей платформа GitHub столкнулась с проблемами масштабируемости, вызванными повсеместным внедрением ИИ и, возможно, обратится за облачными ресурсами к AWS, сообщает The Register.

Пенсионная система полиции и пожарной службы города Сент-Клер-Шорс (St. Clair Shores Police and Fire Retirement System) подала иск в федеральный окружной суд Сиэтла, в котором утверждает, что Microsoft, включая её главу Сатью Наделлу (Satya Nadella), сделали «в значительной степени ложные и/или вводящие в заблуждение» заявления относительно успехов внедрения технологии Copilot.

В иске утверждается, что собственная флагманское ИИ-решение компании в бенчмарках по многим параметрам оказалась значительно хуже конкурентов, и у Microsoft не получилось перевести на платную версию ИИ-помощника значимую часть пользователей коммерческого варианта Microsoft 365. При этом Copilot уступил долю рынка продуктам конкурентов, и соответствующая тенденция только усиливалась.

Некоторые организации всё же активно внедряют Copilot, но, как утверждается в иске, проблемы, связанные с разработкой и внедрением помощника Copilot и собственных ИИ-моделей недостаточно ясно раскрываются в документах, поданных в Комиссию по ценным бумагам и биржам США (SEC).

 Источник изображения: Sasun Bughdaryan/unsplash.com

Источник изображения: Sasun Bughdaryan/unsplash.com

В конце января Microsoft отчиталась о результатах II квартала своего финансового года. Выяснилось, что рост Azure замедлился, а число платных пользователей Microsoft 365 составило лишь 15 млн из 450 млн пользователей всего. В иске утверждается, что после публикации этих данных акции компании упали в цене более чем на $48, приблизительно на 10 %. В самой Microsoft назвали претензии необоснованными и намерены защищать свою позицию в суде.

Тем временем принадлежащей ей площадке GitHub, возможно, придётся обратиться за помощью к конкуренту — облачному гиганту AWS из-за проблем с надёжностью и масштабируемостью. Купленный в 2018 году сервис всё чаще испытывает проблемы с доступностью на фоне роста числа рабочих процессов, поддерживаемых ИИ. Уже была попытка GitHub перенести нагрузки в облако Azure, но проблемы с надёжностью сохраняются, тем более что у облака Microsoft в последнее время тоже есть проблемы с нехваткой вычислительных мощностей.

По некоторым данным, GitHub могут усилить за счёт облачных ресурсов AWS, хотя непонятно, идёт ли речь о временной мере для устранения экстренных проблем или о чём-то постоянном. По словам представителя GitHub, важно понимать контекст, поскольку сообщество растёт темпами, которые никогда раньше не наблюдались. Невероятный рост разработки агентных ИИ-решений с конца прошлого года оказал значительное давление на инфраструктуру компании. Чтобы удовлетворить спрос, происходит перенос сервисов в Azure, также изучается и мультиоблачная стратегия, позволяющая обеспечить мощности, необходимые в будущем.

Постоянный URL: http://servernews.ru/1143668
16.06.2026 [23:37], Владимир Мироненко

SpaceXAI купила Cursor за $60 млрд

Компания SpaceX/xAI подтвердила приобретение Anysphere, разработчика ИИ-инструмента для программирования Cursor, за $60 млрд, о котором договорилась в апреле. Тогда SpaceX получила опцион на покупку стартапа. Соглашение предусматривало выплату ему $10 млрд, если SpaceX решит отказаться от сделки.

О сделке SpaceX известила Комиссию по ценным бумагам и биржам США (SEC) спустя несколько дней после проведения первичного публичного размещения акций (IPO) на Nasdaq, в рамках которого она привлекла $85,7 млрд с оценкой её рыночной стоимости более чем в $2 трлн.

Как сообщает ресурс Investing.com, согласно соглашению о слиянии, подписанному 16 июня, дочерняя компания SpaceX под названием X67 Inc. объединится с Anysphere. Как ожидается, сделка будет завершена в сентябре, после чего Anysphere станет дочерней компанией SpaceX, находящейся в полной её собственности.

 Источник изображения: Fotis Fotopoulos/unsplash.com

Источник изображения: Fotis Fotopoulos/unsplash.com

Акционеры Anysphere получат обыкновенные акции класса А SpaceX в обмен на свои акции. Коэффициент конвертации будет основан на оценке стартапа в $60 млрд и средневзвешенной цене акций SpaceX за семь торговых дней до закрытия сделки. Как отметил ресурс CNBC, реализация сделки на этих условиях представляет собой размывание акционерного капитала на 3,4 % по сравнению с оценкой IPO.

Сделка позволит xAI, разработчику чат-бота Grok, с которым SpaceX объединилась в феврале, расширить свое присутствие на рынке программирования с использованием ИИ. Cursor используется крупными компаниями, включая Stripe, Adobe и NVIDIA. При этом глава NVIDIA Дженсен Хуанг (Jensen Huang), назвал его своим «любимым корпоративным сервисом ИИ».

Как сообщает Reuters, акции SpaceX выросли почти на 10 % на предрыночных торгах. В понедельник SpaceX с оценкой более $2,5 трлн вошла в число шести крупнейших компаний мира, опередив Broadcom, Saudi Aramco и Tesla, уступая лишь компании Amazon. А во вторник рыночная стоимость SpaceX превысила $2,7 трлн, что позволило ей опередить и Amazon.

Постоянный URL: http://servernews.ru/1143645
16.06.2026 [16:21], Сергей Карасёв

В Кембриджском университете запущен AMD-суперкомпьютер Zenith

В Кембриджском университете (University of Cambridge) в Великобритании состоялась церемония запуска высокопроизводительного вычислительного комплекса Zenith, предназначенного для научных исследований с использованием ИИ. Инвестиции в проект составили около £36 млн ($48,3 млн).

В создании суперкомпьютера приняли участие компании AMD и Dell Technologies. Полностью характеристики машины пока не раскрываются. Известно, что в её основу положены серверы PowerEdge, оборудованные процессорами AMD EPYC поколения Turin. Кроме того, задействованы ИИ-ускорители Instinct MI355X с 288 Гбайт памяти HBM3E (8 Тбайт/с).

Вместе с тем AMD, Dell и Кембриджский университет объявили о планах создания на территории Великобритании Лаборатории инноваций в области суверенного ИИ (Sovereign AI Innovation Lab — SAIL). Инициатива, как ожидается, позволит расширить доступ к передовой ИИ-инфраструктуре и НРС-ресурсам для исследователей, медицинских организаций, государственных учреждений и других участников отрасли.

На площадке SAIL компании смогут разрабатывать, оценивать и внедрять передовые технологии ИИ. Ключевой задачей SAIL названо формирование открытой ИИ-экосистемы на базе вычислительных платформ AMD, программного обеспечения AMD ROCm и облачных технологий. Отмечается, что благодаря появлению SAIL исследователи смогут масштабировать ИИ-решения с применением суверенной инфраструктуры, что ускорит инновации в таких областях, как здравоохранение, энергетика, экология, передовые инженерные разработки и пр.

 Источник изображения: University of Cambridge

Источник изображения: University of Cambridge

Одновременно AMD и Dell занимаются созданием ещё одного британского ИИ-суперкомпьютера — системы Sunrise. Этот проект финансируется Департаментом энергетической безопасности и достижения нулевого уровня выбросов (DESNZ) в составе Агентства по атомной энергии Великобритании (UKAEA).

Постоянный URL: http://servernews.ru/1143629

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;