Лента новостей

22.06.2026 [13:41], Руслан Авдеев

Critical Energy привлекла $22 млн на строительство модульных геотермальных электростанций для ИИ ЦОД

Американская Critical Energy, специализирующаяся на разработке и создании готовых модульных геотермальных электростанций, привлекла $22 млн стартового финансирования, сообщает Datacenter Dynamics.

Базирующаяся в Лос-Анджелесе компания объявила о закрытии раунда финансирования, возглавленного Susa Ventures и Upfront Ventures. Она планирует использовать вырученные средства для развития своих технологий и ускорить реализацию плана по созданию полномасштабного коммерческого завода, который должны ввести в эксплуатацию в 2027 году.

Critical Energy основана и возглавляется выходцем из SpaceX Спенсером Джексоном (Spencer Jackson). Компания намерена предложить модульные геотермальные решения для сектора ИИ ЦОД. Её энергомодули Apex разработаны с расчётом на заводское производство, поставку в контейнерах и сборку на тех площадках, где они и будут генерировать энергию.

 Источник изображения: Critical Energy

Источник изображения: Critical Energy

Компания предлагает две модели — Apex 2500 и Apex 5000, обеспечивающие 2,5 МВт и 5 МВт соответственно. По данным компании, первый вариант рассчитан на «стандартную» геотермальную энергию, во втором случае вариант разработан для усовершенствованных геотермальных систем — т.н. Enhanced Geothermal Systems (EGS), предполагающих дополнительные горные работы и создание подземных водных резервуаров. Такие системы в последнее время вызывают всё больше интереса среди гиперскейлеров.

 Источник изображения: Critical Energy

Источник изображения: Critical Energy

По словам Джексона, для успешного развития требуется не изобретение новой технологии, а изменение производственной цепочки и цепочки поставок. Успешный сбор средств на подобный проект отражает рост интереса к геотермальной энергии на рынке дата-центров. За последние два года в секторе заключены несколько сделок, основной фокус приходится на EGS-системы, более эффективные, чем обычные геотермальные варианты.

На сегодня Google, Meta, Microsoft (впрочем, проект пока на паузе) и Amazon уже подписали соглашения с компаниями, специализирующимися на геотермальных энергетических проектах, большая часть сделок приходится на рынок США.

Постоянный URL: https://servernews.ru/1143896
22.06.2026 [13:00], Руслан Авдеев

Саудовская DataVolt строит в Узбекистане 12-МВт дата-центр стоимостью $150 млн

Базирующаяся в Саудовской Аравии компания DataVolt занимается строительством в Ташкенте (Узбекистан) дата-центра мощностью 12 МВт, сообщает Datacenter Dynamics.

На днях компания объявила, что привлекла для реализации проекта строительства ЦОД TAS-1 $150 млн. В числе инвесторов — немецкая German Investment and Development Company, Европейский банк реконструкции и развития, Фонд международного развития ОПЕК и подразделение Французского агентства развития (AFD) — компания Proparco.

В мае 2024 года Министерство цифровых технологий Узбекистана объявило, что проект будет финансироваться исключительно за счёт прямых зарубежных инвестиций. Объект TAS-1 в технопарке IT Park Uzbekistan был заложен в мае 2024 года, тогда DataVolt заявила, что дата-центр заработает в конце 2026 года.

По данным Министерства цифровых технологий, речь идёт о первой фазе более крупного проекта ЦОД. Ещё два дата-центра по 250 МВт должны быть построены на участках по 25 га в «Новом Ташкенте» и Бухаре соответственно. Представители узбекских властей сообщали, что к 2030 году «зарубежный партнёр» инвестирует $5 млрд в строительство объектов.

 Источник изображения: Министерство цифровых технологий Узбекистана

Источник изображения: Министерство цифровых технологий Узбекистана

Подразделение телеком-компании Veon — Beeline Uzbekistan, возможно, будет «ключевым арендатором» нового ЦОД, согласно одному из двух меморандумов о взаимопонимании, подписанных DataVolt. Второй меморандум утверждает программу оценки возможного совместного строительства и эксплуатации ЦОД в Бухаре. Стоит отметить, что меморандумы не обязательны к исполнению.

Основанная в 2023 году компания DataVolt полностью принадлежит саудовской инвестиционной и холдинговой компании Vision Invest, занимающейся проектами в сфере критической инфраструктуры. Значительная часть руководства DataVolt, включая генерального директора, пришла из саудовской ACWA Power, занимающейся строительством энергогенерирующих мощностей и заводов по опреснению воды. Последняя тоже принадлежит Vision Invest.

Штаб-квартира Veon находится в Дубае. Компания ушла с российского рынка в октябре 2023 года, и теперь занимается бизнесом в Бангладеш, Казахстане, Пакистане, Узбекистане и в других странах. В декабре 2025 года её подразделение Beeline Kazakhstan начало строительство в Казахстане 2-МВт дата-центра в Алматы, который должен заработать к концу 2026 года.

Постоянный URL: https://servernews.ru/1143901
22.06.2026 [12:53], Сергей Карасёв

Intersect360: годовой объём мирового рынка ИИ-инфраструктур превысил $300 млрд

По оценкам аналитической компании Intersect360 Research, затраты на глобальном рынке инфраструктур для дата-центров, ориентированных на ИИ-нагрузки, в 2025 году увеличились на 60,1 %, превысив $300 млрд. Ключевым драйвером отрасли выступают гиперскейлеры, продолжающие активно наращивать вычислительные мощности.

Отмечается, что в абсолютном выражении доминирует именно сегмент гиперскейлеров, на который пришлось более $200 млрд расходов. В то же время затраты в области корпоративных ИИ-инфраструктур (включая HPC-направление) в 2025-м оказались на уровне $71,6 млрд.

В дальнейшем, по мнению аналитиков, среднегодовой темп роста в сложных процентах (CAGR) на мировом рынке ИИ-инфраструктур будет исчисляться двузначными числами процентов. В результате, к 2030-му суммарные расходы преодолеют отметку в $500 млрд. В сегменте корпоративных ИИ-инфраструктур показатель прогнозируется в объёме более $130 млрд.

Вместе с тем специалисты Intersect360 Research указывают на трансформацию рассматриваемой отрасли. В частности, наблюдается сдвиг в сторону облачных платформ для задач ИИ и суверенных дата-центров, оптимизированных для соответствующих нагрузок.

 Источник изображения: Intersect360

Источник изображения: Intersect360

Причём направление суверенных ЦОД демонстрирует самые высокие темпы роста, что связано со сформировавшейся геополитической обстановкой и санкционными ограничениями. Такие площадки функционируют полностью в пределах географических границ конкретной страны, что устраняет риски, обусловленные применением иностранных платформ.

В целом, указывают аналитики, до 2030 года основную часть прироста рынка обеспечат ускорители на базе GPU, высокопроизводительные серверы и облачные сервисы, оптимизированные для ИИ. При этом затраты в сегменте традиционной корпоративной инфраструктуры останутся на прежнем уровне или даже сократятся в реальном выражении.

Постоянный URL: https://servernews.ru/1143894
22.06.2026 [09:36], Руслан Авдеев

Hyperscale Data откроет «школу» для роботов-гуманоидов в собственном ЦОД

Американская Hyperscale Data (ранее Ault Alliance), работающая в сфере робототехники и инфраструктурных ИИ-решений, намерена внедрить роботов-гуманоидов в собственном ЦОД в Мичигане. Недавно компания объявила, что полностью принадлежащая ей Omnipresent Robotics в III квартале 2026 года начнёт выпуск первых 30 гуманоидных роботов OPR-R2, сообщает Datacenter Dynamics.

Предполагается, что роботы будут учиться и работать на территории лаборатории Robotics Research, Testing, and Innovation Center площадью 9 290 м2. Они предназначены для поддержки разработки систем физического ИИ, автономных рабочих процессов и передовых систем робототехники. В рамках проекта Hyperscale и её дочерняя структура заключили партнёрское соглашение с китайской Agibot PTE, занимающейся робототехникой. Всего компания рассчитывает внедрить 143 таких робота, купленных у Agibot за $13,4 млн. При этом Omnipresent дано право организовать перепродажу роботов под собственным брендом.

Первые 30 машин отправят на площадку Model Training Laboratory компании Omnipresent Robotics, где они станут работать буквально рука об руку с людьми, обучаясь в реальных условиях. В Hyperscale сообщили, что роботы помогут в сборе информации, обучении моделей, оценке симуляций, эксплуатации объекта и разработке систем физического ИИ следующего поколения. Компания рассчитывает, что внедрение роботов-гуманоидов в ЦОД создаст уникальную среду для разработки и оценки ИИ-систем новейшего поколения, способных действовать в условиях реального мира.

 Источник изображения: Agibot

Источник изображения: Agibot

Hyperscale владеет дата-центром в Мичигане, расположенном на площадке около 14 га. 30-МВт ЦОД площадью 57 320 м2 был куплен в мае 2022 года. Построенное в 1972 году здание изначально использовалось как промышленный объект, но теперь в нём находятся мощности для майнинга биткоинов, HPC-проектов, колокации и упомянутой выше робототехнической лаборатории. В перспективе компания намерена увеличить мощность до 340 МВт, в том числе предусмотрено создание газовых энергогенерирующих мощностей «за счётчиком» на 40 МВт.

По словам Hyperscale, компания сделала ставку на ИИ — если современные ИИ-модели отлично справляются с рассуждениями и генерацией контента, то в будущем ИИ должен уметь разбираться в физическом мире и взаимодействовать с ним. Кампус в Мичигане создаётся для формирования масштабной среды, в которой гуманоидные роботы и передовой ИИ смогут постоянно учиться, тренироваться и совершенствоваться.

Ранее Hyperscale под своим прежним именем инвестировала в разведку нефти, оборонно-аэрокосмический сектор, производство, автомобильную промышленность и другие отрасли, включая медицину и биофармацевтику, гостиничный бизнес и выпуск текстиля. В 2025 году она анонсировала полный разворот бизнеса в направлении ИИ и ЦОД, сменила название и объявила о решении избавиться от всех активов, не связанных с дата-центрами. Теперь контрольный пакет Hyperscale Data принадлежит Ault & Company.

Основанная в 2023 году шанхайская Agibot разрабатывает роботов-гуманоидов, робособак, колёсные автономные машины. Компания заявила, что выпустила более 1 тыс. универсальных роботов-гуманоидов для выполнения широкого круга «физических» задач в реальном мире. В конце апеля сообщалось, что японский техногигант SoftBank намерен использовать роботов для ускоренного строительства дата-центров, в первую очередь в США.

Постоянный URL: https://servernews.ru/1143885
22.06.2026 [09:05], Сергей Карасёв

Одноплатный компьютер Orange Pi 6 получил 12-ядерный процессор и два порта 2.5GbE

В октябре 2025 года дебютировал одноплатный компьютер Orange Pi 6 Plus, предназначенный для построения различных устройств с ИИ-функциями. Теперь у этого изделия появился младший собрат в виде модели Orange Pi 6, которая подходит для создания промышленных контроллеров, интеллектуальных роботов, мини-серверов и пр.

Как и Plus-версия, новинка выполнена на процессоре CIX P1 (CD8180) с 12 вычислительными ядрами — это квартеты Arm Cortex-A720 с тактовой частотой до 2,8 ГГц, Arm Cortex-A720 с частотой 2,4 ГГц и Arm Cortex-A520 с частотой 1,8 ГГц. В состав чипа входят графический ускоритель Arm Immortalis-G720 MC10 и нейропроцессорный модуль с ИИ-быстродействием 28,8 TOPS. Суммарная производительность (CPU+NPU+GPU) на операциях ИИ достигает 45 TOPS.

 Источник изображения: Orange Pi

Источник изображения: Orange Pi

Одноплатный компьютер имеет размеры 90 × 90 мм. Объём оперативной памяти LPDDR5 может составлять 8, 16 или 24 Гбайт (до 64 Гбайт у Orange Pi 6 Plus). Доступны два коннектора M.2 2280 M-Key для SSD с интерфейсом PCIe 4.0 x4 (NVMe), слот для карты microSD и разъём M.2 E-Key для опционального адаптера Wi-Fi. Реализованы два сетевых порта 2.5GbE (против 5GbE у старшей модификации).

Новинка получила по два порта USB 3.0 Type-C, USB 3.0 Type-A и USB 2.0 Type-A, по одному интерфейсу DisplayPort 1.4, HDMI 2.0 и eDP, аудиогнездо на 3,5 мм, два коннектора RJ45 для сетевых кабелей, два интерфейса MIPI-CSI (4 линии) и 40-контактную колодку GPIO (UART, I2C, SPI, PWM). Может быть подключён вентилятор охлаждения с ШИМ-управлением. Заявлена совместимость с ОС OpenHarmony, Debian, Ubuntu, Android, Windows, ROS2.

Постоянный URL: https://servernews.ru/1143878
21.06.2026 [15:08], Руслан Авдеев

Crusoe обеспечит Meta✴ 1,6 ГВт новых мощностей ЦОД

Компания Meta заключила с Crusoe соглашение не поставку 1,6 ГВт вычислительных мощностей ЦОД, сообщает Datacenter Dynamics. Подписаны контракты на покупку мощностей на объектах Crusoe в Чайлдрессе (Childress, Техас) и Уоррентоне (Warrenton, Миссури). Стоимость сделки не называется.

Ранее в июне Crusoe объявила, что законтрактованные инфраструктурные мощности компании достигли 4,9 ГВт, в том числе речь идёт как о проектах ЦОД для внешних клиентов, так и о собственной облачной ИИ-платформе Crusoe Cloud. В целом портфолио проектов компании превышает 40 ГВт, хотя и не все запланированные кампусы строятся так, как планировалось, например, в Вайоминге. Кампус в Уоррентоне планируется возвести на участке площадью около 137 га, речь идёт о двух зданиях ЦОД площадью по 74 786 м2 и административном здании площадью 3 716 м2.

Crusoe известна в первую очередь кампусом ЦОД в Абилине (Abilene, Техас), созданном на принадлежащей Lancium земле для Oracle и сданном в аренду OpenAI. Недавно там же стартовало строительство ещё одного кампуса мощностью 900 МВт для Microsoft. По слухам, эти мощности хотела получить и Meta, но в итоге они достались сопернику.

 Источник изображения: James Sullivan/unsplash.com

Источник изображения: James Sullivan/unsplash.com

Хотя Crusoe не выделяет проект в Чайлдрессе на своём сайте, ранее компания уже заявляла, что имеет контракты на строительство ещё двух крупных кампусов в Техасе и одного — в Миссури. Подчёркивалось, что проекты на разных стадиях готовности. Lancium, работавшая с Crusoe в Абилине, участвует и в проекте в Чайлдрессе. Указывается, что площадка имеет возможность получения от местной энергосети 1 ГВт и получила разрешение техасского регулятора ERCOT.

По словам главы Meta Марка Цукерберга (Mark Zuckerberg), компания не исключает запуск собственного облачного сервиса при определённых условиях. Компания активно наращивает вычислительные мощности, и в начале года создала специальное подразделение Meta Compute для расширения ёмкости ЦОД. Цукерберг заявил, что планируется построить десятки гигаватт в текущем десятилетии и «сотни или больше» — в долгосрочной перспективе. Попутно компания заключает соглашения об аренде мощностей у облачных и неооблачных компаний. Так, с Nebius она подписала соглашение на $27 млрд, сделка на $21 млрд заключена и с CoreWeave. Кроме того, с AWS подписан договор об использовании чипов Graviton5.

Постоянный URL: https://servernews.ru/1143883
21.06.2026 [14:58], Владимир Мироненко

Франция развивает ИИ-инфраструктуру в сотрудничестве с NVIDIA

Платформа AI Factory France (AI2F) под руководством Национального управления высокопроизводительных вычислений (GENCI) Франции объявила о запуске в партнёрстве с NVIDIA программы по ускорению инноваций в области ИИ в стране. Программа обеспечит компаниям упрощённый доступ к передовой вычислительной инфраструктуре и специализированным ИИ-сервисам. Она объединяет глобальную экосистему NVIDIA с национальными и европейскими ресурсами ИИ Франции.

Сотрудничество между AI Factory France (AI2F) и программами NVIDIA Inception, NVIDIA Connect, позволяет стартапам получить доступ к национальным суперкомпьютерным ресурсам, включая Jean Zay. Первые участники, включая Pleias, Nebula и Ryax Technologies, уже используют эту возможность для создания приложений.

Представленные в рамках GTC Paris мероприятия уже реализуются с использованием технологий NVIDIA. Так, Mistral строит новый ЦОД мощностью 44 МВт на севере Франции. Первый дата-центр Mistral, анонсированный в 2025 году, уже получил 18 тыс. систем NVIDIA GB200 в рамках плана по созданию 200 МВт вычислительных мощностей по всей Европе к 2027 году. В сотрудничестве с французским государственным инвестиционным банком Bpifrance, инвестиционной компанией MGX и NVIDIA компания работает над расширением Campus AI, сети предприятий в сфере ИИ, планируя построить ЦОД на 1,4 ГВт, что сделает её одним из крупнейших ИИ-платформ в Европе. Облачный провайдер Scaleway получил NVIDIA B300.

 Источник изображения: AI Factory France

Источник изображения: AI Factory France

Bull и Foxconn намерены производить в Европе NVIDIA Vera Rubin NVL72. Системы будут производиться и первоначально тестироваться на заводах Foxconn в Чехии, после чего их будут собирать, интегрировать и полностью проверять на заводе Bull в Анжере (Angers). Консорциум из восьми ведущих французских компаний подал заявку на размещение европейской гигафабрики ИИ во Франции для укрепления европейской ИИ инфраструктуры и ускорения внедрения ИИ. В свою очередь Schneider Electric объединилась с NVIDIA для разработки проектов гигаваттных ИИ-фабрик для компаний, развивающих ИИ-инфраструктуры.

Аналогичные инициативы внедряются по всей Европе, включая сотрудничество между NVIDIA и Барселонским суперкомпьютерным центром (BSC), в рамках которого создаётся сеть, соединяющая местную инфраструктуру со стартапами и учреждениями государственного сектора. Компания TotalEnergies построит Pangea 5, суперкомпьютер следующего поколения, разработанный совместно с Dell и NVIDIA, который будет использоваться для сейсмической съёмки, передового моделирования и исследований в области ИИ в энергетическом секторе.

Постоянный URL: https://servernews.ru/1143876
20.06.2026 [16:30], Сергей Карасёв

ИИ Continuum найдёт и починит уязвимости у клиентов AWS

AWS анонсировала платформу Continuum — специализированную систему на базе ИИ для автоматического выявления, подтверждения и устранения уязвимостей в программном обеспечении в среде клиента. AWS отмечает, что традиционные подходы к решению проблем в области информационной безопасности оказываются недостаточно эффективными на фоне стремительного развития угроз в эпоху ИИ. Система Continuum спроектирована для управления полным жизненным циклом уязвимостей: инструмент позволяет автоматизировать основные задачи, сведя к минимуму участие человека.

В настоящее время Continuum оптимизирована для поиска уязвимостей в программном коде. Процесс работы системы включает четыре основных этапа: обнаружение, приоритезация, проверка и устранение. В ходе первой фазы платформа анализирует уже существующий список уязвимостей и проводит собственное сканирование среды, выстраивая подробную карту путей атаки. Затем система переходит к расстановке приоритетов: каждая выявленная проблема оценивается с учётом множества факторов — статуса развёртывания того или иного компонента, его доступности для атаки, потенциального риска для бизнеса и пр. В результате формируется перечень наиболее актуальных угроз.

 Источник изображения: unsplash.com / Luca Bravo

Источник изображения: unsplash.com / Luca Bravo

На этапе проверки Continuum оценивает найденные уязвимости в изолированной среде (песочнице), генерируя рабочие эксплойты. Это позволяет подтвердить существование проблемы или отсеять её. В ходе заключительной фазы система анализирует уже действующие меры защиты и предлагает оптимальные пути устранения обнаруженной уязвимости: будь то изменения сетевой конфигурации, обновление политик безопасности или разработка патчей. При этом все изменения проходят повторную проверку, а в случаях, когда это возможно, предусматриваются варианты отката, что помогает минимизировать риски при внедрении исправлений.

Работа Continuum не зависит от какой-либо одной ИИ-модели: платформа задействует несколько передовых LLM — в зависимости от того, какая из них лучше подходит для решения конкретной задачи. Система анализирует как структурированные данные, уже имеющиеся в AWS (инфраструктура, разрешения, сетевая топология и код), так и неструктурированную информацию, включая документацию клиента и бизнес-приоритеты. Уровень автоматизации повышается постепенно — по мере обучения платформы.

Постоянный URL: https://servernews.ru/1143857
20.06.2026 [15:45], Сергей Карасёв

В Словении запущена НРС-система FRIDA с ускорителями NVIDIA Blackwell

Люблянский университет в Словении (University of Ljubljana), по сообщению DataCenter Dynamics, запустил высокопроизводительную систему FRIDA, ориентированную на задачи ИИ и машинного обучения. Это не классический суперкомпьютер, а модульный контейнерный дата-центр, размещённый на крыше здания Факультета компьютерных и информационных наук (FRI) в Любляне.

Известно, что в составе FRIDA задействованы 104 ускорителя на основе GPU. В частности, применяются изделия NVIDIA Blackwell B200 и B300. Суммарный объём GPU-памяти составляет 16,8 Тбайт. Комплекс оборудован гибридной воздушно-жидкостной системой охлаждения. Все вычислительные узлы связаны интерконнектом с высокой пропускной способностью.

Отмечается, что производительность FRIDA при вычислениях с низкой точностью достигает 708 Пфлопс. Пиковое быстродействие при операциях с разреженными матрицами низкой точности заявлено на уровне 1,42 Эфлопс.

FRIDA дополнит словенскую НРС-систему Vega, которая была введена в строй в 2021 году в рамках проекта Европейского совместного предприятия по развитию высокопроизводительных вычислений (EuroHPC JU). Эта машина, основанная на процессорах AMD и ускорителях NVIDIA, демонстрирует FP64-производительность на уровне 6,9 Пфлопс.

 Источник изображения: linkedin.com

Источник изображения: linkedin.com

Vega задумывалась как универсальная платформа для сложных вычислений: она может применяться для решения задач в самых разных областях, включая биоинженерию и разработку новых лекарств, изучение климата и прогнозирование погоды, персонализированную медицину, создание новых материалов и пр. В свою очередь, система FRIDA ориентирована прежде всего на нагрузки, связанные с ИИ.

Постоянный URL: https://servernews.ru/1143855
19.06.2026 [19:34], Владимир Мироненко

«Логарифмический» ИИ-ускоритель Tensordyne Napier обещает выскоую производительность при минимальном энергопотреблении

ИИ-стартап Tensordyne (ранее Recogni) анонсировал платформу Tensordyne Napier (TDN) для ИИ-инференса, разработанную в партнёрстве с Broadcom и HPE Juniper Networks, которая «сочетает в себе инновационные логарифмические математические вычисления в области ИИ, тесно интегрированную архитектуру памяти и высокопроизводительный масштабируемый интерконнект, обеспечивая существенно более высокую пропускную способность, меньшее энергопотребление и улучшенную экономику инфраструктуры для крупномасштабных задач ИИ-инференса».

По словам Tensordyne, новый «логарифмический» чип позволит решить, как проблему скорости, так и стоимости ИИ-инференса. В нём компания заменила крупномасштабные операции умножения упрощёнными вычислениями на основе сложения, значительно повысив эффективность на Вт. Сумматоры меньше размером и как правило потребляют меньше энергии, чем умножители, поэтому их использование обеспечит больше полезной площади для SRAM и лучшую сбалансированность системы.

 Источник изображений: Tensordyne

Источник изображений: Tensordyne

Чип включает 138 млрд транзисторов и поддерживает обработку данных в режимах NVFP4, FP8 и FP16. Tensordyne сообщила о 2,1 Пфлопс в формате плотных вычислений FP8 на кристалл. Частота ядра ускорителя составляет 1,33 ГГц, поддерживающих ядер RISC-V — 1,5 ГГц. Чип получил четыре блока HBM4 (по данным ServeTheHome — HBM3E), каждый по 36 Гбайт (144 Гбайт в сумме) с пропускной способностью 4,7 Тбайт/с. Также на чипе размещено 256 Мбайт SRAM с суммарной пропускной способностью 40 Тбайт/с. Интеграция значительного объёма быстрой SRAM с HBM позволила минимизировать циклы простоя вычислений и обеспечить эффективную поддержку выполнения самых больших моделей в отрасли.

Как рассказал ресурсу The Next Platform Р.К. Ананд (RK Anand), сооснователь и директор по продуктам Tensordyne, ускоритель имеет 48 ядер, которые связаны с блоками обработки векторов. В векторном блоке тоже есть ALU, но он также может использовать таблицу поиска (LUT) и работать полностью параллельно. В целом доступны чередование операций и управляемый конвейер. По словам Ананд, Napier потребляет всего 300 Вт по сравнению с 1200-Вт NVIDIA B300, поскольку новый чип довольно компактен. Ананд не уточнил, состоит ли чип Napier из чиплетов или представляет собой монолитный кристалл.

Девять чипов TDN могут размещаться в 1U-узле, в котором установлен 40-ядерный процессор Xeon для управления хостом и выполнения некоторых задач декодирования, а также 8-Тбайт NVMe SSD. Узел имеет два 200GbE-порта QSFP, а на задней панели расположены шесть портов для фирменного интерконнекта TDNLink, используемого для соединения 72 чипов TDN. Узел обеспечивает 19 Пфлопс в режиме FP8, 1,3 Тбайт HBM и 2,25 Гбайт SRAM с агрегированной пропускной способностью 42 Тбайт/с и 360 Тбайт/с соответственно. Узлы Napier, подобно NVIDIA NVLink, соединены через объединительную плату посредством проприетарного интерконнекта TDNLink. Суперускоритель TDN72 объединяет 72 чипа TDN (восемь узлов), причём TDNLink способен обеспечить задержку менее микросекунды между чипами при пропускной способности 1 Тбайт/с.

TDN72 ориентирован на модели с количеством параметров от 10 до 20 трлн, для работы с которыми важны объём памяти и MoE-маршрутизация. «В каждом TDN72 у нас 320 ядер Xeon и 4608 ядер RISC-V», — отметил сооснователь и вице-президент Tensordyne Жиль Бакхус (Gilles Backhus). «Мы применяем двухуровневый подход к решению проблемы с CPU. Вся работа, выполняемая непосредственно вблизи вычислительных процессов ИИ в рамках цикла обработки токенов и авторегрессионного цикла LLM, в основном проводится на ядрах RISC-V. Здесь же осуществляется маршрутизация MoE, проверка по словарю для отбрасывания определённых токенов и т.д. Прочая обработка данных для инференса происходит на процессорах Intel Xeon».

Четыре TDN72 помещаются в стандартную 52U-стойку Tensordyne Napier, что даёт 608 Пфлопс (FP8), 42 Тбайт HBM, 74 Гбайт SRAM, 256 Тбайт NVMe SSD, 275-Тбайт/с соединение TDNLink и 64 порта 200GbE. При этом такая стойка потребляет всего 120 кВт и может обходиться воздушным охлаждением. Как сообщила компания, стойка Tensordyne Napier обеспечивает по сравнению с полноразмерной стойкой NVIDIA NVL72:

  • В 17 раз больше токенов на ватт;
  • В 13 раз больше токенов в секунду;
  • Дополнительный доход до $33 млн/год на стойку.

Система поддерживает дезагрегированное обслуживание и выполнение моделей с многотриллионными параметрами со скоростью более 1000 токенов в секунду на пользователя. Для достижения той же пропускной способности потребовалось бы как минимум девять стоек NVIDIA Rubin + Groq LPX, отметила Tensordyne.

Самой сложной составляющей запуска платформы может стать ПО. Tensordyne сообщила о выпуске на платформе Hugging Face центра моделей со своим SDK, прямой компиляцией моделей для PyTorch/Triton и кастомным eDSL для Python. Следует отметить, что одним из важных преимуществ ускорителей NVIDIA является экосистема CUDA — огромная база фреймворков, ядер, инструментов профилирования, шаблонов развёртывания и моделей поведения разработчиков. Любой новый ИИ-ускоритель должен сопровождаться достаточно простым ПО, чтобы клиенты захотели его внедрять в своих системах.

Постоянный URL: https://servernews.ru/1143813

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;