Материалы по тегу:
|
19.05.2026 [17:00], Руслан Авдеев
Arm-процессоры NVIDIA Vera поставили в ведущие ИИ-лаборатории мира — Oracle развернёт сотни тысяч таких CPUПервые CPU Vera, разработанные компанией NVIDIA, поставили в Anthropic, OpenAI, Oracle Cloud Infrastructure (OCI) и SpaceX/xAI. Процессоры специально разработаны с учётом особенностей «агентных» ИИ-систем и отличаются от обычных CPU. Это первый кастромный процессор NVIDIA, специально разработанный для агентнызх систем. Он обеспечивает оркестрацию, вызов инструментов, RL-нагрузки, анализ данных, «песочницы» для агентов и др. Процессор предназначен для ИИ-лабораторий, облачных провайдеров и компаний, масштабно работающих с агентными ИИ-системами. Модель получила 88 кастомных ядер Olympus, а пропускная способность памяти составляет 1,2 Тбайт/с. Глава NVIDIA Дженсен Хуанг (Jensen Huang) позиционирует Vera как новый многомиллиардный вектор развития компании. Как сообщает NVIDIA, агентный ИИ создаёт намного более высокую нагрузку на вычислительную инфраструктуру, от компиляции и тестирования программного кода до анализа данных, поиска файлов и др. При этом ИИ-агенты не просто используют ускорители, но и требуют оркестрации, управления агентными «песочницами», и т. п., это работа для CPU. Поток параллельных задач перегружает не рассчитанные на это CPU, но характеристики Vera позволяют повысить эффективность ИИ-фабрик целиком. OCI намерена развернуть сотни тысяч CPU Vera для обеспечения работы нового поколения корпоративного ИИ. Это первый облачный провайдер, намеренный внедрить Vera в таких масштабах. Для корпоративных клиентов это означает, что будет создана агентная ИИ-инфраструктура уровня, недоступного другим облачным провайдерам. Ранее сообщалось, что Oracle строит «вчерашние» ЦОД, не имея на это достаточно средств и теперь, компания, похоже, готова опровергнуть этот тезис. Процессор не только является самостоятельным CPU, но и лежит в основе платформы Vera Rubin NVL72, где он посредством NVLink-C2C второго поколения связан с парой GPU Rubin. Стоит отметить, что работы с Vera фактически ведутся уже давно. Например, ещё в марте HPE представила узлы на базе NVIDIA Vera для платформы Cray Supercomputing GX5000.
19.05.2026 [16:00], Сергей Карасёв
РТК-ЦОД представил модульное решение «Ковчег» для обеспечения полной сохранности данныхРТК-ЦОД анонсировал модульное программно-аппаратное решение для защищённого хранения данных «Ковчег». Продукт ориентирован на организации, которым необходима точка гарантированного восстановления корпоративных данных, неуязвимая для любых атак на IT-инфраструктуру. Концепция «Ковчега» предполагает физическое и логическое отделение хранилища от других IT-систем: такой подход обеспечивает сохранность резервных копий в любых условиях — даже в случае критических инцидентов. Продукт может быть развёрнут на площадках РТК-ЦОД или непосредственно на объекте заказчика. После загрузки данных в «Ковчег» полностью исключаются любые попытки их изменения или удаления, а также обратной выгрузки. Резервные копии недоступны даже для самых привилегированных сотрудников компании и не предназначены для ежедневного использования. Получить резервную копию можно только в случае чрезвычайной ситуации при условии совместного одобрения первых лиц организации-заказчика. «Ковчег» может быть адаптирован под имеющуюся у клиента инфраструктуру с учётом его требований к уровню изоляции, особенностей бизнеса и финансовых возможностей. При необходимости может быть сформировано выделенное хранилище, которое обеспечивает полную физическую изоляцию на уровне оборудования: такой вариант ориентирован в первую очередь на финансовый сектор, госструктуры и крупный бизнес с жёсткими требованиями к сохранности данных. Несколько заказчиков с умеренными требованиями к изоляции и ограниченным бюджетом могут создать совместный «Ковчег» с логическим разделением на уровне сертифицированного ФСТЭК оборудования и ПО. Предусмотрен также сценарий «ЦОД на колёсах»: ключевые системы в режиме реального времени реплицируются в контейнерный модуль, который в экстренной ситуации физически эвакуируется на заранее подготовленную площадку. «Сегодня мы фактически открываем новый рынок, который находится на стыке хранения данных, резервного копирования, аварийного восстановления и кибербезопасности. Ранее между облачными бэкапами для малого бизнеса и дорогостоящими DR-комплексами для корпораций оставалась свободная ниша — организации, требующие гарантии сохранности данных при реализации самых распространённых сценариев угроз. К ним можно отнести физическое воздействие, человеческий фактор и целевые кибератаки на компанию. Наше решение создано именно под этот запрос. Принципиальное отличие продукта — архитектурный запрет на удаление. Защита опирается на технически закреплённую невозможность уничтожить копию изнутри. Этот механизм работает жёстче и надёжнее административных политик хранения или настроек прав доступа», — прокомментировал генеральный директор РТК-ЦОД Давид Мартиросов.
19.05.2026 [13:53], Руслан Авдеев
Иран намекнул на уязвимость подводных кабелей в Ормузском проливе, пригрозив ввести сборы за их использованиеИран пригрозил нарушить работу подводных кабелей в Ормузском проливе. Аккаунт в одной из социальных сетей, ассоциированный с иранским военным командованием, на днях опубликовал послание «Мы будем взимать сборы на интернет-кабели», сообщает The Register. Вероятно, это угроза обязать операторов кабелей платить за то, чтобы кабели продолжали работать. Обычно такие кабели стараются разместить поглубже, чтобы до них было сложнее добраться, но пролив не так глубок, да и у Ирана имеются средства легко повредить их. Иран может использовать подводные интернет-кабели в качестве ещё одного «козыря» для укрепления политических позиций — помимо блокады Ормузского пролива. Отмечается, что в случае, если с кабелями что-то произойдёт, пострадают банковские сети, военная связь, облачные ИИ-системы, онлайн-сервисы и коммерция. В первую очередь речь о ближневосточных государствах. Многие кабели, обеспечивающие связь стран Персидского залива, проходят через Ормузский пролив. При этом некоторые имеют дублирующие маршруты, а также посадочные станции в Омане, восточнее пролива. Кроме того, многие страны региона имеют сухопутные ВОЛС, некоторые из которых тоже связаны с посадочными станциями в Омане. Как сообщает The Register, если Иран выберет уничтожение кабелей в проливе, то соседние страны совсем без связи не останутся, но связность и ширина каналов резко снизятся. Для многих было бы заманчивым объявить краткие заявления в социальных сетях пустыми угрозами, если бы не прежние атаки Ирана по дата-центрам AWS в ОАЭ и Бахрейне с комментариями о том, что их мощности использовались в военных целях. Позже Иран грозил нанести непоправимый ущерб и строящемуся кампусу OpenAI в ОАЭ. В Иране, очевидно, понимают, что атаки на информационную инфраструктуру могут помочь военным усилиям страны, а блокада Ормузского пролива означает контроль над движением не только судов, но и потоков данных в регионе.
19.05.2026 [12:49], Руслан Авдеев
AMD и NVIDIA свернули не туда: следующий крупный американский суперкомпьютер может получить HPC-чипы NextSiliconБольшая часть самых мощнейших суперкомпьютеров мира в рейтинге TOP500 полагаются на ускорители на основе GPU, однако Национальные лаборатории США начали искать новые архитектуры чипов, обеспечивающие высокую производительность в FP64-расчётах, востребованных для симуляций Министерства энергетики США (DoE). Последнее занимается не только вопросами энергетиками, но и управляет одними из мощнейших суперкомпьютеров мира, в т.ч. для моделирования физики ядерного оружия, виртуальных экспериментов, касающихся биологического оружия, а также решения задач обеспечения общественного здоровья и безопасности, сообщает The Register. С запуска суперкомпьютера Titan в 2012 году всё больше систем стали использовать ускорители NVIDIA, а впоследствии и чипы AMD. Однако новый суперкомпьютер Spectra Сандийских национальных лабораторий (SNL), созданный Penguin Solutions и NextSilicon, использует другие решения. В сравнении с экзафлопсными системами уровня Frontier или El Capitan он занимает относительно мало места и состоит всего из 64 узлов. Spectra используют в качестве тестовой площадки для чипов Maverick-2, успешно прошедших все приёмочные испытания. Это открывает возможность их использования в боле крупных системах. Maverick-2 используют перенастраиваемую потоковую (dataflow) архитектуру. Фактически внутри чипа находится сеть связанных вычислительных блоков, работающих не по жёстко заданной схеме, а как узлы графа. В ходе выполнения задачи каждый блок можно настроить под отдельную задачу — сложение, умножение и т.п., благодаря чему происходит адаптация под разные типы вычислений с более эффективной обработкой потоков данных. Главная особенность — возможность одновременных вычислений и передачи данных. В NextSilicon утверждают, что это значительно повышает производительность и энергоэффективность в реальных задачах. Groq, Cerebras и SambaNova и ранее предлагали чипы на «потоковых» архитектурах, но все они были ориентированы на обучение и инференс ИИ, тогда как NextSilicon ориентируется именно на HPC. Подобные архитектуры очень сложны для программирования, поэтому разработчики обычно предлагают готовые сервисы, а не просто продают серверы на их основе. NextSilicon пытается решить подобную проблему, предложив собственный компилятор, позволяющий использовать имеющиеся программы на C, Python, Fortran и CUDA без серьёзной доработки. В Сандийских лабораториях уже проверили технологию на важных HPC-нагрузках, включая HPCG, LAMMPS и Sparta, подтвердив пригодность системы для научных вычислений. Ставка разработчика на HPC контрастирует с вектором развития ИИ-ускорителей NVIDIA. В Rubin компания делает ставку на ИИ-вычисления, снижая «чистую» производительность FP64, полагаясь на эмуляцию посредством схемы Озаки. Если в некоторых HPC-задачах это работает, то в других эффективность подобных обходных решений весьма низкая. AMD помимо ориентированных на ИИ Instinct MI455X готовит и MI430X, где сохранены аппаратные HPC-блоки. Именно на подобные нагрузки ориентируется NextSilicon со своими наработками. Полных системных бенчмарков Maverick-2 и суперкомпьютера пока нет, но компания утверждает, что один такой ускоритель способен обеспечить порядка 600 Гфлопс в тесте HPCG (FP64). По данным стартапа, это сопоставимо по производительности с ведущими GPU, причём энергопотребление у новинки вдвое ниже. Для США главной проблемой может оказаться давление акционеров компаний, поставляющих чипы. Если ИИ сделал NVIDIA финансовым и технологическим гигантом, то рынок решений для HPC остаётся важным, но всё ещё нишевым направлением. Хотя стартапам вроде NextSilicon ещё предстоит доказать право своих продуктов на место под солнцем, Китай уже давно продемонстрировал, что GPU вовсе не обязательны для успешной конкуренции с лучшими суперкомпьютерами Запада. OceanLight и Tianhe-3 полагаются на кастомные процессоры и ускорители на базе DSP вроде Matrix 2000. Последние, по слухам, были созданы в ответ на запрет поставок Intel Xeon Phi в КНР. Также недавно появились данные о новом Arm-суперкомпьютере LineShine.
19.05.2026 [12:30], Сергей Карасёв
В России появится единая платформа управления IT-сервисами и инфраструктуройIT-сервис-провайдер полного цикла РТК-ЦОД, IT-экосистема для автоматизации бизнес-процессов «Лукоморье», производитель программного обеспечения для управления IT-инфраструктурой «Скайфолл Лабс» и разработчик платформы наблюдаемости бизнес-систем Proto в ходе конференции ЦИПР-2026 подписали соглашение о технологическом партнёрстве. Стороны займутся созданием первой в России единой платформы для управления IT-сервисами и инфраструктурой. В рамках проекта в одном цифровом контуре будут совмещены инструменты ITSM/ESM, ITAM, мониторинга, наблюдаемости, автоматизации и сервисного взаимодействия. Ядром платформы станет «Диво Сервис» — решение для автоматизации сервисных процессов и построения Service Desk на основе бизнес-логики компании. Данная система позволит управлять IT-процессами через единую точку входа и обеспечит пространство взаимодействия для пользователей и специалистов. В число других компонентов платформы войдут система самообслуживания в формате одного окна «Диво Портал», инструмент аналитики и визуализации данных «Диво Мера», лингвистический модуль на базе ИИ для обработки обращений и поиска услуг «Диво Лингво», а также модуль для создания интеллектуальных цифровых помощников и чат-ботов «Диво Бот». Кроме того, в составе платформы планируется использование решений, разработанных участниками соглашения. В частности, продукт РТК-ЦОД под названием Smart Control будет интегрирован в систему как «Диво Контроль»: этот модуль представляет собой центр управления IT-инфраструктурой, обеспечивающий автоматизацию процессов эксплуатации, удалённое администрирование, инвентаризацию, обнаружение инфраструктуры и комплексный мониторинг. В свою очередь, «Скайфолл Лабс» предоставит решение SkyV ITAM, которое в рамках проекта получит название «Диво Свод»: модуль позволит формировать и поддерживать актуальную модель IT-инфраструктуры с консолидацией технических и финансовых данных обо всех IT-активах в единой системе без дублирования и противоречий. Наконец, «ПротоСервисез» интегрирует свое решение Proto Observability в виде модуля «Диво Прото»: это система full-stack мониторинга приложений, пользовательского опыта, инфраструктуры и Kubernetes. Она позволит отслеживать состояние сложных распределённых систем и бизнес-процессов в режиме реального времени, а также прогнозировать и предотвращать возможные инциденты. Партнёры выделяют ряд преимуществ единой платформы. Это возможность эволюционной миграции с постепенной заменой элементов существующей IT-инфраструктуры, простая интеграция со сторонними системами через открытые API, безопасное хранение данных на стороне заказчика и возможность администрирования модулей без необходимости программирования. Все компоненты включены в реестр отечественного ПО. Платформа получит функции предиктивного мониторинга, автоматического обнаружения проблем и удалённого устранения неполадок. Упомянут инструмент для сопоставления технических метрик с финансовыми и бизнес-показателями. Среди прочего выделяются централизованное управление учётными записями, сервисами и IT-инфраструктурой, безопасный доступ к ресурсам компании, комплексный мониторинг бизнес-систем и автоматическое обновление данных об активах в режиме реального времени.
19.05.2026 [10:35], Руслан Авдеев
NextEra Energy купит Dominion Energy, превратившись в крупнейшую в мире регулируемую энергокомпаниюNextEra Energy заключила соглашение о покупке ключевого игрока на энергетическом рынке Вирджинии, где находится самый крупный рынок ЦОД в мире — компании Dominion Energy. Это позволит создать крупнейшую в мире регулируемую энергокомпанию (с ценами, устанавливаемыми властями), сообщает Datacenter Dynamics. Объединённая компания будет обслуживать около 10 млн клиентов. Общие генерирующие мощности составят 110 ГВт. В рамках сделки акционеры Dominion Energy получат по 0,8138 акции NextEra Energy за каждую принадлежащую им акцию продаваемой компании. В результате акционерам NextEra и Dominion будет принадлежать приблизительно 74,5 % и 25,5 % акций обновлённой компании соответственно, которая оставит название NextEra Energy. По словам представителя NextEra, энергия нужна уже «сейчас, а не через несколько лет», а большой масштаб обеспечит эффективность капиталовложений и операций и позволит эффективно закупать, строить, финансировать и эксплуатировать объекты, что в долгосрочной перспективе обеспечит более доступную энергию для клиентов. После закрытия сделки главой новой структуры останется нынешний генеральный директор NextEra Джон Кетчум (John Ketchum), он же будет председателем совета директоров. Нынешний глава Dominion станет президентом и генеральным директором подразделения регулируемых коммунальных услуг, посты топ-менеджеров в структуре NextEra получат и некоторые другие действующие руководители Dominion.
Источник изображения: Rock Staar/unsplash.com Сделка будет иметь важные последствия для компаний, действующих на рынке ЦОД, поскольку оба бизнеса являются ключевыми поставщиками электричества на этом рынке. В совокупном портфолио компаний — более 130 ГВт запланированных энергомощностей для крупных клиентов, большая часть которых связана с индустрией ЦОД. В последнем отчёте Dominion сообщала, что на декабрь 2025 года в портфолио её контрактов находилось более 48 ГВт мощностей для дата-центров. В январе NextEra объявила о заинтересованности крупных потребителей, преимущественно гиперскейлеров, в приблизительно 20 ГВт. Их них переговоры о 9 ГВт находятся в «активной» стадии. Также уже заключено несколько соглашений стратегического характера с техногигантами, в т.ч. PPA с Google сроком на 25 лет, предусматривающий поддержку перезапуска электростанции Duane Arnold Energy Center (DAEC) в Пало (Palo, Айова) мощностью 615 МВт. Предполагается, что сделку NextEra и Dominion закроют за 12–18 мес. при соблюдении стандартных условий и в случае одобрения акционерами компаний. Юридическим консультантом NextEra Energy выступила Kirkland & Ellis LLP, а ведущим финансовым консультантом — Lazard, в консультациях также приняли участие Bank of America (BofA) и Wells Fargo. Юридическим консультантом Dominion Energy стала McGuire Woods LLP, а Goldman Sachs и JP Morgan Securities — финансовыми консультантами.
19.05.2026 [09:23], Руслан Авдеев
Энергия как услуга: Hitachi и X LABS займутся созданием гигаваттных энергетических парков для ИИ ЦОДКомпании Hitachi и американская X LABS объявили о готовности совместно строить в Северной Америке энергетические парки гигаваттного уровня, предназначенные для ИИ ЦОД. Они помогут решить одну из ключевых проблем подобных объектов — дефицит надёжного электроснабжения. В рамках совместного проекта будет предоставляться сервис «энергия как услуга» (Energy as a Service, EaaS). Он будет доступен при посредничестве специализированных проектных компаний (SPV), которые займутся финансированием и строительством таких парков, будут владеть ими и эксплуатировать их для автономного питания кампусов ЦОД без подключения к магистральным энергосетям. В предлагаемых энергетических парках энергия будет как генерироваться, так и храниться с помощью аккумуляторных систем (BESS). Там же будет присутствовать инфраструктура для передачи и распределения энергии — всё это будет объединяться в специализированные энергохабы, специально разработанные для крупных вычислительных ИИ-кластеров. В отличие от традиционных вариантов микросетей мегаваттного класса речь идёт о проектах именно гигаваттного масштаба, способных поддерживать кластеры гиперскейлеров для для крупномасштабных обучения и инференса ИИ. Hitachi объявила, что подобная архитектура даёт возможность операторам избежать длительного ожидания модернизации ЛЭП и присоединения к энергосети (если последняя вообще может дать нужные мощности). При этом обеспечиваются более предсказуемые поставки и качество питания, достаточные для современных рабочих нагрузок в ИИ-секторе. X LABS будет отвечать за управление финансированием проекта, выбором площадок, курированием SPV, закупками и общим развитием. Hitachi же обеспечит высоковольтные системы передачи и распределения электроэнергии, предоставит технологии стабилизации сетей и платформы управления энергопотреблением. Дополнительно Hitachi намерена интегрировать в проекты ИИ-платформу оптимизации энергопотребления HMAX Energy. Компании объявили, что рассчитывают завершить развёртывание первого энергетического парка в начале 2030-х гг. В сентябре 2025 годла сообщалось, что Hitachi Energy вложит $1 млрд в выпуск энергооборудования для ИИ ЦОД в США, а месяцем позже появилась информация, OpenAI оснастит дата-центры энергетическим оборудованием Hitachi.
19.05.2026 [09:00], Сергей Карасёв
«Базис» впервые стал лауреатом премии «ЦИПР Диджитал» за проект в теплоэнергетикеКрупнейший российский разработчик ПО управления динамической ИТ-инфраструктурой «Базис» взял золото премии «ЦИПР Диджитал-2026» в номинации «Цифровая энергия». Победу компании принёс проект перевода ИТ-инфраструктуры крупнейшего теплоснабжающего предприятия Санкт-Петербурга АО «ТЭК СПб» с зарубежного ПО на российскую платформу виртуализации Basis Dynamix. Специалисты «Базиса» развернули платформу в собственных ЦОД АО «ТЭК СПб», охватив 16 серверных систем и систем хранения данных. Аппаратной базой для ИТ-ландшафта выступило российское оборудование YADRO, что обеспечило полную независимость от иностранных технологий. Внедренное ПО взяло на себя централизованное управление виртуальными машинами и балансировку нагрузок, обеспечив необходимую отказоустойчивость инфраструктуры. Бесперебойную работу критически важных объектов поддерживают встроенные инструменты резервного копирования, восстановления и автоматизации процессов. По итогам проекта заказчик получил готовую технологическую основу для дальнейшей цифровой трансформации, включая виртуализацию рабочих мест и масштабирование серверных ресурсов. «Ошибки в энергетической отрасли недопустимы, так как они напрямую влияют на подачу тепла в жилые дома и социальные объекты. Поэтому при переходе с иностранных решений заказчику требовалась не просто оперативная миграция, а ювелирная замена ядра инфраструктуры без многолетних пилотных тестирований. Мы успешно перевели ИТ-ландшафт компании на платформу Basis Dynamix и сделали это без простоев. Высокая оценка жюри премии — это лучшее подтверждение того, что наши ИТ-продукты отвечают самым строгим отраслевым стандартам», — прокомментировал Давид Мартиросов, генеральный директор компании «Базис». Премия «ЦИПР Диджитал-2026» — шестая ежегодная деловая премия в области цифровых технологий. Премия нацелена на популяризацию российских проектов и разработок в области экономики данных. Награждение традиционно проходит в рамках конференции «Цифровая индустрия промышленной России» (ЦИПР). Инфраструктура АО «ТЭК СПб» включает 256 котельных, 234 центральных тепловых пункта и почти 5 тыс. километров тепловых сетей. Предприятие снабжает теплом больницы, школы, промышленные объекты и жилые дома. Бесперебойная работа этих систем критически важна для жизнеобеспечения Санкт-Петербурга.
18.05.2026 [23:01], Владимир Мироненко
Western Digital выпустила жёсткий диск с постквантовой криптографией для защиты ИИ-данных в будущемКомпания Western Digital (WD) анонсировала высокоёмкий жёсткий диск Ultrastar DC HC6100 UltraSMR с постквантовой криптографией (PQC), которая обеспечит защиту от атак с отложенной расшифровкой (HNDL), поскольку злоумышленники в настоящее время могут собирать зашифрованные данные, чтобы взломать их после того, как квантовые компьютеры достигнут зрелости. Таким образом, WD присоединилась к таким компаниям, как Cohesity, Commvault, NetApp и Quantum, которые уже выпустили хранилища с новыми алгоритмами шифрования PQC. Ultrastar DC HC6100 UltraSMR с поддержкой PQC в настоящее время проходит квалификацию у крупных компаний, и WD заявила, что со временем расширит возможности PQC на другие линейки корпоративных жёстких дисков. Реализация PQC от WD в новом накопителе разработана для защиты цепочек доверия устройств от производства до сервисного обслуживания. Основное внимание уделяется обеспечению доверия на уровне устройства, включая целостность прошивки и управление ключами, а не шифрованию данных в состоянии покоя (data at rest). Ключевые элементы реализации PQC от WD:
Технический директор и старший вице-президент WD, отметил, что по мере накопления данные, получаемые с помощью ИИ, становятся всё более ценными и долговечными, поэтому растёт актуальность их защиты в будущем. Технологии квантовых вычислений развиваются быстрее, чем ожидалось и архитектуры безопасности, которые защищали корпоративные хранилища более десяти лет, должны эволюционировать. «Интеграция постквантовой криптографии в Ultrastar является частью нашего обязательства помогать клиентам опережать угрозы, которые уже присутствуют в виде атак HNDL», — заявил он. «Соответствуя стандартам NIST и CNSA 2.0 уже сегодня, мы помогаем предприятиям создавать простой и удобный путь к инфраструктуре хранения данных, устойчивой к квантовым атакам», — добавил он.
18.05.2026 [20:00], Руслан Авдеев
NVIDIA представила платформу Fleet Intelligence для мониторинга парка ИИ-ускорителей
dcim
nvidia
software
ии
информационная безопасность
кластер
конфиденциальность
мониторинг
облако
оркестрация
телеметрия
цод
NVIDIA представила управляемую платформу Fleet Intelligence, предназначенную для мониторинга состояния крупных кластеров ускорителей, используемых в ИИ-инфраструктуре. Сервис уже доступен бесплатно для клиентов, использующих продукты NVIDIA на основе ускорителей семейств Hopper, Blackwell и Vera Rubin. NVIDIA позиционирует платформу как независимый слой телеметрии и мониторинга, позволяющий отслеживать работу с гетерогенными инфраструктурными средами, независимо от стека оркестрации или планировщика задач. Платформа применяет «лёгкий», интегрируемый в хост-систему агент, который передаёт телеметрию с ИИ-ускорителей в облачную службу Fleet Intelligence, работающую в экосистеме платформы NGC (NVIDIA GPU Cloud). Агент применяет несколько технологий NVIDIA, включая службу мониторинга ускорителей — GPUd, инструмент управления и диагностики чипов DCGM (NVIDIA Data Center GPU Manager) и средства проверки целостности оборудования и ПО NVIDIA Attestation SDK. Компания также выложила код агента Fleet Intelligence на GitHub, что позволит операторам ИИ-инфраструктуры самостоятельно оценить механизмы телеметрии. Fleet Intelligence ведёт сбор данных о степени загруженности ускорителей, пропускной способности памяти, энергопотреблении системы, состоянии интерконнектов NVLink, температуре системы, ошибках ECC, а также показателях состояния аппаратной составляющей. Это помогает операторам ЦОД организовать раннее выявление недоиспользованных ресурсов и ошибок и снизить простои крупных ИИ-кластеров. Одними из основных свойств платформы стали возможности проверки целостности и аттестации на основе технологий защищённых вычислений NVIDIA Confidential Computing. Fleet Intelligence проводит криптографическую валидацию прошивок ИИ-ускорителей и целостность среды выполнения с помощью корневых сертификатов доверия NVIDIA, а также сервиса удалённой проверки оборудования NRAS (NVIDIA Remote Attestation Service). Платформа может подтвердить, что ускорители используют утверждённую прошивку и использует манифесты целостности Reference Integrity Manifests, привязанные к определённым версиям vBIOS. По словам NVIDIA, при разработке Fleet Intelligence применяли опыт эксплуатации облачных платформ NVIDIA DGX Cloud, использовавших сотни тысяч ИИ-ускорителей. В числе корпоративных пользователей, получивших ранний доступ к платформе — Lambda и Iren, обе предоставляли обратную связь в ходе работ. Премьера Fleet Intelligence свидетельствует, что амбиции NVIDIA простираются далеко за пределы простой разработки ИИ-ускорителей, компания развивает ПО и инструменты управления для ИИ-фабрик. Это дополнение уже имеющегося стека компании, включающего системы DGX, интерконнекты NVLink, сетевые продукты Spectrum-X, платформу оркестрации Mission Control и решения для защищённых вычислений. Добавление масштабной телеметрии и предиктивной аналитики отражает растущий спрос гиперскейлеров и корпоративных клиентов на максимальное использование ресурсов ускорителей. Кроме того, премьера платформы является отражением роста конкуренции на рынке систем мониторинга и эксплуатации ИИ-инфраструктуры. Облачные операторы и другие компании, включая AMD, Intel и т.п., строят собственные платформы для телеметрии, диагностики и управления крупными ИИ-кластерами. Возможность NVIDIA интегрировать аппаратную телеметрию, проверку надёжности прошивок и операционную аналитику напрямую в инфраструктурный стек усиливает позиции компании в роли вертикально интегрированного поставщика ИИ-инфраструктуры. |
|
