Лента новостей
|
19.06.2025 [09:27], Владимир Мироненко
ИИ — это не только GPU: Marvell проектирует полсотни кастомных чипов для ЦОДПоскольку провайдеры облачных сервисов, ИИ-стартапы и суверенные субъекты масштабируют свои ЦОД, Marvell видит растущий спрос не только на основное вычислительное оборудование, включая пользовательские CPU, GPU и ускорители, но и на широкий спектр вспомогательных полупроводниковых элементов, включая контроллеры сетевых интерфейсов, чипы управления питанием, устройства расширения памяти и т.д., пишет Converge Digest. В ходе мероприятия для инвесторов AI Investor Day 2025 гендиректор Мэтт Мерфи (Matt Murphy) обрисовал растущую роль компании в поддержке ИИ-инфраструктуры, отметив два ключевых события, формирующих рынок: рост числа новых разработчиков ИИ-инфраструктуры за пределами традиционных четырёх ведущих гиперскейлеров и быстрое появление компонентов XPU Attach как важной новой категории кастомных полупроводников. Мерфи отметил, что эти тенденции способствуют формированию гораздо более крупного и разнообразного общего целевого рынка, чем прогнозировалось ранее. Мерфи рассказал, как резко выросли глобальные капитальные затраты на ЦОД, обусловленные ростом гиперскейлеров и развитием суверенного ИИ. Ведущие американские гиперскейлеры — AWS, Microsoft, Google и Meta✴ — увеличили совокупные капитальные затраты со $150 млрд в 2023 году до более чем $300 млрд в 2025 году. По прогнозам, на глобальном уровне к 2028 году затраты превысят уже $1 трлн. Marvell считает, что значительная часть этих расходов будет направлена на кастомные полупроводниковые платформы. Marvell пересмотрела прогноз общего целевого рынка (TAM) в сторону увеличения до $94 млрд к 2028 году, что на 25 % больше её оценки в прошлом году. Эта сумма включает:
Мерфи подчеркнул, что XPU Attach — прорывная категория, отметив, что «вычислительные ИИ-платформы больше не определяются одним чипом. Это сложные системы с бурным ростом числа сокетов — каждый из которых представляет собой новую возможность [для компании]». «В прошлом году у нас было три кастомных вычислительных чипа и TAM на $75 млрд. В этом году у нас 18 сокетов, TAM на $94 млрд и растущий поток из более чем 50 проектов. Рынок ИИ-инфраструктуры быстро развивается, и Marvell находится прямо в его центре», — подытожил Мерфи. Marvell на сегодняшний день обеспечила разработку 18 кастомных чипов:
Marvell сопровождает более 50 активных кастомных полупроводниковых проектов — сочетание XPU и Attach — с более чем 10 клиентами. Среди них облачные гиперскейлеры, новые ИИ-стартапы и национальные ИИ-инициативы. По оценкам компании, эти проекты принесут $75 млрд потенциального дохода за весь срок их реализации, и это без учёта 18 уже готовых проектов. Мерфи подчеркнул, что на этом рынке больше не доминирует несколько «мегасокетов». «Ещё в 2023 году на один сокет приходилось 75 % TAM. К 2028 году ни один сокет не будет превышать 10–15 %. Это огромная диверсификация — и она отлично подходит для нас», — сообщил глава Marvell.
18.06.2025 [23:12], Владимир Мироненко
По следам: Роскомнадзор потребует от операторов сведения об оборудовании и маршрутах трафикаРоскомнадзор планирует усилить контроль деятельности операторов, расширив перечень параметров, подлежащих оценке при проведении плановых и неплановых проверок, пишут «Ведомости» со ссылкой на проект нового проверочного листа, опубликованный на Федеральном портале проектов нормативных правовых актов. Согласно документу, помимо сведений о наличия лицензий, соблюдении правил присоединения и взаимодействия сетей, предоставления доступа к экстренным службам, перечень контрольных вопросов теперь касается технических аспектов работы сетевой инфраструктуры оператора, включая подтверждение того, что весь передаваемый трафик проходит через ТСПУ, к которым должен быть обеспечен доступ Центра мониторинга РКН. Также оператору будет необходимо предоставить сведения об устройствах, которые используются для обработки трафика и как реализовано к ним подключение. Новый перечень также теперь включает вопросы о пользовательском оборудовании и параметрах маршрутизации трафика — о MAC- и IP-адресах, характеристиках оборудования и направлениях маршрутизации трафика. Кроме того, в проекте добавлено требование к операторам по ограничению доступа к конфиденциальной информации подрядных организаций, занимающихся обслуживанием сетевой инфраструктуры. По словам источника «Ведомостей» в крупной IT-компании, проект проверочного листа не вводит новых обязанностей для операторов связи, поскольку все добавленные в него параметры закреплены действующим законодательством. Просто регулятор расширил перечень показателей, которые подлежат проверке при проведении контрольно-надзорных мероприятий. По мнению одного из экспертов, расширение отчётности регулятором может быть направлено на решение двух задач — пресечение преступлений экстремистской направленности и расширение его полномочий в области контроля цифрового пространства.
18.06.2025 [18:18], Руслан Авдеев
Дата-центры несут угрозу электросетям США из-за своей непредсказуемостиАмериканский регулятор North American Electric Reliability Corp. (NERC), отвечающий за надзор за электросетями и сопутствующей инфраструктурой в США, заявил, что подключение к сетям ЦОД в настоящее время весьма рискованно. Речь идёт об одной из самых серьёзных угроз надёжности сетей в краткосрочной перспективе, сообщает Bloomberg. Растущие кампусы ЦОД, занимающиеся майнингом криптовалют и ИИ-вычислениями, развиваются значительно быстрее, чем электростанции и линии электропередач, необходимые для обеспечения таких объектов электроэнергией. В результате, как заявляется в отчёте NERC, такая ситуация может привести к нарушению стабильности энергосистемы в целом. В первую очередь это связано с тем, что дата-центрам необходимо огромное количество энергии в непредсказуемые интервалы времени. Кроме того, они очень чувствительны к перепадам напряжения, что делает их главным, плохо прогнозируемым фактором влияния на энергосистемы. Они попросту не готовы к такому режиму использования. Как заявляют в NERC, в мировой «столице» ЦОД, регионе Северная Вирджиния, в июле 2024 года разом отключились дата-центры общей мощностью около 1,5 ГВт. В феврале текущего года из-за проблем с напряжением ситуация снова повторилась, затронув уже 1,8 ГВт мощностей. Считается, что отключения подобных масштабов могут иметь «волновой» эффект, распространяющийся на всю энергосеть страны. В отчёте NERC утверждается, что отключения нагрузки подобного масштаба сопоставимы с неожиданным включением в сеть крупной атомной электростанции. В результате из-за излишков энергии создаётся гигантский дисбаланс.
Источник изображения: Matt Richmond/unsplash.com Расследование NERC показало, что в случае серии коротких сбоев в течение небольшого периода времени дата-центры не переключаются обратно на основную энергосеть — это приходится делать вручную, причём ЦОД в этом время часами питаются от резервных источников. Пока что такие резкие перепады не привели к катастрофам, но операторам энергосетей пришлось принимать меры для сокращения подачи электричества в сеть. Более того, в будущем подобные проблемы, вероятно, станут более распространёнными, поскольку спрос на электричество для ЦОД в Вирджинии только растёт. Регулятор утверждает, что необходимо срочно найти способ максимально безболезненно интегрировать дата-центры в электросети. США всё ещё находятся на ранней стадии бума ИИ, который в Вашингтоне считают необходимым для обеспечения национальной безопасности. В NERC заявили о необходимости разработки моделей, позволяющих лучше понять, как именно ЦОД используют электричество. Регулятор пришёл к выводу, что полезнее всего для обеспечения стабильности сетей будет применение аккумуляторных хранилищ. В конце прошлого года сообщалось, что в 2028 году на дата-центры США может прийтись уже 12 % энергопотребления всей страны. По данным Международного энергетического агентства (IEA), в мировом масштабе энергопотребление ЦОД к 2030 году вырастет более чем вдвое, а из-за ИИ придётся сжигать больше угля и газа.
18.06.2025 [16:03], Руслан Авдеев
Cove Architecture представили первый ЦОД, полностью спроектированный ИИКомпания Cove Architecture, вероятно, впервые в отрасли представила проект ЦОД, полностью созданный ИИ. Речь идёт об объекте площадью чуть менее 1 тыс. м2 — за 30 дней выполнено то, на что обычно уходят месяцы, сообщает Datacenter Knowledge. ИИ ЦОД стали одним из важнейших направлений работ в архитектуре — при этом операторы всё чаще используют ИИ для оптимизации систем охлаждения, управления инфраструктурой (DCIM) и выбора площадок для строительства. Представленный Cove Architecture проект ЦОД для Хартсела (Hartsel, Колорадо) пока ожидает одобрения властей. Это первый проект в отрасли, разработанный с использованием ИИ-платформы для архитекторов, утверждает компания. ИИ помог протестировать и оптимизировать различные конфигурации дата-центра, сократив время работы с недель до минут. При этом достигнут отличный показатель энергоэффективности (PUE) на уровне 1,2.
Источник изображения: Cove Architecture Ключевые детали проекта:
ИИ меняет принципы проектирования дата-центров, позволяя комплексно оптимизировать энергопотребление и вычислительные мощности вместо использования разрозненных решений. Это не только экологично, но и экономически выгодно. Опора на ИИ, по словам представителей компании, меняет правила игры в отрасли. С использованием цифровых двойников будет гораздо дешевле проводить проверки качества, чем делать это в полевых условиях. При этом, как считают в Omdia, человеческая составляющая по-прежнему необходима и в ближайшее время это не изменится, поскольку при проектировании необходимо учитывать множество факторов.
Источник изображения: Zan Lazarevic/unsplash.com В компании настроены оптимистично и заявляют, что ИИ-платформа позволяет учитывать местные требования к зонированию территорий, исторические данные о юридической практике одобрений таких проектов и даже климатические нюансы. Как заявляют в Cove Architecture, использование ИИ в проектировании дата-центров позволяет найти баланс для сложных, часто противоречивых требований: обеспечение доходности, соответствия стандартам, высокого качества дизайна и максимальной эффективности без ущерба экоустойчивости. Такое проектирование — лучший пример того, как технологии помогают избегать традиционных компромиссов в архитектуре, когда одним показателем приходится жертвовать в пользу другого.
18.06.2025 [14:56], Руслан Авдеев
xAI Илона Маска ежемесячно «сжигает» $1 млрд в надежде на будущие прибылиСтартап xAI Илона Маска (Elon Musk) ежемесячно тратит $1 млрд, поскольку стоимость создания компанией передовых ИИ-моделей значительно выше его доходов. Скорость трат средств компанией наглядно демонстрирует огромные финансовые потребности отрасли ИИ, сообщает Bloomberg со ссылкой на собственные источники. Для того, чтобы компенсировать дисбаланс, xAI пытается привлечь $9,3 млрд в долг и в виде акционерного капитала. При этом компания уже намерена потратить более половины из этих средств в ближайшие три месяца. Всего в 2025 году xAI, стоящая за чат-ботом Grok, рассчитывает потратить $13 млрд, но пока её усилия по сбору средств едва поспевают за расходами. Отчасти подобная ситуация обусловлена огромными расходами, с которыми столкнулись все ИИ-компании при создании современных ЦОД и покупке ускорителей для обучения LLM. По данным экспертов Carlyle Group, к 2030 году для удовлетворения спроса на ИИ-инфраструктуру будет потрачено более $1,8 трлн. В компании CreditSights тоже уверены, что разработчики «сожгут много-много денег», поскольку пространство «очень конкурентное».
Источник изображения: Bloomberg При этом компания Маска пока не может зарабатывать столько, сколько OpenAI или Anthropic. Ни одна из этих компаний не раскрывает точных финансовых показателей, но ранее Bloomberg сообщал, что OpenAI ожидает выручить в 2025 году $12,7 млрд, тогда как xAI недавно объявила инвесторам, что в этом году её выручка составит лишь $500 млн, а в следующем — более $2 млрд. Сильная сторона xAI в том, что её глава Илон Маск, самый богатый человек в мире, не раз демонстрировал готовность тратить собственные средства на гигантские футуристические проекты задолго до того, как те начнут приносить деньги. В самой xAI, пытающейся создать «сверхразумный искусственный интеллект», способный конкурировать с людьми, считают, что компания имеет особые преимущества, которые позволят рано или поздно догнать конкурентов. Пока некоторые из компаний арендуют чипы и прочие мощности, xAI платит за большую часть инфраструктуры сама, а также пользуется ресурсами социальной сети X, которая тоже закупала ускорители. По словам Маска, xAI продолжит закупки новых чипов. После недавнего слияния xAI и X руководители ИИ-подразделения компании рассчитывают, что смогут обучать модели на архиве сообщений социальной сети, а не платить за массивы данных на стороне, как другие ИИ-компании. В результате xAI оптимистично рассчитывает стать прибыльной уже к 2027 году. Для сравнения, OpenAI предполагает «выйти в плюс» к 2029 году.
Источник изображения: Bloomberg Оптимистичные прогнозы, популярность Маска и его близость к властям в США привлекают инвесторов. Оценка xAI выросла до $80 млрд в конце I квартала, хотя в конце 2024 года она была на уровне $51 млрд. Среди инвесторов замечены Andreessen Horowitz, Sequoia Capital и VY Capital. Сейчас xAI спешит собрать достаточно денег, чтобы покрыть свои колоссальные расходы. По словам экспертов, с момента основания в 2023 году по июнь текущего компания привлекла $14 млрд акционерного капитала, из них на начало I квартала 2025 года оставалось лишь $4 млрд, оставшиеся средства компания рассчитывала потратить во II квартале. Сейчас компания завершает очередной раунд акционерного финансирования на $4,3 млрд и намерена привлечь ещё $6,4 млрд в следующем году, не считая долга в $5 млрд. Ожидается, что корпоративный долг поможет оплатить развитие ЦОД xAI. Компания также рассчитывает получить скидку в $650 млн от одного из производителей оборудования. По данным Bloomberg, уже есть первые признаки того, что xAI столкнулась с трудностями при привлечении инвестиций на первоначальных условиях. Инвесторы проявляли сдержанность, но после того, как компания изменила условия сделки в их пользу и предоставила дополнительную финансовую информацию, интерес к инвестициям вырос. Morgan Stanley, отвечающая за привлечение долговых средств xAI, отказалась от комментариев.
18.06.2025 [11:57], Руслан Авдеев
Firebird намерена построить в Армении 100-МВт ИИ ЦОДКомпания Firebird, специализирующаяся на облачных ИИ-технологиях, совместно с правительством Армении объявили о планах ввода в эксплуатацию в 2026 году ИИ ЦОД на 100 МВт. Предполагается, что он будет оснащён «тысячами» ускорителей NVIDIA Blackwell, сообщает Datacenter Dynamics. Финансирование проекта будет осуществляться в рамках государственно-частного партнёрства. Проект оценивается в $500 млн. По словам премьер-министра Армении, речь идёт о важном шаге на пути укрепления технологического сектора и глобального партнёрства в целом. Как заявил министр, правительство с радостью поддерживает инициативу, открывающую новые возможности для народа и региона. О самой компании Firebird и проекте пока известно не слишком много. По имеющимся данным, генеральным директором и соучредителем является американский бизнесмен с армянскими корнями Размик Овакимян (Razmig Hovaghimian). Он известен сотрудничеством с несколькими медийными и спортивными компаниями, включая Rakuten Viki, NBC, Hoodline и Matchday. По словам бизнесмена, компания намерена инвестировать в новые модели, робототехнику и науку, привлекая к партнёрству ведущие мировые университеты. Также планируется наращивать потенциал для взращивания нового поколения новаторов в Армении.
Источник изображения: Ivars Utināns/unspalsh.com Ключевым инвестором Firebird выступит фонд «Афеян для Армении» (Afeyan Foundation for Armenia), а его глава Нубар Афеян (Noubar Afeyan), также являющийся руководителем компании Flagship Pioneering, получит должность стратегического консультанта и партнёра-основателя Firebird. По словам Афеяна, Армения намерена сделать ставку на глобальное сотрудничество и долгосрочные инвестиции в технологии. Развитие ИИ-инфраструктуры для страны и окружающего региона — смелый шаг, рассчитанный на превращение Армении в значимого участника «мирового ИИ-ландшафта». Развитие ИИ-инфраструктуры в Армении также поддержат Team Group, материнская компания Telecom Armenia и ирландской Imagine Broadband. Как заявил в своё время генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang), «ИИ-фабрики — инфраструктура XXI века» и сотрудничество с Арменией поможет «открыть новые возможности для инноваций во всём регионе». Пока же в Армении существует небольшой рынок ЦОД. Армянская телеком-компания Ovio, принадлежащая «Ростелекому», Datacom Company и Arminco управляют ЦОД в Ереване. Небольшой объект строится местной VSDATA.
18.06.2025 [11:54], Сергей Карасёв
Мини-плата для мини-маршрутизатора: представлена Orange Pi R2S с чипом RISC-VВ семействе одноплатных компьютеров Orange Pi, по сообщению ресурса CNX Software, появилась модель R2S, которую можно использовать для построения различных сетевых устройств, в частности, маршрутизаторов. Новинка уже доступна для заказа по цене от $30. В основу изделия положен процессор Ky X1 с восемью 64-битными ядрами RISC-V (RV64GCVB), функционирующими на частоте до 1,6 ГГц. В состав чипа входят графический ускоритель Imagination IMG BXE-2-32 (819 МГц) с поддержкой OpenGL ES3.2, Vulkan 1.3 и OpenCL 3.0, а также VPU-блок с возможностью декодирования видео H.265, H.264, VP8, VP9, MPEG4, MPEG2 в форматах до 4K@60 Гц и кодирования H.265, H.264, VP8, VP9 в форматах до 4K @ 30 Гц. Процессор также располагает ИИ-ускорителем с производительностью до 2 TOPS (INT8). В зависимости от модификации плата несёт на борту 2, 4 или 8 Гбайт памяти LPDDR4X. Предусмотрены флеш-модуль eMMC вместимостью 8 Гбайт и слот для карты microSD. За сетевые подключения отвечают два порта 2.5GbE на основе контроллеров RealTek RTL8125BG и два порта 1GbE на базе YT8531C-CA: во всех случаях для подключения кабелей служат разъёмы RJ45. Кроме того, имеются по одному порту USB 3.0 и USB 2.0. Питание 5 В / 3 A подаётся через порт USB Type-C. Изделие имеет размеры 79,2 × 46 мм и весит 60 г. Отмечается, что для новинки будут доступны образы OpenWrt 24.10 и Ubuntu 24.04 (ядро Linux 6.6.xx). Стоимость Orange Pi R2S с 2 Гбайт ОЗУ составляет $30, с 4 Гбайт — $40. Цена варианта с 8 Гбайт памяти пока не указывается, но, по всей видимости, она окажется на уровне $50.
18.06.2025 [09:29], Руслан Авдеев
Дата-центры Яндекса нарастили энергопотребление, сохранив PUEКомпания «Яндекс» опубликовала отчёт об устойчивом развитии в 2024 году. Немало внимание в материалах уделили статистике и выводам, посвящённым работе её дата-центров, в том числе — показателям энергоэффективности и углеродным выбросам, сообщает пресс-служба группы. На территории России на конец 2024 года Яндекс располагал пятью дата-центрами. По словам компании, особое внимание энергоэффективности уделялось уже на этапе проектирования ЦОД. Компания занимается разработкой собственного серверного оборудования, готового к стабильной работе при высоких температурах. Особая конструкция серверов позволяет не применять системы кондиционирования с водой и хладагентами — вместо этого используется фрикулинг, который снижает энергопотребление, уменьшает капитальные затраты и позволяет оптимизировать использование площадей ЦОД (впрочем, развитие ИИ не всегда совместимо с таким подходом). Применяются и другие технологии энергосбережения, например, суперкомпьютеры используют специальную систему эффективного отвода тепла, экономящие электричество. Такие решения тратят на 30–50 % меньше электроэнергии, чем серверы со стандартной архитектурой при прочих равных условиях.
Источник изображений: Яндекс Среднегодовой PUE крупнейших дата-центров Яндекса составляет 1,15, что заметно ниже среднемирового показателя 1,56. PUE для всех ЦОД Яндекса составил 1,26. В сравнении с 2023 годом среднегодовой PUE ЦОД Яндекса не изменился и остался близок к значению 2022 года (1,25). Тепловая энергия закупалась только для ЦОД Мытищи. Увеличение расхода тепла на 34 % связано с переходом на полный учёт потребления — ранее часть теплоэнергии включалась в арендную плату и не учитывалась отдельно. По сравнению с прошлым отчётным периодом потребление дизельного топлива выросло на 35 % из-за использования дизельных генераторов в период модернизации высоковольтной подстанции в ЦОД Сасово и пусконаладочных испытаний генераторной установки в ЦОД Владимир. Наконец, природный газ используется только в ЦОД Сасово для охлаждения серверного оборудования, не рассчитанного на работу при высоких температурах. При слишком высокой температуре воздуха на улице вместо фрикулинга используется режим рециркуляции с охлаждением. Потребление природного газа в 2024 году снизилось на 43 %. Это обусловлено выводом из эксплуатации ряда модулей, которые летом охлаждались с помощью абсорбционных холодильных машин. Что касается углеродных выбросов, более половины совокупного углеродного следа компании приходится именно на дата-центры — 51 % (в 2023 году речь шла о 53 %). Прямой и косвенный углеродный след Яндекса связан с работой инфраструктуры, помимо ЦОД, включающей недвижимое и движимое имущество, от офисов до площадок сервисов доставки и автомобилей. В 2024 году валовые выбросы парниковых газов инфраструктуры выросли на 24 % — до 395 тыс. т СО2-эквивалента. Прямые выбросы Scope 1 выросли на 39 %, а косвенные (Scope 2), связанные с потреблением закупленной энергии, увеличились на 17%. В первую очередь показатели выросли в связи с улучшением системы сбора данных. Увеличение выбросов связано и с ростом потребления электроэнергии дата-центрами и повышением углеродоёмкости 1 кВт·ч в 2024 году, а также в связи с другими факторами. Специальная статистика по углеродным выбросам представлена в приложении. Важную роль играют показатели облачной платформы Yandex Cloud построенной на ЦОД Яндекса. Число коммерческих клиентов платформы в 2024 году выросло до 44 тыс., на 54 % больше, чем в 2023 году. По статистике компании, Yandex Cloud избежала 11,7 тыс. выбросов, эквивалентных CO2e за счёт «использования энергоэффективной серверной инфраструктуры», что равносильно выбросам от годового пробега более 2,7 тыс. легковых автомобилей. Подчёркивается, что если бы в 2024 году использовали оборудование со среднемировыми показателями энергоэффективности, энергопотребление облака Yandex Cloud выросло бы на 50,5 %. В сравнении с 2023 годом энергопотребление ЦОД Яндекса в 2024 году выросло на 9 %, что связано с «расширением мощностей и увеличением вычислительной нагрузки в связи с ростом бизнеса». В целом энергопотребление дата-центров составило в 2024 году 594,16 ГВт∙ч — против 545,64 ГВт∙ч в 2023 году.
18.06.2025 [08:52], Владимир Мироненко
Официальное контейнерное окружение «1С-Битрикс» упростит и ускорит развёртывание её продуктовКомпания «1С-Битрикс» представила контейнерное окружение своих продуктов. Решение на базе Docker позволяет быстро настраивать среду для тестирования и разработки, и устанавливать за несколько минут любую редакцию продуктов компании. Решение ускорит и упростит разработчикам и DevOps-инженерам запуск пилотных проектов, а также локальную разработку и тестирование, а для крупных компаний — обеспечит управляемость и бесшовную интеграцию в сложные мультисервисные кластеры. Конфигурация серверного окружения состоит из более чем десяти контейнеров и микросервисов. Dockerfile, Docker-compose и .env-файлы находятся в официальном GitHub-репозитории «1С-Битрикс». Наличие официальных образов контейнеров позволяет сократить технологические риски и сэкономить время на самостоятельной сборке образов контейнера PHP, Nginx или NodeJS для запуска «Битрикс». В числе главных преимуществ официального контейнерного окружения компания указала:
Разработчики, тестировщики и специалисты по безопасности смогут быстро запустить «Управление сайтом» или «Битрикс24» из контейнеров даже на рабочем столе и получить всю необходимую информацию без привлечения системных администраторов и управления правами доступа.
17.06.2025 [23:55], Владимир Мироненко
AMD анонсировала платформу ROCm 7.0, облако для разработчиков AMD Developer Cloud и программу Radeon Test DriveAMD вместе с ускорителями Instinct MI350X/MI355X представила 7-ю версию своего открытого программного стека ROCm (Radeon open compute). Как сообщает компания, ROCm 7.0 предназначен для удовлетворения растущих потребностей рабочих нагрузок генеративного ИИ и HPC, одновременно расширяя возможности разработчиков за счёт доступности, эффективности и активного сотрудничества сообщества. По данным AMD, платформа ROCm 7 предлагает более чем в 3,5 раза большую производительность инференса, чем ROCm 6, и в 3 раза большую эффективность обучения. Это стало возможным благодаря улучшениям производительности и поддержке типов данных с меньшей точностью, таких как FP4 и FP6. Дальнейшие улучшения в коммуникационных стеках позволили оптимизировать использование ускорителя и перемещение данных. ROCm 7 поддерживает распределённый инференс, а также фреймворки SGLang, vLLM и llm-d. Платформа ROCm 7 создавалась совместно с этими партнёрами, включая разработку общих интерфейсов и примитивов для обеспечения эффективного распределённого инференса на платформах AMD.
Источник изображений: AMD Вместе с ROCm 7 компания представила MLOps-платформу ROCm Enterprise AI для бесперебойных ИИ-операций в корпоративном сегменте. Платформа предлагает инструменты для тонкой настройки модели и интеграции как со структурированными, так и неструктурированными рабочими процессами. AMD заявила, что работает с партнёрами по экосистеме над созданием эталонных реализаций для таких приложений, как чат-боты и обобщение документов. ![]() AMD отметила, что тесное партнёрство гарантирует разработчикам доступ к лучшим в своем классе инструментам, постоянному улучшению производительности и открытой среде для быстрой итерации и развёртывания. Также AMD представила партнёров экосистемы ROCm, которые используют преимущества данной платформы:
Кроме того, AMD представила «простую в использовании платформу для разработчиков» AMD Developer Cloud, обеспечивающую быстрый доступ к AMD Instinct с возможностью масштабирования от одного (192 Гбайт памяти) до восьми AMD Instinct MI300X (1536 Гбайт памяти). Сообщается, что конфигурации с одним ускорителем в основном используются для рабочих нагрузок инференса на «лёгких» моделях, тогда как максимальная конфигурация обеспечивает распределённое обучение, тонкую настройку и высокопроизводительный инференс для крупномасштабных моделей. AMD сообщила, что платформа AMD Developer Cloud была разработана с учётом четырёх основных целей:
По словам компании, AMD Developer Cloud предполагает различные варианты использования. Решение идеально подходит для независимых разработчиков AI/ML, работающих над низкоуровневым программированием, разработкой ядер (kernel) или корпоративных приложений и проектов, нацеленных на нативную поддержку AMD. Также платформу можно использовать для мероприятий и хакатонов, обеспечивая масштабируемую поддержку образовательных и практических мероприятий с предоставлением кредитов на использование ускорителей во время семинаров, хакатонов, конкурсов и демонстраций. Также с выходом ROCm 7 появилась поддержка ноутбуков и рабочих станциях на Windows с видеокартами Radeon и процессорами Ryzen AI. С этим связан ещё один важный анонс — компания представила программу ROCm on Radeon Test Drive, которая будет запущена этим летом партнёрстве с различными поставщиками оборудования (первыми стали Colfax и System76), чтобы упростить разработчикам возможность опробовать ROCm на GPU Radeon, передаёт Phoronix. В рамках Radeon Test Drive предоставляется возможность удалённо протестировать GPU Radeon (PRO). |
|


