Материалы по тегу: а
|
18.06.2025 [18:18], Руслан Авдеев
Дата-центры несут угрозу электросетям США из-за своей непредсказуемостиАмериканский регулятор North American Electric Reliability Corp. (NERC), отвечающий за надзор за электросетями и сопутствующей инфраструктурой в США, заявил, что подключение к сетям ЦОД в настоящее время весьма рискованно. Речь идёт об одной из самых серьёзных угроз надёжности сетей в краткосрочной перспективе, сообщает Bloomberg. Растущие кампусы ЦОД, занимающиеся майнингом криптовалют и ИИ-вычислениями, развиваются значительно быстрее, чем электростанции и линии электропередач, необходимые для обеспечения таких объектов электроэнергией. В результате, как заявляется в отчёте NERC, такая ситуация может привести к нарушению стабильности энергосистемы в целом. В первую очередь это связано с тем, что дата-центрам необходимо огромное количество энергии в непредсказуемые интервалы времени. Кроме того, они очень чувствительны к перепадам напряжения, что делает их главным, плохо прогнозируемым фактором влияния на энергосистемы. Они попросту не готовы к такому режиму использования. Как заявляют в NERC, в мировой «столице» ЦОД, регионе Северная Вирджиния, в июле 2024 года разом отключились дата-центры общей мощностью около 1,5 ГВт. В феврале текущего года из-за проблем с напряжением ситуация снова повторилась, затронув уже 1,8 ГВт мощностей. Считается, что отключения подобных масштабов могут иметь «волновой» эффект, распространяющийся на всю энергосеть страны. В отчёте NERC утверждается, что отключения нагрузки подобного масштаба сопоставимы с неожиданным включением в сеть крупной атомной электростанции. В результате из-за излишков энергии создаётся гигантский дисбаланс.
Источник изображения: Matt Richmond/unsplash.com Расследование NERC показало, что в случае серии коротких сбоев в течение небольшого периода времени дата-центры не переключаются обратно на основную энергосеть — это приходится делать вручную, причём ЦОД в этом время часами питаются от резервных источников. Пока что такие резкие перепады не привели к катастрофам, но операторам энергосетей пришлось принимать меры для сокращения подачи электричества в сеть. Более того, в будущем подобные проблемы, вероятно, станут более распространёнными, поскольку спрос на электричество для ЦОД в Вирджинии только растёт. Регулятор утверждает, что необходимо срочно найти способ максимально безболезненно интегрировать дата-центры в электросети. США всё ещё находятся на ранней стадии бума ИИ, который в Вашингтоне считают необходимым для обеспечения национальной безопасности. В NERC заявили о необходимости разработки моделей, позволяющих лучше понять, как именно ЦОД используют электричество. Регулятор пришёл к выводу, что полезнее всего для обеспечения стабильности сетей будет применение аккумуляторных хранилищ. В конце прошлого года сообщалось, что в 2028 году на дата-центры США может прийтись уже 12 % энергопотребления всей страны. По данным Международного энергетического агентства (IEA), в мировом масштабе энергопотребление ЦОД к 2030 году вырастет более чем вдвое, а из-за ИИ придётся сжигать больше угля и газа.
18.06.2025 [16:03], Руслан Авдеев
Cove Architecture представили первый ЦОД, полностью спроектированный ИИКомпания Cove Architecture, вероятно, впервые в отрасли представила проект ЦОД, полностью созданный ИИ. Речь идёт об объекте площадью чуть менее 1 тыс. м2 — за 30 дней выполнено то, на что обычно уходят месяцы, сообщает Datacenter Knowledge. ИИ ЦОД стали одним из важнейших направлений работ в архитектуре — при этом операторы всё чаще используют ИИ для оптимизации систем охлаждения, управления инфраструктурой (DCIM) и выбора площадок для строительства. Представленный Cove Architecture проект ЦОД для Хартсела (Hartsel, Колорадо) пока ожидает одобрения властей. Это первый проект в отрасли, разработанный с использованием ИИ-платформы для архитекторов, утверждает компания. ИИ помог протестировать и оптимизировать различные конфигурации дата-центра, сократив время работы с недель до минут. При этом достигнут отличный показатель энергоэффективности (PUE) на уровне 1,2.
Источник изображения: Cove Architecture Ключевые детали проекта:
ИИ меняет принципы проектирования дата-центров, позволяя комплексно оптимизировать энергопотребление и вычислительные мощности вместо использования разрозненных решений. Это не только экологично, но и экономически выгодно. Опора на ИИ, по словам представителей компании, меняет правила игры в отрасли. С использованием цифровых двойников будет гораздо дешевле проводить проверки качества, чем делать это в полевых условиях. При этом, как считают в Omdia, человеческая составляющая по-прежнему необходима и в ближайшее время это не изменится, поскольку при проектировании необходимо учитывать множество факторов.
Источник изображения: Zan Lazarevic/unsplash.com В компании настроены оптимистично и заявляют, что ИИ-платформа позволяет учитывать местные требования к зонированию территорий, исторические данные о юридической практике одобрений таких проектов и даже климатические нюансы. Как заявляют в Cove Architecture, использование ИИ в проектировании дата-центров позволяет найти баланс для сложных, часто противоречивых требований: обеспечение доходности, соответствия стандартам, высокого качества дизайна и максимальной эффективности без ущерба экоустойчивости. Такое проектирование — лучший пример того, как технологии помогают избегать традиционных компромиссов в архитектуре, когда одним показателем приходится жертвовать в пользу другого.
18.06.2025 [09:29], Руслан Авдеев
Дата-центры Яндекса нарастили энергопотребление, сохранив PUEКомпания «Яндекс» опубликовала отчёт об устойчивом развитии в 2024 году. Немало внимание в материалах уделили статистике и выводам, посвящённым работе её дата-центров, в том числе — показателям энергоэффективности и углеродным выбросам, сообщает пресс-служба группы. На территории России на конец 2024 года Яндекс располагал пятью дата-центрами. По словам компании, особое внимание энергоэффективности уделялось уже на этапе проектирования ЦОД. Компания занимается разработкой собственного серверного оборудования, готового к стабильной работе при высоких температурах. Особая конструкция серверов позволяет не применять системы кондиционирования с водой и хладагентами — вместо этого используется фрикулинг, который снижает энергопотребление, уменьшает капитальные затраты и позволяет оптимизировать использование площадей ЦОД (впрочем, развитие ИИ не всегда совместимо с таким подходом). Применяются и другие технологии энергосбережения, например, суперкомпьютеры используют специальную систему эффективного отвода тепла, экономящие электричество. Такие решения тратят на 30–50 % меньше электроэнергии, чем серверы со стандартной архитектурой при прочих равных условиях.
Источник изображений: Яндекс Среднегодовой PUE крупнейших дата-центров Яндекса составляет 1,15, что заметно ниже среднемирового показателя 1,56. PUE для всех ЦОД Яндекса составил 1,26. В сравнении с 2023 годом среднегодовой PUE ЦОД Яндекса не изменился и остался близок к значению 2022 года (1,25). Тепловая энергия закупалась только для ЦОД Мытищи. Увеличение расхода тепла на 34 % связано с переходом на полный учёт потребления — ранее часть теплоэнергии включалась в арендную плату и не учитывалась отдельно. По сравнению с прошлым отчётным периодом потребление дизельного топлива выросло на 35 % из-за использования дизельных генераторов в период модернизации высоковольтной подстанции в ЦОД Сасово и пусконаладочных испытаний генераторной установки в ЦОД Владимир. Наконец, природный газ используется только в ЦОД Сасово для охлаждения серверного оборудования, не рассчитанного на работу при высоких температурах. При слишком высокой температуре воздуха на улице вместо фрикулинга используется режим рециркуляции с охлаждением. Потребление природного газа в 2024 году снизилось на 43 %. Это обусловлено выводом из эксплуатации ряда модулей, которые летом охлаждались с помощью абсорбционных холодильных машин. Что касается углеродных выбросов, более половины совокупного углеродного следа компании приходится именно на дата-центры — 51 % (в 2023 году речь шла о 53 %). Прямой и косвенный углеродный след Яндекса связан с работой инфраструктуры, помимо ЦОД, включающей недвижимое и движимое имущество, от офисов до площадок сервисов доставки и автомобилей. В 2024 году валовые выбросы парниковых газов инфраструктуры выросли на 24 % — до 395 тыс. т СО2-эквивалента. Прямые выбросы Scope 1 выросли на 39 %, а косвенные (Scope 2), связанные с потреблением закупленной энергии, увеличились на 17%. В первую очередь показатели выросли в связи с улучшением системы сбора данных. Увеличение выбросов связано и с ростом потребления электроэнергии дата-центрами и повышением углеродоёмкости 1 кВт·ч в 2024 году, а также в связи с другими факторами. Специальная статистика по углеродным выбросам представлена в приложении. Важную роль играют показатели облачной платформы Yandex Cloud построенной на ЦОД Яндекса. Число коммерческих клиентов платформы в 2024 году выросло до 44 тыс., на 54 % больше, чем в 2023 году. По статистике компании, Yandex Cloud избежала 11,7 тыс. выбросов, эквивалентных CO2e за счёт «использования энергоэффективной серверной инфраструктуры», что равносильно выбросам от годового пробега более 2,7 тыс. легковых автомобилей. Подчёркивается, что если бы в 2024 году использовали оборудование со среднемировыми показателями энергоэффективности, энергопотребление облака Yandex Cloud выросло бы на 50,5 %. В сравнении с 2023 годом энергопотребление ЦОД Яндекса в 2024 году выросло на 9 %, что связано с «расширением мощностей и увеличением вычислительной нагрузки в связи с ростом бизнеса». В целом энергопотребление дата-центров составило в 2024 году 594,16 ГВт∙ч — против 545,64 ГВт∙ч в 2023 году.
17.06.2025 [23:55], Владимир Мироненко
AMD анонсировала платформу ROCm 7.0, облако для разработчиков AMD Developer Cloud и программу Radeon Test DriveAMD вместе с ускорителями Instinct MI350X/MI355X представила 7-ю версию своего открытого программного стека ROCm (Radeon open compute). Как сообщает компания, ROCm 7.0 предназначен для удовлетворения растущих потребностей рабочих нагрузок генеративного ИИ и HPC, одновременно расширяя возможности разработчиков за счёт доступности, эффективности и активного сотрудничества сообщества. По данным AMD, платформа ROCm 7 предлагает более чем в 3,5 раза большую производительность инференса, чем ROCm 6, и в 3 раза большую эффективность обучения. Это стало возможным благодаря улучшениям производительности и поддержке типов данных с меньшей точностью, таких как FP4 и FP6. Дальнейшие улучшения в коммуникационных стеках позволили оптимизировать использование ускорителя и перемещение данных. ROCm 7 поддерживает распределённый инференс, а также фреймворки SGLang, vLLM и llm-d. Платформа ROCm 7 создавалась совместно с этими партнёрами, включая разработку общих интерфейсов и примитивов для обеспечения эффективного распределённого инференса на платформах AMD.
Источник изображений: AMD Вместе с ROCm 7 компания представила MLOps-платформу ROCm Enterprise AI для бесперебойных ИИ-операций в корпоративном сегменте. Платформа предлагает инструменты для тонкой настройки модели и интеграции как со структурированными, так и неструктурированными рабочими процессами. AMD заявила, что работает с партнёрами по экосистеме над созданием эталонных реализаций для таких приложений, как чат-боты и обобщение документов. ![]() AMD отметила, что тесное партнёрство гарантирует разработчикам доступ к лучшим в своем классе инструментам, постоянному улучшению производительности и открытой среде для быстрой итерации и развёртывания. Также AMD представила партнёров экосистемы ROCm, которые используют преимущества данной платформы:
Кроме того, AMD представила «простую в использовании платформу для разработчиков» AMD Developer Cloud, обеспечивающую быстрый доступ к AMD Instinct с возможностью масштабирования от одного (192 Гбайт памяти) до восьми AMD Instinct MI300X (1536 Гбайт памяти). Сообщается, что конфигурации с одним ускорителем в основном используются для рабочих нагрузок инференса на «лёгких» моделях, тогда как максимальная конфигурация обеспечивает распределённое обучение, тонкую настройку и высокопроизводительный инференс для крупномасштабных моделей. AMD сообщила, что платформа AMD Developer Cloud была разработана с учётом четырёх основных целей:
По словам компании, AMD Developer Cloud предполагает различные варианты использования. Решение идеально подходит для независимых разработчиков AI/ML, работающих над низкоуровневым программированием, разработкой ядер (kernel) или корпоративных приложений и проектов, нацеленных на нативную поддержку AMD. Также платформу можно использовать для мероприятий и хакатонов, обеспечивая масштабируемую поддержку образовательных и практических мероприятий с предоставлением кредитов на использование ускорителей во время семинаров, хакатонов, конкурсов и демонстраций. Также с выходом ROCm 7 появилась поддержка ноутбуков и рабочих станциях на Windows с видеокартами Radeon и процессорами Ryzen AI. С этим связан ещё один важный анонс — компания представила программу ROCm on Radeon Test Drive, которая будет запущена этим летом партнёрстве с различными поставщиками оборудования (первыми стали Colfax и System76), чтобы упростить разработчикам возможность опробовать ROCm на GPU Radeon, передаёт Phoronix. В рамках Radeon Test Drive предоставляется возможность удалённо протестировать GPU Radeon (PRO).
17.06.2025 [14:36], Владимир Мироненко
NVIDIA поможет Германии в создании индустриальных ИИ-облаков для европейских производителейNVIDIA объявила о планах по созданию первого в мире промышленного ИИ-облака для европейских производителей, базирующегося в Германии. ИИ-фабрики, которые развернут по всей стране, будут поддерживать разработку суверенных ИИ-приложений в государственном и частном секторах, в том числе для малых и средних компаний страны, известных как Mittelstand. На Mittelstand приходится 99 % всех предприятий в Германии и более половины экономического производства страны. ИИ-фабрика, построенная на системах NVIDIA DGX B200 и серверах NVIDIA RTX PRO с 10 тыс. ускорителей NVIDIA Blackwell позволит лидерам промышленности Европы ускорить работу индустриальных приложений, включая системы проектирования, инжиниринга и моделирования, цифровых двойников и робототехнику, сообщила компания. ИИ-фабрика будет построена в соответствии с концепцией NVIDIA Omniverse Blueprint. В Юлихском исследовательском центре (FZJ) в Германии идёт сборка суперкомпьютера JUPITER, который станет первой в Европе экзафлопсной системой. Благодаря 24 тыс. суперчипов GH200 с интерконнектом Quantum-2 InfiniBand JUPITER получит вдвое большую вычислительную мощность по сравнению с предыдущим самым мощным общедоступным суперкомпьютером континента. С его помощью исследователи смогут обучать большие языковые модели (LLM) с более чем 100 млрд параметров, заниматься моделированием климата, исследовать квантовых вычисления и разрабатывать лекарства. Во II половине 2026 года в Суперкомпьютерный центр Лейбница (LRZ) в Германии будет запущен суперкомпьютер Blue Lion с чипами NVIDIA Vera Rubin, предназначенный для ускорения исследований в области климата, физики и машинного обучения. NVIDIA также займётся созданием исследовательского центр в Германии в рамках программы NVIDIA AI Technology Center. Баварский ИИ-центр, который планируется создать в сотрудничестве с консорциумом BayernKI, будет продвигать исследования в таких областях, как цифровая медицина, устойчивая диффузия AI и платформы робототехники с открытым исходным кодом для содействия глобальному сотрудничеству. Технологии NVIDIA широко используются немецкими компаниями всех масштабов. В частности, ИИ-компания DeepL из Кёльна развёртывает кластер на базе DGX SuperPOD GB200, который позволит ей переводить весь контент в интернете всего за 18 дней вместо нынешних 194. А модели серии FLUX от Black Forest Labs из Фрайбурга включены в NVIDIA AI Blueprint. Немецкие разработчики систем робототехники, автоматизации и сенсорных систем, включая Agile Robots, idealworks, Neura Robotics и SICK, интегрируют платформу NVIDIA Isaac. Наконец, Finanz Informatik использует инфраструктуру и ПО NVIDIA AI Enterprise для разработки ИИ-ассистента для помощи сотрудникам в обработке банковских данных. Mercedes-Benz использует Omniverse для создания цифровых двойников своих заводов и NVIDIA DRIVE AV/AGX в своих автомобилях. Технологии NVIDIA применяют BMW Group и Continental. NVIDIA также назвала в числе немецких компаний, внедряющих её ИИ-технологии, KION Group, занимающуюся решениями в сфере цепочек поставок, ИИ-стартап в сфере юриспруденции Noxtua и компанию по кибербезопасности Security Networks AG.
Источник изображения: NVIDIA Чтобы инициировать трансформацию ИИ на всех уровнях экономики страны, необходимо обширное сообщество разработчиков в сфере ИИ, отметила NVIDIA. Поэтому Германия инвестирует в образование и повышение квалификации специалистов в области ИИ через некоммерческие организации, университеты и отраслевое сотрудничество. Одной из таких инициатив является appliedAI, крупнейшая в Европе инициатива по применению доверенного ИИ. В её рамках малым компаниям предоставляется доступ к современной инфраструктуре и ПО NVIDIA, практическому обучению и возможность подключения к экосистеме партнёров NVIDIA. Выступая на прошлом неделе с докладом на мероприятии GTC NVIDIA в Париже, гендиректор компании Дженсен Хуанг (Jensen Huang) заявил, что мощности для ИИ-вычислений в Европе вырастут в течение следующих двух лет на порядок. После фактической потери из-за санкций США доступа к рынку Китая, NVIDIA стремится расширить присутствие на новых рынках. Компания уже договорилась о сотрудничестве с французским стартапом Mistral, который построит ИИ-облако на базе 18 тыс. чипов NVIDIA Grace Blackwell. NVIDIA также объявила о запуске инфраструктурных проектов в Италии и Армении. Кроме того, компания заключила соглашения о сотрудничестве с такими телекоммуникационными компаниями, как Orange и Telefonica. В Европе компания уделяет особое внимание «суверенному ИИ», что подразумевает нахождение на территории ЕС дата-центров и серверов, предоставляющих услуги гражданам блока. NVIDIA также объявила о так называемых «технологических центрах» в Европе для передовых исследований, повышения квалификации рабочей силы и ускорении научных прорывов в таких странах, как Великобритания, Франция, Испания и Германия. NVIDIA также расширила возможности GPU-маркетплейса NVIDIA DGX Cloud Lepton.
16.06.2025 [12:21], Руслан Авдеев
Великобритания инвестирует почти $20 млрд в АЭС Sizewell C и множество малых модульных реакторов ради ИИ ЦОДВ свете растущего спроса дата-центров на энергию Великобритании делает ставку на атомную энергетику — правительство анонсировало инвестиции в объёме £14,2 млрд ($19,2 млрд) в строительство АЭС Sizewell C в Суффолке (Suffolk) и малых модульных реакторов (SMR), сообщает The Register. По словам Министерства энергетики, атомная энергетика нужна для достижения «золотого века» с изобилием «чистой» энергии. Это единственный способ защитить финансы, вернуть контроль над национальной энергетикой и справиться с климатическим кризисом. Строительство атомной электростанции к северо-востоку от Лондона одобрено Казначейством Великобритании. Сообщается, что 70 % контрактов в рамках этого проекта получат компании из британской цепочки поставок. Электрическая мощность Sizewell C должна составить около 3,2 ГВт. Помимо этого, правительство выразило приверженность идее строительства малых модульных реакторов. В частности, контракт на строительство выиграл промышленный гигант Rolls-Royce — речь идёт о создании реактора с генерацией 300 МВт электроэнергии — это будет первый из серии подобных SMR. Согласно правительственным данным, когда SMR и станция Sizewell C заработают в 2030-х годах, а в строй будет введена новая электростанция Hinkley Point C, которая сейчас всё ещё достраивается французской EDF, Великобритания будет отдавать в энергосеть больше «новой» атомной энергии, чем в предыдущие полвека. А энергия стране нужна и для электрификации транспорта в ответ на климатические изменения, и для ИИ ЦОД. В мае глава AWS Мэтт Гарман (Matt Garman) заявил, что Великобритании придётся создать новые технологии для обеспечения будущего спроса на электричество, в частности со стороны ИИ ЦОД. По его словам, атомная энергетика — большая часть нового проекта с расчётом на десятилетнюю перспективу. AWS пообещала инвестировать £8 млрд ($10,6 млрд) в Великобритании до конца 2028 года для удовлетворения спроса клиентов и партнёров в облачных сервисах. Группа гиперскейлеров, включающая Amazon, Meta✴ и Google уже заявили, что мир должен утроить генерацию атомной энергии к 2050 году для того, чтобы удовлетворить растущий спрос на электричество и намерены поддерживать соответствующие проекты. Не так давно в Великобритании уже было объявлено о намерении стать «ИИ-сверхдержавой» именно с упором на использование атомной энергетики. Правда, ещё в апреле местные политики и эксперты ломали головы над тем, где именно в кратчайшие сроки взять столько энергетических ресурсов.
16.06.2025 [08:56], Руслан Авдеев
Meta✴ подписала новое соглашение о поставках геотермальной энергииMeta✴ наращивает использование геотермальной энергии для своих ИИ ЦОД. В Нью-Мексико компания заключила сделку с компанией XGS Energy, разрабатывающей геотермальные технологии нового поколения — они позволяют использовать тепло Земли там, где ранее это было невозможно, сообщает The Verge. Согласно пресс-релизу, в рамках сделки региональная энергосистема, питающая в том числе дата-центры Meta✴, получит дополнительные 150 МВт. Гиперскейлеры отчаянно нуждаются в новых источниках энергии для своих ИИ ЦОД, желательно экологичных. По словам Meta✴, геотермальные технологии нового поколения готовы к масштабированию. ГеоЭС вырабатывают электричество, используя тепло Земли, например, горячей воды и пара из природных резервуаров — для обеспечения работы турбин. При этом удобных для использования источников в США не особенно много, поэтому США получают лишь около 0,5 % энергии из геотермальных источников. Некоторые стартапы пытаются изменить ситуацию, сделав подобную энергию более доступной. В прошлом году Meta✴ заключила сделку на 150 МВт с Sage Geosystems для строительства новых геотермальных электростанций. Sage работает над технологиями извлечения энергии из горячих сухих скальных образований, в которых путём бурения и закачки воды формируются искусственные резервуары. Google сотрудничает со стартапом Fervo, работающим над схожей технологией. XGS Energy тоже намерена использовать горячие сухие породы, но путём формирования закрытого водного контура, который предотвращает утечки закачиваемой воды в скальные трещины — вода фактически циркулирует внутри стальной конструкции. Экономия особенно важна в засушливых штатах вроде Нью-Мексико, где Meta✴ расширяет кампус дата-центров Los Lunas. В Meta✴ отказались раскрыть сумму сделки с XGS, но известно, что компании намерены реализовать проект в два этапа к 2030 году. В своё время Meta✴ обязалась добиться нулевых выбросов к концу десятилетия, но энергоёмкие ИИ ЦОД могут помешать достижению этих целей, если не появится возможности поставлять им более «чистую» энергию. Совсем недавно Meta✴ объявила о намерении получать больше «безуглеродного» электричества, намереваясь помочь поддержать в Иллинойсе жизнь в старой АЭС Clinton Clean Energy Center, принадлежащей Constellation. Впрочем, есть и менее «зелёные» проекты — свой самый крупный ИИ ЦОД в Луизиане Meta✴ запитает от газовых электростанций.
15.06.2025 [23:29], Владимир Мироненко
Большая жатва: AMD назначила вице-президентом по ИИ гендиректора ИИ-стартапа Lamini, в который сама же и вложиласьAMD продолжает укреплять команду специалистов в сфере ИИ за счёт привлечения талантливых разработчиков, а также поглощения ИИ-стартапов. На минувшей неделе Шарон Чжоу (Sharon Zhou, вторая справа на фото ниже), соучредитель и гендиректор ИИ-стартапа Lamini (PowerML Inc.) сообщила в соцсети X, что она и несколько сотрудников присоединяются к AMD. Комментируя переход, представитель AMD сообщил ресурсу CRN, что это было наймом специалистов, а не приобретением команды, как это было в случае с разработчиком ИИ-чипов Untether AI, который фактически прекратил существование после сделки. В настоящее время неизвестно, какой будет дальнейшая судьба Lamini, которую в прошлом году покинул Грег Диамос (Greg Diamos), бывший архитектор ПО NVIDIA CUDA, основавший компанию вместе с Чжоу в 2022 году. До основания Lamini Чжоу работала менеджером по ML-продуктам в Google, менеджером по продуктам в ИИ-стартапах Kensho Technologies и Tamr, а также занимала должность внештатного преподавателя компьютерных наук в Стэнфордском университете, где она получила докторскую степень по этой же специальности. В AMD её назначили на должность вице-президента по ИИ. Платформа Lamini позволяет компаниям настраивать и кастомизировать большие языковые модели (LLM) с использованием собственных данных. В частности, Lamini предложила новый подход под названием Mixture of Memory Experts (MoME), направленный на повышение производительности LLM и фактической точности путем радикального снижения частоты галлюцинаций с 50 % до 5 %. Утверждается, что этот подход позволяет значительно сократить объём вычислительных ресурсов для обучения LLM, а также продолжительность этого процесса. В 2023 году AMD представила Lamini как одного из первых независимых поставщиков ПО, поддержавших её ускорители Instinct. В сентябре того же года Lamini сообщила, что использует более чем 100 ускорителей серии Instinct MI200 и что платформа AMD ROCm «достигла программного паритета» с NVIDIA CUDA. До определённого момента ИИ-платформа Lamini была единственной коммерческой платформой, целиком и полностью работающей на базе AMD Instinct. В прошлом году стартап привлек финансирование в размере $25 млн от нескольких инвесторов, включая венчурное подразделение AMD, Эндрю Ына (Andrew Ng), гендиректора Dropbox Дрю Хьюстона (Drew Houston), и Лип-Бу Тана (Lip-Bu Tan), который в начале этого года стал гендиректором Intel. Помимо команды Untether AI, AMD приобрела в течение последних нескольких неделе разработчика систем кремниевой фотоники Enosemi и стартапа Brium, специализирующегося на инструментах оптимизации ИИ ПО для различной аппаратной инфраструктуры.
14.06.2025 [17:04], Владимир Мироненко
Scale AI получила от Meta✴ более $14 млрд, но потеряла гендиректора и рискует лишиться крупных контрактов с Gooogle, Microsoft, OpenAI и xAIИИ-стартап Scale AI, занимающийся подготовкой, оценкой и разметкой данных для обучения ИИ-моделей, объявил о крупной инвестиционной сделке с Meta✴, по результатм которой его рыночная стоимость превысила $29 млрд. Сделка существенно расширит коммерческие отношения Scale и Meta✴. Также её условиями предусмотрен переход гендиректора Scale AI Александра Ванга (Alexandr Wang) и ещё ряда сотрудников в Meta✴. Вместо Ванга, который останется в совете директоров стартапа, временно исполняющим обязанности гендиректора Scale AI назначен Джейсон Дроги (Jason Droege), директор по стратегии, имеющий «20-летний опыт создания и руководства знаковыми технологическими компаниями, включая Uber Eats и Axon». Представитель Scale AI уточнил в интервью ресурсу CNBC, что Meta✴ вложит в компанию $14,3 млрд, в результате чего получит в ней 49-% долю акций, но без права голоса. «Мы углубим совместную работу по созданию данных для ИИ-моделей, а Александр Ванг присоединится к Meta✴ для работы над нашими усилиями по созданию суперинтеллекта», — рассказал представитель Meta✴. Переманивая Ванга, который не имея опыта в R&D, сумел с нуля создать крупный бизнес в сфере ИИ, гендиректор Meta✴ Марк Цукерберг (Mark Zuckerberg) делает ставку на его организаторские способности, полагая, что укрепить позиции Meta✴ в сфере ИИ под силу опытному бизнес-лидеру, больше похожему на Сэма Альтмана (Sam Altman), чем на учёных, стоящих у руля большинства конкурирующих ИИ-лабораторий, пишет Reuters. Инвестиции в Scale AI станут вторыми по величине в истории Meta✴ после приобретения WhatsApp за $19 млрд. Однако сделка может оказаться не совсем выгодной для Scale AI, предупреждает Reuters, поскольку многие компании, являющиеся клиентами Scale AI, могут отказаться от дальнейшего сотрудничества из-за опасений по поводу того, что Ванг, оставаясь в совете директоров стартапа, будет предоставлять Meta✴ внутреннюю информацию о приоритетах конкурентов. Представитель Scale AI заверил, что инвестиции Meta✴ и переход Ванга не повлияют на клиентов стартапа, и что Meta✴ не будет иметь доступа к его какой-либо деловой информации или данным. Тем не менее, по словам источников Reuters, Google, один их крупнейших клиентов Scale AI, планирует разорвать отношения со стартапом. Источники сообщили, что Google планировала потратить $200 млн только в этом году на услуги Scale AI по подгтовке и разметке данных людьми. После объявления о сделке поисковый гигант уже провёл переговоры с несколькими конкурентами Scale AI. Scale AI получила в 2024 году размере $870 млн, из них около около $150 млн от Google, утверждают источники. По их словам, другие крупные клиенты, включая Microsoft, OpenAI и xAI, тоже планируют отказаться от услуг Scale AI. Официальных подтверждений этой информации пока не поступало. А финансовый директор OpenAI заявил в пятницу, что компания, которой источники тоже приписывают намерение отказаться от услуг Scale AI, продолжит работать со стартапом, как с одним из своих многочисленных поставщиков данных.
13.06.2025 [23:52], Руслан Авдеев
И нашим, и вашим: Talen всё-таки поставит 1,92 ГВт энергии с АЭС дата-центрам AWS, но опосредованноAmazon внесла поправки в условия сделки с Talen Energy, предусматривавшей закупки энергии с АЭС Susquehanna для питания дата-центров AWS в Пенсильвании. Это случилось после того, как регулятор заблокировал предыдущую сделку, напоминает The Register. В среду компания объявила, что подписала с Amazon новом соглашение о покупке энергии (PPA) на 1,92 ГВт до 2042 года. В рамках сделки также будет изучена возможность строительства на площадке малых модульных реакторов (SMR) и финансирование модернизации Susquehanna для увеличения мощности АЭС. Критически важной деталью сделки является пункт о поддержке работы дата-центров AWS «в регионе». Дело в том, что Cumulus, дочерняя структура Talen, построила кампус ЦОД практически на территории АЭС, чтобы запитать его напрямую от станции. Amazon объявила о покупке кампуса Cumulus в марте 2024-го. В сделку включалось ISA (специальное соглашение), оговаривавшее поставки энергии из Susquehanna напрямую объекту Cumulus. Но попытка увеличить поставляемую кампусу мощность вызвала протесты местных коммунальных компаний. Они заявили регулятору Federal Energy Regulatory Commission (FERC), что ISA обеспечит Cumulus преимущество при поставках электричества, в результате чего другие клиенты Susquehanna могут столкнуться с менее стабильным энергоснабжением. В FERC согласились с доводами, и сделка была заблокирована. Talen неоднократно пыталась оспорить в суде решение FERC, но, похоже, в конце концов сдалась. Новое соглашение с AWS, по словам Talen, вообще не требует разрешения регулятора. Главная причина, вероятно, в том, что теперь Amazon будет получать 1,92 ГВт не напрямую и не только для кампуса Cumulus. Вместо этого энергия АЭС будет поступать в общую сеть, откуда её и будет получать AWS, причём фактически не только от Susquehanna. Для IT-гиганта это идеальное время для вложений. Губернатор Пенсильвании Джош Шапиро (Josh Shapiro) объявил в прошлый понедельник, что Amazon планировала вложить в создание облачных и ИИ-мощностей в штате не менее $20 млрд — как в округе Люцерн (Luzerne), где как раз и находится Susquehanna, так и в округе Бакс (Bucks), также обслуживаемым этой АЭС. В Talen заявили, что сделка с Amazon станет для неё стабильным источником доходов на долгое время. Похожие сделки с операторами АЭС заключили Meta✴ и Microsoft. Google пока, похоже, делает ставку на SMR. |
|


