Материалы по тегу: ии
09.05.2025 [09:22], Владимир Мироненко
OpenAI планирует развивать ИИ-инфраструктуру Stargate за пределами СШАOpenAI объявила о намерении продолжить развитие проекта Stargate, в рамках которого предполагается построить в США ИИ-инфраструктуру стоимостью $500 млрд, за пределами Соединённых Штатов, пишет The Financial Times. Глобальное развитие Stargate, которое будет осуществляться под брендом OpenAI for Countries, предполагает запуск десяти проектов с историческими союзниками США. «Эти инвестиции [в проекты] превзойдут то, что мы рассматриваем в США», — сказал Крис Лихейн (Chris Lehane), вице-президент OpenAI по глобальным вопросам. Он отметил, что во Франции, Великобритании и Германии выразили заинтересованность в строительстве новых ЦОД. Ранее сообщалось, что OpenAI взвешивает возможность направления инвестиций на строительство регионального объекта Stargate в Великобритании и уже начала переговоры по этому поводу. Вместе с тем Лихейн уточнил, что в отличие о США, где ведущая роль в финансировании Stargate отведена SoftBank, разработки OpenAI за рубежом будут финансироваться индивидуальной группой партнёров по каждому отдельному проекту. «Правительства, государственные инвестиционные фонды, фонды прямых инвестиций и более традиционный капитал — все они присматриваются к этому, — сказал он. — Наша роль заключается в предоставлении лучшей ИИ-технологии… наше участие в создании этой структуры помогает привлечь этот капитал». Лихейн также отметил, что сотрудничество с OpenAI в реализации проектов Stargate обеспечит возможность союзникам США получить доступ к передовым американским полупроводникам. OpenAI направила властям США предложение ослабить экспортные ограничения на передовые чипы для компаний, инвестирующих в инфраструктуру США.
09.05.2025 [01:40], Владимир Мироненко
Первая фаза ИИ-кластера xAI Colossus полностью обеспечена энергией1 мая ИИ-кластер xAI Colossus в Мемфисе (Теннесси, США), менее чем через год после запуска проекта, достиг полной готовности для эксплуатации в рамках первой фазы развёртывания, поскольку оборудование подключили к основной энергосети посредством недавно построенной электрической подстанции, сообщается на сайте Торговой палаты Большого Мемфиса. Питание ИИ-кластера в пределах 150 МВт будут обеспечивать энергоснабжающие компании Memphis Light, Gas, and Water (MLGW) и Tennessee Valley Authority (TVA). Кроме того, площадка оборудована аккумуляторными системами Tesla Megapack на 150 МВт (ёмкость явно не указана), предназначенными для использования в качестве резервного источника питания на случай аварийных отключений сети или повышенного спроса, говорится в сообщении. «xAI привержена Мемфису посредством своих устойчивых экологических практик. Компания участвует в программе Demand Response, как указала MLGW, и изучает способы подачи энергии в сеть на благо общества, особенно в чрезвычайных ситуациях или других случаях необходимости. По мере роста xAI будет расти и Мемфис», — отметила Торговая палата Большого Мемфиса. xAI запустила ИИ-кластер xAI Colossus в июле прошлого года. В нём было установлено 100 тыс. ускорителей NVIDIA H100. В связи с тем, что ИИ-кластер был построен в рекордные сроки — всего за 19 дней — на период строительства подстанций для подключения к сетям операторов, для обеспечения его энергией установили временные газовые генераторы, а также энергохранилища Tesla Megapack. Торговая палата сообщила, что примерно половина газовых турбин будет демонтирована в течение двух месяцев. Остальная часть продолжит функционировать до ввода в эксплуатацию второй подстанции на 150 МВт, строительство которой должны закончить осенью 2025 года, после чего газовые турбины переведут в резервную систему электропитания. Таким образом, власти косвенным образом признали, что xAI действительно воспользовалась лазейкой в законах, развернув 35 турбин вместо изначально разрешённых 15. Как сообщает The Register, всего в качестве резерва в дальнейшем будет использоваться 15 газовых турбин: восемь новых, оснащённых системами селективного каталитического восстановления (SCR) для снижения выбросов, и семь модернизированных, которые будут соответствовать существующим требованиям Закона о чистом воздухе США. По словам основателя xAI Илона Маска (Elon Musk), со временем в ИИ-кластере будет развернуто до 1 млн ускорителей. В феврале сообщалось, что xAI рассматривает возможность строительства ещё одного ЦОД.
08.05.2025 [23:59], Владимир Мироненко
Квартальная выручка Arm впервые превысила $1 млрд, но акции упали из-за слабого прогнозаArm Holdings объявила результаты IV квартала и всего 2025 финансового года, завершившегося 31 марта 2025 года. Несмотря на рекордную выручку, впервые в истории компании превысившую $1 млрд за квартал, её акции упали в ходе расширенных торгов на 11 % из-за слабого прогноза на I квартал 2026 финансового года, оказавшегося ниже ожиданий Уолл-стрит, а также из-за отказа предоставить прогноз на весь финансовый год, пишет Reuters. «Масштабные мировые пошлины, объявленные президентом США Дональдом Трампом (Donald Trump), и более жёсткие ограничения США на экспорт передовых полупроводников на ключевой рынок микросхем Китая омрачили перспективы полупроводниковых компаний», — отметило новостное агентство. «Учитывая неопределённость глобальной торговой и экономической ситуации, у нас меньше возможностей для обзора, чем обычно, чтобы начать год. В результате мы не считаем целесообразным давать прогноз на весь год», — сообщил финансовый директор Джейсон Чайлд (Jason Child) аналитикам во время телефонной конференции. В свою очередь, гендиректор Рене Хаас (Rene Haas) заявил, что растущая доля выручки Arm от роялти за чипы, реализация которых, в свою очередь, связана с продажами таких устройств, как смартфоны и ноутбуки, затрудняет прогнозирование показателей. Выручка Arm за IV финансовый квартал составила $1,24 млрд, превысив результат аналогичного квартала годом ранее в размере $928 млн на 34 %, а также консенсус-прогноз аналитиков, опрошенных LSEG, равный $1,23 млрд. При этом выручка от лицензирования за квартал увеличилась на 53 % до $634 млн с $414 млн годом ранее, выручка от роялти выросла на 18 % — с $514 млн до $607 млн. Чистая прибыль (GAAP) упала на 6 % до $210 млн, или 20 центов на акцию, с $224 млн или 21 цента годом ранее. Скорректированная прибыль (non-GAAP) на акцию в размере 55 центов превысила прогноз аналитиков, опрошенных FactSet и LSEG, равный в обоих случаях 52 центам на акцию. По итогам 2025 финансового года выручка компании составила $4 млрд, а доходы от роялти впервые превысили $2 млрд, составив $2,17 млрд. Выручка Arm от лицензирования за год равна $1,84 млрд. Arm прогнозирует выручку за I квартал 2026 финансового года в размере от $1,00 до $1,10 млрд, что ниже средней оценки аналитиков, опрошенных LSEG, в $1,10 млрд. Прогноз скорректированной прибыли составляет от 30 до 38 центов на акцию по сравнению с оценкой аналитиков в 42 цента на акцию. Как сообщает Reuters, прогноз компании, оказавшийся ниже ожиданий аналитиков, был обусловлен крупной лицензионной сделкой, которую, возможно, не удастся закрыть в течение текущего финансового квартала. Он добавил, рост выручки от роялти составит в I финансовом квартале от 25 до 30 %, что выше, чем в предыдущем квартале. Arm отметила, что быстрый рост использования ИИ от облака до периферии создаёт спрос на энергоэффективные вычисления, который способны удовлетворить её решения, в частности, платформа Arm Neoverse. Она добавила, что NVIDIA запустила суперчип Grace Blackwell на базе Armv9 в серийное производство. Согласно прогнозу Arm, около 50 % всех новых серверных чипов, поставляемых гиперскейлерам в 2025 году, будут основаны на архитектуре Arm. Эти компании объединяют собственные чипы на базе Armv9 с собственными же ускорителями для запуска ИИ-нагрузок. Так, Google подтвердила, что её чип Axion теперь доступен в 10 регионах и используется примерно 40 из 100 ее крупнейших клиентов, включая Spotify. Microsoft расширила спектр программной поддержки своих чипов Cobalt 100, запустив рабочие нагрузки различных клиентов, включая Databricks, Siemens и Snowflake. Arm также сообщила, что продолжает увеличивать инвестиции в свою экосистему из более чем 22 млн разработчиков ПО, включая новое бесплатное расширение для GitHub Copilot. Кроме того, ПО Arm Kleidi для максимизации производительности ИИ на платформе Arm было установлено более 8 млрд раз на устройствах на базе Arm.
08.05.2025 [19:22], Сергей Карасёв
Cadence представила суперкомпьютер Millennium M2000 на базе NVIDIA BlackwellКомпания Cadence анонсировала суперкомпьютер Millennium M2000, спроектированный для выполнения сложного моделирования с использованием ИИ. Новая НРС-система предназначена для ускорения проектирования микрочипов, разработки лекарственных препаратов следующего поколения и пр. Суперкомпьютер построен на платформе NVIDIA HGX B200. Кроме того, задействованы карты NVIDIA RTX Pro 6000 Blackwell Server Edition, оснащённые 96 Гбайт памяти GDDR7. Применены библиотеки NVIDIA CUDA-X и специализированное ПО для решения ресурсоёмких задач. Утверждается, что Millennium M2000 обеспечивает до 80 раз более высокую производительность по сравнению с системами на базе CPU в области автоматизации проектирования электроники (EDA), создания и анализа систем (SDA) и разработки медикаментов. При этом глубоко оптимизированный программно-аппаратный стек помогает существенно сократить общее энергопотребление. В качестве примера приводится моделирование подсистемы питания на уровне полупроводниковых чипов. В случае вычислительных комплексов на основе сотен традиционных CPU на выполнение такой задачи может потребоваться около двух недель. Суперкомпьютер Millennium M2000 позволит получить результат менее чем за один день. Генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) сообщил, что компания планирует приобрести десять суперкомпьютерных систем Millennium на базе GB200 NVL72 для ускорения проектирования собственных продуктов. Сторонние заказчики смогут получить доступ к Millennium M2000 через облако или купить устройство для установки в собственном дата-центре. Базовая конфигурация включает около 32 ускорителей и стоит $2 млн, но это не финальная цена.
07.05.2025 [18:23], Владимир Мироненко
AMD получила рекордную квартальную выручку, но ожидает до $1,5 млрд потерь из-за экспортных ограничений СШАAMD сообщила о рекордной выручке в I квартале 2025 финансового года, закончившемся 29 марта. Выручка составила $7,44 млрд, что на 3 % меньше, чем в предыдущем квартале, но на 36 % больше в годовом исчислении, что, как пишет ресурс CRN, стало возможным благодаря значительному росту продаж ускорителей Instinct и процессоров EPYC, а также процессоров Ryzen для ПК. Согласно консенсус-прогнозу аналитиков, опрошенных LSEG, выручка должна была составить $7,13 млрд. Чистая прибыль составила $709 млн или 44 цента на разводнённую акцию, по сравнению с $123 млн или 7 центов на акцию за аналогичный период годом ранее. Скорректированная прибыль (non-GAA) равняется $1,57 млрд или $0,96 на разводнённую акцию, что немного выше прогноза аналитиков, опрошенных LSEG, в $0,94 на разводнённую акцию. «Несмотря на неопределённый макроэкономический фон, наши результаты за I квартал подчёркивают силу нашего дифференцированного портфеля продуктов и его реализацию, и хорошо позиционируют нас для сильного роста в 2025 году», — отметила генеральный директор AMD Лиза Су (Lisa Su) в отчёте компании за I квартал. Су сообщила, что компания расширяет инвестиции в свой полный програмнный стек для ИИ и возможности решений для ЦОД, которые получили импульс после завершения приобретения AMD ZT Systems за $4,9 млрд в марте. Су сказала, что команда ZT Systems «полностью вовлечена и совместно с ключевыми клиентами уже разрабатывает оптимизированные конструкции уровня стойки». Компания также «работает с клиентами и OEM-партнёрами, чтобы ускорить выход на рынок» MI350. Выручка сегмента ЦОД за квартал составила $3,7 млрд, что на 57 % больше по сравнению с прошлым годом и выше прогноза аналитиков, опрошенных StreetAccount — в основном благодаря росту продаж процессоров AMD EPYC и ускорителей AMD Instinct. Компания отметила высокий спрос на EPYC со стороны предприятий, как в облаке, где количество инстансов на базе EPYC, активированных компаниями из списка Forbes 2000, более чем удвоилось по сравнению с прошлым годом, так и on-premise, где, по словам Су, их продажи стали выше «на большой двузначный процент по сравнению с прошлым годом» — рост наблюдается седьмой квартал подряд. Су заявила, что партнёры AMD увеличили количество платформ на базе EPYC до более чем 450, а компания расширила совместные программы выхода на рынок. «В результате EPYC теперь используется всеми 10 крупнейшими телекоммуникационными, аэрокосмическими и полупроводниковыми компаниями, 9 из 10 крупнейших автомобильных, 7 из 10 крупнейших производственных и 6 из 10 крупнейших энергетических компаний из списка Forbes 2000», — добавила она. Лиза Су сообщила, что выручка от продаж AMD Instinct увеличилась на «значительные двузначные проценты в годовом исчислении» благодаря поставкам чипов Instinct MI325X для новых корпоративных и облачных развертываний. По её словам, несколько гиперскейлеров расширили использование ускорителей Instinct, чтобы охватить всё больше вариантов использования генеративного ИИ, поиска, ранжирования и рекомендаций. «В этом квартале мы также добавили несколько ключевых облачных и корпоративных клиентов, включая одного из крупнейших разработчиков передовых моделей, который теперь использует ускорители Instinct для обслуживания значительной части инференса», — рассказала Су. «Глубина и широта нашего взаимодействия с клиентами продолжают увеличиваться, поскольку прорывы в крупномасштабных моделях, такие как выход OpenAI 03 и DeepSeek R1, стимулируют рост спроса», — сказала Су. По её словам, чтобы стимулировать внедрение ускорителей Instinct, компания «значительно ускорила» частоту выпуска обновлений своего программного стека ROCm AI. Теперь релизы выходят каждые две недели, а не ежеквартально, и содержат «готовые к развёртыванию контейнеры для обучения и инференса», которые «включают оптимизацию производительности и поддержку новейших библиотек, ядер и алгоритмов», отметила Лиза Су. Су также сообщила, что AMD начала в I квартале тестировать ускорители Instinct MI350 следующего поколения с несколькими клиентами и готовится к старту их производства к середине этого года. «Интерес клиентов к серии MI350 очень высок, что создаёт условия для широкого развёртывания во II половине этого года», — сказала она. Ускоритель MI400 следующего поколения компания планирует выпустить в следующем году. Сегмент встраиваемых решений, продажи которого в основном состоят из продуктов Xilinx, сократил выручку на 3% в годовом исчислении до $823 млн. При этом Су заявила, что спрос в сегменте продолжает «постепенно восстанавливаться». «Мы ожидаем, что улучшение спроса на рынках тестирования и измерений, связи и аэрокосмической отрасли приведёт к возобновлению роста во II половине 2025 года», — сказала она. Выручка сегмента клиентских и игровых решений за квартал составила $2,9 млрд, увеличившись на 28 % по сравнению с прошлым годом. При этом выручка клиентского сегмента выросла год к году на 68 % до $2,3 млрд, в игровом сегменте упала на 30 % до $647 млн. В текущем квартале AMD прогнозирует выручку около $7,4 млрд ± $300 млн, в то время как Уолл-стрит оценивает ожидаемые продажи в $7,25 млрд при скорректированной прибыли в 86 центов на разводнённую акцию. Также компания сообщила, что ожидает из-за экспортных ограничений около $700 млн упущенной выгоды в текущем квартале и $1,5 млрд в общей сложности до конца финансового года. Для сравнения, NVIDIA недосчитается $5,5 млрд только по итогам одного квартала.
07.05.2025 [18:13], Сергей Карасёв
Вышла операционная система «Альт Рабочая станция К» 11.0: Wayland по умолчанию и мегавыпуск KDE Plasma 6«Базальт СПО» выпустила операционную систему «Альт Рабочая станция К» 11.0. Среди ключевых изменений — графическая среда KDE Plasma 6 с расширенными настройками интерфейса и поддержкой Wayland, технология шифрования дисков LUKS2. Кастомизация интерфейсаВ ОС «Альт Рабочая станция К» 11.0 графическая платформа KDE Plasma обновлена до версии 6. KDE Plasma обеспечивает большой набор настроек интерфейса. Пользователь может:
Разобраться с настройками рабочей среды поможет приложение-«экскурсовод» «Помощник первого запуска». Его назначение — познакомить пользователя с интерфейсом и особенностями рабочего окружения. Инструменты администратораДобавлен модуль Fortinet SSLVPN, защищающий чувствительную информацию от несанкционированного доступа даже в общественных сетях Wi-Fi. Модуль использует протокол SSL/TLS (Transport Layer Security) для шифрования всех передаваемых данных. Модуль kio-admin позволяет редактировать системные файлы и файлы конфигурации в графическом интерфейсе через файловый менеджер Dolphin с правами суперпользователя. Обновилась поддержка Secure Boot, позволяющего установить на один компьютер ОС «Альт Рабочая станция К» и Windows, что может быть удобно в период постепенной замены импортной ОС на российскую. Добавлено приложение для изготовления копий операционных систем «Копидел». Образ в формате ISO создаётся в несколько кликов, и далее его можно тиражировать через физические носители и/или через сеть. Графика и производительностьВ «Альт Рабочей станции К» 11.0 основная сессия использует Wayland, а сессия Xorg (X11) является дополнительной. «Графическая подсистема определяет, как операционная система работает с экранами и устройствами ввода, как отображаются приложения, — поясняет директор по продукту Олег Щавелев. — Раньше для этих задач по умолчанию использовался сервер Xorg, однако сейчас он устарел и на смену пришла более перспективная технология Wayland. Она увеличивает быстродействие и "отзывчивость" графики, обеспечивает более быстрое и плавное открытие приложений и применение визуальных эффектов, усиливает безопасность». Среди преимуществ Wayland — функции управления жестами и мультитач на устройствах с сенсорными экранами, которой нет в Xorg. Wayland поддерживает HDR (High Dynamic Range Imaging), что делает рабочую среду более красочной. Ядро 6.12 LTS и драйверы NVIDIAВ операционной системе ядро Linux обновлено до версии 6.12 LTS (Long-term-support — ядро с долгосрочной поддержкой). Оно обеспечивает совместимость с современным оборудованием, которое можно будет использовать в течение всего срока амортизации, и таким образом увеличить рентабельность инвестиций в инфраструктуру. Добавлены драйверы для новых видеокарт NVIDIA 570.133.07 с улучшенной поддержкой Wayland. Они позволяют раскрыть максимальную производительность NVIDIA в 3D-рендеринге, задачах искусственного интеллекта и играх. Усилена безопасностьС помощью технологии шифрования дисков LUKS2 выполняется шифрование дисковых разделов при установке. Оно обеспечивает защиту данных, например, при утере устройства. Графическая подсистема Wayland изолирует приложения друг от друга, они не могут «подсматривать» содержимое других окон или перехватывать ввод, что повышает безопасность операционной системы. Творчество и досугЗвуковую подсистему PulseAudio сменила более функциональная PipeWire. Она позволяет использовать рабочую станцию для записи музыкальных инструментов с минимальной задержкой, обеспечивает более тонкую настройку аудиовходов. Модуль FFmpeg обновлен до версии 7.1. В нём появилась полноценная поддержка нового стандарта сжатия видео VVC (H.266), который обеспечивает такое же качество картинки как H.265/HEVC, но при вдвое меньшем размере файла. Это особенно полезно для 4K/8K видео и стриминга. В FFmpeg 7.1 добавлено ускорение через Vulkan — видео быстрее обрабатывается на видеокартах. Теперь корректно обрабатываются цветовые диапазоны — меньше пересвеченных/затемнённых участков при конвертации между разными стандартами. Обеспечена поддержка шлемов виртуальной реальности, в том числе через беспроводное подключение. Добавлена утилита для оптимизации игр gamemode. Она позволяет настраивать системные параметры для разных игр, не затрагивая системные настройки в целом. Доступна электронная подписьДобавлено приложение «Сургуч» для работы со встроенными электронными цифровыми подписями. «Сургуч» работает с документами в формате PDF и совместим с популярным в России криптопровайдером КриптоПро CSP. Браузеры, включённые в дистрибутив, поддерживают криптографические алгоритмы ГОСТ: по умолчанию устанавливается Chromium, дополнительно доступен Яндекc Браузеp. Приобретение и лицензирование«Альт Рабочая станция К» 11.0 предназначена для апробации и сбора обратной связи по изменениям в пользовательском интерфейсе на различных устройствах и периферии. Операционная система свободно распространяется для некоммерческого использования и тестирования. Подробности о возможностях ОС — в документации. Обратная связь принимается через:
Условия лицензирования указаны на сайте «Базальт СПО» на странице продукта.
07.05.2025 [09:05], Владимир Мироненко
IBM разработала инструменты для быстрого создания и интеграции ИИ-агентовIBM планирует укрепить свои позиции на быстрорастущем рынке ИИ-технологий с помощью увеличения инвестиций в США и предложения собственных инструментов, которые помогут клиентам управлять ИИ-агентами для их ключевых бизнес-приложений. Об этом сообщил генеральный директор IBM Арвинд Кришна (Arvind Krishna) в интервью агентству Reuters. Глава IBM заявил, что разработанное компанией ПО позволяет клиентам создавать собственные ИИ-системы, а также интегрировать ИИ-агентов от других провайдеров, включая Salesforce, Adobe и Workday. Это поможет удовлетворить потребность в кастомных решениях во многих областях бизнеса. Подход IBM заключается в том, чтобы предложить полный спектр облачных и ИИ-сервисов остальным компаниям, которые в настоящее время полагаются на лидеров рынка AWS и Microsoft. Особое внимание IBM уделяет внедрению функций ИИ в мультиоблачных платформах, что найдёт спрос среди тех, кому нужны кастомные ИИ-решения, а также в собственные инфраструктуры заказчиков для управления данными. ![]() Источник изображения: IBM По словам гендиректора IBM, предлагаемые инструменты, позволяющие создавать собственных ИИ-агентов в течение не более пяти минут, основаны на семействе LLM Granite, а также на альтернативных моделях от Meta✴ Platforms и Mistral. IBM сообщила, что уже получила заказы на создание решений на базе генеративного ИИ на $6 млрд. Также компания объявила в апреле о планах инвестировать в течение пяти лет $150 млрд в США, где она в течение более 60 лет производит мейнфреймы. Кришна подчеркнул, что квантовые компьютеры тоже будут производиться в США. Глава IBM отметил, что синергия мейнфреймов, ИИ и квантовых вычислений, как ожидается, создаст надёжный и устойчивый рынок, в который следует инвестировать и который позволит компании использовать эти достижения в течение следующего десятилетия. Кришна добавил, что фокус на технологии и сокращение регулирования со стороны администрации оказали благотворное влияние на экономику США, способствуя её росту. Это позволяет IBM наращивать инвестиции и инновации, тем самым потенциально укрепляя свою конкурентную позицию как поставщика бизнес-решений на основе ИИ.
06.05.2025 [21:12], Руслан Авдеев
Meta✴ Llama API задействует ИИ-ускорители Cerebras и GroqMeta✴ объединила усилия с Cerebras и Groq для инференс-сервиса с применением API Llama. Открыв API-доступ к собственным моделям, Meta✴ становится чуть более похожа на облачных провайдеров. Как утверждают в Cerebras, разработчики, применяющие API для работы с моделями Llama 4 Cerebras, могут получить скорость инференса до 18 раз выше, чем у традиционных решений на базе GPU. В компании объявили, что такое ускорение позволит использовать новейшее поколение приложений, которые невозможно построить на других ИИ-технологиях. Речь, например, идёт о «голосовых» решениях с низкой задержкой, интерактивной генерации кода, мгновенном многоэтапном рассуждении и т. п. — многие задачи можно решать за секунды, а не минуты. После запуска инференс-платформы в 2024 году Cerebras обеспечила для Llama самый быстрый инференс, обрабатывая миллиарды токенов через собственную ИИ-инфраструктуру. Теперь прямой доступ к альтернативам решений OpenAI получит широкое сообщество разработчиков. По словам компании, партнёрство Cerebras и Meta✴ позволит создавать ИИ-системы, «принципиально недосягаемые для ведущих облаков». Согласно замерам Artificial Analysis, Cerebras действительно предлагает самые быстрые решения для ИИ-инференса, более 2600 токенов/с для Llama 4 Scout. ![]() Источник изображения: Meta✴ При этом Cerebras не единственный партнёр Meta✴. Она также договорилась с Groq об использовании ускорителей Language Processing Units (LPU), которые обеспечивают высокую скорость (до 625 токенов/с), низкую задержку и хорошую масштабируемость при довольно низких издержках. Groq использует собственную вертикально интегрированную архитектуру, полностью контролируя и железо, и софт. Это позволяет добиться эффективности, недоступной в облаках на базе универсальных ИИ-чипов. Партнёрство с Meta✴ усиливает позиции Groq и Cerebras в борьбе с NVIDIA. Для Meta✴ новое сотрудничество — очередной шаг в деле выпуска готовых open source ИИ-моделей, которые позволят сосредоточиться на исследованиях и разработке, фактически передав инференс надёжному партнёру. Разработчики могут легко перейти на новый стек без необходимости дообучения моделей или перенастройки ускорителей — API Llama совместимы с API OpenAI. Пока что доступ к новым API ограничен. Цены Meta✴ также не сообщает. Meta✴ активно работает над продвижением своих ИИ-моделей. Так, она даже выступила с довольно необычной инициативой, предложив «коллегам-конкурентам» в лице Microsoft и Amazon, а также другим компаниям, поделиться ресурсами для развития и обучения моделей Llama.
06.05.2025 [17:46], Владимир Мироненко
Эксперты: репрессии Трампа в отношении «зелёной» энергетики навредят США в гонке за ИИ-лидерствоВступив в должность президента США, Дональд Трамп (Donald Trump) объявил самую настоящую войну «зелёной» энергетике. Одним из его первых распоряжений был указ о приостановке утверждения проектов в области чистой энергии на федеральных землях, пишет The Financial Times. Также было приостановлено выделение федеральных займов на проекты в этой сфере, а в апреле Бюро по управлению энергией океана (Bureau of Ocean Energy Management, BOEM) направило компании Empire Offshore Wind предписание на время проведения проверки приостановить строительство ветропарка Empire Wind стоимостью $2,5 млрд у восточного побережья США. По словам экспертов, отказ от возобновляемых источников энергии может привести к проблемам в электроснабжении технологических компаний, которые стремятся обеспечить надёжные поставки энергии для питания и обучения ИИ, что повлечёт за собой рост затрат и может подтолкнуть операторов к использованию более «грязной» энергии. В Hitachi Vantara заявили, что «антагонистический подход» администрации Трампа к возобновляемым источникам энергии может сделать «невозможным удовлетворение [потребностей в обработке] всё растущих объёмов данных». В компании отметили, что стратегически США рискуют подорвать свою текущую позицию лидера в глобальной гонке ИИ, в то время как Китай активно занимается модернизацией энергосетей и эффективным распределением энергии. Дефицит энергии может «привести к отмене или задержкам в строительстве ЦОД или модернизации инфраструктуры», предупредила Hitachi Vantara. ![]() Источник изображения: James Whately/unsplash.com Ранее администрация Трампа заявила, что проигрыш в ИИ-гонке Китаю представляет большую угрозу для мира, чем глобальное потепление, выступив за увеличение использования ископаемого топлива для питания ЦОД. В свою очередь, эксперты предупреждают, что будет сложно удовлетворить растущий спрос без добавления гораздо большего количества мощностей возобновляемой энергии, запустить которые можно быстрее и дешевле, чем строить газовые электростанции. Наступление Трампа на возобновляемые источники энергии обеспокоило ряд политиков, которые взяли курс на расширение использования ветроэнергетики для удовлетворения будущего спроса на электроэнергию. В минувший понедельник генеральные прокуроры 17 штатов подали в суд на администрацию Трампа в связи с её политикой по сворачиванию развития ветроэнергетики в США. Также политика запрета возобновляемых источников энергии усложняет задачу Equinix, Microsoft, Google и Meta✴ по компенсации выбросов и инвестированию в возобновляемые источники энергии. «Спрос [на возобновляемые источники энергии] достиг исторического максимума», — отметил Кристофер Уэллиз (Christopher Wellise), вице-президент по устойчивому развитию в Equinix, добавив, что в сочетании с ограничениями администрации Трампа это может вызвать проблемы с обеспечением энергией в среднесрочной перспективе.
06.05.2025 [14:36], Руслан Авдеев
«Билайн» готовит российский сервис ИИ-инференса на отечественном оборудовании«Билайн» и один из российских производителей серверов ведут переговоры о возможной доработке решений для ИИ-инференса — весьма перспективной в обозримом будущем услуги. Сама «Билайн» разрабатывает инфраструктурное ПО, входящее в часть специального программно-аппаратного комплекса, сообщают «Ведомости». На основе таких комплексов партнёры смогут развернуть ИИ-модели, а «Билайн» в перспективе сможет предлагать их в своих дата-центрах, продавая доступ к соответствующим мощностям бизнес-клиентам. По словам одного из источников, сейчас «Билайн» договаривается с OpenYard. Последняя подтвердила, что ведёт переговоры с рядом телеком-операторов, но подробности возможных сделок раскрывать не стала. Тем временем в «Билайне» отмечают рост спроса на аренду стоек с GPU-серверами. Правда, платить за это готовы «не все», отмечают в компании. По оценкам экспертов, сотрудничество «Билайн» с OpenYard позволит первой запустить новые сервисы, а для второй — получить крупного заказчика на оборудование. Для крупных компаний, как считают эксперты, такой совместный сервис будет обходиться в 100–200 млн руб. в год. Ожидается, что в первую очередь новое решение заинтересует банки (для создания чат-ботов и скоринга), IT-компании и просто крупный бизнес (для ИИ-аналитики), а также, например, телеком-операторов и промышленный сектор. Как ранее писали «Ведомости», к 2030 году в российских ЦОД будут развёрнуты ускорители, эквивалентные по производительности 70 тыс. ускорителей NVIDIA A100. Стоимость закупки, вероятно, составит $1,5–$2 млрд. Впрочем, уникальность инференс-решений для России — под вопросом. Например, в октябре прошлого года Selectel запустил бета-тестирование собственного инференс-сервиса для ускорения запуска ИИ-моделей. В конце апреля 2025 года Cloud.ru представил «первый в России» управляемый облачный сервис для инференса ИИ-моделей — Evolution ML Inference. |
|