Материалы по тегу: i
17.03.2025 [17:23], Руслан Авдеев
Ежегодные расходы техногигантов на ИИ превысят $500 млрд, но большая часть денег пойдёт на инференс, а не на обучение моделейКрупнейшие IT-компании нарастят ежегодные расходы на ИИ-технологии — в совокупности они превысят $500 млрд уже в следующем десятилетии. Одной из причин роста инвестиций в ИИ станет новый подход к разработкам со стороны китайской DeepSeek и OpenAI, сообщает Bloomberg Intelligence. Группа гиперскейлеров, включая Microsoft, Amazon и Meta✴ намерена потратить $371 млрд на ЦОД и вычислительные ресурсы для ИИ в 2025 году, на 44 % больше, чем годом ранее. К 2032 году затраты вырастут до $525 млрд — быстрее, чем ожидали в Bloomberg Intelligence до того, как недавно «выстрелили» продукты DeepSeek. До недавних пор большая часть инвестиций в ИИ уходила на дата-центры и чипы, которые использовались для обучения или разработки новых, всё более крупных ИИ-моделей. Теперь компании намерены больше тратить на инференс. Изменение стратегии ускорилось после выпуска «рассуждающих» моделей компаний OpenAI и DeepSeek. У этих систем уходит больше времени на ответы на запросы пользователей, при этом они требуют больше ресурсов на инференс. Неожиданный для многих успех DeepSeek, которая, как утверждается, создала чрезвычайно недорогую и конкурентоспособную модель на уровне современных продуктов западных конкурентов (с оговорками), вызвал вопросы об эффективности инвестиций в США. Эксперты оценивают, стоило ли вкладывать огромные средства в укрупнение моделей. Некоторые компании уже стали внедрять эффективные LLM, работающие на относительно небольшом числе ускорителей. ![]() Источник изображения: The Drink/unspalsh.com По данным Bloomberg, «рассуждающие» модели обеспечивают новые возможности для заработка на ПО и потенциально обходятся дороже на этапе инференса, чем на этапе обучения. Это, похоже, приведёт к наращиванию инвестиций в соответствии с новой концепцией и приведёт к росту вложений в ИИ в целом. Рост капитальных затрат на обучение ИИ, как считают в Bloomberg, может быть заметно медленнее, чем предсказывалось ранее. Огромное внимание, которое привлекла DeepSeek, вероятно, заставит технологические фирмы нарастить инвестиции в инференс — именно он станет самым быстрорастущим сегментом на рынке систем генеративного ИИ. Похожие прогнозы давала и Omdia. Хотя в текущем году затраты на связанные с обучением задачи, вероятно, составят более 40 % расходов гиперскейлеров на ИИ, сегмент, как ожидается, уменьшится к 2032 году до всего 14 %. В том же году связанные с инференсом инвестиции могут составить около половины всех расходов на ИИ. Как считают в Bloomberg, наилучшие позиции среди гиперскейлеров у Google. У неё TPU собственной разработки, которые можно использовать как для обучения, так и для инференса. Другие компании, вроде Microsoft и Meta✴, сильно зависят от NVIDIA и могут оказаться не столь гибкими в гонке по новым правилам.
11.03.2025 [11:09], Сергей Карасёв
OpenAI потратит $11,9 млрд на аренду ИИ-инфраструктуры у CoreWeave и получит долю в компанииКомпания OpenAI заключила соглашение по использованию облачной инфраструктуры CoreWeave для обучения и развёртывания передовых ИИ-моделей. Контракт подписан на пять лет, а его стоимость составляет $11,9 млрд. При этом OpenAI продолжит размещать нагрузки на облачной платформе Azure, поддерживая партнёрские отношения с Microsoft как минимум до 2030 года. В рамках соглашения CoreWeave предоставит OpenAI высокопроизводительную инфраструктуру ИИ. В облаке CoreWeave применяются различные карты NVIDIA, включая суперускорители NVIDIA GB200 NVL72. В общей сложности CoreWeave закупила более 250 тыс. ИИ-ускорителей NVIDIA, в том числе H100 и H200. По условиям подписанного договора, OpenAI получит долю в CoreWeave в виде ценных бумаг стоимостью $350 млн. Сама CoreWeave недавно подала заявку на первичное публичное размещение акций (IPO) на бирже Nasdaq. Процедура будет проведена при участии Morgan Stanley, JPMorgan Chase и Goldman Sachs, а CoreWeave, как ожидается, получит рыночную оценку более $35 млрд. Нужно отметить, что вычислительные мощности у CoreWeave также арендует Microsoft: на эти цели редмондский гигант потратит почти $10 млрд в период с 2023 по 2030 год. В 2024 году на долю Microsoft пришлось 62 % выручки CoreWeave, которая выросла до $1,9 млрд. Кроме того, Microsoft арендует у Oracle ускорители для нужд OpenAI. Таким образом, как отмечает TechCrunch, конкуренция между компанией OpenAI и её инвестором Microsoft усиливается. Напряженность между сторонами растет на протяжении нескольких лет, поскольку OpenAI активно укрепляет позиции на мировом ИИ-рынке. В частности, OpenAI конкурирует с Microsoft за корпоративных клиентов.
10.03.2025 [11:50], Сергей Карасёв
Одноплатный компьютер Orange Pi RV2 получил загадочный RISC-V процессор Ky X1 с ИИ-ускорителемВ семействе одноплатных компьютеров Orange Pi, по сообщению CNX Software, появилась модель Orange Pi RV2 на открытой архитектуре RISC-V. Среди ключевых сфер применения новинки названы приложения ИИ, робототехника, индустриальные системы управления и периферийные вычисления. Изделие несёт на борту чип Ky X1 с восемью 64-битными ядрами RISC-V и ускорителем ИИ с производительностью до 2 TOPS. Утверждается, что в одноядерном режиме процессор Ky X1 по производительности на 30 % превосходит Arm Cortex-A55 (вероятно, на той же частоте) при снижении энергопотребления на 20 %. Объём оперативной памяти LPDDR4X может составлять 2, 4 и 8 Гбайт. Опциональный флеш-модуль обладает вместимостью 16, 32, 64 или 128 Гбайт. Одноплатный компьютер располагает двумя коннекторами M.2 M-Key (PCIe 2.0 x2) для NVMe SSD форматов 2280 и 2230. Кроме того, предусмотрен слот для карты microSD (SDIO 3.0). Реализована поддержка Wi-Fi 5.0 и Bluetooth 5.0 LE с помощью контроллера Ampak AP6256. Есть два сетевых порта 1GbE RJ-45 (контроллер YT8531C-CA). Изделие оснащено выходом HDMI 2.0 с поддержкой разрешения до 1920 × 1440 пикселей (60 Гц) и коннектором MIPI DSI (4 линии), что позволяет выводить изображение одновременно на два дисплея. Предусмотрены два разъёма MIPI CSI (4 линии) для подключения камер, аудиогнездо на 3,5 мм, три порта USB 3.0 Type-A и порт USB 2.0 Type-A. Питание 5 В подаётся через коннектор USB Type-C. Среди прочего упомянуты 26-контактная колодка с поддержкой GPIO, UART, I2C, SPI, PWM и двухконтактный коннектор для подсоединения вентилятора охлаждения. Размеры составляют 89 × 56 мм. Для Orange Pi RV2 заявлена поддержка Ubuntu 24.04 и OpenHarmony 5.0 OS. Цена новинки варьируется от $30 до $45 в зависимости от объёма ОЗУ.
08.03.2025 [22:45], Владимир Мироненко
Первый ЦОД Stargate получит 64 тыс. ИИ-ускорителей NVIDIA GB200 к концу 2026 годаВ ближайшие месяцы OpenAI и Oracle в рамках ИИ-мегапроекта Stargate начнут установку оборудования в первом ЦОД в техасском городе Абилин (Abilene), сообщил Bloomberg со ссылкой на информированные источники. По словам собеседника Bloomberg, к концу 2026 года в этом дата-центре будет размещено 64 тыс. ИИ-ускорителей NVIDIA GB200. Монтаж оборудования в нескольких залах дата-центра будет выполнен в несколько этапов. К лету на первом этапе здесь будет установлено 16 тыс. чипов NVIDIA GB200. Стоимость оборудования не раскрывается, но строительство только одного объекта Stargate, по оценкам, обойдётся в несколько миллиардов долларов. Представитель OpenAI рассказал Bloomberg, что стартап работает вместе с Oracle над архитектурой и поставками для первого ЦОД в Абилине, и что Oracle отвечает за развёртывание и эксплуатацию суперкомпьютера, который строится в данном ЦОД. Ранее OpenAI сообщала, что в рамках проекта Stargate будет построено 10 ЦОД на территории США, включая несколько дата-центров на территории Техаса. Желание поддержать проект выразили 16 штатов, включая Аризону, Калифорнию, Флориду, Луизиану, Мэриленд, Неваду, Нью-Йорк, Огайо, Орегон, Пенсильванию, Юту, Техас, Вирджинию, Вашингтон, Висконсин и Западную Вирджинию. В стремлении нарастить вычислительные мощности совместное предприятие Stargate далеко не одиноко. Недавно стартап xAI, курируемый Илоном Маском (Elon Musk), заключил с Dell сделку стоимостью $5 млрд на поставку ИИ-серверов для суперкомпьютера Colossus в Мемфисе. Более года назад Meta✴ заявила, что к концу 2024 года планирует достичь вычислительной мощности, равной 600 тыс. ИИ-ускорителей NVIDIA H100. А CoreWeave заявила, что у неё есть более 250 тыс. ускорителей NVIDIA, размещённых в 32 ЦОД.
04.03.2025 [10:24], Сергей Карасёв
Вышел модуль Raspberry Pi CM4 с расширенным температурным диапазономКомпания Raspberry Pi объявила о выпуске вычислительных модулей Compute Module 4 (CM4) серии Extended Temperature с расширенным диапазоном рабочих температур. Эти изделия предназначены для использования в промышленных и встраиваемых устройствах, которые эксплуатируются в суровых условиях. Оригинальное решение Raspberry Pi CM4 дебютировало ещё в 2020 году. Оно несёт на борту 64-битный процессор Broadcom BCM2711 с четырьмя ядрами Cortex-A72 (ARM v8), работающими на частоте до 1,5 ГГц. Объём оперативной памяти LPDDR4-3200 SDRAM может составлять 1, 2, 4 или 8 Гбайт. Вместимость флеш-чипа eMMC — 8, 16 и 32 Гбайт (вариант Lite лишён встроенной флеш-памяти). Стандартные версии Raspberry Pi CM4 могут эксплуатироваться при температурах от -20 до +85 °C. В случае модификаций Extended Temperature нижняя планка находится на отметке -40 °C. Такие варианты оснащаются микросхемами SDRAM и eMMC с расширенным температурным диапазоном, произведёнными компанией Samsung. Все другие компоненты, как отмечается, уже были квалифицированы для работы при температурах до -40 °C. Изделия Raspberry Pi CM4 Extended Temperature доступны с 1, 2 и 4 Гбайт оперативной памяти, а также с накопителем eMMC вместимостью 16 Гбайт и без такового. Опционально может быть добавлена поддержка Wi-Fi 802.11b/g/n/ac с частотными диапазонами 2,4/5 ГГц и Bluetooth 5.0 (BLE). Подчёркивается, что производить изделия планируется как минимум до января 2034 года. Устройства проходят комплексное тестирование. Цена начинается с $30.
04.03.2025 [09:00], Руслан Авдеев
WSJ: дата-центры не создадут тысячи рабочих мест, как обещают политики и операторыХотя для постройки дата-центров требуются усилия тысяч рабочих, когда ЦОД заработает, для его обслуживания требуется не так много людей. Таким образом, отмечает The Wall Street Journal (WSJ), продвигаемый операторами и другими сторонами миф о массовом создании новых рабочих мест, не соответствует действительности. Более того, операторы ЦОД не прочь заменить людей роботами, ИИ и иными системами автоматизации. Часто ЦОД позиционируются политиками и бизнесменами как новая сфера для трудоустройства большого числа людей. Рассказывая об ИИ-проекте Stargate с участием OpenAI, президент США Дональд Трамп (Donald Trump) заявил, что более 100 тыс. новых рабочих мест будут созданы «практически немедленно». Почти то же самое объявила в своём блоге и OpenAI, играющая в проекте ключевую роль. Однако, отмечает WSJ, дело обстоит несколько иначе. Например, по имеющимся данным, первый объект Stargate в Абилине (Техас) потребует 1,5 тыс. строителей, а вот в штат на полный рабочий день после ввода кампуса в эксплуатацию возьмут около 100 человек. Издание констатирует, что это лишь 20 % от числа рабочих, занятых на соседнем заводе по упаковке сыра площадью 26,6 тыс. м2. При этом ЦОД для Stargate будет занимать более 93 тыс. м2. Дата-центры в целом являются антилидерами по количеству рабочих мест на единицу площади. По словам главного аналитика Synergy Research Group Джона Динсдейла (John Dinsdale), дата-центры могут нанять более 1 тыс. человек на период стройки, т.е. от нескольких месяцев до нескольких лет, но мало какие ЦОД имеют штат более 100–200 человек после открытия. Его словам вторит вашингтонская НКО Good Jobs First, отслеживающая использование государственных и локальных субсидий. Она утверждает, что дата-центры нуждаются в больших объёмах капитальных затрат, но, в отличие от промышленных предприятий, создают мало рабочих мест. Кроме того, дата-центры делают очень мало закупок у местных поставщиков, потребляя в основном электричество и воду. Впрочем, в OpenAI полагаются на другую систему подсчёта, учитывающую не только сотрудников непосредственно ЦОД, но и косвенно созданные рабочие места. Также, по данным представителей компании, стоит учитывать и средства, которые потратят сотрудники дата-центров в ближайших окрестностях. Кроме того, строящая в Абилине ЦОД компания Crusoe Energy построит и газовую электростанцию, на которой будет работать около 30 человек. Также у компании заводы в Колорадо и Оклахоме, на которых будет выпускаться для нового ЦОД электроборудование, этим будут заниматься около 400 рабочих. Преимуществом дата-центров, по данным WSJ, является и то, что их возведение всё-таки благоприятно сказывается на экономике малонаселённых местностей. Именно там может происходить ресурсоёмкое обучение ИИ-моделей. Земли в таких местах много, а энергия дешевле, так что даже несколько сотен трудоустроенных имеет значение.
03.03.2025 [22:08], Татьяна Золотова
DDoS-атаки на API выросли в два раза — под прицелом ритейл и банкиВ IV квартале 2024 года количество DDoS-атак на API увеличилось вдвое по сравнению с тем же кварталом 2023 года. При этом 70 % DDoS-атак на API пришлось на ритейл и банки, об этом сообщает аналитический центр компании StormWall. Проанализировав данные клиентов, эксперты StormWall обнаружили, что за отчетный период 38 % DDoS-атак на API пришлось на ритейл (рост на 26 %), 32 % — на банковскую индустрию (рост на 22 %). На рост инцидентов повлияла потребительская активность в дни распродаж «Черная пятница» и подготовка к Новому году, в том числе возрастающий пик платежей в Новогодние праздники. Как поясняют в компании, DDoS-атаки на API направлены на перегрузку серверов, обрабатывающих запросы к API, путем отправки огромного количества запросов. В итоге компании теряют доступ к сервисам, что приводит к простоям и ухудшению пользовательского опыта, финансовым потерям из-за остановки бизнес-процессов. ![]() Источник изображения: StormWall Атаки на API могут иметь такие последствия, как потеря данных, компрометация системы, изменение логики работы приложения или полный выход из строя системы. Достаточно найти уязвимость или вызвать чрезмерную нагрузку на конкретный эндпойнт. Запросы к API часто выглядят как легитимный трафик, что затрудняет их обнаружение и фильтрацию по сравнению с более очевидными атаками типа HTTP Flood. Противостоять DDoS-атакам на API помогут системы мониторинга трафика для обнаружения аномалий, использование WAF для фильтрации вредоносного трафика, создание резервных копий данных и план действий при инцидентах.
03.03.2025 [13:48], Сергей Карасёв
Rigetti и Quanta Computer объединили усилия в области квантовых вычисленийКомпании Rigetti Computing и Quanta Computer объявили о заключении соглашения о стратегическом сотрудничестве с целью ускорения разработки и коммерциализации квантовых вычислительных систем на основе сверхпроводящих кубитов. Rigetti Computing, основанная в 2013 году, базируется в Беркли (Калифорния, США). Компания занимается созданием квантовых компьютеров. Благодаря фирменной платформе Quantum Cloud Services (QCS) такие машины могут быть интегрированы в любое публичное, частное или гибридное облако. В 2021 году Rigetti начала поставлять квантовые вычислительные системы для локальной установки: эти комплексы насчитывает от 24 до 84 кубитов. В свою очередь, Quanta Computer основана в 1988 году. Этот тайваньский контрактный производитель серверов, ноутбуков и другой компьютерной техники оперирует производственными и сервисными центрами в Азии, Америке и Европе. Подразделение Quanta Cloud Technology, созданное в мае 2012 года, занимается поставками оборудования для дата-центров и облачных платформ. В рамках соглашения Rigetti Computing и Quanta Computer сосредоточатся на своих взаимодополняющих технологиях для разработки сверхпроводящих квантовых вычислительных платформ. Каждая из компаний при этом в течение следующих пяти лет инвестирует в совместные проекты более $100 млн. Кроме того, Quanta Computer потратит $35 млн на покупку акций Rigetti Computing при условии получения соответствующего разрешения от регулирующих органов. В совместном заявлении партнёров говорится, что индустрия квантовых вычислений продолжит демонстрировать быстрый рост, включая расширение коммерческого сектора. Объём этого рынка, как ожидается, достигнет $1–$2 млрд к 2030 г. При этом компании видят большой потенциал в области решений на основе сверхпроводящих кубитов.
26.02.2025 [17:18], Руслан Авдеев
ИИ-ускорители Ascend впервые стали приносить Huawei прибыльHuawei поступательно улучшает качество своих чипов. По последним данным, уже 40 % экземпляров новейших ускорителей Ascend пригодны к эксплуатации, а их производство впервые стало для компании прибыльным, говорят отраслевые эксперты. Компания намерена повысить показатель годности до 60 % в соответствии со стандартами индустрии, сообщает The Financial Times. Год назад речь шла якобы лишь о 20 %. Это чрезвычайно важно для компании, поскольку Ascend 910C значительно производительнее 910B. Это очередной шаг на пути Китая к строительству независимой вычислительной инфраструктуры, не подверженной санкциям. Местную полупроводниковую отрасль активно поддерживает государство. Пекин постоянно призывает китайские компании покупать местные альтернативы продуктов NVIDIA, которая до сих пор остаётся лидером рынка ускорителей в КНР. По данным отраслевых источников, в этом году Huawei намерена выпустить 100 тыс. чипов 910C и 300 тыс. 910B. В 2024 году последних выпустили 200 тыс. экземпляров, а массовый впуск 910С ещё не был налажен. Впрочем, компании придётся постараться, чтобы убедить потенциальных покупателей отказаться от продукции NVIDIA. Отмечается, что программная экосистема NVIDIA CUDA намного удобнее и производительнее ПО Huawei. Кроме того, бизнес и сама Huawei признают, Ascend 910B недостаточно хороши для обучения больших моделей. Эту проблему компания попыталась решить в модели 910C. В 2020 году США буквально заставили тайваньскую TSMC прекратить производство для Huawei ускорителей Ascend и чипсетов для смартфонов компании. Выпуском ускорителей Huawei занимается китайская SMIC, которая тоже находится под американскими санкциями. Компания использует техпроцесс N+2, позволяющий выпускать высокопроизводительные чипы без EUV-литографии. В Китай запрещено продавать соответствующее оборудование нидерландской ASML. Так или иначе, Huawei является единственным конкурентом, способным состязаться с NVIDIA при производстве чипов для инференса. Правда, как отмечают многие китайские заказчики, компания не может обеспечить действительно масштабных поставок для всех желающих, отдавая приоритет крупным облачным провайдерам, за которыми стоит государство, например, China Mobile. По мнению экспертов, на Huawei сегодня приходится более ¾ общего производства ИИ-чипов в Китае, мелким соперникам трудно конкурировать с техногигантом из-за того, что тот имеет доступ к самым передовым технологическим процессам SMIC. Предполагается, что NVIDIA всё равно будет продавать больше ускорителей в Китае, чем Huawei, несмотря на то что американской компании разрешено поставлять только урезанные модели H20. По оценкам SemiAnalysis, выручка NVIDIA за продажу только в 2024 году в Китай 1 млн ускорителей составила $12 млрд. Триумф ИИ-моделей DeepSeek только подстегнул спрос на чипы NVIDIA H20 в Китае.
25.02.2025 [13:30], Руслан Авдеев
Нефтегигант Eni совместно с MGX и G42 из ОАЭ построят в Италии ЦОД ёмкостью до 1 ГВтИтальянский нефтяной гигант Eni намерен построить новые дата-центры в стране общей ёмкостью 1 ГВт. Компания подписала соглашение о намерениях с инвестиционной MGX и G42 из ОАЭ для строительства нескольких ЦОД, трансграничной передачи возобновляемой энергии и участия в других проектах, сообщает пресс-служба Eni. Новые объекты будут обеспечены «низкоуглеродной» энергией, поставляемой Eni и добываемой путём сжигания природного газа. Первый проект претворят в жизнь близ Феррера-Эрбоньоне (Ferrera Erbognone) в Ломбардии, где уже находится собственный ЦОД Green Data Centre компании. Строительство будет осуществляться в два этапа, на каждом из которых планируется ввести до 500 МВт IT-мощностей — это приблизительно равно текущей установленной мощности ЦОД всей Италии. Также Eni подписала соглашение с Abu Dhabi Future Energy Company PJSC (Masdar) из ОАЭ, занимающейся «чистой» энергетикой, и Taqa Transmission, специализирующейся на передаче электроэнергии — речь идёт о долгосрочных поставках электричества в Италию. Eni определена предпочтительным покупателем возобновляемой энергии, вырабатываемой в Албании, общей мощностью до 3 ГВт. Ожидается, что передача будет осуществляться в том числе через 1-ГВт подводный кабель между странами. В январе 2025 года было подписано трёхстороннее стратегическое рамочное соглашение о сотрудничестве, подписанное между правительствами Италии, Албании и ОАЭ. По данным Datacenter Dynamics, захват и хранение углекислого газа будет осуществляться в рамках проекта Ravenna CCS Hub — газ закачивается на глубину 3000 м на территории истощённого газоносного поля Porto Corsini Mare Ovest. По словам руководства Eni, совместно с арабскими энергетическими компаниями будут реализованы инициативы, имеющие ключевое значение для энергетического перехода — к ним относится и строительство ЦОД с питанием от энергии, получаемой из природного газа. Такая модель позволят компенсировать растущий спрос на вычислительные мощности для ИИ. ![]() Источник изображения: Eni Eni является крупнейшей нефтегазовой компании Италии и второй по величине в Евросоюзе после Total. Компания запустила Green Data Centre к югу от Милана в 2013 году. Объект на 30 МВт занимает площадь 5200 м2 и обеспечивает плотность размещения 50 кВт/м2. Отчасти дата-центр питается от солнечной электростанции на 1 МВт. В ЦОД работают несколько суперкомпьютеров, в том числе самая мощная в Европе машина HCP6, занимающая пятое место в рейтинге TOP500. G42 специализируется на ИИ-проектах и финансирует строительство ЦОД в Африке, Европе и на Ближнем Востоке, а MGX — эмиратская инвестиционная компания, вкладывающая в технологии искусственного интеллекта, она участвует в развитии проекта Stargate в США и некоторых проектах во Франции. |
|