Материалы по тегу: ии
|
12.12.2024 [23:59], Руслан Авдеев
Царь-ускоритель Cerebras WSE-3 в одиночку обучил ИИ-модель с 1 трлн параметровCerebras Systems совместно с Сандийскими национальными лабораториями (SNL) Министерства энергетики США (DOE) провели успешный эксперимент по обучению ИИ-модели с 1 трлн параметров с использованием единственной системы CS-3 с царь-ускорителем WSE-3 и 55 Тбайт внешней памяти MemoryX. Обучение моделей такого масштаба обычно требует тысяч ускорителей на базе GPU, потребляющих мегаватты энергии, участия десятков экспертов и недель на наладку аппаратного и программного обеспечения, говорит Cerebras. Однако учёным SNL удалось добиться обучения модели на единственной системе без внесения изменений как в модель, так и в инфраструктурное ПО. Более того, они смогли добиться и практически линейного масштабирования — 16 систем CS-3 показали 15,3-кратный прирост скорости обучения. Модель такого масштаба требует терабайты памяти, что в тысячи раз больше, чем доступно отдельному GPU. Другими словами, классические кластеры из тысяч ускорителей необходимо корректно подключить друг к другу ещё до начала обучения. Системы Cerebras для хранения весов используют внешнюю память MemoryX на базе 1U-узлов с самой обычной DDR5, благодаря чему модель на триллион параметров обучать так же легко, как и малую модель на единственном ускорителе, говорит компания. Ранее SNL и Cerebras развернули кластер Kingfisher на базе систем CS-3, который будет использоваться в качестве испытательной платформы при разработке ИИ-технологий для обеспечения национальной безопасности.
12.12.2024 [18:37], Руслан Авдеев
Broadcom поможет Apple создать собственные серверные ИИ-ускорителиПо неофициальным данным, Apple работает с Broadcom над разработкой серверного ИИ-ускорителя для обслуживания ИИ-сервисов в своих ОС. По словам трёх анонимных источников The Information, чип создаётся в рамках проекта Baltra и будет запущен в производство в 2026 году. Ранее компании уже работали над 5G-технологиями. Деталей пока немного. На одной из конференций в этом году представитель Apple заявил, что ИИ-экосистема Apple Intelligence должна работать как на самих устройствах компании, так и в частном облаке Apple Private Cloud Compute на базе чипов M2 Ultra. Они используются для инференса, тогда как для обучения ИИ-моделей Apple использует ускорители Google TPU. Первые слухи о том, что компания разрабатывает серверные ускорители, появились в мае 2024 года. У компании богатый опыт разработки Arm-чипов, а Broadcom, помимо прочего, продаёт лицензии на различные IP-блоки и уже не раз помогала гиперскейлерам в создании кастомных чипов. Не так давно Broadcom анонсировала новую технологию упаковки 3.5D eXtreme Dimension System in Package (3.5D XDSiP), которая как раз ориентирована на создание высокопроизводительных кастомных чипов. Она позволяет объединить два 3D-стека, пару I/O чиплетов и до 12 модулей памяти HBM3 в одной упаковке, занимающей более 6000 мм². Производство первых чипов по этой технологии ожидается в 2026 году. Созданием собственных ИИ-ускорителей заняты практически все крупные гиперскейлеры. Google первой занялась созданием собственных ускорителей и теперь в её портфолио есть уже шесть поколений TPU, Meta✴ трудится над MTIA, AWS предлагает Trainium2 и Inferentia2, Microsoft анонсировала Maia 100, Alibaba разработала Hanguang 800, а ByteDance и OpenAI пока ещё только создают будущие ускорители, причём при помощи всё той же Broadcom. Впрочем, для многих из них это попытка снизить зависимость от NVIDIA, выручка которой бьёт все рекорды.
12.12.2024 [08:57], Владимир Мироненко
Google попросила регулятора разорвать эксклюзивное облачное соглашение Microsoft и OpenAI из-за вреда конкуренцииGoogle попросила Федеральную торговую комиссию США (FTC) разорвать эксклюзивное облачное соглашение Microsoft с OpenAI, в рамках которого разработчик ИИ-чат-бота ChatGPT использует её облачную инфраструктуру для функционирования своих сервисов и других задач, сообщил ресурс The Information. Просьба Google поступила после того, как FTC запросила у неё отзыв о деловой практике Microsoft в рамках более широкого расследования, касающегося лицензирования софтверным гигантом ПО, а также облачных вычислений, предложений по обеспечению кибербезопасности и услуг ИИ. По словам Google, соглашение о партнёрстве Microsoft и OpenAI, которое позволяет Microsoft быть единственным поставщиком облачных сервисов, размещающим передовые модели OpenAI, создает значительные рыночные барьеры и потенциально увеличивает затраты для клиентов облачных сервисов, желающих получить доступ к передовым технологиям ИИ То, что Microsoft является крупнейшим инвестором OpenAI, вложившим в неё более $13 млрд, объясняет столь тесное сотрудничество двух компаний, но другим технологическим компаниям, которые конкурируют с Microsoft на облачном рынке, таким как Google и Amazon, тоже хотелось бы размещать у себя в облаке модели OpenAI, чтобы их облачным клиентам не нужно было обращаться к услугам Microsoft для получения доступа к технологии стартапа, говорится в публикации The Information. Ведущие игроки считают, что нынешнее эксклюзивное соглашение ограничивает конкуренцию на облачном рынке и выбор клиентов. Как утверждают источники ресурса, компании, которые приобретают технологию OpenAI через Microsoft, могут столкнуться с дополнительными расходами, если они не используют решения Microsoft для своей работы. Google и другие участники рынка отметили, что такой подход к ценообразованию может навредить клиентам и ограничить доступ к ИИ-технологиям.
12.12.2024 [01:45], Владимир Мироненко
«Страна чувствует себя уверенно»: «Ростелеком» заявил об успехе импортозамещения серверовВ России полностью решена проблема с импортозамещением мощных вычислительных ресурсов, заявил глава «Ростелекома» Михаил Осеевский, выступая на пленарном заседании Совета Федерации, пишет ТАСС. «Хочу доложить, что сегодня страна чувствует себя достаточно уверенно. У нас полностью решена проблема импортозамещения мощных вычислительных ресурсов, серверов, систем хранения [данных]», — цитирует ТАСС заявление руководителя «Ростелекома». Напомним, что ещё в мае замглавы Минпромторга Василий Шпак сообщил, что в ведомстве обсуждают предложение участников отрасли об исключении из списка товаров, разрешённых к параллельному импорту в Россию, серверов и СХД. Рынок серверов в России активно развивается. В конце 2023 года на территории индустриального парка «Рязанский» неподалёку от Рязани был введён в эксплуатацию завод «Центра открытых разработок» (бренд OpenYard) по производству серверного оборудования, мощность которого позволяет изготавливать свыше 60 тыс. единиц техники ежегодно. В июле «Гравитон» и OpenYard договорились о технологическом партнёрстве, в рамках которого на площадке OpenYard было налажено контрактное производство плат для серверов и клиентских устройств. В феврале текущего года «Сбербанк» запустил производство серверов, адаптированных для применения в собственных ЦОД, что позволило ему полностью отказаться от проприетарных ПАК сторонних поставщиков. А в декабре на бывшем заводе Samsung в Калуге, по данным СМИ, организовали сборку серверов под брендом «Гравитон». Кроме того, производства есть и у ряда других российских брендов, например, у «Аквариус» и F-Plus.
11.12.2024 [17:59], Руслан Авдеев
Российский рынок облачных сервисов с ИИ-ускорителями в 2024 году вырастет в 1,5 раза до 17,1 млрд рублейРынок российских облачных сервисов для вычислений с использованием ИИ-ускорителей в 2024 году может вырасти до 17,1 млрд руб., +55 % год к году. Предварительный прогноз подготовлен экспертами J’son & Partners Consulting, сообщают «Ведомости». Исследование посвящено развитию публичных облаков. В целом, по прогнозам экспертов, рынок облачных услуг в 2024 году в России вырастет на 31,2 % — до 142,4 млрд руб. Доступ к ускорителям в облаках тарифицируются по принципу Pay as You Go (PAYG) — пользователи обычно платят за потребление ресурсов. Согласно прогнозам J’son & Partners данным, среднегодовой прирост (GAGR) на рынке соответствующих вычислений в публичных облаках до 2025 года, возможно, составит 32,7 %, а в денежном выражении сегмент к 2029 году достигнет 66,3 млрд руб. Использование ускорителей в облаках весьма удобно, поскольку позволяет быстро получить доступ к вычислительным мощностям и обходится дешевле, чем закупки собственного оборудования, которые к тому же осложняются санкционными ограничениями. На фоне быстрого роста спроса на сервисы, требующие использования ускорителей, наблюдается их дефицит на российском рынке, но эксперты прогнозируют постепенный выход к состоянию баланса. По данным iKS-Consulting, пока ускорители для обучения ИИ арендуют не очень часто — на эту услугу приходится 5,4 % рынка облачных услуг. При этом в 2023 году совокупная выручка провайдеров таких GPU-сервисов составила около 6,6 млрд руб., при общей выручке от облачных инфраструктурных сервисов в том же году на уровне 121,4 млрд руб. Рынок вырос — в 2022 году на аренду сервисов с ИИ-ускорителями приходилось 4 % (всего 3,7 млрд руб.). Ранее аналитики прогнозировали, что к 2028 году российский рынок облачной инфраструктуры достигнет 464 млрд руб., а к концу 2024 года может вырасти до 162 млрд руб. с 121,4 млрд руб. в прошлом году. Статистика J’son & Partners Consulting показывает, что сегодня облачные провайдеры имеют около 77 400 клиентов. Правда, более 50 % из них можно отнести к мелким пользователям, тратящим на облачные услуги до 10 тыс. руб. в месяц. При этом пока даже крупные компании часто размещают задачи в локальных ЦОД, которые тоже требуют как масштабирования, так и модернизации в целом.
11.12.2024 [15:39], Руслан Авдеев
HPE отказалась продать неизвестному клиенту ИИ-серверы на $700 млнВ ходе отчёта за IV квартал 2024 года HPE упомянула, что отказалась от заказа на поставку ИИ-оборудования на $700 млн, усомнившись в неназванном покупателе, сообщает Network World. Общий объём бронирования по итогам квартала составил ожидамеые $1,2 млрд, а портфель необработанных заказов вырос до $3,5 млрд. В компании подчеркнули, что заказы на ИИ-системы могут поступать неравномерно, и это как раз такой случай. На вопрос Network World об отмене заказа компания ответила, что имеет надёжную систему контроля, внимательно следит за работой с надёжными клиентами, управляет рисками и проводит диверсификацию портфеля заказов. Другими словами, по мнению экспертов, HPE потеряла веру в то, что один из её клиентов сможет справиться с контрактными обязательствами, и должным образом отреагировала на эту угрозу. И это важный сигнал для рынка в целом. Одна из основных проблем в том, что системы генеративного ИИ пока слабо окупаются. По данным Sequoia Capital, ИИ-индустрия потратила в прошлом году почти $50 млрд на чипы NVIDIA, но выручка за тот же период составила всего $3 млрд. Подчёркивается, что скидки и прочие привилегии больше не являются необходимой частью распространения ИИ-продуктов.
Источник изображения: HPE По мнению экспертов, сейчас спрос превышает предложение, поэтому HPE может позволить себе отдавать преимущество отдельным сегментам рынка и продуктам, поскольку объёмы доступной ИИ-инфраструктуры ограничены. Похожий дисбаланс спроса и предложения наблюдался несколько лет назад во время пандемии COVID-19. Выяснить, когда спрос превысит предложение, не так просто — на насыщение цепочки поставок продуктами уходит сравнительно много времени. При этом финансовые директора компаний из списка Fortune 2000 могут счесть перспективы инвестиций в генеративный ИИ не слишком впечатляющими. Это окажет влияние на позиции заказчиков и покупателей. Впрочем, те, кто первыми начали внедрять такие системы, в долгосрочной перспективе, возможно, будут иметь лучшие позиции, более низкую стоимость эксплуатации и т.п. Пока эксперты остерегаются делать чересчур смелые прогнозы. С учётом скорости развития ИИ-инфраструктуры не исключено, что на $1 млн, который можно потратить прямо сейчас, позднее можно будет получить гораздо более выгодное предложение. В то же время не исключено, что полупроводники достигнут физического предела своей производительности и IT-руководителям придётся делать сложный выбор, в числе прочего сделав акценты на повышение «нишевости» и качества ИИ-моделей.
11.12.2024 [14:20], Руслан Авдеев
Солнце, ветер и аккумуляторы: Google пристроит к своим ИИ ЦОД гигаваттные энергокомплексыКомпания Google вкладывает средства в строительство энергетических мегапарков для получения возобновляемой энергии — IT-гигант стремится обеспечить электричеством свои ЦОД. В частности, он заключил партнёрское соглашение с независимым производителем энергии Intersect Power. Также в сделке участвует инвестиционная TPG Rise Climate LP, сообщает Bloomberg. Консорциум займётся проектированием и строительством крупных энергетических комплексов рядом с кампусами ЦОД, которые будут включать возобновляемые источники энергии, энергохранилища и сопутствующую инфраструктуру передачи энергии на несколько гигаватт. Это обойдётся приблизительно в $20 млрд. Для поддержки проекта Google также инвестировала и в акционерный капитал Intersect Power. TPG возглавила раунд финансирования, в котором помимо Google приняли участие CAI и Greenbelt Capital Partners. Всего привлечено $800 млн. Новые инвестиции помогут Intersect получить дополнительные заёмные средства на строительство энергетических мощностей.
Источник изображения: Intersect Power План Google заключается в постройке ЦОД и новых энергетических мощностей таким образом, чтобы те подключались к одним и тем же подстанциям. Это должно помочь ускорить их ввод в эксплуатацию. В Google сообщают, что компания намерена оплатить 100 % расходов на модернизацию энергосетей для этих проектов. По оценкам партнёров, кампусу ИИ ЦОД на 1 ГВт потребуется по 1 ГВт солнечных и ветряных мощностей, а также 1-ГВт энергохранилище, способное проработать два-четыре часа — всё это на площади более 4 тыс. га. Энергетические парки станут альтернативой стареющим электросетям США, которые с трудом справляются с потребностями ИИ ЦОД и параллельным электроснабжением домов, транспорта и промышленности. Google, Microsoft и AWS, а также другим крупным операторам ЦОД необходимы многомиллиардные инвестиции для удовлетворения потребностей ИИ в энергии. Все, включая Google, присматриваются к малым модульным реакторам, но они заработают не раньше 2030-х годов. По данным пресс-службы Intersect, компания будет строить новые мощности по выработке чистой энергии, а Google станет её якорным клиентом. Таким образом, запросы Google будут полностью соответствовать доступным мощностям. Сейчас Intersect привлекает заемные средства для своего первого проекта с Google, который планируется к вводу в эксплуатацию в 2026 году. Параметры и местоположение проекта компании пока не раскрывают.
10.12.2024 [15:21], Владимир Мироненко
Спрос на ИИ-ускорители в облаке Oracle вырос за квартал на 336 %, а новым крупным клиентом стала Meta✴Американская корпорация Oracle сообщила результаты работы во II квартале 2025 финансового года, закончившемся 30 ноября 2024 года. Результаты и прогноз на текущий квартал оказались ниже ожиданий аналитиков Уолл-стрит и инвесторов, в связи с чем акции корпорации упали в понедельник в ходе расширенных торгов на 7 %. Выручка Oracle составила $14,06 млрд, превысив результат аналогичного финансового квартала годом ранее на 9 %, а также консенсус-прогноз аналитиков, опрошенных LSEG, в размере $14,1 млрд. Вместе с тем скорректированная прибыль на акцию (non-GAAP), составившая $1,47 и превысившая прошлогодний результат на 10 %, оказалась ниже ожиданий Уолл-стрит в размере $1,48 на акцию. Чистая прибыль (GAAP) увеличилась на 26 % до $3,15 млрд, или $1,10 на акцию, с $2,5 млрд, или $0,89 на акцию годом ранее. Выручка в сфере облачных сервисов и поддержки Oracle выросла по сравнению с прошлым годом на 12 % до $10,81 млрд, что составляет 77 % от общей выручки корпорации. Выручка от лицензирования облачных и локальных продуктов увеличилась всего на 1 % до $1,2 млрд. Вместе с тем упали продажи оборудования — на 4 % год к году до $728 млн, и сократилась выручка от сервисов — на 3 % до $1,33 млрд.
Источник изображения: Oracle Генеральный директор Oracle Сафра Кац (Safra Catz) заявила в ходе отчёта, что рекордный спрос на ИИ привёл к росту выручки Oracle Cloud Infrastructure во II квартале на 52 %, что намного выше темпов роста любого из гиперскейлеров. «Рост в сегменте ИИ нашего инфраструктурного бизнеса был необычайным — потребление GPU выросло на 336 % за квартал — и мы развернули самый большой и быстрый в мире облачный ИИ-суперкомпьютер из 65 тыс. ускорителей NVIDIA H200», — сообщила она, добавив, что в этом финансовом году общий доход Oracle Cloud должен превысить $25 млрд. Oracle заявила, что только что подписала соглашение с Meta✴, позволяющее последней использовать её инфраструктуру для работы в различных проектах, связанных с семейством больших языковых моделей Llama. Одним из ключевых заказчиков ИИ-ускорителей в облаке Oracle также являются Microsoft с OpenAI. «Oracle Cloud Infrastructure обучает несколько важнейших в мире моделей генеративного ИИ, поскольку мы быстрее и дешевле других облаков», — указал основатель и главный технический директор Oracle Ларри Эллисон (Larry Ellison) в своем заявлении. В III квартале 2025 финансового года Oracle ожидает роста выручки на 7–9 % — около $14,3 млрд в средней точке, что ниже прогноза Уолл-стрит в размере $14,65 млрд (согласно LSEG). Прогноз по скорректированной прибыли Oracle находится в пределах от $1,50 до $1,54 на акцию. Аналитики прогнозируют прибыль на акцию в размере $1,57. В сентябре Oracle повысила прогноз выручки на 2026 финансовый год до $66 млрд, что примерно на $1,5 млрд больше, чем ожидают аналитики. Также Oracle тогда объявила, что ее облачное подразделение начнёт принимать заказы клиентов на вычислительные кластеры из более чем 131 тыс. ускорителей NVIDIA Blackwell.
10.12.2024 [14:55], Руслан Авдеев
Китай инициировал антимонопольное расследование против NVIDIA в ответ на ужесточение санкций США в отношении КНРКитайский антимонопольный регулятор начал расследование в отношении NVIDIA. Вероятно, главной причиной является желание дать ответ на решение властей США снова ужесточить ограничения на поставку чипов в Китай, сообщает гонконгское издание SCMP. В NVIDIA не спешат комментировать ситуацию. На фоне новостей акции компании незначительно упали на торгах в понедельник. NVIDIA, соблюдающая американские законы, касающиеся ограничений поставок передовых чипов в КНР, подозревается китайскими регулятором в нарушении антимонопольных законов при покупке израильской компании Mellanox Technologies. Об этом в понедельник заявила китайская Государственная администрация по регулированию рынка. Сделка NVIDIA-Mellanox стоимостью $6,9 млрд была анонсирована в 2019 году. Китайский регулятор одобрил поглощение в апреле 2020-го с условием, что ускорители NVIDIA, сетевые решения Mellanox и сопутствующее ПО будут поставляться в КНР на «честных, разумных и недискриминационных принципах».
Источник изображения: NVIDIA Антимонопольное расследование китайских регуляторов рассматривается некоторыми экспертами как начало реализации систематической «стратегии возмездии». Расследование называют предвестником более жёстких мер. Некоторые даже называют его не вопросом регуляций, а «геополитическим манёвром» — Китай посылает сообщение Вашингтону и, похоже, не намерен отступать. Принятые Пекином меры последовали всего через несколько дней после того, как поддерживаемые властями КНР промышленные ассоциации призвали своих участников с осторожностью покупать американские чипы. Например, Китайская ассоциация полупроводниковой промышленности (China Semiconductor Industry Association), в которую входит и подразделение NVIDIA Technical Service (Пекин), призвала своих участников избегать покупки чипов у американских поставщиков, заявив, что они «не безопасны не надёжны». Ирония в том, что деятельность NVIDIA расследует Министерство юстиции и в самих США, сообщает Datacenter Dynamics. Интерес к делам компании проявляет и французский антимонопольный регулятор, а также антимонопольное ведомство Евросоюза в целом.
10.12.2024 [08:43], Владимир Мироненко
Axiado привлекла $60 млн на развитии аппаратной ИИ-защиты для серверовСтартап Axiado Corporation, специализирующийся на аппаратных решениях кибербезопасности, объявил об успешном проведении раунда финансирования серии C с привлечением $60 млн и превышением лимита подписки, который возглавила Maverick Silicon при участии Samsung Catalyst Fund, Atreides Management и Crosslink Capital. С учётом раунда серии B на $25 млн, прошедшем три года назад, общий объём инвестиций в стартап составил примерно $108 млн, пишет ресурс EE Times. Привлечённые средства стартап планирует использовать для стимулирования дальнейших разработок, укрепления стратегических партнёрств с ведущими поставщиками, такими как NVIDIA, AMD, Intel и Arm, и ускорения инициатив по выходу на рынок с OEM- и ODM-партнёрами для внедрения решений Axiado в ЦОД. За последнее время стартап удвоил численность персонала на Тайване и в Индии, на 30 % увеличилась его команда в Сан-Хосе. Также сообщается об открытии Axiado нового офиса в Индии для поддержки постоянного роста. Компания говорит, что фокусируется на обеспечении «безопасности, основанной на аппаратном обеспечении» для ускоренных вычислений и ЦОД ИИ с использованием нового сопроцессора собственной разработки под названием доверенный блок управления/вычисления (Trusted Control/Compute Unit, TCU). TCU обеспечивает упреждающее обнаружение угроз и их смягчение в реальном времени, используя защищённые хранилище RoT, криптографическое ядро и ИИ-движок. Решение Axiado Dynamic Thermal Management (DTM), работающее на базе TCU, позволяет ИИ ЦОД снизить потребление энергии за счёт динамической регулировки охлаждения с использованием опять-таки ИИ. DTM оптимизирует управление температурой, прогнозируя и корректируя требования к охлаждению — будь то воздушное или жидкостное — на основе данных рабочих нагрузок серверов в реальном времени. По словам Axiado, такой подход радикально повышает энергоэффективность серверов ИИ и ускоряет переход к ЦОД с нулевым уровнем выбросов углерода. Как отметил Патрик Мурхед (Patrick Moorhead), основатель, генеральный директор и главный аналитик Moor Insights & Strategy, технология TCU отличается тем, что интегрирует средства безопасности на основе ИИ с нулевым доверием непосредственно в «кремний», чтобы противостоять программам-вымогателям и продвинутым угрозам в реальном времени. Потребность в надёжной платформенной кибербезопасности никогда не была более острой, говорит Axiado. Согласно отчёту Центра рассмотрения жалоб на интернет-преступления (IC3) ФБР за 2023 год, ущерб от зарегистрированных киберпреступлений в США вырос в прошлом году на 22 %, превысив $12,5 млрд. В отчёте Forrester 2025 Predictions report for Cybersecurity, Risk, and Privacy прогнозируется, что к 2025 году расходы на борьбу с киберпреступностью достигнут нескольких триллионов долларов по всему миру. При этом значительно выросла частота атак с целью вымогательства — только в I половине 2024 года было зарегистрировано более 2500 инцидентов, в среднем объявлялось о более чем 14 атаках ежедневно. |
|
