Материалы по тегу: ии
13.12.2024 [15:33], Андрей Крупин
«Лаборатория Касперского» внедрила GigaChat в систему KUMA для мониторинга и анализа инцидентов ИБ«Лаборатория Касперского» сообщила о расширении функциональных возможностей программного комплекса Kaspersky Unified Monitoring and Analysis Platform (KUMA) и включении в состав продукта инструментов анализа событий безопасности посредством нейросетевой модели GigaChat от «Сбера». KUMA относится к классу решений SIEM (Security Information and Event Management) и позволяет IT-службам в режиме реального времени осуществлять централизованный мониторинг событий ИБ, выявлять инциденты информационной безопасности, оперативно реагировать на возникающие угрозы, а также выполнять требования, предъявляемые регуляторами к защите персональных данных, в том числе к обеспечению безопасности государственных информационных систем. Построенный на базе GigaChat инструментарий получил название KIRA — Kaspersky Investigation and Response Assistant. Он позволяет сократить объём выполняемых ИБ-персоналом рутинных операций и снизить вероятность ошибок при анализе инцидентов — искусственный интеллект автоматически формирует карточки событий, оценивает степень их риска и помогает в принятии решений о приоритетности реагирования. Также ИИ в KUMA позволяет работать с системой профильным сотрудникам с разным уровнем подготовки. Так, опираясь на анализ от GigaChat, начинающие специалисты могут принимать более быстрые и точные решения по реагированию на инциденты. ![]() Пример работы Kaspersky Investigation and Response Assistant (источник изображения: «Лаборатория Касперского») «Лаборатория Касперского внедряет инструменты искусственного интеллекта в свои решения уже более 20 лет. Интеграция KUMA с GigaChat — логичное продолжение развития наших защитных продуктов с опорой на передовые технологии и прекрасный пример того, как лидеры в своих областях объединяют усилия, чтобы усовершенствовать безопасность организаций и помочь специалистам в их работе», — говорится в заявлении «Лаборатории Касперского». SIEM-платформа KUMA зарегистрирована в реестре отечественного ПО и имеет статус рекомендованной для использования в государственных ведомствах и организациях РФ.
13.12.2024 [12:05], Сергей Карасёв
Объём облачного рынка в России в 2024 году вырос на треть — до 165,6 млрд рублейВ 2024 году объём российского рынка облачных инфраструктурных сервисов достиг примерно 165,6 млрд руб., что соответствует росту на 36,3 % по отношению к 2023-му. Такую оценку дают аналитики iKS-Consulting. Отмечается, что рост отрасли в долларовом выражении составил только 8,6 % — до $1,95 млрд. Объясняется это резким падением курса рубля по отношению к иностранным валютам. В сегменте IaaS+PaaS лидером по выручке по итогам 2024 года стал Cloud.ru (до 2022 года входил в структуру «Сбера») с долей 28,9 %. На втором месте находится РТК-ЦОД с 16,9 %, а замыкает тройку Yandex Cloud с 11,4 %. Кроме того, в первую пятёрку вошли Selectel и MTS Web Services (MWS) с результатом 6,7 % и 6,5 % соответственно. Если рассматривать только направление PaaS, то первое место в рейтинге ведущих провайдеров занимает Cloud.ru с долей 45,6 %. Затем идут Yandex Cloud и РТК-ЦОД, контролирующие соответственно 26,7 % и 5,3 % сегмента. В сфере IaaS также лидирует Cloud.ru — доля зафиксирована на уровне 24,7 %. На втором и третьем местах находятся РТК-ЦОД и MTS Web Services с результатом 19,8 % и 8,1 %. ![]() Источник изображений: iKS-Consulting «Активное развитие российского IT-рынка происходило в том числе на фоне общемирового тренда на повышение проникновения высоких технологий во все сферы бизнеса и дополнительного импульса, полученного в результате пандемии COVID-19. В России также продолжается цифровая трансформация экономики, одним из наиболее заметных трендов которой является внедрение технологий ИИ в различные бизнес-процессы», — отмечается в исследовании iKS-Consulting. ![]() Среди ключевых драйверов облачного рынка в России авторы исследования называют быстрое развитие сервисов ИИ, ограниченные возможности предприятий по инвестициям в собственную инфраструктуру, спрос на услуги со стороны государства, а также миграцию заказчиков на отечественные платформы. Кроме того, наблюдается расширение облачных инфраструктур в целом. ![]() С другой стороны, существуют сдерживающие факторы: это сохраняющееся недоверие к облачным услугам со стороны ряда организаций, дефицит специализированных кадров и экономическая нестабильность. Для расширения облачных инфраструктур требуются значительные инвестиции в серверы и другое оборудование, что приводит к росту цен для конечных клиентов.
12.12.2024 [23:59], Руслан Авдеев
Царь-ускоритель Cerebras WSE-3 в одиночку обучил ИИ-модель с 1 трлн параметровCerebras Systems совместно с Сандийскими национальными лабораториями (SNL) Министерства энергетики США (DOE) провели успешный эксперимент по обучению ИИ-модели с 1 трлн параметров с использованием единственной системы CS-3 с царь-ускорителем WSE-3 и 55 Тбайт внешней памяти MemoryX. Обучение моделей такого масштаба обычно требует тысяч ускорителей на базе GPU, потребляющих мегаватты энергии, участия десятков экспертов и недель на наладку аппаратного и программного обеспечения, говорит Cerebras. Однако учёным SNL удалось добиться обучения модели на единственной системе без внесения изменений как в модель, так и в инфраструктурное ПО. Более того, они смогли добиться и практически линейного масштабирования — 16 систем CS-3 показали 15,3-кратный прирост скорости обучения. Модель такого масштаба требует терабайты памяти, что в тысячи раз больше, чем доступно отдельному GPU. Другими словами, классические кластеры из тысяч ускорителей необходимо корректно подключить друг к другу ещё до начала обучения. Системы Cerebras для хранения весов используют внешнюю память MemoryX на базе 1U-узлов с самой обычной DDR5, благодаря чему модель на триллион параметров обучать так же легко, как и малую модель на единственном ускорителе, говорит компания. Ранее SNL и Cerebras развернули кластер Kingfisher на базе систем CS-3, который будет использоваться в качестве испытательной платформы при разработке ИИ-технологий для обеспечения национальной безопасности.
12.12.2024 [18:37], Руслан Авдеев
Broadcom поможет Apple создать собственные серверные ИИ-ускорителиПо неофициальным данным, Apple работает с Broadcom над разработкой серверного ИИ-ускорителя для обслуживания ИИ-сервисов в своих ОС. По словам трёх анонимных источников The Information, чип создаётся в рамках проекта Baltra и будет запущен в производство в 2026 году. Ранее компании уже работали над 5G-технологиями. Деталей пока немного. На одной из конференций в этом году представитель Apple заявил, что ИИ-экосистема Apple Intelligence должна работать как на самих устройствах компании, так и в частном облаке Apple Private Cloud Compute на базе чипов M2 Ultra. Они используются для инференса, тогда как для обучения ИИ-моделей Apple использует ускорители Google TPU. Первые слухи о том, что компания разрабатывает серверные ускорители, появились в мае 2024 года. У компании богатый опыт разработки Arm-чипов, а Broadcom, помимо прочего, продаёт лицензии на различные IP-блоки и уже не раз помогала гиперскейлерам в создании кастомных чипов. Не так давно Broadcom анонсировала новую технологию упаковки 3.5D eXtreme Dimension System in Package (3.5D XDSiP), которая как раз ориентирована на создание высокопроизводительных кастомных чипов. Она позволяет объединить два 3D-стека, пару I/O чиплетов и до 12 модулей памяти HBM3 в одной упаковке, занимающей более 6000 мм². Производство первых чипов по этой технологии ожидается в 2026 году. Созданием собственных ИИ-ускорителей заняты практически все крупные гиперскейлеры. Google первой занялась созданием собственных ускорителей и теперь в её портфолио есть уже шесть поколений TPU, Meta✴ трудится над MTIA, AWS предлагает Trainium2 и Inferentia2, Microsoft анонсировала Maia 100, Alibaba разработала Hanguang 800, а ByteDance и OpenAI пока ещё только создают будущие ускорители, причём при помощи всё той же Broadcom. Впрочем, для многих из них это попытка снизить зависимость от NVIDIA, выручка которой бьёт все рекорды.
12.12.2024 [08:57], Владимир Мироненко
Google попросила регулятора разорвать эксклюзивное облачное соглашение Microsoft и OpenAI из-за вреда конкуренцииGoogle попросила Федеральную торговую комиссию США (FTC) разорвать эксклюзивное облачное соглашение Microsoft с OpenAI, в рамках которого разработчик ИИ-чат-бота ChatGPT использует её облачную инфраструктуру для функционирования своих сервисов и других задач, сообщил ресурс The Information. Просьба Google поступила после того, как FTC запросила у неё отзыв о деловой практике Microsoft в рамках более широкого расследования, касающегося лицензирования софтверным гигантом ПО, а также облачных вычислений, предложений по обеспечению кибербезопасности и услуг ИИ. По словам Google, соглашение о партнёрстве Microsoft и OpenAI, которое позволяет Microsoft быть единственным поставщиком облачных сервисов, размещающим передовые модели OpenAI, создает значительные рыночные барьеры и потенциально увеличивает затраты для клиентов облачных сервисов, желающих получить доступ к передовым технологиям ИИ То, что Microsoft является крупнейшим инвестором OpenAI, вложившим в неё более $13 млрд, объясняет столь тесное сотрудничество двух компаний, но другим технологическим компаниям, которые конкурируют с Microsoft на облачном рынке, таким как Google и Amazon, тоже хотелось бы размещать у себя в облаке модели OpenAI, чтобы их облачным клиентам не нужно было обращаться к услугам Microsoft для получения доступа к технологии стартапа, говорится в публикации The Information. Ведущие игроки считают, что нынешнее эксклюзивное соглашение ограничивает конкуренцию на облачном рынке и выбор клиентов. Как утверждают источники ресурса, компании, которые приобретают технологию OpenAI через Microsoft, могут столкнуться с дополнительными расходами, если они не используют решения Microsoft для своей работы. Google и другие участники рынка отметили, что такой подход к ценообразованию может навредить клиентам и ограничить доступ к ИИ-технологиям.
12.12.2024 [01:45], Владимир Мироненко
«Страна чувствует себя уверенно»: «Ростелеком» заявил об успехе импортозамещения серверовВ России полностью решена проблема с импортозамещением мощных вычислительных ресурсов, заявил глава «Ростелекома» Михаил Осеевский, выступая на пленарном заседании Совета Федерации, пишет ТАСС. «Хочу доложить, что сегодня страна чувствует себя достаточно уверенно. У нас полностью решена проблема импортозамещения мощных вычислительных ресурсов, серверов, систем хранения [данных]», — цитирует ТАСС заявление руководителя «Ростелекома». Напомним, что ещё в мае замглавы Минпромторга Василий Шпак сообщил, что в ведомстве обсуждают предложение участников отрасли об исключении из списка товаров, разрешённых к параллельному импорту в Россию, серверов и СХД. Рынок серверов в России активно развивается. В конце 2023 года на территории индустриального парка «Рязанский» неподалёку от Рязани был введён в эксплуатацию завод «Центра открытых разработок» (бренд OpenYard) по производству серверного оборудования, мощность которого позволяет изготавливать свыше 60 тыс. единиц техники ежегодно. В июле «Гравитон» и OpenYard договорились о технологическом партнёрстве, в рамках которого на площадке OpenYard было налажено контрактное производство плат для серверов и клиентских устройств. В феврале текущего года «Сбербанк» запустил производство серверов, адаптированных для применения в собственных ЦОД, что позволило ему полностью отказаться от проприетарных ПАК сторонних поставщиков. А в декабре на бывшем заводе Samsung в Калуге, по данным СМИ, организовали сборку серверов под брендом «Гравитон». Кроме того, производства есть и у ряда других российских брендов, например, у «Аквариус» и F-Plus.
11.12.2024 [17:59], Руслан Авдеев
Российский рынок облачных сервисов с ИИ-ускорителями в 2024 году вырастет в 1,5 раза до 17,1 млрд рублейРынок российских облачных сервисов для вычислений с использованием ИИ-ускорителей в 2024 году может вырасти до 17,1 млрд руб., +55 % год к году. Предварительный прогноз подготовлен экспертами J’son & Partners Consulting, сообщают «Ведомости». Исследование посвящено развитию публичных облаков. В целом, по прогнозам экспертов, рынок облачных услуг в 2024 году в России вырастет на 31,2 % — до 142,4 млрд руб. Доступ к ускорителям в облаках тарифицируются по принципу Pay as You Go (PAYG) — пользователи обычно платят за потребление ресурсов. Согласно прогнозам J’son & Partners данным, среднегодовой прирост (GAGR) на рынке соответствующих вычислений в публичных облаках до 2025 года, возможно, составит 32,7 %, а в денежном выражении сегмент к 2029 году достигнет 66,3 млрд руб. Использование ускорителей в облаках весьма удобно, поскольку позволяет быстро получить доступ к вычислительным мощностям и обходится дешевле, чем закупки собственного оборудования, которые к тому же осложняются санкционными ограничениями. На фоне быстрого роста спроса на сервисы, требующие использования ускорителей, наблюдается их дефицит на российском рынке, но эксперты прогнозируют постепенный выход к состоянию баланса. По данным iKS-Consulting, пока ускорители для обучения ИИ арендуют не очень часто — на эту услугу приходится 5,4 % рынка облачных услуг. При этом в 2023 году совокупная выручка провайдеров таких GPU-сервисов составила около 6,6 млрд руб., при общей выручке от облачных инфраструктурных сервисов в том же году на уровне 121,4 млрд руб. Рынок вырос — в 2022 году на аренду сервисов с ИИ-ускорителями приходилось 4 % (всего 3,7 млрд руб.). Ранее аналитики прогнозировали, что к 2028 году российский рынок облачной инфраструктуры достигнет 464 млрд руб., а к концу 2024 года может вырасти до 162 млрд руб. с 121,4 млрд руб. в прошлом году. Статистика J’son & Partners Consulting показывает, что сегодня облачные провайдеры имеют около 77 400 клиентов. Правда, более 50 % из них можно отнести к мелким пользователям, тратящим на облачные услуги до 10 тыс. руб. в месяц. При этом пока даже крупные компании часто размещают задачи в локальных ЦОД, которые тоже требуют как масштабирования, так и модернизации в целом.
11.12.2024 [15:39], Руслан Авдеев
HPE отказалась продать неизвестному клиенту ИИ-серверы на $700 млнВ ходе отчёта за IV квартал 2024 года HPE упомянула, что отказалась от заказа на поставку ИИ-оборудования на $700 млн, усомнившись в неназванном покупателе, сообщает Network World. Общий объём бронирования по итогам квартала составил ожидамеые $1,2 млрд, а портфель необработанных заказов вырос до $3,5 млрд. В компании подчеркнули, что заказы на ИИ-системы могут поступать неравномерно, и это как раз такой случай. На вопрос Network World об отмене заказа компания ответила, что имеет надёжную систему контроля, внимательно следит за работой с надёжными клиентами, управляет рисками и проводит диверсификацию портфеля заказов. Другими словами, по мнению экспертов, HPE потеряла веру в то, что один из её клиентов сможет справиться с контрактными обязательствами, и должным образом отреагировала на эту угрозу. И это важный сигнал для рынка в целом. Одна из основных проблем в том, что системы генеративного ИИ пока слабо окупаются. По данным Sequoia Capital, ИИ-индустрия потратила в прошлом году почти $50 млрд на чипы NVIDIA, но выручка за тот же период составила всего $3 млрд. Подчёркивается, что скидки и прочие привилегии больше не являются необходимой частью распространения ИИ-продуктов. ![]() Источник изображения: HPE По мнению экспертов, сейчас спрос превышает предложение, поэтому HPE может позволить себе отдавать преимущество отдельным сегментам рынка и продуктам, поскольку объёмы доступной ИИ-инфраструктуры ограничены. Похожий дисбаланс спроса и предложения наблюдался несколько лет назад во время пандемии COVID-19. Выяснить, когда спрос превысит предложение, не так просто — на насыщение цепочки поставок продуктами уходит сравнительно много времени. При этом финансовые директора компаний из списка Fortune 2000 могут счесть перспективы инвестиций в генеративный ИИ не слишком впечатляющими. Это окажет влияние на позиции заказчиков и покупателей. Впрочем, те, кто первыми начали внедрять такие системы, в долгосрочной перспективе, возможно, будут иметь лучшие позиции, более низкую стоимость эксплуатации и т.п. Пока эксперты остерегаются делать чересчур смелые прогнозы. С учётом скорости развития ИИ-инфраструктуры не исключено, что на $1 млн, который можно потратить прямо сейчас, позднее можно будет получить гораздо более выгодное предложение. В то же время не исключено, что полупроводники достигнут физического предела своей производительности и IT-руководителям придётся делать сложный выбор, в числе прочего сделав акценты на повышение «нишевости» и качества ИИ-моделей.
11.12.2024 [14:20], Руслан Авдеев
Солнце, ветер и аккумуляторы: Google пристроит к своим ИИ ЦОД гигаваттные энергокомплексыКомпания Google вкладывает средства в строительство энергетических мегапарков для получения возобновляемой энергии — IT-гигант стремится обеспечить электричеством свои ЦОД. В частности, он заключил партнёрское соглашение с независимым производителем энергии Intersect Power. Также в сделке участвует инвестиционная TPG Rise Climate LP, сообщает Bloomberg. Консорциум займётся проектированием и строительством крупных энергетических комплексов рядом с кампусами ЦОД, которые будут включать возобновляемые источники энергии, энергохранилища и сопутствующую инфраструктуру передачи энергии на несколько гигаватт. Это обойдётся приблизительно в $20 млрд. Для поддержки проекта Google также инвестировала и в акционерный капитал Intersect Power. TPG возглавила раунд финансирования, в котором помимо Google приняли участие CAI и Greenbelt Capital Partners. Всего привлечено $800 млн. Новые инвестиции помогут Intersect получить дополнительные заёмные средства на строительство энергетических мощностей. ![]() Источник изображения: Intersect Power План Google заключается в постройке ЦОД и новых энергетических мощностей таким образом, чтобы те подключались к одним и тем же подстанциям. Это должно помочь ускорить их ввод в эксплуатацию. В Google сообщают, что компания намерена оплатить 100 % расходов на модернизацию энергосетей для этих проектов. По оценкам партнёров, кампусу ИИ ЦОД на 1 ГВт потребуется по 1 ГВт солнечных и ветряных мощностей, а также 1-ГВт энергохранилище, способное проработать два-четыре часа — всё это на площади более 4 тыс. га. Энергетические парки станут альтернативой стареющим электросетям США, которые с трудом справляются с потребностями ИИ ЦОД и параллельным электроснабжением домов, транспорта и промышленности. Google, Microsoft и AWS, а также другим крупным операторам ЦОД необходимы многомиллиардные инвестиции для удовлетворения потребностей ИИ в энергии. Все, включая Google, присматриваются к малым модульным реакторам, но они заработают не раньше 2030-х годов. По данным пресс-службы Intersect, компания будет строить новые мощности по выработке чистой энергии, а Google станет её якорным клиентом. Таким образом, запросы Google будут полностью соответствовать доступным мощностям. Сейчас Intersect привлекает заемные средства для своего первого проекта с Google, который планируется к вводу в эксплуатацию в 2026 году. Параметры и местоположение проекта компании пока не раскрывают.
10.12.2024 [15:21], Владимир Мироненко
Спрос на ИИ-ускорители в облаке Oracle вырос за квартал на 336 %, а новым крупным клиентом стала Meta✴Американская корпорация Oracle сообщила результаты работы во II квартале 2025 финансового года, закончившемся 30 ноября 2024 года. Результаты и прогноз на текущий квартал оказались ниже ожиданий аналитиков Уолл-стрит и инвесторов, в связи с чем акции корпорации упали в понедельник в ходе расширенных торгов на 7 %. Выручка Oracle составила $14,06 млрд, превысив результат аналогичного финансового квартала годом ранее на 9 %, а также консенсус-прогноз аналитиков, опрошенных LSEG, в размере $14,1 млрд. Вместе с тем скорректированная прибыль на акцию (non-GAAP), составившая $1,47 и превысившая прошлогодний результат на 10 %, оказалась ниже ожиданий Уолл-стрит в размере $1,48 на акцию. Чистая прибыль (GAAP) увеличилась на 26 % до $3,15 млрд, или $1,10 на акцию, с $2,5 млрд, или $0,89 на акцию годом ранее. Выручка в сфере облачных сервисов и поддержки Oracle выросла по сравнению с прошлым годом на 12 % до $10,81 млрд, что составляет 77 % от общей выручки корпорации. Выручка от лицензирования облачных и локальных продуктов увеличилась всего на 1 % до $1,2 млрд. Вместе с тем упали продажи оборудования — на 4 % год к году до $728 млн, и сократилась выручка от сервисов — на 3 % до $1,33 млрд. ![]() Источник изображения: Oracle Генеральный директор Oracle Сафра Кац (Safra Catz) заявила в ходе отчёта, что рекордный спрос на ИИ привёл к росту выручки Oracle Cloud Infrastructure во II квартале на 52 %, что намного выше темпов роста любого из гиперскейлеров. «Рост в сегменте ИИ нашего инфраструктурного бизнеса был необычайным — потребление GPU выросло на 336 % за квартал — и мы развернули самый большой и быстрый в мире облачный ИИ-суперкомпьютер из 65 тыс. ускорителей NVIDIA H200», — сообщила она, добавив, что в этом финансовом году общий доход Oracle Cloud должен превысить $25 млрд. Oracle заявила, что только что подписала соглашение с Meta✴, позволяющее последней использовать её инфраструктуру для работы в различных проектах, связанных с семейством больших языковых моделей Llama. Одним из ключевых заказчиков ИИ-ускорителей в облаке Oracle также являются Microsoft с OpenAI. «Oracle Cloud Infrastructure обучает несколько важнейших в мире моделей генеративного ИИ, поскольку мы быстрее и дешевле других облаков», — указал основатель и главный технический директор Oracle Ларри Эллисон (Larry Ellison) в своем заявлении. В III квартале 2025 финансового года Oracle ожидает роста выручки на 7–9 % — около $14,3 млрд в средней точке, что ниже прогноза Уолл-стрит в размере $14,65 млрд (согласно LSEG). Прогноз по скорректированной прибыли Oracle находится в пределах от $1,50 до $1,54 на акцию. Аналитики прогнозируют прибыль на акцию в размере $1,57. В сентябре Oracle повысила прогноз выручки на 2026 финансовый год до $66 млрд, что примерно на $1,5 млрд больше, чем ожидают аналитики. Также Oracle тогда объявила, что ее облачное подразделение начнёт принимать заказы клиентов на вычислительные кластеры из более чем 131 тыс. ускорителей NVIDIA Blackwell. |
|