Материалы по тегу: прогноз
|
25.05.2026 [14:30], Сергей Карасёв
Gartner: расходы в сфере ИИ в 2026 году вырастут почти в полтора раза — до $2,6 трлнКомпания Gartner опубликовала свежий прогноз по глобальному рынку ИИ: отрасль демонстрирует стремительный рост, чему способствует высокий спрос на высокопроизводительные серверы и сетевые компоненты, платформы IaaS и пр. Затраты в области ИИ в 2025 году составили $1,764 трлн, а в 2026-м, как ожидается, превысят $2,5 трлн, увеличившись практически в полтора раза. Аналитики выделяют восемь ключевых отраслевых направлений: это ИИ-инфраструктура, ИИ-сервисы, ИИ-модели, средства ИИ-кибербезопасности, программное обеспечение для ИИ, платформы разработки ИИ-приложений, ИИ-платформы для наук о данных и машинного обучения, а также данные для ИИ. В 2025 году наибольшую выручку обеспечили инфраструктурные решения — $975,58 млрд. ИИ-сервисы принесли $436,35 млрд, а софт — $282,9 млрд. На средства кибербезопасности пришлось $25,92 млрд, на ИИ-модели — $15,49 млрд, на платформы машинного обучения — $21,29 млрд, на платформы разработки — $6,59 млрд. В сегменте данных затраты оцениваются в $826 млн. В 2026 году прогнозируется рост по всем перечисленным направлениям. В частности, полагают специалисты Gartner, расходы в области ИИ-инфраструктуры достигнут $1,43 трлн, в сфере ИИ-сервисов — $585,53 млрд. На софт, по оценкам, будет затрачено около $453,21 млрд, на средства безопасности — $51,35 млрд. Приблизительно $32,6 млрд пойдёт на ИИ-модели, $29,93 млрд — на ИИ-платформы для наук о данных и машинного обучения. В сегменте платформ разработки затраты поднимутся до $8,42 млрд, в сфере данных — до $3,13 млрд. Таким образом, суммарные расходы в области ИИ в 2026 году составят около $2,595 трлн, что будет соответствовать росту на 47 % по отношению к предыдущему году. В 2027-м ожидается дальнейшее расширение рынка — до $3,493 трлн.
03.05.2026 [23:30], Владимир Мироненко
Поборы Broadcom вынудили Google обратиться к MediaTek для создания ИИ-ускорителей TPUСогласно свежему отчёту Foundry Quarterly and Monthly Intelligence от Counterpoint Research, благодаря сотрудничеству с Google доля компании MediaTek на рынке ИИ-серверов на базе кастомных ускорителей (ASIC) может вырасти к 2028 году до 26 %. В результате MediaTek может выйти на второе место, уступив лишь Broadcom. Google представила в апреле два TPU восьмого поколения: TPU 8t (Sunfish) для обучения ИИ и TPU 8i (Zebrafish) для ИИ-инференса. Как сообщается в отчёте Counterpoint Research, TPU v8t занимает ключевое место в стратегии Google в области ИИ. «Мы рассматриваем это поколение как переломный момент с точки зрения цепочки поставок, поскольку оно знаменует собой первый важный шаг в диверсификации Google от простой модели ASIC Broadcom “под ключ”», — отметили в Counterpoint Research. Что касается основной причины соглашения Google с MediaTek, в рамках которого Google разрабатывает вычислительный кристалл, а MediaTek предоставляет кристалл I/O, то Counterpoint Research объясняет это экономикой закупок HBM. В рамках модели поставок «под ключ» Broadcom сама занимается поиском поставщиков HBM, прибавляя к стоимости памяти ещё 15–20 %. С учётом того, что на HBM приходится всё более значительная доля в себестоимости ASIC, такая наценка становится всё более обременительной для Google, которая к тому же наращивает темпы развёртывания TPU в ЦОД. Взяв на себя разработку чипов и закупку HBM, начиная с TPU 8t, Google устраняет поборы посредников и снижает себестоимость своих чипов. Объём производства MediaTek значительно возрастёт после того, как начнётся выпуск TPU 8t в конце 2026 года и его преемника TPU v8e (Humufish) в период до 2028 года. Исходя из последнего прогноза глобальных поставок ASIC для ИИ-вычислений, аналитики ожидают, что совокупные поставки TPU v8t и v8e приблизятся к 5 млн единиц в 2028 году, что более чем в 10 раз больше по сравнению с отгрузкой примерно 400 тыс. чипов в 2026 году. Это станет возможным благодаря ускоренному внедрению TPU Google как для внутренних рабочих нагрузок, так и для облачных клиентов. Комментируя прогноз, Counterpoint Research уточняет, что он не учитывает реализацию проекта Meta✴ MTIA. Кроме того, достижение прогнозируемого объёма зависит от наличия достаточных мощностей по упаковке TSMC CoWoS и Intel EMIB-T. Основной риск для реализации прогноза связан с TPU v8e, для которого MediaTek предлагает упаковку Intel EMIB-T: «В настоящее время компания находится на стадии проектирования и квалификации, а массовое производство запланировано не ранее конца 2027 года, и этот переход сопряжён с весьма специфическими рисками для исполнения». К числу ключевых факторов отнесены необходимое для этого увеличение производительности Intel Foundry Services (IFS) и готовность поставщиков подложек, что в конечном итоге может повлиять на объём поставок MediaTek.
23.04.2026 [14:54], Руслан Авдеев
Gartner: нефтяной кризис не затормозит IT-индустрию — в ИИ готовы вкладываться всеНа следующий день после того, как Международное энергетическое агентство (IEA) заявило, что война на Ближнем Востоке создаёт серьёзнейший энергетический кризис за мировую историю, агентство Gartner сообщила о вероятном росте расходов на IT почти на 3 п.п., сообщает The Register. Стремительный рост цен на нефть и газ, вызванный кризисом, по мнению Gartner, не имеет прямого влияния на расходы в IT. И хотя косвенное влияние на уверенность бизнеса и потребителей не исключено, это пока не подтверждается цифрами. В Gartner прогнозируют, что мировые расходы на IT вырастут в 2026 году на 13,5 % до $6,31 трлн. В феврале агентство прогнозировало рост на 10,8 %, до $6,15 трлн. Подчёркивается, что цена на нефть мало соотносится с ростом расходов. Отчасти кризис оказал влияние лишь на цены на электричество в некоторых странах, например в АТР, где это стало реальной проблемой. Единственным значимым эффектом можно признать изменение уверенности бизнеса, но пока не произошло и этого. За пределами сегментов облачной инфраструктуры и ИИ, инвестиции в IT тоже находятся в относительно нормальном состоянии. Расходы на потребительские IT-решения растут всего на 4,1 %, и то из-за изменения стоимости памяти. Даже рост корпоративных IT-расходов оценивается приблизительно в 7 %, а показатель в 13,5 % достигается только с учётом расходов гиперскейлеров. А без учёта ЦОД и ИИ-серверов общий рост расходов составит текущем году 7,2 %. Таким образом, строительство ЦОД, совместные разработки новых технологий для ИИ, создание ИИ-моделей и т.п. оказывают существенное влияние на рынок. При этом в долгосрочной перспективе, вероятно, корпоративные пользователи окупят инвестиции. Ожидается, что к 2026 году компании выйдут из периода «избавления от иллюзий» в отношении ИИ-проектов. Сейчас ожидания находятся на самом низком уровне и выход будет найден к началу 2027 года. IT-руководители ищут ПО на базе ИИ у своих текущих поставщиков. Более мелкие проекты помогают добиться немедленных улучшений. В контексте ИИ-агентов в 2026 году ожидается гораздо больше провальных проектов, после чего индустрия выйдет на «плато продуктивности» — станет понятно, что именно следует делать с этими технологиями, а сами они станут более надёжными, предсказуемыми и стабильными, но это вряд ли произойдёт раньше 2030 года. Впрочем, прогноз основан на предположении, что война на Ближнем Востоке будет «относительно кратковременным конфликтом». Если она продлится весь год, мир, вероятно, потеряет доверие к мировой экономике, и IT-бюджеты некоторых компаний могут пострадать от этого. Впрочем, даже если это произойдёт, в гонке поставщиков ИИ-технологий вряд ли что-то изменится, поскольку игроки этого рынка оперируют «четырёхлетними циклами».
16.04.2026 [10:22], Владимир Мироненко
ИИ не поможет: Gartner предрекает провал автоматизированному переносу древнего ПО с мейнфреймовБольшинство пользователей мейнфреймов, которые попытаются воспользоваться ИИ для миграции устаревшего кода на альтернативные платформы, потерпят неудачу, сообщил The Register со ссылкой на данные аналитической компании Gartner. «Более 70 % проектов по уходу с рынка мейнфреймов, начатых в 2026 году, не принесут ожидаемых результатов из-за переоценки возможностей инструментов генеративного ИИ», — говорится в материале под названием «Too Big to Fail: Why Mainframe Exit Projects Are Likely to Fail in the Age of Generative AI», опубликованной Gartner на прошлой неделе. Gartner также считает, что рынок услуг миграции с мейнфреймов с использованием ИИ вот-вот лопнет. «К 2030 году 75 % поставщиков, работающих на рынке “ухода с мейнфреймов”, либо изменят свои бизнес-модели, либо прекратят свое существование», — предупреждает компания. Пессимизм Gartner объясняется ролью мейнфреймов как хранилища критически важных приложений и данных в течение долгого периода. «Для большинства крупных предприятий огромный объём и взаимосвязанная сложность данных делают полную миграцию физически и финансово невозможной», — считают в Gartner. Аналитики отметили, что мейнфреймы являются значительным источником технического долга и что генеративный ИИ очень полезен для выявления и описания этого долга. Вместе с тем они указали на то, что генеративный ИИ имеет «значительные ограничения, когда речь идет об автоматизированных переписывании и миграции устаревшего кода». «Также не учитываются уникальные возможности, которые предлагает мейнфрейм, например, сохранения той же производительности и пропускной способности после миграции», — добавили они. В Gartner сообщили, что одной из причин, по которой поставщики предлагают ИИ для проектов по отказу от мейнфреймов, является «агрессивный спрос инвесторов на возможности ИИ как единственный показатель долгосрочного “здоровья” поставщика, вынуждающий поставщиков внедрять ИИ даже там, где это не требуется». Это давление усиливает опасения пользователей по поводу трудностей с поиском персонала для работы с мейнфреймами и технического долга. Аналитики отметили «разрыв между “маркетинговым заявлениями” о генеративном ИИ и его реальными возможностями в трансформации кода». «Поддавшись обещаниям “кажущегося волшебным решения” в виде миграции и игнорируя подход, ориентированный на конкретную платформу (то есть, тщательную оценку рабочих нагрузок и выбор оптимальной платформы для соответствующих задач), мы наращиваем огромный технический долг и создаём критические риски для всего предприятия», — сообщается в статье Gartner. В связи с этим пользователям предлагается искать способы улучшения своих систем, а не переходить на новые. «Стремление отказаться от мейнфреймов ослабевает, — пишут аналитики. — Клиенты всё больше осознают, что практически невозможно отказаться от мейнфреймов с приемлемыми затратами и рисками, что заставляет их отказаться от давней надежды на создание совершенного инструмента для осуществления этой миграции». Согласно Gartner, мейнфреймы по-прежнему являются «ведущей платформой для некоторых критически важных приложений, даже с учётом продолжающегося стремления к облачным архитектурам». Публикацию Gartner позитивно восприняли в IBM, чьи акции резко упали после того, как Anthropic разрекламировала возможности своего инструмента Claude Code по преобразованию COBOL, что вызвало очередной виток спекуляций о том, что мейнфреймы, возможно, находятся на грани исчезновения. Аналогичное решение на базе Google Gemini во время анонса такого эффекта не вызвало.
09.04.2026 [15:25], Руслан Авдеев
Synergy Research: более половины всех мощностей ЦОД в мире приходится на гиперскейлеров, а к 2031 году они займут ⅔ рынкаСогласно прогнозам Synergy Research Group, на долю операторов ЦОД из числа гиперскейлеров уже сегодня приходится около половины всех мощностей дата-центров в мире, а к 2031 году баланс окончательно изменится в пользу техногигантов. Согласно результатам исследования Synergy Research, на долю крупных облачных провайдеров сейчас приходится 48 % мировых мощностей ЦОД, из них 60 % — собственные дата-центры, самостоятельно построенные или находящиеся в собственности гиперскейлеров. На колокейшн-ЦОД, не связанные с гиперскейлерами, приходится всего 20 % мощности, а ещё 32 % — на корпоративные объекты, расположенные на собственных территориях бизнесов различного профиля. При этом ещё в 2018 году на собственные дата-центры компаний приходилось 56 % мировой мощности ЦОД, но ситуация продолжает меняться в пользу гиперскейлеров. Мощность в целом будет расти, чему, как ожидается, будет способствовать трёхкратное увеличение мощностей гиперскейлеров. Synergy прогнозирует, что к 2031 году на долю гиперскейлеров будет приходиться уже 67 % всех мощностей ЦОД в мире, при этом доля корпоративных площадок сократится до 19 %. Хотя доля колокейшн-объектов будет уменьшаться, их совокупная мощность, наоборот, будет расти ежегодно двухзначными темпами в процентах. Благодаря развитию рынка ИИ и размещению ИИ-ускорителей ёмкость корпоративных ЦОД тоже начнёт расти после периода стагнации, хотя их доля будет падать в среднем на пару процентов ежегодно. По словам Synergy Research, облачные сервисы и цифровые потребительские сервисы многие годы меняли модель использования дата-центров, а в последние три года ключевым драйвером, ускорившим изменения, стал искусственный интеллект. Хотя имеются региональные различия в использовании ЦОД, общемировой тренд — увеличение доли мощностей, контролируемых крупным игроками, включая AWS, Microsoft, Google и др. В ближайшие три года их мощности должны удвоиться, всего техногиганты планируют построить в указанный период почти 800 новых дата-центров. Кроме того, гиперскейлеры усиливают контроль и над интернет-каналами. Как заявляется в докладе JLL, к 2030 году на ЦОД будет потрачено в мире $3 трлн — это крупнейший инвестиционный «суперцикл» в истории, 2025–2030 гг. появятся ЦОД общей мощностью около 97 ГВт. Впрочем, согласно анализу DC Byte, существуют немалые риски для этого рынка. Аналитики назвали отмечают, что всё больше проектов не доходят до стадии строительства, правительства всё больше влияют на реализацию проектов, а капитал всё активнее расходуется на ранних стадиях реализации — это повышает риски для инвесторов.
09.04.2026 [12:22], Руслан Авдеев
TrendForce: начало поставок NVIDIA Rubin задержится, а Hopper для Китая выпустят меньше, чем ожидалосьВысока вероятность, что поставки ИИ-ускорителей семейства NVIDIA Rubin начнутся позже, чем планировалось и в меньших объёмах, чем рассчитывали ранее. По данным The Register, это связано с вероятными проблемами с цепочками поставок. По словам экспертов TrendForce, на долю Rubin придётся 22 % всех поставок передовых ускорителей NVIDIA в 2026 году, хотя раньше в прогнозах речь шла о 29 %. Причинами называются задержки с проверкой новейшей памяти HBM4, применяемой с ускорителями, трудности с переходом на адаптеры NVIDIA ConnectX‑9, а также увеличение энергопотребления ИИ-систем и повышение требований к СЖО. Более того, будут ниже прежних прогнозов поставки ускорителей на архитектуре Hopper, включая модели H200, предназначенные для поставок в Китай. В январе 2026 года одобрили поставки в обмен на 25 % от выручки от продаж этих изделий. Пришлось уговаривать и сам Пекин, который одобрил импорт H200 в КНР лишь недавно. В марте глава NVIDIA Дженсен Хуанг (Jensen Huang) сообщил, что компания наращивает производственные мощности по выпуску H200 для Китая, и уже имеются заказы. TrendForce прогнозирует, что в 2026 году доля поставок ускорителей Hopper составит 7 % от общего объёма поставок NVIDIA, это ниже 10 %, как ожидалось ранее. Впрочем, в TrendForce предполагают, что их место и место недопоставленных Rubin займут чипы Blackwell, включая Blackwell Ultra. На долю Blackwell, вероятно, придётся 71 % об общего объёма продаж ускорителей NVIDIA за 2026 год. Кроме того, TrendForce предрекает неплохие перспективы недавно анонсированным инференс-ускорителям NVIDIA LPU Groq, предназначенным для совместной работы с «классическими» GPU вроде Rubin. Впрочем, из-за ограничений встроенной SRAM-памяти такие модели понадобятся в больших количествах, говорит TrendForce, предрекая спрос в «сотни тысяч единиц» в 2026 году и приблизительно вдвое больше — в следующем. При этом эксперты подчёркивают, что во II квартале цены на DRAM могут вырасти на 45–50 % дополнительно, вдобавок к росту на 75–80 %, отмеченному в I квартале. В последние месяцы цена на память, включая продукты вроде DDR5 и SSD, стремительно растут, они более чем втрое дороже, чем стоили год назад. В значительной степени это обусловлено спросом на ИИ-инфраструктуру и высокой цикличностью ценообразования на рынках модулей памяти.
06.04.2026 [13:01], Руслан Авдеев
Dell’Oro Group: мировая телеком-отрасль снизит затраты в 2026 годуСогласно недавнему докладу, подготовленному Dell'Oro Group, в 2025 году мировые капитальные затраты в 2025 году оставались стабильными. При этом прогноз расходов в этой сфере на текущий год выглядит несколько хуже. В докладе Telecom Capex Report оценивались расходы полусотни мировых операторов связи, на которых приходится приблизительно 80 % мировых капитальных затрат. Стабильным оставалось соотношение капитальных затрат к выручке от продажи оборудования в шести сегментах, отслеживаемых компанией: Broadband Access, Microwave & Optical Transport, Mobile Core Network (MCN), Radio Access Network (RAN) и Service Provider Router & Switch. При этом год к году выручка производителей оборудования год к году в 2025 году выросла на 4 %. Более заметное увеличение выручки в сравнении с капитальными затратами в некоторой степени объясняется поддержкой спроса со стороны облачных провайдеров, на них приходится около половины роста выручки, связанной с продажами оборудования.
Источник изображения: Mario Caruso/unsplash.com По словам Dell'Oro Group, операторы демонстрируют оптимизм относительно долгосрочной перспективы, но остаются осторожными в краткосрочной. Компании верят, что спрос будет расти, в т.ч. из-за развития ИИ и новых цифровых сервисов. Тем не менее в ближайшей перспективе капитальные затраты могут быть даже сокращены. Согласно прогнозам экспертов, в 2026 году капитальные затраты телеком-отрасли могут сократиться на 2 %, а затем до 2030 года будут медленно расти в среднем по 1 % в год. Выручка операторов связи будет расти в среднем по 2 % ежегодно, к 2029 году капитальные затраты должны составить 14 % от выручки. Доля инвестиций в беспроводную инфраструктуру (капиталоёмкость беспроводных сетей) снизится к 2029 году до приблизительно 11 %, это на 7 п.п. ниже пиковых значений, отмечавшихся в период активного строительства 5G-сетей.
06.04.2026 [12:40], Сергей Карасёв
Объём мирового рынка неооблаков достигнет $400 млрд к 2031 годуИсследование, проведённое компанией Synergy Research Group, говорит о том, что мировой рынок неооблаков демонстрирует беспрецедентные темпы роста. В IV квартале 2025 года его объём достиг $9 млрд, что на 223 % больше по сравнению с аналогичным периодом предыдущего года. Аналитики отмечают, что неооблачные платформы становятся отдельной и быстрорастущей категорией облачной инфраструктуры, специально ориентированной на высокопроизводительные вычисления для задач ИИ и машинного обучения. Это, в частности, сервисы GPUaaS (GPU как услуга), решения для генеративного ИИ и пр. Среди ключевых игроков сектора названы CoreWeave, Crusoe, Core Scientific, Lambda, Nebius и Nscale.
Источник изображения: Synergy Research Group По мере роста спроса на инфраструктуру ИИ неооблачные системы набирают обороты. Авторы исследования отмечают, что одним из наиболее сильных конкурентов традиционным гиперскейлерам, таким как AWS, Microsoft Azure и Google Cloud, является компания CoreWeave. Вместе с тем OpenAI и Anthropic закладывают основу для всё более важного направления рынка — платформоориентированных поставщиков, предлагающих облачный доступ к ИИ-моделям и соответствующим средам разработки. В результате, конкурентная обстановка на рынке облаков начинает меняться. «Мы наблюдаем не просто появление нового класса поставщиков облачных услуг, а более глубокую структурную перестройку в самой архитектуре вычислений», — говорит Джереми Дьюк (Jeremy Duke), основатель и главный аналитик Synergy Research Group. Спрос на вычислительные ресурсы для ИИ продолжает стремительно расти. По оценкам, в 2025 году в целом объём мирового рынка неооблаков превысил $25 млрд. Аналитики Synergy Research Group прогнозируют, что в дальнейшем среднегодовой темп роста в сложных процентах (CAGR) составит 58 %. Если эти ожидания оправдаются, к 2031 году выручка поставщиков таких услуг приблизится к $400 млрд.
06.04.2026 [12:30], Сергей Карасёв
IDC: расходы на европейском ИИ-рынке достигнут $290 млрд к 2029 годуВ Европе стремительно увеличиваются затраты в области ИИ: согласно прогнозам IDC, с 2025-го по 2029 год среднегодовой темп роста в сложных процентах (CAGR) составит 33,7 %. В результате, к концу рассматриваемого периода расходы могут достичь примерно $290 млрд. Аналитики отмечают, что быстрое расширение рынка обусловлено значительными вложениями в ИИ в таких сегментах, как информационные сервисы, розничная торговля, банковский сектор, ПО, здравоохранение и пр. Набирают обороты решения на основе генеративного ИИ, которые уже широко распространены в корпоративных средах. Ожидается, что к 2029 году вклад генеративных систем в общий объём европейского ИИ-сектора достигнет 54 %. Крупнейшим и самым быстрорастущим сегментом ИИ-рынка в Европе является софт: его доля, по оценкам, составит 58,5 % от общих расходов в 2026 году, а величина CAGR в 2025–2029 годах окажется на уровне 42,9 %. Наиболее ёмким направлением названа банковская сфера, вклад которой прогнозируется в размере 12,5 % в 2026 году. Самая быстрорастущая отрасль — здравоохранение с показателем CAGR в 39,7 % в 2025–2029 годах. Аналитики IDC указывают, что даже в условиях геополитической напряжённости, провоцирующей сбои в цепочках поставок, европейский рынок ИИ быстро развивается, переходя от экспериментов к полноценным внедрениям. Организации больше не рассматривают ИИ как самостоятельный инструмент: технология всё чаще позиционируется как стратегический актив для трансформации бизнес-моделей. На этом фоне происходит перераспределение бюджетов в пользу ИИ. Самые высокие среднегодовые темпы роста фиксируются в области ПО и платформ ИИ — в 42,9 % и 52,5 % соответственно. При этом катализатором рынка является агентный ИИ, способный решать определённые задачи без вмешательства человека.
26.03.2026 [14:25], Руслан Авдеев
Gartner: к 2030 году себестоимость инференса снизится на 90 %, но качественный ИИ дешевле не станетСогласно прогнозу Gartner, к 2030 году инференс LLM с триллионом параметров будет обходиться провайдерам ИИ-сервисов более чем на 90 % дешевле в сравнении с 2025 годом. При этом речь не идёт о получении всеобщего доступа к передовым вычислениям. В Gartner для исследования каждый токен «оценили» в 3,5 байта или приблизительно четыре символа английского текста. Эксперты предполагают, что снижение затрат будет обусловлено сочетанием повышенной эффективности ИИ-чипов и сопутствующей инфраструктуры, инновациями в разработке самих моделей, повышением эффективности использования чипов, расширением использования специализированных инференс-ускорителей, а также распространением периферийных вычислений для определённых сценариев. В результате, по прогнозам Gartner, к 2030 году LLM станут в 100 раз более экономически эффективными в сравнении с первыми моделями аналогичного масштаба, представленными в 2022 году. Согласно выкладкам Gartner, эксплуатировать модели с помощью передовых ИИ-чипов будет предсказуемо значительно дешевле, чем с использованием более старого или смешанного оборудования на основе более доступных полупроводников с учётом меньшей вычислительной мощности. Про это, в частности, регулярно говорит NVIDIA.
Источник изображения: Gartner Впрочем, снижение стоимости токенов вовсе не означает, что передовые технологии станут более доступными для всех. Во-первых, снижение себестоимости для ИИ-провайдеров не будет означать соизмеримого падения цен для корпоративных клиентов. Кроме того, передовым ИИ-технологиям нужно будет значительно больше токенов, чем сегодня. Так, ИИ-агенты требуют на задачу в 5–30 раз больше токенов, чем обычный чат-бот, и способны выполнять значительно больше задач, чем обычный человек, использующий ИИ. Хотя возможности ИИ расширятся, это будет сопровождаться «непропорционально большим» ростом спроса на токены. Их потребление растёт быстрее, чем снижается стоимость, поэтому ожидается увеличение затрат на инференс. Подчёркивается, что речь не идёт о демократизации передовых вычислений. Стоимость «стандартного» ИИ действительно продолжит падать, но ресурсы, необходимые для сложных ИИ-проектов, по-прежнему будут в дефиците. Руководителям ИИ-проектов, пока маскирующим недостатки их архитектур дешевеющими токенами, придётся столкнуться с трудностями при масштабировании вычислений, связанных с ИИ-агентами. По прогнозам Gartner, наиболее востребованными станут платформы, позволяющие координировать рабочие нагрузки, распределяемые в рамках целого портфеля моделей. Так, рутинные задачи необходимо поручать небольшим, специализированным ИИ-моделям, лучше подходящим при меньших затратах для специальных рабочих процессов в сравнении с универсальными решениями. А дорогостоящие ресурсы передовых моделей необходимо выделять со строгими ограничениями, резервируя их только для сложного, но высокомаржинального инференса. |
|
