Материалы по тегу: cloud

27.11.2025 [23:19], Владимир Мироненко

Сословное право доступа: из-за дефицита ИИ-серверов Alibaba Cloud вынужденно разделила клиентов на категории

Alibaba Group сообщила финансовые результаты за II квартал 2026 финансового года, завершившийся 30 сентября. Группа отметила значительный рост выручки своего облачного подразделения благодаря буму в сфере ИИ. В связи с этим генеральный директор Alibaba Group Эдди Ву (Eddie Wu) заявил, что группа может увеличить расходы на ИИ-инфраструктуру сверх своего трёхлетнего прогноза, если спрос на ИИ-технологии останется высоким.

Однако общая выручка за квартал увеличилась всего на 5 % в годовом исчислении до ¥247,8 млрд ($35 млрд), а прибыль упала на 52 % по сравнению с прошлым годом до ¥20,99 млрд ($2,95 млрд). При этом выручка Cloud Intelligence Group увеличилась на 34 % год к году до ¥39,8 млрд ($5,6 млрд) против консенсус-прогноза аналитиков, опрошенных LSEG (по данным CNBC), в размере ¥37,9 млрд. Это выше роста в размере 26 % год к году в предыдущем квартале. Эдди Ву заявил, что «значительные» инвестиции группы в ИИ способствовали росту её выручки. Ранее компания объявила о планах инвестировать не менее ¥380 млрд ($53 млрд) в течение трёх лет в развитие своей инфраструктуры облачных вычислений и ИИ.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

«Высокий спрос на решения для ИИ ещё больше ускорил развитие нашего подразделения Cloud Intelligence Group: выручка выросла на 34 %, а выручка от продуктов, связанных с ИИ, достигла трехзначного показателя роста в годовом исчислении девятый квартал подряд», — сообщил Ву в квартальном отчёте. Согласно публикации The Register, гендиректор заявил, что «спрос на ИИ ускоряется» и углубляется благодаря спросу «во всех аспектах корпоративной деятельности… с применением в разработке продуктов, на всех этапах производственных процессов».

«Мы даже не успеваем за ростом спроса со стороны клиентов, в том числе и в плане скорости развёртывания новых серверов», — добавил он. В связи с этим компания вынужденно приняла решение ограничить доступ к ним, разделяя клиентов по масштабу использования облачных мощностей. «Если клиент использует все наши облачные сервисы, охватывающие хранилища, Big Data и пр., то, конечно, он получит более высокий приоритет», — пояснил гендиректор. «Если же клиент просто арендует GPU для решения каких-то очень простых задач по инференсу, то его потребности, соответственно, будут иметь более низкий приоритет», — добавил он. Ставка делается и на программные оптимизации.

Ву также выступил с опровержением опасений по поводу того, что ИИ — это инвестиционный пузырь, поддержав генерального директора NVIDIA Дженсена Хуанга (Jensen Huang) и генерального директора Lenovo Юаньцина Яна (Yuanqing Yang). Во-первых, по его словам, спрос на ИИ очень высок — Alibaba уже использует GPU на полную мощность — как последние модели, так и решения трёх-пятилетней давности. Во-вторых, он уверен в том, что всё лучшее в сфере ИИ ещё впереди, а по мере совершенствования базовых моделей Alibaba появятся новые сценарии использования, что привлечёт клиентов. Кроме того, компания разрабатывает собственные ИИ-ускорители T-Head PPU.

 Источник изображения: Alibaba Group

Источник изображения: Alibaba Group

Alibaba сообщила, что за последние 12 месяцев вложила ¥120 млрд ($16 млрд) в связанные с ИИ капитальные расходы. Это гораздо меньше, чем квартальные расходы Google, AWS, Microsoft или Meta. Только у AWS капзатраты за последний квартал составили около $34,2 млрд. В ходе общения с инвесторами Эдди Ву заявил, что нынешних капвложений может оказаться недостаточно, то есть, придётся их нарастить. Вместе с тем санкции США на поставку актуальных ускорителей и недостаток локальных аналогов сдерживает развитие Alibaba и других китайских игроков, отметил Bloomberg.

Акции группы на фондовой бирже в Гонконге выросли во вторник на 2 %, а незадолго до открытия торгов на Нью-Йоркской фондовой бирже — на 2,4 %. С начала года акции Alibaba выросли более чем на 90 % благодаря оптимизму инвесторов относительно её прогресса в области ИИ, пишет AP News. Способность Alibaba контролировать расходы и одновременно инвестировать в облачные операции — это то, за чем инвесторы будут следить в долгосрочной перспективе, полагает Bloomberg.

Постоянный URL: http://servernews.ru/1133071
25.11.2025 [13:42], Андрей Крупин

Yandex B2B Tech открыла доступ к Alice AI LLM — самому мощному семейству нейросетей «Яндекса»

Yandex B2B Tech (бизнес-группа «Яндекса», объединяющая технологии и инструменты компании для корпоративных пользователей, включая продукты Yandex Cloud и «Яндекс 360») сообщила о доступности пользователям облачной платформы Yandex Cloud нового семейства генеративных моделей — Alice AI LLM.

Alice AI LLM является флагманской ИИ-разработкой компании «Яндекс». Модель построена на архитектуре MoE (Mixture of Experts) с технологией тренировки на основе обучения с подкреплением (Online RL). Нейросеть понимает около 20 языков (в том числе японский) и может быть использована для решения сложных задач: поиска по базам знаний и генерации результатов на основе найденной информации (RAG-сценарий), анализа документов, построения отчётов и аналитики, извлечения информации и автоматизации заполнения полей, форм и баз CRM, а также для создания «человеко-ориентированных» ИИ-ассистентов.

 Источник изображения: пресс-служба «Яндекса» / company.yandex.ru

Источник изображения: пресс-служба «Яндекса» / company.yandex.ru

Alice AI LLM доступна через OpenAI-совместимые Completions API и Responses API, а также собственный API генерации текста в форматах REST и gRPC. Модель поддерживает интеграцию с популярными open source-библиотеками LangChain, AutoGPT и LlamaIndex.

В Yandex B2B Tech подчёркивают, что стоимость использования Alice AI значительно ниже, чем у опенсорсных нейросетей, благодаря оптимизированному под русский язык разделению текста на токены. В один токен в Alice AI помещаются примерно 4–5 символов на кириллице, а в опенсорсных моделях — примерно 2–3 символа. Таким образом, конечная стоимость использования Alice AI в 1,5–2 раза ниже открытых моделей с той же тарификацией. Кроме того, запросы пользователя к нейросети и ответы модели тарифицируются по-разному: токены «на вход» нейросети стоят в четыре раза дешевле, чем «на выход», что позволяет использовать модель более экономно.

Постоянный URL: http://servernews.ru/1132916
24.11.2025 [22:25], Владимир Мироненко

Внедрение облачных технологий увеличивает прибыль компаний, показало исследование Yandex B2B Tech и «Яков и Партнёры»

Согласно совместному исследованию консалтинговой компании «Яков и Партнёры» и Yandex B2B Tech «Облачные технологии: тренды и перспективы развития», российские компании продолжают наращивать масштабы использования облачных сервисов, получая от внедрения облачных решений заметный финансовый эффект. В основу исследования легли результаты опроса руководителей 200 крупных российских компаний из 17 отраслей.

По оценкам экспертов, большей частью высоким уровнем внедрения ИИ могут похвастать компании с высоким уровнем использования облаков — таких 30 %. При низком уровне использования облаков уровень внедрения ИИ составляет не более 2 %.

Около половины компаний оценивают эффект от внедрения облачных решений как превышающий 3 % их EBITDA, что значительно больше затрат на облако. В цифровых отраслях финансовый эффект ещё выше: более 5 % EBITDA у компаний в сфере ИТ и технологий электронной коммерции, а также телекоме и медиа. У 73 % респондентов эффект превысил затраты, у 2 % — он оказался выше 25 %, но 23 % опрошенных всё ещё не могут его оценить.

 Источник изображений: Yandex B2B Tech / «Яков и Партнёры»

Источник изображений: Yandex B2B Tech / «Яков и Партнёры»

При этом главный результат внедрения компании видят не в прямой экономии, а в улучшение масштабируемости, повышении доступности данных и надёжности инфраструктуры. В этих условиях около половины компаний тратят на облачные решения более 5 % от годового ИТ-бюджета, а свыше 30 % планируют увеличить расходы в будущем.

Большинство участников опроса (94 %) планируют и дальше использовать облачные технологии, причем 44 % намерены масштабировать существующие решения, 28 % — применять технологии в новых сценариях, 26 % — использовать облачные технологии в тех же объёмах.

Половина компаний планирует увеличить количество провайдеров облачных услуг. При этом ключевым критерием при выборе компании называют качество платформы и сопутствующих сервисов, превышающим по значимости цену и модель ценообразования. Согласно опросу, компании быстро переходят к гибридной модели: более 70 % используют одновременно публичное облако и on-premise инфраструктуру. Проникновение решений PaaS и SaaS составляет 65–66 %, при этом свыше половины компаний (52 %) комбинируют IaaS-, PaaS- и SaaS.

Компании активно используют PaaS для ускорения разработки, анализа данных и внедрения AI-технологий, в большинстве случаев — несколько типов. Наиболее востребованы решения для хранения и обработки данных (78 % респондентов), инструменты для разработчиков (76 %), сервисы в области ML и ИИ (65 %), оркестрация, управление контейнерными кластерами (40 %) и инструменты аналитики и визуализации данных (27 %).

Отмечено, что аналитические платформы ускоряют подготовку отчётов более чем в два раза, автоматизация консультаций снижает нагрузку на клиентскую поддержку на 20 %, а генеративные сервисы для создания карточек товаров увеличивают скорость публикации в десятки раз.

В исследовании отмечено, что глобальный рынок публичных облаков увеличился с 2020 по 2024 гг. почти втрое, до почти $600 млрд, и, согласно прогнозу, достигнет $1,26 трлн в 2028 году. По словам «Яков и Партнёры», на публичные облака приходится больше 60 % мирового рынка ПО, и при позитивном сценарии к 2030 году доля может составить порядка 80 %. При этом в России этот рынок всё ещё является недостаточно зрелым, занимая около 35 % рынка ПО. Вместе с тем прогнозируемые темпы его роста будут превышать мировые, и в течение следующих пяти лет рынок вырастет приблизительно в три раза, практически сравнявшись с on-premise.

Согласно прогнозу экспертов, в 2030 году российский рынок облаков по основным типам решений достигнет рекордных 1,24 трлн руб. Основными драйверами его роста являются цифровизация отраслей и спрос на гибкие решения. Рынок включает в себя все облачные решения ПО, а также потребление частных облаков и внутригрупповое потребление решений облачных провайдеров. На внешнее потребление приходится около 70 %.

Постоянный URL: http://servernews.ru/1132876
05.11.2025 [09:59], Сергей Карасёв

350-кВт ИИ-суперускоритель Alibaba Panjiu 128 Supernode объединяет 128 GPU мощностью до 2 кВт

Облачная платформа Alibaba Cloud в ходе мероприятия 2025 OCP Global Summit анонсировала систему Panjiu 128 Supernode, предназначенную для решения наиболее ресурсоёмких задач в сфере ИИ. Новинка представляет собой стойку высокой плотности мощностью до 350 кВт.

Решение имеет «ортогональную архитектуру» с возможностью размещения определённых компонентов перпендикулярно друг к другу. Говорится о поддержке до 128 ускорителей на базе GPU и о гибких возможностях в плане конфигурации CPU — GPU. Задействованы фирменные DPU-решения Cloud Infrastructure Processing Unit (CIPU) 2.0 и высокопроизводительные сетевые адаптеры. Кроме того, реализована поддержка протокола UALink, который разрабатывается в качестве альтернативы NVIDIA NVLink.

 Источник изображения: Alibaba / OCP

Источник изображения: Alibaba / OCP

Благодаря модульной конструкции упрощаются обслуживание и замена узлов. Стойка оборудована высокоэффективной системой жидкостного охлаждения, которая позволяет использовать ускорители мощностью до 2000 Вт. В состав Panjiu 128 Supernode входят пассивные полки питания. При этом реализована схема энергоснабжения с резервированием N+2, что, по заявлениям Alibaba Cloud, помогает добиться доступности на уровне 99,9999 %.

 Источник изображения: Alibaba / OCP

Источник изображения: Alibaba / OCP

В целом, реализованная архитектура обеспечивает задержки на уровне 150 нс внутри одноуровневой mesh-фабрики. По сравнению с традиционными решениями сопоставимого класса ИИ-система на базе Panjiu 128 Supernode теоретически позволяет повысить производительность инференса на 50 %, говорит компания.

Нужно отметить, что спрос на оборудование для ИИ-инфраструктур стремительно растёт. По оценкам IDC, во II квартале текущего года продажи серверов и СХД для ИИ-платформ в денежном выражении достигли $82 млрд, что на 166 % больше по сравнению с аналогичным периодом 2024-го ($30,8 млрд). Причем серверы с ИИ-ускорителями принесли 91,8 % от суммарной выручки.

Постоянный URL: http://servernews.ru/1131795
29.10.2025 [21:59], Владимир Мироненко

«Яндекс» увеличила выручку в сегменте «Б2Б Тех» на 47 %

«Яндекс» сообщил неаудированные финансовые результаты за III квартал 2025 года, завершившийся 30 сентября. Выручка компании выросла год к году на 32 % до 366,1 млрд руб. Операционная прибыль составила 53,0 млрд руб., что на 9 % больше показателя аналогичного квартала 2024 года. Чистая прибыль увеличилась на 355 % до 34,6 млрд руб., скорректированная прибыль выросла на 78 % до 44,7 млрд руб. Скорректированный показатель EBITDA составил 78,1 млрд руб. или 21,3 % от выручки, увеличившись на 1,5 п.п. год к году. Общая численность персонала компании выросла на 5 %, составив 95 097 человек.

В III квартале «Яндекс» провела ресегментацию, чтобы более точно отражать бизнес-процессы компании, что позволит инвесторам лучше оценить результаты и потенциал развития каждого направления бизнеса. В частности, из категории «Прочие бизнес-юниты и инициативы» был выделен сегмент «Б2Б Тех», включающий Yandex Cloud и «Яндекс 360». Этот сегмент объединяет решения Яндекса для корпоративного сектора, которые помогают бизнесу управлять инфраструктурой, данными и коммуникациями, а также применять ИИ для повышения эффективности и ускорения цифровой трансформации.

«Б2Б Тех» предлагает широкому кругу клиентов «Яндекса», от стартапов до крупнейших компаний, решения полного цикла: от облачной инфраструктуры и инструментов для совместной работы до систем анализа данных и on-premise внедрений в клиентских контурах. Ключевым драйвером развития сегмента являются ИИ-технологии. «Б2Б Тех» развивает платформу для создания ИИ-приложений и агентов, интегрирует интеллектуальные инструменты в корпоративные процессы и укрепляет информационную безопасность.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

Выручка «Б2Б Тех» выросла в III квартале на 47 % до 12,4 млрд руб. Скорректированный показатель EBITDA составил 2,2 млрд руб. (рост год к году на 110 %). Рентабельность скорректированного показателя EBITDA увеличилась на 5,2 п.п. до 17,4 %. Ключевыми факторами роста стали увеличение количества крупных клиентов, высокий спрос на решения на базе ИИ-технологий, развитие направления on-premise, а также активное внедрение облачных сервисов для автоматизации бизнес-процессов и работы с данными.

«Яндекс» отметил, что «Б2Б Тех» растёт вдвое быстрее, чем российский рынок корпоративных IT-решений. За 9 месяцев 2025 года выручка ИИ-сервисов Yandex Cloud выросла в два раза год к году, достигнув 1,5 млрд руб. Больше половины (55 %) совокупной выручки облачного направления приносят крупные компании. Количество клиентов Yandex Cloud увеличилось по сравнению с прошлым годом на 31 % и сейчас составляет почти 46 тысяч. Кроме того, каждый четвёртый коммерческий клиент Yandex Cloud в III квартале пользовался сервисами безопасности. Выручка ИБ-сервисов выросла в 2,5 раза год к году.

В минувшем квартале Yandex Cloud запустила ряд новых сервисов и инструментов, в том числе платформу Yandex AI Studio, которая позволяет за короткое время создать ИИ-агента и встроить его в продукт. Сервисами «Яндекс 360» пользуются более 160 тыс. компаний, а ежемесячная аудитория сервисов превышает 93 млн пользователей. «Яндекс» отметила, что это одно из самых быстрорастущих её направлений — его выручка увеличилась год к году в 1,6 раза.

Компания сообщила, что сохраняет свой прогноз относительно роста общей выручки группы в 2025 году, который превысит более 30 % год к году, и повышает прогноз скорректированного показателя EBITDA до 270 млрд руб. с прежнего в размере 250 млрд руб.

Постоянный URL: http://servernews.ru/1131579
24.10.2025 [18:49], Андрей Крупин

Платформа VK WorkSpace дополнилась средствами управления проектами

Российский разработчик корпоративного ПО VK Tech (входит в экосистему VK) сообщил о включении в состав платформы для корпоративных коммуникаций и совместной работы команд VK WorkSpace набора инструментов для управления проектами.

Рабочее окружение VK WorkSpace для управления проектами включает базу знаний, менеджер задач с поддержкой различных представлений (канбан-досок, диаграмм Ганта и таблиц), средства аналитики, а также инструменты для документирования бизнес-процессов, фиксирования результатов встреч, хранения документов, регламентов, инструкций, презентаций и прочей корпоративной информации. Поддерживается импортирование данных из других систем управления проектами, например, таких как Jira и Confluence.

 Источник изображения: Ofspace LLC / unsplash.com

Источник изображения: Ofspace LLC / unsplash.com

В числе прочего реализованные в VK WorkSpace инструменты управления проектами позволяют руководителю отслеживать эффективность работы компании на стратегическом и тактическом уровнях. В частности, доступны функции построения OKR (Objectives and Key Results) и дерева целей, каскадирования этих целей на департаменты, установка и мониторинг KPI. На операционном уровне можно транслировать цели в конкретные задачи, распределять их между исполнителями и отслеживать выполнение в режиме реального времени.

Кроме того, поддерживаются сложные сценарии автоматизации. Их можно собирать в графическом редакторе или реализовывать скриптами, чтобы автоматически назначать исполнителей, изменять статусы задач по заданным условиям, отправлять уведомления, создавать связанные задачи и многое другое.

Постоянный URL: http://servernews.ru/1131364
24.10.2025 [14:40], Руслан Авдеев

Crusoe развернёт облачную ИИ-платформу на спутнике Starcloud

Crusoe, известная в качестве застройщика первого ИИ-кампуса OpenAI Stargate. намерена развернуть свою облачную платформу на спутнике Starcloud (бывшей Lumen Orbit), запуск которого запланирован на конец 2026 года. Ограниченный доступ к ИИ-мощностям в космосе должен появиться к началу 2027 года, сообщает Datacenter Dynamics. Соглашение о партнёрстве заключено незадолго до запуска спутника Starcloud-1.

Starcloud-1 на платформе Corvus-Micro компании Astro Digital размером с небольшой холодильник (60 кг) будет оснащён ИИ-ускорителем NVIDIA H100 и позволит на практике оценить концепцию космических вычислений. После примерно 11 месяцев службы он сойдёт с орбиты на высоте 325 км и сгорит в атмосфере. Если тестирование признают успешным, Crusoe рассмотрит создание более крупного ЦОД в космосе — мощностью до 5 ГВт и с солнечными панелями площадью 4 км2.

По словам Starcloud, Crusoe станет основным поставщиком облачных услуг на её. Подчёркивается, что опыт Crusoe в создании надёжных, эффективных и масштабируемых вычислительных решений делает компанию идеальным партнёром для пионеров новой космической эры. В Crusoe считают, что космос сыграет важную роль в будущем облачных вычислений, поскольку позволяет практически неограниченно масштабировать ИИ-инфраструктуру благодаря доступу к безлимитной солнечной энергии. Как будут решаться вопросы охлаждения космических ЦОД и защиты от радиации, которая не позволяет надёжно использовать в течение длительного времени современные чипы с тонкими техпроцессами, пока не уточняется.

 Источник изображения: Starcloud

Источник изображения: Starcloud

В космосе намерены развернуть свои дата-центры многие компании, включая Axiom Space, NTT, Ramon.Space и Sophia Space. Ранее в 2025 году стартап Lonestar успешно разместил небольшой тестовый ЦОД даже на Луне, хотя тот проработал не очень долго. В октябре основатель Amazon Джефф Безос (Jeff Bezos) уже прогнозировал появление гигаваттных ЦОД в космосе через десять лет, а один из основателей Google Эрик Шмидт (Eric Schmidt) объявил, что именно поэтому им куплена авиакосмическая компания Relativity Space.

Также появились сообщения о том, что Crusoe привлекла $1,4 млрд в ходе раунда финансирования, возглавленного Mubadala Capital и Valor Equity Partners, в результате оценка компании выросла до $10 млрд.

Постоянный URL: http://servernews.ru/1131332
23.10.2025 [15:49], Андрей Крупин

Yandex B2B Tech поможет компаниям быстро разворачивать инфраструктуру для ИИ-сервисов по модели On‑Premise

Yandex B2B Tech (бизнес-группа «Яндекса», объединяющая технологии и инструменты компании для корпоративных пользователей, включая продукты Yandex Cloud и «Яндекс 360») сообщила о планах по запуску в первом квартале 2026 года нового инфраструктурного решения Yandex Cloud Stackland, с помощью которого организации смогут оперативно разворачивать инфраструктуру для управления ИИ‑нагрузками в закрытом контуре по модели on‑premise.

Yandex Cloud Stackland предложит пользователям следующие компоненты для построения интегрированной ИИ-среды: платформу AI Studio для разработки ИИ-приложений и агентов, модуль речевой аналитики SpeechSense, BI-систему DataLens, контейнерный оркестратор, масштабируемое объектное S3-хранилище, управляемые СУБД PostgreSQL, ClickHouse, Kafka, а также векторные базы данных, которые распространены в RAG-решениях.

В дополнение к этому будут представлены инструменты для обеспечения приложений доступом к графическим ускорителям и высокопроизводительным сетям, таким как InfiniBand, для задач распределённого инференса. Отдельное внимание будет уделено безопасности и защите обрабатываемых данных: Stackland получит встроенные средства IAM для гибкого разграничения доступов и инструменты для защищённого хранения паролей, токенов и сертификатов.

 Архитектура Yandex Cloud Stackland (источник изображения: yandex.cloud/services/stackland)

Архитектура Yandex Cloud Stackland (источник изображения: yandex.cloud/services/stackland)

Stackland базируется на Kubernetes, что позволит компаниям применять привычные подходы и инструменты для управления микросервисными приложениями, а также управлять PaaS-сервисами Yandex Cloud через Kubernetes API.

Ожидается, что интерес к Stackland проявят организации из сфер электронной коммерции, финтеха, ритейла и промышленного сектора, которые хотят использовать ИИ-решения на базе облачных технологий, но не могут сделать это из-за внутренних или регуляторных требований. Как передают «Ведомости», по оценке «Яндекса», в 2025 г. объём рынка контейнеризации составит 4–6 млрд руб., а к 2030 г. вырастет до 9–14 млрд руб. С новым решением компания планирует занять полоивину рынка инфраструктурного ПО для ИИ.

Лицензирование Yandex Cloud Stackland будет производиться по количеству ядер CPU. Все инфраструктурные компоненты, в частности управляемые базы данных, будут включены в лицензию. Для отдельных сервисов, таких как AI Studio, DataLens и SpeechSense, нужно будет приобретать отдельные лицензии.

Постоянный URL: http://servernews.ru/1131278
20.10.2025 [01:23], Владимир Мироненко

Ускорителей хватит на всех — Alibaba Aegaeon оптимизировал обработку ИИ-нагрузок, снизив использование дефицитных NVIDIA H20 на 82 %

Alibaba Cloud представила Aegaeon, систему пулинга вычислений, позволяющую сократить количество ускорителей NVIDIA, необходимых для обслуживания ИИ-моделей, на 82 %, пишет ресурс SCMP. По словам разработчиков, благодаря Aegaeon количество ускорителей NVIDIA H20, необходимых для обслуживания десятков моделей с 72 млрд параметров, удалось сократить с 1192 до 213 единиц. «Aegaeon — это первое решение на рынке, которое выявило чрезмерные затраты, связанные с обслуживанием параллельных рабочих нагрузок LLM», — сообщили исследователи из Пекинского университета и Alibaba Cloud.

Провайдеры облачных сервисов, такие как Alibaba Cloud и ByteDance Volcano Engine, предоставляют пользователям одновременно тысячи ИИ-моделей — множество вызовов API обрабатывается одновременно. Однако на практике для инференса чаще всего используются лишь несколько моделей, таких как Qwen и DeepSeek, а большинство других моделей применяются лишь эпизодически. Это приводит к неэффективному использованию вычислительных ресурсов: исследователи обнаружили, что 17,7 % ускорителей выделяется на обслуживание лишь 1,35 % запросов в Alibaba Cloud.

Aegaeon выполняет «автоматическое масштабирование» на уровне токенов, обеспечивая переключение ускорителей между обслуживанием различных моделей в процессе генерации. В рамках системы один ускоритель поддерживает обработку до семи моделей по сравнению с двумя-тремя моделями в альтернативных системах. При этом задержка, связанная с переключением между моделями, снижена на 97 %, заявили исследователи. Alibaba Cloud сообщила, что решение уже используется на её торговой площадке моделей Bailian.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Глава NVIDIA Дженсен Хуанг (Jensen Huang) объявил, что из-за экспортных ограничений доля компании на рынке передовых чипов в Китае сократилась с 95 % до нуля. Этому также способствовала стратегия Пекина, направленная на самообеспечение местного рынка. В связи с этим планы NVIDIA возобновить отгрузки ИИ-ускорителей H20, на которые ранее были установлены ограничения правительством США, встретили в Китае довольно прохладно. Более того, в Китае вынесли запрет местным компаниям на покупку разработанного специально для местного рынка ускорителя NVIDIA RTX Pro 6000D, поскольку пришли к выводу, что китайские ИИ-чипы не уступают продукции NVIDIA, разрешённой к экспорту в Китай.

Постоянный URL: http://servernews.ru/1131059
19.10.2025 [13:51], Руслан Авдеев

Alibaba Cloud запустила свой второй ЦОД в Дубае

Китайская Alibaba Cloud ввела в эксплуатацию свой второй дата-центр в Дубае (ОАЭ). Новый ЦОД появился через девять лет после открытия первого объекта компании в городе, сообщает Datacenter Dynamics. Новый дата-центр — часть планов по глобальному масштабированию бизнеса. В его рамках Alibaba обязалась потратить $52,7 млрд на облачную и ИИ-инфраструктуру.

Как сообщает Alibaba, новый объект позволит компании расширить предложение новых облачных технологий и систем искусственного интеллекта в Дубае. По словам Alibaba, запуск нового дата-центра и объявление об инновационных проектах на GITEX Global 2025 — важные вехи на пути расширения бизнеса компании в регионе. Готовность Ближнего Востока к быстрому внедрения ИИ и готовая к сотрудничеству экосистема — важнейшие факторы, способствующие процветанию структур в частном и государственном секторах, говорит Alibaba Cloud.

 Источник изображения: Alibaba Cloud

Источник изображения: Alibaba Cloud

Дополнительно Alibaba Cloud объявила о подписании меморандума о взаимопонимании c ближневосточной цифровой финансовой платформой Wio Bank. Соглашение позволит использовать облачные технологии и ИИ Alibaba в рамках мультиоблачной стратегии платформы. В частности, Wio Bank будет использовать дубайские ЦОД комапнии. В Wio Bank подчёркивают, что масштабируя возможности с помощью передовых технологий Alibaba Cloud, компания создаёт ИИ-агентов, упрощающих операции и позволяющих клиентам безопасно расти, процветать и достигать большего.

Среди прочих организаций, подписавших соглашение о переходе на Alibaba Cloud — облачная игровая платформа The Game Company и оказывающая услуги по переработке отходов компания Accumed.

Alibaba Cloud стремительно развивается за пределами КНР. В сентябре она подтверждала, что намерена запустить до конца года восемь новых дата-центров, в том числе в Дубае. Среди прочих регионов — Мексика, Япония, Малайзия и очередная локация в Южной Корее, где в текущем году компания открыла две новые.

В конце августа сообщалось, что Alibaba разработала собственный ИИ-ускоритель для инфреренса, который поможет компании избавиться от зависимости от ИИ-чипов NVIDIA и других зарубежных продуктов.

Постоянный URL: http://servernews.ru/1131054

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;