Материалы по тегу: cloud
|
20.10.2025 [01:23], Владимир Мироненко
Ускорителей хватит на всех — Alibaba Aegaeon оптимизировал обработку ИИ-нагрузок, снизив использование дефицитных NVIDIA H20 на 82 %Alibaba Cloud представила Aegaeon, систему пулинга вычислений, позволяющую сократить количество ускорителей NVIDIA, необходимых для обслуживания ИИ-моделей, на 82 %, пишет ресурс SCMP. По словам разработчиков, благодаря Aegaeon количество ускорителей NVIDIA H20, необходимых для обслуживания десятков моделей с 72 млрд параметров, удалось сократить с 1192 до 213 единиц. «Aegaeon — это первое решение на рынке, которое выявило чрезмерные затраты, связанные с обслуживанием параллельных рабочих нагрузок LLM», — сообщили исследователи из Пекинского университета и Alibaba Cloud. Провайдеры облачных сервисов, такие как Alibaba Cloud и ByteDance Volcano Engine, предоставляют пользователям одновременно тысячи ИИ-моделей — множество вызовов API обрабатывается одновременно. Однако на практике для инференса чаще всего используются лишь несколько моделей, таких как Qwen и DeepSeek, а большинство других моделей применяются лишь эпизодически. Это приводит к неэффективному использованию вычислительных ресурсов: исследователи обнаружили, что 17,7 % ускорителей выделяется на обслуживание лишь 1,35 % запросов в Alibaba Cloud. Aegaeon выполняет «автоматическое масштабирование» на уровне токенов, обеспечивая переключение ускорителей между обслуживанием различных моделей в процессе генерации. В рамках системы один ускоритель поддерживает обработку до семи моделей по сравнению с двумя-тремя моделями в альтернативных системах. При этом задержка, связанная с переключением между моделями, снижена на 97 %, заявили исследователи. Alibaba Cloud сообщила, что решение уже используется на её торговой площадке моделей Bailian. Глава NVIDIA Дженсен Хуанг (Jensen Huang) объявил, что из-за экспортных ограничений доля компании на рынке передовых чипов в Китае сократилась с 95 % до нуля. Этому также способствовала стратегия Пекина, направленная на самообеспечение местного рынка. В связи с этим планы NVIDIA возобновить отгрузки ИИ-ускорителей H20, на которые ранее были установлены ограничения правительством США, встретили в Китае довольно прохладно. Более того, в Китае вынесли запрет местным компаниям на покупку разработанного специально для местного рынка ускорителя NVIDIA RTX Pro 6000D, поскольку пришли к выводу, что китайские ИИ-чипы не уступают продукции NVIDIA, разрешённой к экспорту в Китай.
19.10.2025 [13:51], Руслан Авдеев
Alibaba Cloud запустила свой второй ЦОД в ДубаеКитайская Alibaba Cloud ввела в эксплуатацию свой второй дата-центр в Дубае (ОАЭ). Новый ЦОД появился через девять лет после открытия первого объекта компании в городе, сообщает Datacenter Dynamics. Новый дата-центр — часть планов по глобальному масштабированию бизнеса. В его рамках Alibaba обязалась потратить $52,7 млрд на облачную и ИИ-инфраструктуру. Как сообщает Alibaba, новый объект позволит компании расширить предложение новых облачных технологий и систем искусственного интеллекта в Дубае. По словам Alibaba, запуск нового дата-центра и объявление об инновационных проектах на GITEX Global 2025 — важные вехи на пути расширения бизнеса компании в регионе. Готовность Ближнего Востока к быстрому внедрения ИИ и готовая к сотрудничеству экосистема — важнейшие факторы, способствующие процветанию структур в частном и государственном секторах, говорит Alibaba Cloud.
Источник изображения: Alibaba Cloud Дополнительно Alibaba Cloud объявила о подписании меморандума о взаимопонимании c ближневосточной цифровой финансовой платформой Wio Bank. Соглашение позволит использовать облачные технологии и ИИ Alibaba в рамках мультиоблачной стратегии платформы. В частности, Wio Bank будет использовать дубайские ЦОД комапнии. В Wio Bank подчёркивают, что масштабируя возможности с помощью передовых технологий Alibaba Cloud, компания создаёт ИИ-агентов, упрощающих операции и позволяющих клиентам безопасно расти, процветать и достигать большего. Среди прочих организаций, подписавших соглашение о переходе на Alibaba Cloud — облачная игровая платформа The Game Company и оказывающая услуги по переработке отходов компания Accumed. Alibaba Cloud стремительно развивается за пределами КНР. В сентябре она подтверждала, что намерена запустить до конца года восемь новых дата-центров, в том числе в Дубае. Среди прочих регионов — Мексика, Япония, Малайзия и очередная локация в Южной Корее, где в текущем году компания открыла две новые. В конце августа сообщалось, что Alibaba разработала собственный ИИ-ускоритель для инфреренса, который поможет компании избавиться от зависимости от ИИ-чипов NVIDIA и других зарубежных продуктов.
16.10.2025 [16:20], Андрей Крупин
VK Tech запустил сервис виртуальных карт GPUРоссийский разработчик корпоративного программного обеспечения VK Tech (входит в экосистему VK) сообщил о включении в состав облачной платформы VK Cloud виртуальных GPU-карт. Виртуальные GPU реализованы на базе аппаратных решений компании Nvidia и доступны в VDI-сервисе Cloud Desktop, предназначенном для доставки пользователям рабочих столов, развёрнутых на удалённом сервере и функционирующих в виртуализированном окружении. Поддержка GPU может быть актуальна для проектирования, анимации, редактирования видео, 3D-моделирования, рендеринга, тяжёлых вычислений, машинного обучения и других ресурсоёмких задач.
Источник изображения: Christina @ wocintechchat.com / unsplash.com «Мы стремимся сделать технологии более доступными для наших пользователей. Облачные вычисления на базе GPU помогут повысить производительность решений, сократить время на обработку данных и снизить расходы. Новый сервис позволяет быстро получить готовую к работе видеокарту и оплатить только необходимый объем её мощностей», — отмечает VK Tech. Инфраструктура VK Cloud соответствует 152-ФЗ на высшем уровне защищённости (УЗ-1), а также стандартам ГОСТ Р 57580 и PCI DSS.
16.10.2025 [15:53], Руслан Авдеев
NVIDIA поможет Starcloud отправить в космос первый ИИ-спутник с H100Появление массовых космических дата-центров уже не за горами. В скором времени вывести на орбиту ИИ-спутник намерен стартап Starcloud (ранее Lumen Orbit), участвующий в грантовой программе NVIDIA Inception. В Starcloud заявляют, что в космосе доступна практически неограниченная возобновляемая энергия, которая даже с учётом расходов на запуск на порядок дешевле, чем на Земле. При этом постоянное нахождение Солнца в «пределах прямой видимости» позволяет отказаться от мощных резервных источников питания. Затраты ожидаются в основном до вывода в космос, а после предполагается десятикратная «экономия» углеродных выбросов в течение всего жизненного цикла в сравнении с ЦОД на Земле. Охлаждение в космосе тоже практически «бесплатное» и «безлимитное». Запуск спутника запланирован на ноябрь 2025 года. Речь идёт о дебютном использовании ИИ-ускорителей NVIDIA H100 в космосе. 60-килограммовый спутник Starcloud-1 размером с небольшой холодильник должен обеспечить в 100 раз более эффективные вычисления, чем любой предыдущий космический проект аналогичного назначения.
Источник изображения: Starcloud На начальном этапе космические дата-центры будут применяться для анализа данных наблюдений за земной поверхностью. Обработка данных в режиме реального времени в космосе обеспечивает огромные преимущества в критических ситуациях — при распознавании лесных пожаров, получении сигналов о бедствии и др. Инференс в космосе, т.е. там же, где будут собираться данные, позволяет выдавать результаты практически немедленно, снижая задержки с часов до минут. Методы наблюдения за Землёй включают съёмки камерами в нескольких диапазонах и радарами с синтезированной апертурой (SAR) для создания трёхмерных карт с высоким разрешением. SAR, в частности, генерируют около 10 Гбайт данных в секунду, поэтому обрабатывать информацию на месте намного выгоднее, чем отправлять её на Землю.
Источник изображения: Starcloud В Starcloud подчёркивают необходимость быть конкурентоспособными на фоне наземных ЦОД, поэтому компания выбрала ИИ-ускорители NVIDIA. Вместе с тем Starcloud — недавний «выпускник» программы Google for Startups Cloud AI Accelerator, поэтому для тестов будет использоваться LLM Gemma. Что касается будущих запусков, в перспективе Starcloud рассчитывает перейти на платформу NVIDIA Blackwell. Ещё осенью 2024 года сообщалось, что Lumen Orbit проектирует на орбите гигантские гигаваттные дата центры. Идея популярна — основатель Amazon Джефф Безос (Jeff Bezos) в начале октября заявлял, что в космосе скоро появится множество ЦОД гигаваттного масштаба.
08.10.2025 [14:40], Андрей Крупин
Beeline Cloud представил комплексное решение для работы с «1С» в защищённом облакеПоставщик облачных и IT-услуг Beeline Cloud сообщил о выводе на рынок комплексного решения 1С Cloud Pro, предназначенного для размещения высоконагруженных систем «1С:Предприятие» в защищённой облачной инфраструктуре. 1С Cloud Pro включает инструменты переноса существующих систем «1С» в инфраструктуру Beeline Cloud и предоставляет на выбор типовые конфигурации на базе операционных систем Windows Server с СУБД Microsoft SQL Server или Linux с PostgreSQL. В дополнение к этому заказчикам предлагается экспертная поддержка с полным циклом операционного сопровождения, включая мониторинг, администрирование и обеспечение работоспособности серверных кластеров «1С», систем управления базами данных и веб-публикаций.
Источник изображения: cloud.beeline.ru Облачная инфраструктура 1С Cloud Pro соответствует требованиям 152-ФЗ (УЗ-1), ГОСТ Р 57580.1-2017 и другим отраслевым стандартам. Соглашение об уровне сервиса (SLA) обеспечивает базовую доступность на уровне 99,95 % с возможностью повышения до 99,99 %. Предусмотрена возможность прямого взаимодействия с центром корпоративной технологической поддержки «1С».
26.09.2025 [13:28], Руслан Авдеев
Alibaba Cloud запустит восемь новых ЦОД в Европе, Азии и Северной АмерикеКитайский облачный провайдер Alibaba Cloud (Aliyun) готовится открыть восемь новых ЦОД в разных странах. Анонсирован запуск первых объектов в Бразилии, Франции и Нидерландах, а также расширение присутствия в Мексике, Японии, Южной Корее, Малайзии и ОАЭ. По словам компании, ИИ меняет не только технологии, но и сами методы «создания ценности» и стимулирования роста. Стратегическое расширение глобальной инфраструктуры призвано удовлетворить растущий спрос со стороны «дальновидных» клиентов. В Alibaba Cloud считают, что компания находится в авангарде инноваций в сфере ИИ, развиваясь вместе с клиентами, предлагая комплексные решения на базе искусственного интеллекта и облачных технологий, поддерживающих бизнес в любое время, в любом месте. Компания готова вложить ¥380 млрд ($52,7 млрд) в развитие собственной инфраструктуры, чтобы сохранить лидерские позиции. На сегодня Alibaba Cloud управляет 91 зоной доступности в 29 облачных регионах, включая материковый Китай, Азию, США, Южную Америку, Европу и Ближний Восток. Так, Alibaba вышла на японский рынок в 2016 году, в Токио действуют три зоны доступности. В Сеуле (Южная Корея) имеются две зоны доступности, в Мексике в 2025 году была открыта зона. В Дубае (ОАЭ) Alibaba присутствует с 2016 года, там компания управляет двумя зонами. Также три зоны имеются в Куала-Лумпуре (Малайзия). Ранее в сентябре компания опубликовала финансовый отчёт за I квартал 2026 финансового года, согласно которому совокупная выручка подразделения Alibaba Cloud Intelligence Group составила $4,662 млрд, на 26 % выше год к году. При этом, как сообщают в Alibaba, год к году выручка от ИИ сохранила «трёхзначный» рост — подобный рост сохраняется уже восемь кварталов подряд. Кварталом ранее выручка облачного подразделения составила $4,152 млрд, увеличившись в годовом исчислении на 18 %.
24.09.2025 [15:33], Руслан Авдеев
«Яндекс» строит во Владимирской области новый ЦОД, где разместится новая зона доступности Yandex CloudYandex Cloud намерена запустить в начале 2026 года новую зону доступности на базе дата-центра компании, сообщают «Ведомости». Это уже шестой ЦОД «Яндекса», его мощность составит более 40 МВт. Новый объект разместят неподалёку от уже действующего дата-центра «Яндекса». По данным пресс-службы «Яндекса», зона будет обеспечивать (минимальную) задержку до соседней зоны менее 1 мс, а общая ёмкость канала составит 25,6 Тбит/с. В компании подчёркивают, что такие показатели позволят ускорить работу критически важных для банков, ритейлеров и других крупных клиентов сервисов, требующих транзакций, бронирования и запросов во внутренние базы данных. Новая зона доступности получит независимые каналы для связи с другими зонами, что повысит общую надёжность системы. В «Яндексе» подчеркнули, что спрос на облака только увеличивается, в I полугодии 2025-го спрос на vCPU в Yandex Cloud вырос на 29,6 % год к году. Также в компании утверждают, что она первой в России запустила инструменты для проведения учений по отказоустойчивости инфраструктуры. PUE нового объекта будет на уровне 1,1 — благодаря использованию фрикулинга в течение всего года.
Источник изображения: Яндекс Как сообщают «Ведомости», по оценкам экспертов Apple Hills Digital, инвестиции в проект превышают 15–20 млрд руб. Новая зона доступности будет драйвером потребления сервисов текущими клиентами «Яндекса». Эксперты предполагают, что новое решение усилит позиции компании на рынке отечественных облаков. На фоне высокой фрагментированности российского облачного рынка у «Яндекса» сильная позиция, которую дополнительно укрепит открытие новой зоны доступности. В апреле сообщалось, что в Можайском округе Московской области построят очередной дата-центр «Яндекса» с инвестициями в объёме $16 млрд. Ввод в эксплуатацию запланирован на 2027 год.
16.09.2025 [18:07], Владимир Мироненко
NVIDIA отказалась от активного развития собственного ИИ-облака DGX CloudNVIDIA отказалась от первоначальных планов относительно будущего облачной платформы DGX Cloud, запущенной в 2023 году в партнёрстве с ведущими облачными провайдерами, для которых оно было не очень-то и выгодно. Как сообщает Data Center Dynamics со ссылкой The Information, NVIDIA прекратила предлагать платформу новым клиентам из-за более высоких цен по сравнению с предложениями самих облачных провайдеров и теперь в основном использует её для нужд собственных исследовательских подразделений. Ранее NVIDIA планировала получить $150 млрд дохода от своего облачного бизнеса и даже собиралась арендовать ЦОД для поддержания его работы. Но в отчёте о финансовых результатах NVIDIA за II квартал 2026 финансового года больше нет упоминания DGX Cloud в расходах на облако, как это было в предыдущих кварталах. Вместе с тем в компании выразили несогласие с публикацией The Information по поводу того, что сервис не оправдал ожиданий. «DGX Cloud пользуется большим успехом как облако для собственных исследований и разработок NVIDIA в области ИИ, а также как своего рода “песочница”, в которой мы работаем с облачными партнёрами над оптимизацией их вычислительных стеков и с их разработчиками ИИ-стеков на основе CUDA», — сообщила Алексис Блэк Бьорлин (Alexis Black Bjorlin), руководитель DGX Cloud, изданию The Information. Она подчеркнула, что спрос в разрезе подразделений NVIDIA остаётся высоким, и компания продолжает расширять мощности DGX Cloud. Более того, у сервиса продолжают появляться новые клиенты. В частности, стартап SandboxAQ, работающий в области квантовых вычислений и ИИ, в который инвестировала NVIDIA, сообщил в апреле об использовании для своих разработок DGX Cloud. Ранее в этом году NVIDIA представила DGX Cloud Lepton — торговую площадку, предназначенную для использования разработчиками ускорителей от таких поставщиков, как CoreWeave, SoftBank и Yotta Data Services. Несмотря на то, что это решение открыло новые способы доступа к вычислительным мощностям, оно всё же вызвало конфликты с представителями инфраструктурного бизнеса, расценившими это как попытку NVIDIA найти пути общения с их клиентами напрямую, отметил ресурс Data Center Dynamics. Тем не менее, сервис DGX Cloud Lepton позволил более мелким поставщикам оставаться в экосистеме NVIDIA. Для разработчиков переход с DGX Cloud на Lepton означает более доступную вычислительную мощность по конкурентоспособным ценам в уже используемых ими облаках, а для NVIDIA — меньше конфликтов между каналами продаж и более строгий контроль над потоком рабочих нагрузок GPU по всему миру, отмечает Tom's Hardware.
10.09.2025 [15:17], Сергей Карасёв
Облачный провайдер Linx Cloud запустил объектное хранилище S3Российский облачный провайдер Linx Cloud объявил о расширении набора предоставляемых клиентам сервисов: запущено объектное хранилище S3, доступ к которому предоставляется как через интернет, так и по выделенному каналу «точка — точка». Хранилище развёрнуто на базе собственных ЦОД Linx Datacenter: это площадки уровня Tier III, расположенные в Москве и Санкт-Петербурге. Провайдер гарантирует высокий уровень доступности с показателем SLA в 99,99 %. Сервис Linx Cloud S3 предназначен для надёжного и экономичного хранения неструктурированных данных. Тарификация осуществляется по фактическому потреблению — оплачиваются только занятый объём хранилища и исходящий трафик. Кроме того, имеется опция без дополнительных затрат на исходящий трафик: такая схема оплаты ориентирована на заказчиков, которые не могут заранее спрогнозировать нагрузку. Среди потенциальных клиентов названы финансовые организации, производственные предприятия, IT-компании, ретейлеры и пр. При организации доступа по выделенному каналу «точка — точка», например, от офиса или ЦОД клиента, снижается зависимость от публичных сетей, что обеспечивает повышенную надёжность и безопасность. Предлагается также опция хранения WORM (однократная запись и многократное чтение), что исключает возможность изменения информации: это, в частности, обеспечивает защиту от программ-вымогателей, шифрующих данные. «На фоне стабильного роста объёма данных нашим клиентам требуется экономичное и легко масштабируемое решение для их хранения. При этом мы часто видим требование по организации интернет-независимого канала для доступа к сервису, и поэтому реализовали такое решение», — говорит руководитель направления по развитию продуктов Linx Cloud. В перспективе функциональность объектного хранилища Linx Cloud S3 будет расширяться. Планируются добавление дополнительных профилей, масштабирование и интеграция с другими сервисами Linx Cloud, такими как Kubernetes as a service и DBaaS.
15.08.2025 [16:25], Сергей Карасёв
Квартальная выручка Beeline Cloud выросла год к году более чем на четверть«Билайн» отрапортовал о работе во II четверти текущего года: выручка по операционной деятельности достигла 80,55 млрд руб., что на 6,7 % больше по сравнению с результатом за аналогичный период прошлого года, когда компания получила 75,47 млрд руб. Чистая прибыль «Билайна» в период с апреля по июнь включительно составила 4,32 млрд руб. Для сравнения, годом ранее были зафиксированы чистые убытки в размере 1,13 млрд руб. Показатель EBITDA (прибыль до вычета процентов, налогов и амортизационных отчислений) в годовом исчислении поднялся на 8,8 % — c 33,11 млрд до 36,03 млрд руб. Компания продолжает быстро развивать облачную платформу Beeline Cloud: выручка по данному направлению по сравнению со II кварталом 2024 года подскочила на 27 % (абсолютное значение не раскрывается). Среди значимых событий отчётного периода названы запуск Beeline Cloud 2.0 с интеллектуальным оркестратором VEGA3, получение трёх международных сертификатов ISO/IEC (27001, 27017 и 27018), а также обеспечение доступности маркетплейсов для клиентов за рубежом с помощью выделенных серверов в Китае, Турции и Белоруссии. В течение квартала были отражены около 32 тыс. DDoS-атак. Сформирован метрокластер, объединивший два дата-центра в отказоустойчивое облако. Помимо этого, модернизирован Ярославский ЦОД. «Билайн» продолжает развивать инфраструктуру связи. Во II четверти 2024 года количество базовых станций увеличилось на 8,7 %, или на 18 тыс. единиц, по сравнению с тем же периодом прошлого года. Объём трафика данных вырос на 11,2 %, а доля VoLTE в голосовом трафике — на 10,9%. Введены в эксплуатацию магистральные каналы волоконно-оптической линии связи суммарной ёмкостью 1,6 Тбит/с по двум ключевым маршрутам транзита международного трафика — южному и восточному. Первый проходит через Европу, Россию, Грузию, Армению, Турцию и доходит до границ со странами Ближнего Востока. Восточный маршрут пролегает через Казахстан в сторону Китая. |
|
