Материалы по тегу: облако
|
01.05.2025 [19:15], Андрей Крупин
Новое поколение платформы Beeline Cloud 2.0 дополнилось функцией интеллектуальной оркестрации гибридного облакаКомпания «Вымпелком», предоставляющая услуги под брендом «Билайн», анонсировала релиз нового поколения облачной платформы Beeline Cloud 2.0 для корпоративного сегмента. Ключевой особенностью Beeline Cloud 2.0 является интеллектуальный оркестратор Vega собственной разработки, обеспечивающий управление гибридной IT-инфраструктурой и объединяющий различные среды виртуализации (OpenStack, VMware и другие) в единый управляемый комплекс. По заверениям команды «Вымпелкома», нововведение позволяет максимально эффективно использовать вычислительные ресурсы дата-центра, одновременно предоставляя облачные сервисы в формате, доступном не только IT-инженерам, но и продуктовым командам, архитекторам и разработчикам ПО с поддержкой методологии CI/CD (Continuous Integration/Continuous Delivery). Будучи комплексным решением, Beeline Cloud 2.0 предоставляет множество функциональных возможностей. В их числе: единое управление мультивиртуализацией через Vega-оркестратор; доступ к IaaS и PaaS (виртуальные машины, базы данных, Kubernetes, DevOps-инструменты и др.); оптимизация инфраструктурных ресурсов и снижение затрат; быстрый запуск и масштабирование продуктов через инструменты самообслуживания; готовность к внедрению генеративных ИИ-систем и современных подходов к разработке; кибербезопасность корпоративного уровня с соблюдением российских стандартов.
Источник изображения: cloud.beeline.ru «Изначально Vega создавался внутри «Вымпелкома» как оркестратор для трансформации корпоративного IT-ландшафта в соответствии с концепцией «всё как код» — архитектурного подхода, при котором инфраструктура, конфигурации и приложения описываются и управляются через код. Такой подход стал основой подготовки к масштабному внедрению GenAI, поскольку генеративные модели требуют предсказуемой автоматизированной и масштабируемой среды», — поясняют в компании. На текущий момент Beeline Cloud 2.0 находится в стадии закрытого тестирования и проходит финальную настройку. В ближайшем будущем «Вымпелком» планирует запустить платформу в коммерческую эксплуатацию и предоставить клиентам доступ к полноценному облачному стеку, построенному по самым современным принципам.
01.05.2025 [01:35], Руслан Авдеев
Microsoft готова судиться с правительством США, если оно попытается лишить Европу продуктов компанииЕсли президент США Дональд Трамп (Donald Trump) каким-то образом попытается ограничить доступ европейских клиентов Microsoft к сервисам компании, та обещает судиться с ним для защиты интересов жителей Евросоюза. Таким образом IT-гигант пытается убедить ЕС в том, что Трамп не сможет лишить их доступа к критически важным технологиям, сообщает The Financial Times. По словам президента и главного юриста Microsoft Брэда Смита (Brad Smith), европейские лидеры, будучи в шоке от действий Трампа, резонно задаются вопрос, не перекроет ли он доступ к американским технологиям Евросоюзу. Смит утверждает, что компания должна стать источником «цифровой стабильности» в период нестабильности геополитической. В новом обещании упоминаются пять «цифровых обязательств» перед Евросоюзом. Это, например, обязательство оспаривать любой приказ «неевропейского» правительства о прекращении доступа к облачным сервисам европейским клиентам или нарушение их работы, в том числе в суде. Компания намерена включить соответствующий пункт в свои контракты. Смит напомнил, что у компании есть большой опыт судебных тяжб с американскими властями. Также Microsoft обязуется, что облачные сервисы в ЕС будут контролироваться местным советом директоров и действовать в соответствии с местным законодательством. Microsoft стала первым американским IT-гигантом, попытавшимся успокоить клиентов в Евросоюзе на фоне усложняющихся торговых отношений и призывов европейских политиков обеспечить технологический суверенитет, исключив из государственных контрактов любые компании из США. Сообщается, что среди политиков и компаний нарастают опасения относительно конфиденциальности европейских данных и даже возможного запрета США на деятельность американских компаний в Европе. Хотя по словам Смита, последний вариант маловероятен, он признаёт, что у европейских лидеров есть поводы сомневаться в этом. Microsoft хочет развить облачные и ИИ-платформы в Евросоюзе, увеличив мощности своих ЦОД в регионе на 40 % в следующие два года и расширив деятельность в 16 странах, на что компания готова тратить десятки миллиардов долларов ежегодно. По словам Смита, размер европейского рынка (более четверти бизнеса Microsoft) означает, что поддерживать доверие местных клиентов и правительств крайне важно для компании. Она не так давно достигла соглашения с местными облачными операторами — дополнительные проблемы ей вряд ли нужны.
29.04.2025 [14:44], Сергей Карасёв
Oracle развернула в облаке суперускорители NVIDIA GB200 NVL72Корпорация Oracle ввела в эксплуатацию в своих дата-центрах первые суперускорители NVIDIA GB200 NVL72. Тысячи GPU семейства Blackwell доступны клиентам через облако NVIDIA DGX Cloud и инфраструктуру Oracle Cloud Infrastructure (OCI) для создания и запуска ИИ-агентов и «рассуждающих» моделей следующего поколения. Решение GB200 NVL72 объединяет 18 узлов 1U в одной стойке: каждый из них содержит два ускорителя GB200, что в сумме даёт 72 чипа B200 и 36 процессоров Grace. Задействована система жидкостного охлаждения. Платформа Oracle включает высокоскоростные сетевые решения NVIDIA Quantum-2 InfiniBand и Spectrum-X Ethernet. Отмечается, что Oracle планирует сформировать один из самых крупных в мире кластеров с ИИ-ускорителями поколения Blackwell. Системы OCI Supercluster смогут масштабироваться до более чем 100 тыс. GPU для удовлетворения стремительно растущих потребностей в вычислительных ресурсах для задач инференса и НРС. При этом Oracle предлагает гибкие варианты развёртывания, позволяющие клиентам использовать Blackwell через публичные, государственные и суверенные облака, а также собственные дата-центры. О намерении задействовать мощности OCI GB200 уже заявили ряд крупных клиентов. В их число входят технологические компании, корпоративные заказчики, государственные учреждения, а также региональные поставщики облачных услуг. Ранее о запуске общедоступных инстансов на основе NVIDIA GB200 NVL72 объявила компания CoreWeave, предоставляющая облачные сервисы для ИИ-задач. Кластеры Supermicro на базе NVIDIA GB200 NVL72 предложит клиентам Eviden (подразделение Atos Group). Эти суперускорители также взяла на вооружение облачная платформа Google Cloud. xAI также приступил к монтажу NVIDIA GB200 NVL72 для ИИ-кластера Colossus.
28.04.2025 [15:00], Руслан Авдеев
Beeline cloud объявил о доступности Cloud Compute MetroClusterОблачный оператор beeline cloud объявил о коммерческой доступности гибридной платформы Cloud Compute MetroCluster, комбинирующей преимущества частных и публичных облаков. Платформа призвана обеспечить бесперебойную работу критически важных приложений и бизнес-процессов клиентов, сообщает пресс-служба облачного провайдера. MetroCluster позволяет развёртывать IT-инфраструктуру сразу в двух московских ЦОД — данные будут немедленно дублироваться в разных хранилищах, что обеспечит максимальную отказоустойчивость. Автоматическая репликация в другой ЦОД происходит сразу при создании ВМ. Если в одном дата-центре случится авария, доступ к клиентским сервисам сохранится. При этом платформа совместима со сторонними облачными площадками и приложениями, включая и beeline cloud. Покупка оборудования для развёртывания сервисов не потребуется, инфраструктура будет обеспечена благодаря beeline cloud. Дополнительно оператор обещает гарантии повышенной безопасности благодаря хранению информации клиентов на территории России. Кроме того, инфраструктура соответствует требованиям 152-ФЗ «О персональных данных» и ГОСТ Р 56939. Предложение рассчитано на крупный и средний бизнес, в том числе банки и страховые компании, телеком-операторов и организации госсектора, а также промышленные предприятия и др. Как заявляют в beeline, MetroCluster «гарантирует 99,95% SLA по бесперебойности и снижает CAPEX за счёт оплаты по подписке без капитальных затрат». Кром того, предусмотрена поддержка миграции существующих систем, клиентами предлагается «гибкая» тарифная схема.
28.04.2025 [07:54], Сергей Карасёв
SambaNova уволила 15 % персонала и переключилась на инференс в облакеРазработчик ИИ-ускорителей SambaNova, по сообщению EE Times, проводит реорганизацию, направленную на трансформацию бизнеса. Стартап, в частности, намерен сосредоточиться на предоставлении облачных услуг в сфере ИИ, включая, ресурсы для инференса. SambaNova была основана в 2017 году. Актуальный ИИ-ускоритель компании SN40L RDU (Reconfigurable Dataflow Unit) объединяет два крупных чиплета, которые оперируют 520 Мбайт SRAM-кеша, 1,5 Тбайт DDR5 DRAM и 64 Гбайт HBM3. Восьмипроцессорная система на базе SN40L, по заявлениям SambaNova, способна запускать и обслуживать ИИ-модели с 5 трлн параметров и глубиной запроса более 256k. Осенью прошлого года SambaNova объявила о запуске самой быстрой на тот момент облачной платформы для ИИ-инференса. В этом вопросе она соревнуется с Cerebras и Groq, ещё двумя заметными стартапами, которые пытаются составить конкуренцию NVIDIA. Стоит отметить, что Groq также сменила бизнес-подход, отказавшись от продажи отдельных ускорителей в пользу оснащения целых ИИ ЦОД для инференса.
Источник изображения: SambaNova В рамках реорганизации SambaNova сократила численность персонала примерно на 15 %: уволены 77 из 500 сотрудников. Отмечается, что масштабные коммерческие ИИ-нагрузки смещаются от обучения в сторону инференса. В результате стартапы в сфере ускорителей и другого ИИ-оборудования для дата-центров переключились на предоставление обалчного доступа к LLM посредством API. «Мы оперативно переориентировались на предоставление облачных решений, которые помогают предприятиям и разработчикам развёртывать открытые ИИ-модели в масштабе. В рамках трансформации операций пришлось принять трудное решение о сокращении примерно 75 сотрудников и сместить фокус команды для поддержания следующего этапа роста», — заявили представители SambaNova.
26.04.2025 [13:12], Владимир Мироненко
Alphabet в полтора раза нарастил квартальную прибыль и подтвердил планы потратить $75 млрд на ИИ-инфраструктуруGoogle утверждает, что огромные капиталовложения в ЦОД в последние годы оказывают большее давление на её баланс из-за растущих амортизационных расходов. Несмотря на это, компания по-прежнему планирует направить в 2025 году $75 млрд на развитие ИИ-инфраструктуры, включая развёртывание и модернизацию ЦОД, пишет The Register. Подводя итоги I квартала 2025 года, финансовый директор холдинга Alphabet Анат Ашкенази (Anat Ashkenazi) сообщила, что компания за три месяца израсходовала «технической инфраструктуры» $17,2 млрд. Она отметила, что крупнейшими были «инвестиции в серверы, за которыми следуют ЦОД» для поддержки подразделений поиска, облака и DeepMind, занимающегося ИИ-технологиями. Google владеет и управляет 135 ЦОД по всему миру и прибегает к помощи поставщиков услуг колокации. Тем не менее, признала финансовый директор, компании по-прежнему не хватает мощностей, чтобы полностью удовлетворить спрос клиентов. «Мы находимся в условиях ограниченного предложения по отношению к спросу, и, учитывая, что доходы зависят от сроков развёртывания новых мощностей, мы можем наблюдать колебания темпов роста доходов от облачных технологий в зависимости от развёртывания мощностей каждый квартал», — отметила Ашкенази. Ашкенази напомнила аналитикам, что Google Cloud завершила 2024 год с превышением спроса со стороны клиентов над имеющимися у компании мощностями. И ситуация повторилась в отчётном квартале. «Мы ожидаем относительно более высокого развёртывания мощностей к концу 2025 года», — сообщила она, добавив, что капитальные затраты Google в 2024 году составили от $50 до $55 млрд, и в текущем календарном году компания намерена израсходовать по этой статье на 36–50 % больше. Ожидая всплеск заказов на облако и ИИ от корпоративных клиентов, Microsoft планирует направить $80 млрд на инфраструктуру в 2025 году, AWS — до $100 млрд, а Meta✴ — $60–65 млрд. Вместе с тем AWS и Microsoft пересмотрели часть планов по развитию ЦОД. ИИ — это всего лишь фактор в расширении цифровой империи Google, как и для Microsoft и AWS, но руководство компаний надеется, что эти затраты окупятся, отметил The Register. Недостатком строительства ЦОД является амортизация. Ашкенази сообщила, что рост амортизации составил за квартал примерно 31 % в годовом исчислении, и этот показатель вырастет в течение года. Alphabet получил в I квартале выручку в размере $90,234 млрд, что на 12 % больше, чем годом ранее, и выше консенсус-прогноза аналитиков, опрошенных LSEG, в размере $89,12 млрд. Реклама принесла холдингу $66,88 млрд, что на 8,5 % больше, чем годом ранее, когда доход от рекламы составил $61,66 млрд. Чистая прибыль Alphabet выросла на 46 % до $34,54 млрд или $2,81 на акцию при прогнозе от LSEG в размере $2,01 на акцию. Выручка облачного подразделения Google Cloud увеличилась на 24 % до $12,26 млрд, что чуть меньше прогноза аналитиков, опрошенных StreetAccount, в размере $12,27 млрд. Операционная прибыль Google Cloud выросла до $2,17 млрд с $900 млн годом ранее.
23.04.2025 [16:15], Руслан Авдеев
GPU под роспись: Amazon резко ужесточила использование дефицитных ИИ-ускорителей внутри компании в рамках Project GreenlandВ прошлом году ретейл-бизнес Amazon столкнулся с острой нехваткой ИИ-ускорителей для внутреннего пользования. Это привело к задержкам при реализации ключевых проектов. На фоне глобального бума ИИ-технологий и дефицита чипов NVIDIA компания вынужденно пересмотрела принципы доступа к ускорителям для собственных нужд, сообщает Business Insider. В июле 2024 года началась реализация т. н. Project Greenland. Фактически речь идёт о платформе для централизованного распределения ресурсов ускорителей. Платформа позволяет отслеживать их использование, перераспределяет мощности в случае простоя и даёт возможность оперативно реагировать на изменения спроса. Теперь все заявки на доступ к ускорителям подаются только через Greenland, а приоритет получают проекты с высоким уровнем возврата инвестиций (ROI), чётким графиком и заметным влиянием на снижение затрат или рост выручки. У проектов с низкой эффективностью доступ к вычислительным мощностям могут вообще отозвать в пользу более перспективных инициатив. Amazon выделила восемь принципов распределения ускорителей среди сотрудников компании:
Источник изображения: Centre for Ageing Better/unsplash.com Amazon уже активно использует искусственный интеллект в различных проектах. В числе ключевых инициатив:
По оценкам Amazon, ИИ-проекты розничного подразделения в 2024 году принесли $2,5 млрд операционной прибыли, попутно сэкономив $670 млн. В 2025 году ретейл-подразделение Amazon намерено вложить $1 млрд в ИИ-проекты розничного сегмента и увеличить расходы на облако AWS до $5,7 млрд (с $4,5 млрд в 2024 году). Если во II полугодии 2024 года розница Amazon нуждалась в более 1 тыс. дополнительных инстансов P5 с NVIDIA H100, то в 2025 году ситуация, как свидетельствуют внутренние прогнозы, должна стабилизироваться. А к концу года внутренние запросы полностью удовлетворят с помощью чипов собственной разработки Amazon Tranium, «но не раньше». Тем не менее, в Amazon не теряют бдительности, постоянно задаваясь вопросом: «Как получить больше ускорителей?».
19.04.2025 [02:15], Руслан Авдеев
Linux — это дорого и сложно: AWS и Google Cloud заявили, что вырваться из экосистемы Microsoft невероятно трудно
aws
google cloud platform
microsoft
microsoft azure
software
sql server
windows server
великобритания
конкуренция
лицензия
миграция
облако
Компании, вложившие большие средства в ПО Microsoft, буквально не могут покинуть принадлежащее последней облако Azure, чтобы перейти в AWS или Google Cloud Platform вместо собственных серверов. Использовать ПО гиганта из Редмонда в облаках сторонних провайдеров из-за лицензионной политики Microsoft очень дорого, но и переписывать ПО для Linux, возможно, ещё дороже, сообщает The Register. AWS и Google пожаловались в британское Управление по конкуренции и рынкам (CMA), ведущее расследование ситуации на облачном рынке страны, что клиенты столкнулись с дилеммой — либо использовать Azure, либо платить в четыре раза больше за запуск приложений под Windows Server и SQL Server в сторонних облаках. В 2019 году Microsoft ввела систему «запретительного» лицензирования, начав требовать отдельные лицензии для работы Windows Server и SQL Server в облаках Amazon, Google и Alibaba. Простейшим решением был бы переход клиентов на Linux, но зачастую они вложили немало средств в экосистему Microsoft и выбирать им не приходится — они «очень зависимы» от Windows и других продуктов. Google жалуется на искусственно созданную Microsoft привязку к Windows Server и SQL Server — на модернизацию и перенос таких систем на Linux «уйдут годы и годы». Фактически придётся переписать все приложения, годами создававшиеся под экосистему Microsoft. По данным Google, у некоторых компаний на подобную миграцию действительно уходило по несколько лет, что сказалось на ценах для конечных пользователей. У многих организаций просто нет ресурсов для таких «реформ». Кроме того, использующие Windows Server на собственном оборудовании и желающие перебраться в облако компании из-за стоимости лицензий фактически не имеют выбора — миграция в Azure для них будет значительно дешевле, чем в другие облака. AWS также согласна с тем, что переход на Linux и другое облако для многих клиентов Azure — это очень дорогая, часто экономически неоправданная задача. По подсчётам Google, 70–80 % выручки Azure поступает от клиентов, использующих Windows Server и SQL Server. Таким образом, говорит Google, конкретно это ПО — «критически важная часть» облачного рынка. Google и AWS хотят, чтобы CMA решила вопрос с неконкурентным ценообразованием Microsoft. Британский регулятор предварительно уже решил, что такое поведение компании действительно не соответствует правилам «здорового» рынка. В самой Microsoft считают, что в удержании клиентов при переходе с on-premise в облако нет ничего противоправного. По её мнению, при подходе к ценообразованию SPLA она соблюдает баланс, прося «не слишком мало, но и не слишком много». Кроме того, компания предлагает Linux-версию SQL Server. Окончательное решение CMA должно вынести 4 июля. В числе прочих расследуемых проблем — комиссии за перенос данных (egress fees) и технические барьеры при переходе из облака в облако. В самом CMA больших проблем в этом не видят, но малые облачные провайдеры не согласны, считая, что подобные препятствия на руку лишь гиперскейлерам. Формально «штрафы» за перенос данных в другое облако «большая тройка» отменила. Вот только Amazon не требует при миграции отказываться от всех сервисов и закрывать аккаунты, а Microsoft и Google — требуют.
18.04.2025 [15:47], Владимир Мироненко
Cloud.ru представил первый в России управляемый облачный сервис для инференса ИИ-моделей — Evolution ML InferenceПровайдер Cloud.ru представил Evolution ML Inference — первый, по словам компании, в России управляемый облачный сервис для инференса больших языковых моделей (LLM), который позволит эффективно управлять вычислительными ресурсами. С его помощью клиенты смогут помимо моделей GigaChat от Cloud.ru запускать и развертывать собственные ИИ-модели, а также open source модели из библиотеки Hugging Face на базе облачных ускорителей. Это полностью управляемый сервис — пользователю достаточно настроить конфигурацию, модель и тип масштабирования, Cloud.ru предоставит доступ к мощным ускорителям, а также будет отвечать за полное администрирование и обслуживание инфраструктуры. Сервис отличается простотой и гибкостью управления, что позволяет запускать модели без необходимости сборки образа напрямую из Hugging Face, а также запускать собственные образы со своим окружением. Благодаря поддержке технологии Shared GPU, позволяющей распределять GPU-ресурсы с учётом потребления количества vRAM, необходимого для эффективной работы модели без задержек, а также с возможностью динамически перераспределять ресурсы в зависимости от текущих потребностей, сервис обеспечивает повышение утилизации мощностей в ИИ-проектах от 15 до 45 % в сравнении со сценарием, когда GPU используется целиком. Тем самым обеспечивается высокая степень адаптации и рациональное использование доступных ресурсов с одновременным запуском нескольких моделей на одном GPU. «Это делает технологию наиболее оптимальной для распределённых систем с разнородной вычислительной инфраструктурой и помогает эффективно масштабировать нагрузку», — отметила Cloud.ru. Ещё одно отличие сервиса — поддержка режима скайлирования (эффективного масштабирования), когда оплата за использование модели начисляет только с момента обращения к ней. По оценкам Cloud.ru, около 70 % заказчиков используют GPU-ресурсы, зарезервированные под инференс в процессе эксплуатации ML-моделей, менее чем на 55 %. При внедрении ИИ в большинстве случаев базой становится именно среда исполнения модели. Поэтому для рационального использования ресурсов и оптимизации затрат при обработке ИИ-нагрузок, особенно генеративного ИИ, необходима производительная инфраструктура с гибким масштабированием в реальном времени, отметил глава Cloud.ru.
18.04.2025 [15:17], Руслан Авдеев
Из-за политики США европейские пользователи задумались об уходе из американских облаковЕвропейские пользователи облачных сервисов становятся всё менее лояльны американским гиперскейлерам в условиях геополитической неопределённости — некоторые региональные европейские облака сообщают о росте спроса со стороны «соотечественников», сообщает The Register. После года «зацикливания» на ИИ-тематике, акцент сместился на обсуждение политики США. Даже до начала недавней, весьма опасной игры с пошлинами, европейские пользователи уже задавались вопросом, так ли необходимо включать базирующихся в США гиперскейлеров в свои бизнес-цепочки. По словам британского облачного провайдера CIVO, перемены происходят на удивление быстро — в компании всё ещё «ошеломлены» скоростью роста интереса к альтернативным облакам. Nextcloud говорит, что интерес к её сервисам вырос втрое, причём не только из-за действий самого президента США, но и его администрации в целом. В частности, Nextcloud обвиняет американскую сторону в «ненадёжности» и возможном росте цен из-за пошлин. Более того, на повестке появился даже фактор шпионажа — Илона Маска (Elon Musk) и департамент DOGE обвиняют в доступе к по-настоящему конфиденциальным базам (о том, что США регулярно следили даже за союзниками десятилетиями, не упоминается). Частный облачный оператор Vultr (американского происхождения) с площадками по всему миру тоже отметил рост интереса к суверенной инфраструктуре — правительства и организации желают знать, где хранятся, обрабатываются и резервируются их данные, как они используются. Теперь же опасения только усилились, поскольку нет ясности, как будут развиваться экономические отношения между сторонами. При этом уйти от гиперскейлеров непросто и на это могут уйти месяцы или даже годы, а приступать к переходу следует поэтапно, после того как найдутся альтернативные провайдеры. Впрочем, в Nextcloud сообщают, что некоторые организации, которым «по-настоящему угрожает» американский режим, запросили компанию о более быстром переходе. В Open Infrastructure Foundation подтверждают, что интерес к альтернативным облакам действительно резко вырос, хотя до этого разговоры о переходе велись годами. Ситуацию некоторые эксперты сравнили с покупкой VMware в 2023 году, когда для многих клиентов последней цена лицензий значительно выросла и отголоски до сих пор ощущаются в IT-индустрии, а многие клиенты начали лихорадочно искать альтернативы. Многие эксперты уверены, что с правильной мотивацией переход от американских гиперскейлеров вполне возможен, а мотивация именно сейчас как раз присутствует. Конечно, интерес ещё не значит, что все, выразившие его, обязательно мигрируют к европейским облачным провайдерам, но саму тенденцию уже невозможно не замечать. В октябре 2024 года сообщалось, что Евросоюзу не хватает мощностей ЦОД для обретения суверенного ИИ. Впрочем, строительством суверенных облаков для Европы занялись как гиперскейлеры вроде AWS и Microsoft, так и местные игроки, развивающие, например, суверенную платформу Virt8ra. |
|

