Материалы по тегу: гибридное облако
|
15.05.2026 [09:34], Владимир Мироненко
Вот это разворот: SAP всё же предоставит ИИ-агентов для локальных ECC и S4/HANA, но при обещании переехать в облакоSAP совершила резкий разворот в своей стратегии внедрения ИИ, пишет The Register. Ранее немецкая компания утверждала об отсутствии планов внедрять «инновации», такие как ИИ, в системы on-premise, включая устаревшую ERP-платформу ECC, вызывав возмущение у некоторых пользователей. В июле 2023 года генеральный директор Кристиан Кляйн (Christian Klein) заявил, что «новейшие инновации и возможности» SAP будут предоставляться только в публичном или частном облаке с использованием RISE with SAP — программы переноса и трансформации, которую компания запустила совместно с партнёрами и облачными провайдерами в начале 2021 года. «Наши новые инновации не будут доступны для клиентов, использующих локальные или размещённые на локальных серверах ERP-системы крупных облачных провайдеров», — отметил он тогда. Но сейчас SAP утверждает обратное. На этой неделе на конференции SAP Sapphire Кляйн заявил, что «никакой путаницы нет». По его словам, новые технологии, такие как ИИ-агенты, созданные на платформе SAP Joule, будут доступны клиентам, использующим локальные решения, при условии, что они «зарегистрировались для перехода в облако», уточнил он. Кляйн добавил, что большинство ИИ-помощников и агентов Joule будут доступны on-premise в качестве временного решения в ECC и S/4HANA клиентов, которые уже вложили значительные силы в процесс миграции, чтобы они могли воспользоваться преимуществами ИИ во время модернизации. «Это абсолютно правильное решение, и я рад видеть, как клиенты воспользуются этой возможностью», — добавил он. Мухаммад Алам (Muhammad Alam), член исполнительного совета по продуктам и разработке, заявил на конференции, что SAP предоставит «значительную часть ИИ-помощников и агентов Joule для работы в гибридных средах с возможностью подключения к локальной среде S/4 и ECC». Он тоже отметил, что предложение будет доступно «клиентам, которые начали модернизацию на платформе RISE with SAP».
Источник изображения: SAP Новая возможность включена в пакет услуг под новым брендом Business AI Platform, сказал Алам: «Мы сделали это для того, чтобы вы могли начать получать выгоду от ИИ уже сегодня на платформе SAP Business AI Platform, пока вы модернизируете свою инфраструктуру». Опцией смогут воспользоваться только подписчики тарифного плана Max Success Plan. Согласно заявлению компании, этот план позволит клиентам ускорить активацию помощников и агентов, а также «внедрять ИИ, включая облачные и подходящие локальные системы, в удобном для них темпе по мере перехода в облако». Планируется, что предложение станет доступно уже в этом месяце.
13.05.2026 [00:40], Владимир Мироненко
Red Hat анонсировала интегрированную ИИ-платформу Red Hat AI 3.4Red Hat представила Red Hat AI 3.4, обновлённую версию корпоративной ИИ-платформы, разработанную для поддержки крупномасштабного инференса и развёртывания агентного ИИ в гибридных облачных средах. В качестве комплексной платформы Red Hat AI 3.4 предлагает архитектурную основу и операционные инструменты, необходимые для масштабирования моделей и рабочих процессов агентов в гибридном облаке. Стратегия Red Hat в области ИИ разделена на четыре ключевых направления, заявил Джо Фернандес (Joe Fernandes), вице-президент и генеральный директор Red Hat AI. «Во-первых, мы помогаем клиентам быстро, гибко и эффективно выполнять инференс, предоставляя модели в их среде, — передаёт SiliconANGLE. — Во-вторых, мы подключаем их корпоративные данные к этим моделям и агентам. В-третьих, мы помогаем им ускорить развёртывание и управление агентами в гибридной облачной среде. В-четвёртых, мы объединяем всё это на нашей интегрированной ИИ-платформе, позволяя им запускать любую модель в любом агенте на любом оборудовании и в любой облачной среде». Как отметила компания, ключевым элементом этого релиза является предоставление модели как услуги (MaaS), которое обеспечивает единый управляемый интерфейс для разработчиков, позволяющий получать доступ к тщательно отобранным моделям, а администраторам — отслеживать их использование и применять политики. Разработчики получают доступ к моделям через стандартные OpenAI-совместимые API. Таким образом, единое управление применяется как к внутренним, так и к внешним моделям. А инструменты AutoRAG и AutoML автоматизируют сложные задачи ИИ, начиная с выбора наиболее эффективных стратегий извлечения данных для конкретных наборов и заканчивая построением и оптимизацией моделей. В основе системы лежит открытая библиотека vLLM. Её дополняет Kubernetes-нативный стек для инференса llm-d. Поддержка спекулятивного декодирования, которая в этом релизе стала общедоступной, повышает скорость ответа в два-три раза с минимальным влиянием на его качество и снижает стоимость взаимодействия. Кроме того, vLLM теперь поддерживает работу на CPU, что актуально для небольших языковых моделей. Для управления инструментами для агентов Red Hat представляет каталог серверов MCP и связанный с ним шлюз MCP. Новый инструментарий AgentOps даёт возможность управления агентами в масштабе, независимо от используемой платформы, на протяжении всего их жизненного цикла. Это включает в себя интегрированную трассировку вызовов LLM, вызовов инструментов и этапов рассуждений, а также управление криптографической идентификацией через SPIFFE/SPIRE. Последний позволяет организациям заменять статические, жёстко закодированные ключи кратковременными токенами. Это поддерживает операции с минимальными привилегиями для автономных агентов на всех уровнях стека и помогает подтвердить, что действия агентов связаны с проверенной личностью. Для обеспечения интеграции корпоративных данных с моделями и агентами Red Hat AI 3.4 представляет управление с помощью промптов и центр оценки точности, качества и безопасности моделей и агентов. Последний не зависит от фреймворков и заменяет разрозненные методы тестирования единым интегрированным подходом. Prompt Lab and Registry, централизованное хранилище промптов в виде полноценных информационных ресурсов, предоставляет разработчикам и администраторам единый источник достоверной информации о входных данных, управляющих моделями и агентами.
Источник изображения: Red Hat Новые возможности трассировки построены на основе MLflow. Интеграция MLflow обеспечивает прозрачность работы агента, позволяя осуществлять сквозную трассировку вызовов LLM, этапов рассуждений, запуска инструментов, ответов модели и использования токенов через OpenTelemetry. Это создаёт прозрачный журнал аудита для всего жизненного цикла подсказок, эмбеддингов и конфигураций RAG для поддержки отладки и аудита. MLflow также обеспечивает интегрированное отслеживание экспериментов и управление артефактами для сценариев использования генеративного ИИ и прогнозного ИИ. Платформа Red Hat AI позволяет пользователям проверять безопасность моделей и агентов с помощью автоматизированного сканирования на наличие угроз, которое теперь интегрировано непосредственно в цикл разработки. Используются инструменты Chatterbox Labs и Garak. Платформа проверяет модели и агентных систем на наличие таких рисков как взлом, промпт-инъекций и предвзятость, в сочетании с NVIDIA NeMo Guardrails для обеспечения безопасности во время выполнения. Сообщается, что Red Hat AI 3.4 изначально поддерживает ускорители NVIDIA Blackwell и AMD Instinct MI325X. Расширяя эту унифицированную архитектуру платформы для работы непосредственно в управляемых облаках сторонних разработчиков, в том числе посредством Red Hat AI Inference в IBM Cloud, Red Hat обеспечивает операционную согласованность на широком спектре оборудования и облачных провайдеров.
12.05.2026 [16:33], Руслан Авдеев
Космический DevSecOps: Red Hat и Voyager Technologies успешно протестировали микро-ЦОД на борту МКС
linux
red hat
red hat enterprise linux
software
гибридное облако
ии
контейнеризация
космос
микро-цод
мкс
периферийные вычисления
Red Hat и Voyager Technologies объявили об успешном развёртывании в космическом микро-ЦОД LEOcloud Space Edge IaaS на борту МКС программных платформы RHEL Linux 10.1 и образа Red Hat Universal Base Image (UBI). Проект предназначен для развития орбитальных ЦОД и периферийных вычислений в космосе. Предлагаемое решение позволяет запускать контейнеризированные и связанные с ИИ нагрузки на орбите, ближе к источнику получаемых в космосе данных. Использование версии Red Hat Enterprise Linux на аппаратной площадке Space Edge Micro Datacenter позволяет снизить задержки и операционные издержки, в то же время обеспечивая более проактивную защиту периферийных сред, говорит компания. По словам Red Hat, космос стал «новым фронтиром» для гибридных облаков, на котором успех зависит от наличия надёжной, доверенной облачной инфраструктуры, где бы ни генерировались данные. Появление орбитальных ЦОД (ODC) требует открытых инноваций и чрезвычайно высокой отказоустойчивости. Взаимодействие компаний направлено на решение уникальных для космических сред проблем: оптимизацию работы систем при дефиците электроэнергии и аппаратных ресурсов, обработку данных при задержках и перебоях связи, предоставление Linux корпоративного уровня. Интеграция соответствующих задач с наземными DevSecOps-практиками даст возможность Red Hat и Voyager помочь различным организациям расширять свои гибридные облака с повышением стабильности и операционной надёжности.
Источник изображения: NASA/unsplash.com Сегодня компании закладывают основу для новой эры вычислений в космосе, где облачные возможности будут распространяться от земной поверхности к низким околоземным орбитам, на Луну и т.д. Соответствующий подход позволит переносить DevSecOps-практики, стратегии контейнеризации и проактивные механизмы безопасности в передовые операционные среды. Компании выделили несколько ключевых технологических особенностей платформы:
Voyager расширяет DevSecOps-практики в космос благодаря использованию «движка» для запуска контейнеров Podman и Ansible Automation Platform для автоматизации задач, с контейнеризированными приложениями, работающими от земли до орбиты и инструментами, оптимизированными с помощью ИИ. В сентябре 2025 года сообщалось, что прототип орбитального ЦОД Axiom Space и Red Hat для экспериментов с периферийными вычислениями прибыл на МКС, а в октябре того же года основатель Amazon Джефф Безос (Jeff Bezos) пророчил эпоху космических ЦОД гигаваттного масштаба. Этой весной SpaceX подала заявку на вывод в космос миллиона спутников-ЦОД, а у Amazon, раскритиковавшей инициативу. Похоже, имеются собственные планы на этот счёт.
12.05.2026 [10:25], Руслан Авдеев
Gartner: суверенное облако могут позволить себе только США и Китай, но не Европа
gartner
hardware
гибридное облако
евросоюз
импортозамещение
информационная безопасность
китай
конфиденциальность
облако
сша
По словам вице-президента Gartner Дугласа Тумбса (Douglas Toombs), создать полностью суверенное облако за пределами США или Китая не представляется возможным. Лишь они располагают необходимыми для этого технологиями, сообщает The Register. Соответствующее заявление Тумбс сделал на недавней конференции в Сиднее. В других странах заказчикам невозможно избежать взаимодействия с иностранными поставщиками. По мнению эксперта, хотя американские поставщики облачных решений предлагают продукты, якобы не подпадающие под действие законов за пределами избранных клиентами стран, в конечном итоге облака принадлежат американским корпорациям, а это значит, что уверенно гарантировать полный суверенитет данных невозможно. В своё время Microsoft уже признала, что защитить пользователей от американских законов она попросту не в силах. Gartner отмечает, что даже «локальные» облака вроде AWS Outposts/Dedicated Local Zone, Azure Local или выделенных облачных регионов Oracle периодически должны устанавливать связь с удалёнными серверами. Эксперт уверен, что попытки создавать суверенные облачные среды всё равно не увенчаются успехом. В пример приводятся европейские проекты Andromeda, Numergy и Gaia-X, которые позволили разве что подготовить несколько хороших научных докладов. Тумбс также сослался на «Правило трёх и четырёх», выведенное в недрах Boston Consulting Group. Оно предполагает, что на стабильном конкурентном рынке не может быть более трёх значимых игроков, при этом доля рынка крупнейшего из них не более чем вчетверо больше доли самого мелкого. По словам Тумбса, в соответствии с этим правилом рынок облачных вычислений «стабилизировался» вокруг «большой тройки»: AWS, Google и Microsoft. Впрочем, Тумбс допустил, что отдельные небольшие облачные платформы способны успешно развиваться, что позволит появиться суверенным поставщикам SaaS и соответствующих продуктов. Тем не менее, он считает, что даже решительные меры для перехода на локальные мощности не освободит их владельцев от зависимости от гиперскейлеров. В пример эксперт привёл медицинскую организацию из Нидерландов, уже попытавшуюся создать суверенную инфраструктуру — перебои в её работе начались после того, как поставщик «суверенного» решения (крупный облачный провайдер) сам столкнулся со сбоем в своём облаке. У европейских структур уже возникли опасения, что американские облачные провайдеры однажды способны покинуть европейскую экосистему, поставив клиентов перед необходимостью поспешной и рискованной миграции. В Gartner утверждают, что «усиление геополитической напряжённости» заставит клиентов гиперскейлеров пересмотреть свои стратегии, а пока немногие всерьёз задумываются о разработке стратегии выхода из чужих облаков, пользователи чрезвычайно привязаны к существующей системе. В Gartner отмечают, что отсутствие стратегии выхода из чужих облаков — одна из десяти крупных ошибок, допускаемых пользователями наряду с началом использования облаков с критически важным и сложным ПО вроде ERP. Кроме того, большой ошибкой будет предполагать, что облако подходит для любых приложений, и ожидать, что каждое приложение получит все преимущества облачной инфраструктуры — от снижения затрат до отказоустойчивости. Также подчёркивается, что глупо предполагать, что переход на мультиоблачную среду повысит надёжность доступа к сервисам. Для этого необходимо сначала решить сложную и дорогую задачу переносимости приложений между облаками. Подчёркивается, что мультиоблачные решения стоит использовать не для страховки от сбоев, а преимущественно для доступа к наиболее привлекательным функциям и сервисам каждого из них. На днях сообщалось, что Евросоюз рассматривает правовые нормы, ограничивающие обработку конфиденциальных данных ЕС американскими облачными провайдерами. В частности, Еврокомиссия должна представить пакет мер, укрепляющих стратегическую автономию блока государств в ключевых цифровых сферах. В апреле Еврокомиссия уже объявила тендер на €180 млн для реализации четырёх европейских проектов в сфере суверенных облачных вычислений. Тем не менее, пока американские гиперскейлеры годами доминируют на европейском облачном рынке. Более того, по оценкам аналитиков, особенно надеяться на изменение ситуации и не стоит.
14.07.2025 [22:41], Владимир Мироненко
Иран захотел создать госооблако по американским стандартам безопасностиОрганизация информационных технологий Ирана (ITOI), правительственный орган, ответственный за разработку и внедрение ИТ-сервисов, запустила официальный процесс оценки для отбора как минимум трёх поставщиков облачных услуг, способных обеспечить функционирование государственных сервисов по всей стране, передаёт The Register. По результатам оценки провайдерам будет выдан «сертификат рейтинга облачных услуг», что позволит их включить в список авторизованных поставщиков, которые могут претендовать на крупные государственные контракты Ирана. Интерес представляют провайдеры, способные предоставлять услуги IaaS, PaaS и SaaS, поддерживающие модели частного, публичного, гибридного или коллективного облака, а также специализирующиеся на безопасности, мониторинге, поддержке и миграции в облако. При оценке претендентов ITOI будет исходить из их соответствия международным стандартам ISO 27017 и ISO 27018, которые определяют механизмы контроля безопасности облачных вычислений и защиты персональной информации, а также стандартам облачных вычислений NIST SP 800-145, разработанным Национальным институтом стандартов и технологий США (NIST). Примечательно, что официальные учреждения Ирана, несмотря на вражду страны с США, придерживаются американских стандартов, отметил The Register. Ресурс считает, что подыскать подходящих кандидатов для укрепления ИТ-инфраструктуры страны будет непросто, поскольку многие страны из-за санкций США объявили запрет на ведение бизнеса с Ираном или ввели серьёзные ограничения. Иран уже ограничивает доступ в интернет, иногда целиком, а сейчас, по-видимому, решил ускорить реализацию своих проектов по цифровизации страны и развитию IT-инфраструктуры.
27.06.2025 [16:15], Владимир Мироненко
Инфраструктура в публичном облаке России ежегодно увеличивается почти на третьВ период с 2022 по 2024 год на российском рынке облачных сервисов среди наиболее динамично развивающихся сегментов рынка следует отметить инфраструктуру в публичном облаке (IaaS) со среднегодовым темпом роста (CAGR) в размере 29 %, сообщается в исследовании компании Apple Hills Digital проведенном по методологии IDC, которое было дополнено экспертным анализом от VK Tech. Особенно активно растёт спрос на услуги GPU-accelerated server — в среднем за год на 39,3 % — на фоне роста числа задач в области машинного обучения, обработки больших данных и аналитики. Как ожидается, подсегмент GPU-accelerated server сохранит высокие темпы и в дальнейшем — его CAGR в период с 2024 по 2029 год превысит 26 %. За это время российский рынок публичных IaaS увеличится более чем в 2,3 раза до 170,8 млрд руб. в 2029 году. Среднегодовой темп роста (CAGR) рынка за этот период составит 18,1 %. В исследовании проведён анализ рынка облачных сервисов как в публичном облаке, так и в гибридных моделях использования — в частных облаках (Private Cloud), которые могут быть развёрнуты у провайдера и заказчика (on-premise). В 2024 году объём потребления в частных облаках (Private Cloud и On-Premise Cloud) превысил 40 млрд руб., составив 12 % всего рынка облачных сервисов. Реагируя на спрос, ведущие российские провайдеры вывели на рынок решения для развёртывания облачных сервисов в закрытых средах, соответствующих требованиям к информационной безопасности и запросу регулятора. Сегмент PaaS в России развивается медленнее других сегментов. Его доля рынка публичных облачных сервисов в 2024 году составила лишь 9 % или 28,9 млрд руб., что более чем вдвое ниже доли PaaS на мировом рынке публичных облачных сервисов, которая, согласно данным IDC, составляет 20 %. Основная причина этого заключается в отсутствии полноценной замены многим иностранным платформенным продуктам, что ограничивает развитие сегмента и в целом замедляет эволюцию российского рынка облачных сервисов, хотя российские провайдеры уже предлагают отдельные ML-Ops решения. Согласно прогнозу аналитиков, с 2024 по 2029 год российский рынок публичных PaaS увеличится более чем в 3 раза до 89 млрд руб. в 2029 году. Среднегодовой темп роста (CAGR) за этот период составит 25,1 %. Исследователи отметили, что на объём российского рынка влияет распространение в России практики внутреннего потребления облачных сервисов, которое рассматривается отдельно от рыночного потребления. На долю внутреннего потребления в 2024 году пришлось около 12 % от общего потребления облачных сервисов в России или 47 млрд руб., на рыночное потребление — 88 % или 345,7 млрд руб. Общий объём потребления облачных сервисов в РФ включая сегменты IaaS, PaaS и SaaS составил 392,7 млрд руб. Внутреннее потребление развито в сегментах PaaS (до 30 %) и IaaS (25 %), что свидетельствует о высоком технологическом уровне и преимуществах в ресурсах крупных групп с собственными облачными платформами и цифровыми инфраструктурами. Apple Hills Digital отмечает, что российский рынок облачных сервисов находится под влиянием крупных финансовых и технологических групп, рост внутреннего потребления облачных сервисов в которых опережает темпы его развития. Также отмечается рост интереса к облачным сервисам в частных облаках провайдера и on-premise для повышения надёжности, безопасности и независимости ИТ инфраструктуры крупных заказчиков. VK Tech активно развивает VK Cloud в направлении платформенных сервисов, предлагая решения как публичного, так и частного облака. В 2024 году выручка её направления облачной платформы выросла на 82,3 % год к году до 5,8 млрд руб.
03.06.2025 [08:40], Владимир Мироненко
Broadcom: на рынке происходит «облачная перезагрузка» — доверие к частным облакам только растёт
broadcom
software
гибридное облако
ии
информационная безопасность
исследование
конфиденциальность
миграция
облако
частное облако
Облако остаётся основой для модернизации инфраструктуры и приложений, однако организации изменили свой подход к нему. Частное облако больше не является второстепенным решением. Предприятия пересматривают свои облачные стратегии, выбирая для рабочих нагрузок среду, которая наилучшим образом соответствует их требованиям, часто помещая частное облако в центр своей стратегии. В настоящее время на рынке происходит «облачная перезагрузка» — таков ключевой вывод исследования Private Cloud Outlook 2025, выполненного Illuminas по поручению Broadcom. В рамках исследования весной 2025 года были проведены глубинные интервью 1800 старших ИТ-руководителей компаний в Америке, Европе и Азиатско-Тихоокеанском регионе. Респонденты представляли различные секторы экономики, включая финансовые услуги, государственное управление, здравоохранение, страхование и фармацевтику. Более половины (53 %) участников опроса указали частное облако в качестве приоритетного при развёртывании новых рабочих нагрузок в течение следующих трёх лет, 69% рассматривают возможность возвращения рабочих нагрузок из публичного облака в частное, а треть уже сделала это. Это знаменует собой завершение эпохи, когда публичное облако было выбором по умолчанию, отметил ресурс StorageReview. Частное облако теперь также является стратегически равным для обработки облачных и ИИ-приложений, при этом 66% респондентов предпочитает запускать контейнерные и основанные на Kubernetes приложения в частном или гибридном облаках. 55% предпочитают частное облако для обучения, тюнинга и инференса ИИ-моделей. Безопасность и соответствие требованиям стали значимыми факторами при принятии решений в отношении выбора типа облака. Подавляющее большинство ИТ-руководителей (92 %) доверяют частному облаку в плане обеспечения требований к безопасности и соответствию законодательству, нормативным актам и т.д. При этом 66 % респондентов указали, что «очень» или «крайне» обеспокоены соответствием публичного облака различным требованиям, а безопасность назвали в качестве главного фактора возвращения нагрузок из публичного облака в частное. Использование генеративного ИИ также повлияло на изменение предпочтений в отношении облака. 49% респондентов назвали главными проблемами при внедрении генеративного ИИ проблемы конфиденциальности и безопасности данных. В результате частное облако теперь выбирают для рабочих нагрузок ИИ почти с той же частотой, что и публичное облако (55 % против 56 %). Предсказуемость затрат — еще один критический фактор при выборе в пользу частного облака. 90 % респондентов ценят финансовую прозрачность и предсказуемость, предлагаемые частным облаком. Напротив, 94 % сообщают о некотором уровне расточительства в расходах на публичное облако, причем почти половина (49 %) считает, что более 25 % их расходов на публичное облако тратятся впустую. Это создаёт значительные возможности для оптимизации и контроля затрат в средах частного облака, отмечено в исследовании. Реальный опыт использования публичного облака, быстрый рост рабочих нагрузок генеративного ИИ и растущие требования к безопасности, соответствию и предсказуемости затрат являются движущими силами «облачной перезагрузки», говорится в исследовании. Стоит отметить, что Broadcom кровно заинтересована в развитии VMware и частных облаков, поскольку изменение лицензионной политики уже запустило процессы девиртуализации и ревиртуализации. Чтобы в полной мере воспользоваться преимуществами частного облака, организациям необходимо решить две ключевые проблемы: преодолеть разрозненность ИТ-команд и сохраняющийся разрыв в навыках. Разрозненность ИТ-команд представляет наибольшую проблему для внедрения частного облака, считает 33 % респондентов, а 30 % назвали существенным препятствием отсутствие внутренних навыков/опыта. Согласно опросу, 81 % компаний теперь выстраивают свои структуры вокруг платформенной команды, а не технологических разрозненных команд. Это позволяет сосредоточиться на повышении квалификации персонала, чтобы устранить разрыв в навыках и снизить зависимость от профессиональных сервисов.
21.05.2025 [10:39], Владимир Мироненко
GPU-маркетплейс NVIDIA DGX Cloud Lepton упростит доступ к дефицитным ИИ-ускорителямNVIDIA анонсировала GPU-маркетплейс NVIDIA DGX Cloud Lepton, которая позволит разработчикам со всего мира, создающим агентские и другие ИИ-приложения использовать NVIDIA Blackwell и другие модели ускорителей в глобальной сети партнёрских облаков (NCP): CoreWeave, Crusoe, Firmus, Foxconn, GMI Cloud, Lambda, Nebius, Nscale, Softbank и Yotta Data Services. Ожидается, что ведущие провайдеры облачных услуг и другие GPU-маркетплейсы также присоединятся к DGX Cloud Lepton. Разработчики смогут использовать вычислительные мощности ускорителй в определённых регионах как для вычислений по требованию, так и на постоянной основе. «NVIDIA DGX Cloud Lepton свяжет нашу сеть глобальных поставщиков облачных GPU с разработчиками в сфере ИИ, — заявил основатель и генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang). — Вместе с нашими NCP мы строим ИИ-фабрику планетарного масштаба». По замыслу NVIDIA, платформа DGX Cloud Lepton поможет решить критическую задачу обеспечения разработчиков надёжными, высокопроизводительными ресурсами ускорителей путём унификации доступа к облачным ИИ-сервисам и мощностям собственных ускорителей. Платформа интегрирована с программным стеком NVIDIA, включая микросервисы NIM и NeMo, Blueprints и Cloud Functions. В числе основных преимуществ новой платформы компания назвала:
А для самих провайдеров, участвующих в DGX Cloud Lepton, предоставляется ПО для управления, которое обеспечивает диагностику состояния ускорителей в реальном времени и автоматизирует анализ первопричин возникших проблем, избавляя от ручной диагностики и сокращая время простоев. NVIDIA также анонсировала инициативу Exemplar Clouds, предназначенную для стандартизации прозрачного сравнительного анализа облачной ИИ-инфраструктуры. Это предложение должно решить серьёзную проблему, с которой сталкиваются разработчики и предприятия, развёртывающие рабочие ИИ-нагрузки — прогнозирование эффективности, надёжности и ценовой эффективности облачной платформы. Exemplar Clouds использует NVIDIA DGX Cloud Benchmarking, комплексный набор инструментов и рекомендаций для оптимизации производительности облачных ИИ-нагрузок и количественной оценки связи между стоимостью и производительностью.
19.05.2025 [14:48], Владимир Мироненко
HPE предложила клиентам VMware новые решения с Morpheus VM EssentialsКомпания Hewlett Packard Enterprise (HPE) объявила о новых предложениях, направленных на упрощение модернизации гибридных ИТ-решений, а также повышение киберустойчивости, доступности данных и энергоэффективности для клиентов, использующих хранилища. В августе прошлого года HPE завершила приобретение создателя облачной платформы управления Morpheus Data, который поставлял ПО, используемое в подписных предложениях HPE GreenLake. Компания объединила функции Morpheus со своим собственным предложением виртуализации на основе KVM для создания VM Essentials в стремлении привлечь клиентов VMware, недовольных политикой Broadcom. Решение может работать автономно или на собственных системах HPE и позволяет управлять не только виртуальными машинами HPE, но и традиционными (VMware) ВМ.
Источник изображений: HPE Следующим шагом стало объявление об интеграции HPE Morpheus VM Essentials с HPE Private Cloud Business Edition, что позволяет снизить до 90 % стоимость лицензий на ВМ с поддержкой нескольких гипервизоров и самостоятельным потреблением облачных ресурсов. Эта экономия добавляется к предполагаемому снижению совокупной стоимости владения (TCO) в 2,5 раза, обеспечиваемому дезагрегированной гиперконвергентной инфраструктурой (dHCI). HPE Private Cloud Business Edition, доступная в формате dHCI или HCI, предоставляет организациям гибкость в выборе оптимальной архитектуры для рабочих нагрузок ВМ как на периферии, так и в ЦОД, говорит HPE. Семейство ПО HPE Morpheus, включающее решения HPE Morpheus VM Essentials для виртуализированных рабочих нагрузок и HPE Morpheus Enterprise Software для унифицированного управления облаками, теперь находится в открытом доступе. Обе версии включают гипервизор HVM от HPE и лицензируются по сокетам для снижения совокупной стоимости владения. Клиенты VM Essentials также смогут перейти на полную версию HPE Morpheus Enterprise. Как сообщает компания, решение VM Essentials разработано для глобального развёртывания и поддерживается комплексными корпоративными службами, охватывающими всё, от инфраструктуры до рабочих нагрузок. При этом используется ИИ на всех этапах — от настройки до эксплуатации. С его помощью HPE автоматизирует настройку инфраструктуры и управление жизненным циклом платформы Business Edition. Возможности AIOps позволяют прогнозировать и предотвращать до 86 % операционных проблем, высвобождая ИТ-ресурсы, а также повышая производительность и надежность. Ресурс Blocks & Files отметил, что софт Morpheus Enterprise позволяет ИТ-отделу клиента стать внутренним поставщиком ИТ-услуг. Он имеет графический интерфейс и API, поддерживает подход инфраструктура-как-код или подключаемые модули ITSM, и позволяет управлять как собственными средами KVM и Kubernetes HPE, так и другими приложениями на физическом, локальном и публичном облачных ресурсах. Продукт не зависит от гипервизора, оборудования и облака и интегрируется с окружающими наборами инструментов, такими как ServiceNow, DNS, системами резервного копирования и инструментами оркестрации задач для сквозного управления зависимостями приложений (end-to-end). HPE утверждает, что он ускоряет подготовку нагрузок до 150 раз, сокращает расходы на облако до 30 % и снижает риски за счёт детального управления доступом на основе ролей (RBAC). Commvault станет первым партнером экосистемы VM Essentials, который будет поддерживать резервное копирование и восстановление виртуальных машин на основе образов с предстоящим релизом в мае. Morpheus Enterprise и VM Essentials недавно были протестированы для работы на серверах Dell PowerEdge и массивах NetApp AFF, а также на серверах HPE ProLiant Compute Gen11 и Gen12. По данным HPE, комбинация VM Essentials и HPE Aruba Networking CX 10000 снижает совокупную стоимость владения до 48 %, увеличивает производительность до 10 раз, обеспечивает микросегментацию, ускорение благодаря DPU и повышенную безопасность. VM Essentials также обеспечивает простое, детализированное управление хранилищем HPE Alletra Storage MP B10000. HPE Advisory and Professional Services также теперь предлагает услуги модернизации виртуализации с аналитикой затрат, инструментами миграции, схемами оркестрации и интеграцией конвейера DevOps. HPE Services предоставляет специализированную оценку, комплексный процесс для создания надёжных зон посадки, а также услуги по перенастройке рабочих нагрузок, модернизации инфраструктуры, миграции данных, обучению членов команды и управлению инфраструктурой для снижения накладных расходов. ПО Morpheus Enterprise уже доступно как отдельное ПО и в составе HPE Private Cloud Business Edition с Morpheus VM Essentials. Новые системы Business Edition с HPE SimpliVity будут доступны в III квартале. Интеграция ПО Morpheus для Alletra Storage MP B10000 доступна уже сейчас, для HPE Aruba Networking CX 10000 — в июне.
13.04.2025 [23:54], Владимир Мироненко
ИИ-агенты под присмотром: Google Distributed Cloud заработает на on-premise платформах NVIDIA Blackwell DGX/HGX
b200
dgx
google cloud platform
hardware
hgx
nvidia
гибридное облако
ии
ии-агент
инференс
конфиденциальность
облако
частное облако
NVIDIA объявила о стратегическом партнёрстве с Google Cloud с целью внедрения агентного ИИ на предприятиях, которые хотели бы локально использовать семейство моделей Google Gemini с помощью платформ NVIDIA Blackwell HGX/DGX, а также функции NVIDIA Confidential Computing для повышения безопасности данных. Интеграция платформы NVIDIA Blackwell с портфелем программно-аппаратных решений Google Distributed Cloud позволяет локальным ЦОД соответствовать нормативным требованиям и законам о суверенитете данных, блокируя доступ к конфиденциальной информации, включая истории болезни пациентов, финансовые транзакции и секретную правительственную информацию. NVIDIA Confidential Computing защищает конфиденциальный код в моделях Gemini от несанкционированного доступа и утечек данных — запросы пользователя к API Gemini, а также данные, которые они использовали для тонкой настройки, остаются в безопасности и защищены от несанкционированного доступа или изменений. Сачин Гупта (Sachin Gupta), вице-президент и генеральный менеджер по инфраструктуре и решениям в Google Cloud, отметил, что партнёрство позволяет предприятиям в полной мере использовать весь потенциал агентного ИИ, внедряя модели Gemini в локальные системы, и объединяя производительность NVIDIA Blackwell и возможности конфиденциальных вычислений. Хотя многие уже могут использовать модели с мультимодальным рассуждением — интегрируя текст, изображения, код и другие типы данных для решения сложных проблем и создания облачных приложений агентного ИИ, предприятия с повышенными требованиями к безопасности или суверенитету данных столкнулись с трудностями при внедрении этих технологий. Данное партнёрство позволит решить эти проблемы, благодаря чему Google Cloud становится одним из первых поставщиков, предлагающих возможности конфиденциальных вычислений для защиты рабочих нагрузок ИИ-агентов в любой среде, как облачной, так и гибридной. Масштабирование агентного ИИ требует надёжного мониторинга и безопасности для обеспечения стабильной производительности и соответствия требованиям. Google Cloud представила новый шлюз GKE Inference Gateway, созданный для оптимизации развёртывания рабочих нагрузок ИИ-агентов с расширенной маршрутизацией и масштабируемостью. Интеграция с NVIDIA Triton Inference Server и NVIDIA NeMo Guardrails обеспечивает интеллектуальную балансировку нагрузки, которая повышает производительность и снижает затраты на обслуживание, также обеспечивая централизованную безопасность и управление моделями. В дальнейшем Google Cloud планирует улучшить отслеживания рабочих нагрузок агентского ИИ, интегрировав NVIDIA Dynamo, библиотеку с открытым исходным кодом, предназначенную для обслуживания и масштабирования рассуждающих моделей. Этот перспективный подход гарантирует, что предприятия смогут уверенно масштабировать свои приложения агентского ИИ, сохраняя при этом безопасность и соответствие требованиям. |
|
