Материалы по тегу: bare metal
|
11.12.2025 [22:26], Андрей Крупин
«Рег.ру» вывел на рынок приватного ИИ-ассистента для работы с конфиденциальными даннымиРаботающая на рынке хостинга, доменов и облачных решений компания «Рег.ру» сообщила о доступности клиентам приватного ИИ-ассистента, реализованного по модели HaaS (Hardware as a Service). Новый продукт призван закрыть потребность бизнеса в использовании генеративного ИИ там, где развёртывание в публичном облаке невозможно из-за нормативных требований или внутренних политик безопасности. В отличие от облачной версии, где ресурсы выделяются из общего пула, приватный ИИ-ассистент функционирует в полностью изолированном контуре. «Рег.ру» берет на себя техническую поддержку инфраструктуры с широким ассортиментом предустанавливаемых open-source ИИ-моделей. Донастройку и интеграцию решения под конкретные бизнес-задачи организации могут выполнять самостоятельно или с привлечением партнёров-интеграторов.
Источник изображения: Steve Johnson / unsplash.com Решение поставляется в виде серверных машин с ускорителями NVIDIA (включая решения H100 и H200 с 80 и 141 Гбайт памяти соответственно, а также карты серий A100, L40S и A6000), на которых размещается образ на базе платформы Ollama с предустановленными ИИ-моделями и веб-интерфейсом. Серверы поддерживают установку до 8 GPU, комплектуются производительными CPU, оперативной памятью до 4 Тбайт и NVMe-накопителями. Архитектура сервиса позволяет проводить аттестацию для соответствия строгим стандартам, включая ФЗ-152 «О персональных данных» и требования ФСТЭК России.
07.11.2025 [12:16], Владимир Мироненко
Google представила инстансы N4A и C4A Metal на базе фирменных Arm-процессоров AxionGoogle представила новые инстансы на базе фирменных Arm-процессоров Axion: N4A и C4A Metal. N4A — самая экономичная виртуальная машина серии N на сегодняшний день, которая уже доступна в тестовом режиме (Preview Mode). N4A предлагает до двух раз лучшее соотношение цены и производительности, чем сопоставимые виртуальные машины текущего поколения на базе x86. N4A доступен в готовых и настраиваемых конфигурациях: до 64 vCPU, 512 Гбайт DDR5 и сетевым подключением 50 Гбит/с. N4A предлагается в конфигурациях с высокой производительностью процессора (2 Гбайт RAM на vCPU), стандартной (4 Гбайт на vCPU) и с высокой производительностью памяти (8 Гбайт на vCPU). Виртуальные машины N4A поддерживают новейшие решения для хранения данных Hyperdisk, включая Hyperdisk Balanced, Hyperdisk Throughput и Hyperdisk ML (будет доступно позже), обеспечивая до 160 тыс. IOPS и пропускную способность 2,4 Гбайт/с на инстанс. N4A демонстрирует высокие результаты в ряде отраслевых бенчмарков, отражающих ключевые рабочие нагрузки. Например, по сравнению с аналогичными x86-инстансами текущего поколения N4A обеспечивает до 105 % лучшее соотношение цены и производительности для вычислительных нагрузок, до 90 % — для масштабируемых веб-серверов, до 85 % — для Java-приложений и до 20 % — для баз данных общего назначения. N4A доступен в виде превью для Compute Engine, Google Kubernetes Engine (GKE), Dataproc и Batch, а поддержка Dataflow и других сервисов появится в ближайшее время. C4A Metal — первый инстанс Google на базе Arm-архитектуры на bare metal-серверах. Он включает до 96 vCPU, до 768 Гбайт DDR5, сетевое подключение со скоростью до 100 Гбит/с и полную поддержку Google Cloud Hyperdisk, включая варианты хранения Hyperdisk Balanced, Extreme, Throughput и блочный доступ. Этот инстанс оптимизирован для специализированных рабочих нагрузок, таких как гипервизоры и разработка нативных приложений для Arm-архитектуры. Как облачное решение, C4A Metal обеспечивает снижение совокупной стоимости владения (TCO), предлагая предсказуемые эксплуатационные расходы. Компания отметила, что, запуская конвейеры разработки и тестирования на физических экземплярах процессоров Axion с использованием C4A Metal, разработчики Android могут получить выгоду от нативной производительности, устраняя накладные расходы на управление эмуляцией, такие как медленные уровни трансляции инструкций. Кроме того, они могут значительно сократить задержки для инструментов сборки Android и автоматизированных систем тестирования, что приведёт к ускорению циклов обратной связи. C4A Metal также решает проблемы производительности, связанные с вложенной виртуализацией, что делает его отличной платформой для масштабируемых сред Cuttlefish (Cloud Android). После сегодняшнего анонса портфолио инстансов на базе процессоров Axion теперь включает три варианта: N4A, C4A и C4A Metal. Вместе серии C и N позволяют снизить общие расходы на ведение бизнеса без ущерба для производительности или требований к конкретной рабочей нагрузке, отметила компания. «Независимо от того, используете ли вы Ironwood и Axion вместе или комбинируете их с другими вычислительными решениями, доступными на базе AI Hypercomputer, этот системный подход обеспечивает вам максимальную гибкость и производительность для самых требовательных рабочих нагрузок», — заявила Google.
13.09.2025 [14:01], Сергей Карасёв
Облачные Mac'и с Nitro: AWS запустила инстансы EC2 M4 Mac и M4 Pro MacОблачная платформа AWS анонсировала инстансы EC2 M4 Mac и EC2 M4 Pro Mac на основе компьютеров небольшого форм-фактора Apple Mac Mini с фирменными процессорами семейства M4. Новые экземпляры приходят на смену EC2 M2 Mac, которые были доступны с сентября 2023 года. Инстансы EC2 M4 Mac базируются на модификации Mac Mini с процессором M4. Этот чип объединяет 10 ядер CPU (четыре производительных и шесть энергоэффективных), 10 ядер GPU и 16-ядерный движок Neural Engine. Объём унифицированной памяти составляет 24 Гбайт, а её пропускная способность достигает 120 Гбайт/с. Утверждается, что на задачах сборки приложений экземпляры EC2 M4 Mac обеспечивают на 20 % более высокую производительность по сравнению с EC2 M2 Mac. В свою очередь, инстансы EC2 M4 Pro Mac используют мини-компьютеры Mac Mini с процессором M4 Pro, который содержит 12 ядер CPU (восемь производительных и четыре энергоэффективных), 16 ядер GPU и 16-ядерный движок Neural Engine. В оснащение входят 48 Гбайт унифицированной памяти с пропускной способностью до 273 Гбайт/с. По сравнению с EC2 M2 Pro Mac быстродействие на операциях сборки приложений увеличилось на 15 %.
Источник изображения: Apple Инстансы EC2 M4 Mac и EC2 M4 Pro Mac предполагают наличие локального хранилища вместимостью 2 Тбайт. Применяется система AWS Nitro, которая переносит функции виртуализации, хранения и сетевые операции на выделенное оборудование и ПО для повышения производительности и улучшения безопасности. Благодаря подключению посредством интерфейса Thunderbolt обеспечивается пропускная способность VPC (Virtual Private Cloud) до 10 Гбит/ с и пропускная способность EBS (Elastic Block Store) до 8 Гбит/с. Новые экземпляры совместимы с macOS Sonoma 15.6 и выше. Говорится о простоте интеграции с другими сервисами AWS. Инстансы EC2 M4 Mac и EC2 M4 Pro Mac уже доступны в регионах US East (Северная Вирджиния) и US West (Орегон), а в перспективе география охвата будет расширяться.
11.09.2025 [18:04], Сергей Карасёв
В облаке Astra Cloud появились выделенные серверы с процессорами Baikal-SОблачный провайдер «Астра Облако» (Astra Cloud), входящий в «Группу Астра», и российский производитель микроэлектроники «Байкал Электроникс» объявили о запуске сервиса аренды выделенных серверов, оснащённых отечественными процессорами Baikal-S. Предложение ориентировано в том числе на объекты критической информационной инфраструктуры (КИИ). Чипы Baikal-S (BE-S1000) содержат 48 ядер Arm Cortex-A75, поддерживают память DDR4-3200 МГц (6 каналов, до 128 Гбайт на канал), имеют 80 линий PCIe 4.0 и два интерфейса 1GbE. Заявленное энергопотребление находится на уровне 120 Вт. Серверы расположены в московском дата-центре с надёжностью Tier IV, что гарантирует максимальную отказоустойчивость инфраструктуры. На таких объектах дублируются и основные, и дополнительные системы, а показатель доступности достигает 99,995 %. Время простоя не превышает 26 минут в год. Сервис аренды серверов на базе Baikal-S ориентирован на заказчиков, которым необходимо отладить и адаптировать своё ПО под отечественную архитектуру. Помимо предприятий КИИ, это могут быть государственные организации, корпоративные заказчики и пр. Благодаря арендной модели аппаратные ресурсы полностью закрепляются за клиентом. Это, как утверждается, обеспечивает предсказуемую производительность приложений и высокий уровень защиты данных. Среди других преимуществ нового сервиса названы возможность формирования частных облаков и отказоустойчивых кластеров, гибкость в настройке систем под индивидуальные потребности, отсутствие капитальных затрат на покупку и обслуживание оборудования, технологическая независимость от зарубежных платформ. «Запуск аренды выделенных серверов на процессорах Baikal-S — это важный шаг в развитии отечественной IT-сферы. Мы даём бизнесу и государственным структурам доступ к надёжной, предсказуемой и безопасной платформе для построения частных облаков и работы с критичными нагрузками», — говорит технический директор «Группы Астра».
03.07.2025 [18:56], Андрей Крупин
«Рег.ру» начал предлагать в аренду серверное оборудование по модели HaaSРаботающая на рынке хостинга, доменов и облачных решений компания «Рег.ру» сообщила о доступности клиентам нового типа аренды серверов по модели HaaS (Hardware as a Service). Модель HaaS подразумевает размещение оборудования на территории заказчика, как в центре обработки данных, так и в офисе организации. В формате подписки можно арендовать серверы, системы хранения данных и сетевое оборудование. Доступно масштабирование мощностей по мере необходимости. Кроме того, серверы, размещённые на разных площадках, можно объединить в единую сеть в виде частного облака, распределённого на несколько локаций. Специалистами «Рег.ру» осуществляется монтаж оборудования, настройка техники и соответствующих служб, а также круглосуточная техническая поддержка.
Источник изображения: Thomas Jensen / unsplash.com «Мы видим растущий спрос на гибкие модели облачных и аппаратных решений и понимаем, что современный бизнес требует не только технологических сервисов, но и гибкости в их использовании. HaaS разработан именно с учётом этих требований, и запуск новой услуги — важный шаг в развитии гибридного облака в продуктовом портфеле «Рег.ру». Благодаря новому сервису компании смогут сосредоточиться на своём основном бизнесе, поручив нам обслуживание IT-инфраструктуры», — комментирует Сергей Белов, руководитель департамента корпоративных продуктов «Рег.ру». Новая услуга может быть актуальна для стартапов, малого и среднего бизнеса, а также для предприятий с сезонными или изменяющимися нагрузками на IT-ресурсы.
26.06.2025 [18:07], Андрей Крупин
VK Tech открыл доступ к сервису Bare Metal в дата-центрах VKРазработчик корпоративного программного обеспечения VK Tech (входит в экосистему VK) запустил Bare Metal — сервис предоставления физических серверов в центрах обработки данных VK. Решение нативно интегрировано с облачной инфраструктурой VK Cloud и позволяет заказчикам размещать высоконагруженные сервисы на физических серверах с полным контролем над вычислительными ресурсами и управлением через интерфейс облака. Серверное оборудование Bare Metal размещено в дата-центрах Московского региона, отвечающих уровню надёжности Tier IV, требованиям 152‑ФЗ, стандартам ISO и PCI DSS, соответствие которым гарантирует безопасность обрабатываемых персональных и банковских данных.
Источник изображения: Thomas Jensen / unsplash.com Сервис Bare Metal может быть востребован организациями, которым необходима мощная инфраструктура для работы с высоконагруженными приложениями, корпоративными ERP/CRM-системами, аналитическими и транзакционными операциями. Также мощности Bare Metal могут быть использованы для аналитики больших данных и решения задач с использованием технологий машинного обучения и искусственного интеллекта на базе нейронных сетей. Для этого в составе сервиса представлены серверные конфигурации с новым поколением графических ускорителей GPU, которые, как утверждается, ускоряют обучение больших языковых моделей на 15–320 % и инференс на 100–570 % по сравнению с Nvidia H100 и A100 в зависимости от используемых видеокарт и сценариев использования. Интеграция с VK Cloud позволяет выстроить масштабируемую и отказоустойчивую инфраструктуру.
12.05.2025 [17:27], Владимир Мироненко
Облако.ру предлагает ИИ-системы, которые позволят запускать даже мощные ИИ-моделиВедущий российский поставщик решений для облачной инфраструктуры Облако.ру предлагает различные специализированные интегрированные решения для обработки ресурсоёмких нагрузок, включая обучение и запуск ИИ-моделей. GPU-серверы, доступные в Облако.ру, отлично справляются со сложными задачами с использованием больших объёмов данных и вычислений. Использование услуг по аренде вычислительных мощностей позволяет избежать существенных капитальных затрат. Главное отличие GPU от CPU заключается в его способности параллельно выполнять множество операций, распределяя задачи между своими ядрами, что предоставляет ему возможность выполнения громадных объёмов вычислений, лежащих в основе ИИ, в гораздо более короткие сроки и обеспечивает значительное преимущество в таких областях, как обработка изображений и видео, научное моделирование, машинное обучение, где используются большие наборы данных и сложные алгоритмы. Изначально созданные для обработки изображений GPU стали крайне важными для ИИ-индустрии, позволяя обучать и развёртывать продвинутые ИИ модели, обеспечивающие широкие возможности в сфере ИИ — от распознавания изображений до обработки естественного языка. Благодаря ускорению процессов обучения и инференса использование серверных GPU позволяет разрабатывать и развёртывать модели ИИ быстрее и эффективнее, чего невозможно добиться, используя только классические CPU. А по мере роста сложности ИИ-моделей потребность в GPU будет только расти. Так, для локального запуска компактной версии популярной ИИ-модели DeepSeek R1 8B, разработанной посредством дистилляции нейросеть Llama 3.2 и демонстрирующей высокую эффективность в задачах текстовой генерации, обработки естественного языка, создания программного кода и анализа данных, потребуется система с 4 Гбайт VRAM (видеопамяти) для инференса с низкой и целочисленной точностью вычислений (FP8/INT8), 8 Гбайт VRAM для инференса с половинной точностью (FP16) и 16 Гбайт VRAM для инференса с полной точностью (FP32). Точность вычислений влияет на качество и скорость ответов ИИ-модели. Если же использовать DeepSeek R1 8B в качестве основы для собственных моделей, ориентированных на конкретные бизнес-задачи, то при обучении с низкой и целочисленной точностью (FP8/INT8) потребуется система с 8 Гбайт VRAM, при обучении с половинной точностью (FP16) — с 16 Гбайт VRAM, а и при обучении с полной точностью (FP32) — с 32 Гбайт VRAM. С увеличением количества параметров модели, определяющих её «эрудицию» и знания о мире или предметной области, одновременно растут и требования к доступной памяти и вычислительной мощности GPU. Кроме того, т.н. размышляющие модели, к которым относится и семейство DeepSeek R1, тем лучше и оперативнее отвечают на запросы, чем больше им доступно ресурсов. Предлагаемые Облако.ру системы позволяют запускать не только базовые модели уровня DeepSeek R1 8B, которым требуется 8–12 Гбайт VRAM, но и более мощные ИИ-модели, такие как DeepSeek R1 14B, которая подходит для большинства профессиональных рабочих процессов. DeepSeek R1 14B, содержащая 14 млрд параметров и созданая с помощью метода дистилляции модели Qwen 2.5, предназначена для решения сложных задач, требующих высокой точности и производительности, таких, как написание сложных текстов, анализ больших объёмов данных, написание кода уровня Senior и т.д. Для инференса с использованием DeepSeek R1 14B с низкой и целочисленной точностью (FP8/INT8) потребуется система с 7 Гбайт VRAM, с полной точностью (FP32) — с 28 Гбайт VRAM. Для обучения с низкой и целочисленной точностью (FP8/INT8) требуется система с 14 Гбайт VRAM, с половинной точностью (FP16) — с 28 Гбайт VRAM, с полной точностью (FP32) — с 56 Гбайт VRAM. Облако.ру предлагает различные системы с серверными GPU, которые способны удовлетворить нужды практически любого заказчика. Доступны системы с самыми простыми ускорителями NVIDIA T4, с ускорителями среднего класса 3 × RTX6000 (суммарно 72 Гбайт) и с ускорителями топового уровня. К последним относятся конфигурации сразу с восемью PCIe-ускорителями с суммарным объёмом памяти 640 Гбайт, 1 Тбайт системной памяти и парой 24-ядерных AMD EPYC 9224. А для самых требовательных заказчиков предлагается платформа с восемью ускорителями, объединёнными быстрой шиной (900 Гбайт/с) и 1128 Гбайт VRAM, которые работают как единое целое. Компанию им составляют два 48-ядерных Intel Xeon Platinum 8558 и 2 Тбайт RAM. При этом во всех случаях речь идёт именно о физических серверах, что гарантирует полную доступность всех вычислительных ресурсов.
08.04.2025 [15:42], Руслан Авдеев
В Yandex Cloud появились серверы Bare MetalВ Yandex Cloud стал доступен сервис аренды выделенных физических серверов Yandex BareMetal. Посредством Cloud Interconnect их можно интегрировать с другими облачными сервисами и инфраструктурами, формируя единую вычислительную среду. Как сообщает пресс-служба компании, «в публичном превью с сервисом можно работать по API» — это упростит интеграцию Yandex BareMetal с бизнес-приложениями «Яндекса». Дополнительно сообщается, что права доступа к серверу можно гранулярно распределять между сотрудниками. По словам представителя Yandex Cloud, у компании большая команда инженеров, годами поддерживающих серверную инфраструктуру. Этот опыт «инвестирован» в Yandex BareMetal, поэтому компании могут полностью доверить обслуживание железа провайдеру, сосредоточившись на развитии IT-продуктов. Кроме того, для Yandex BareMetal доступны облачные инструменты резервного копирования, миграции данных и мониторинга. По статистике Yandex Cloud, 59 % компаний из России начали пользоваться сервисами BareMetal лишь в последние полтора года. Причина в том, что в этот период у бизнеса стало меньше ресурсов и возможностей для самостоятельной закупки оборудования и его обслуживания. Кроме того, вырос спрос на инфраструктуру для развития ИИ. Наиболее распространённый сценарий применения BareMetal — для хранения и обработки данных. 70 % респондентов используют арендуемую инфраструктуру именно для этого, 66 % применяют выделенные серверы для собственных развёртываний OpenStack или VMware, 47 % — для хостинга бизнес-приложений и 44 % — для задач бэкофиса. В любом случае респонденты отмечали значимость возможной интеграции BareMetal с технологиями защиты от DDoS-атак (59%), резервного копирования (48 %) и 46 % — интеграции с т.н. «облачным роутером» — сетью между выделенными серверами и облаками провайдера. В марте «Яндекс» впервыеотчиталась о результатах работы Yandex B2B Tech. Выручка Yandex Cloud увеличилась год к году в 1,5 раза, составив 19,8 млрд руб. 51 % суммы принесли контракты с крупными компаниями. Количество клиентов Yandex Cloud увеличилось год к году в 1,5 раза до 44 тыс., количество партнёров-интеграторов выросло в 1,3 раза — до 674.
29.11.2024 [10:22], Владимир Мироненко
«РТК-ЦОД» запустил в работу обновленный сервис BareMetal 2.0 с ускорителями NVIDIAСервис-провайдер «РТК-ЦОД» (дочерняя компания «Ростелекома», предоставляющая услуги дата-центров и облачные услуги) объявил о запуске обновлённого сервиса BareMetal 2.0 с GPU-ускорителями. Как сообщает «РТК-ЦОД», сервис BareMetal 2.0 обеспечивает максимально эффективное использование вычислительных ресурсов, в том числе, с помощью интеграции физических серверов в единую сеть с виртуальной облачной инфраструктурой. Это дает возможность выстраивать гибридные IaaS-решения для повышения производительности и масштабируемости. По словам компании, обновлённый сервис идеально подходит для задач, требующих максимальной производительности: от анализа данных и машинного обучения до научных исследований и обработки графики. Согласно пресс-релизу, работу BareMetal 2.0 обеспечивают выделенные серверы без виртуализации, предоставляемые в составе «Публичного облака». Доступные конфигурации включают процессоры с частотой 2,6 и 3,0 ГГц, поддержку до 48 ядер и объём оперативной памяти до 1024 Гбайт с возможностью использования высокоскоростных сетевых SSD для хранения данных. В обновлённом сервисе для работы с графикой, 3D-моделированием, рендерингом, интенсивными вычислительными задачами можно выбрать сервер с ускорителями NVIDIA L4 (24 Гбайт), RTX A6000 (48 Гбайт) или A100 (80 Гбайт). Клиентам доступен выделенный менеджер и команда архитекторов, которые помогут адаптировать решение под индивидуальные задачи. BareMetal 2.0 и другие облачные сервисы РТК-ЦОД можно самостоятельно настроить через единый портал, а также использовать инструменты для удалённого управления.
25.10.2024 [19:02], Владимир Мироненко
В Cloud.ru появилась аренда bare metal серверовОблачный провайдер Cloud.ru сообщил о запуске сервиса Evolution Bare Metal, с помощью которого пользователь может получить выделенный сервер из личного кабинета без обращения за помощью к службе техподдержки. Сервис позволит арендовать выделенные серверы для систем, которым требуется доступ к аппаратной части. Evolution Bare Metal интегрирован с кроссплатформенными сервисами Cloud.ru. Пользователь может выбрать нужную из готовых конфигураций для разных типов задач, различающихся типом процессоров, объёмом памяти и характеристиками дисков. После заказа клиент получает доступ к серверу менее, чем за минуту без учёта времени на установку операционной системы. Для управления сервером доступны VNC и API. Сценарии использования сервиса Evolution Bare Metal:
Как указано в пресс-релизе, Evolution Bare Metal позволит использовать выделенные физические серверы с облачной инфраструктурой, гибкой конфигурацией и удобным управлением для аналитических задач, работы с высоконагруженными корпоративными приложениями и базами данных в цифровом банкинге, финтехе, e-commerce, онлайн-стриминге. Впрочем, пока что на выбор предлагаются всего пять конфигураций готовых серверов серии Light на базе 12- и 22-ядерных CPU Intel Xeon поколения Haswell-EP/Broadwell-EP и Skylake-SP с 64 или 128 Гбайт RAM и SAS/SATA SSD/HDD. Для установки доступны ОС Ubuntu Linux и Oracle Linux. |
|
