Материалы по тегу:
|
09.06.2026 [10:45], Руслан Авдеев
Как в «Безумном Максе»: Meta✴ строит в США «палаточные» ЦОД для ИИ-серверов на миллиарды долларовВместо традиционных зданий для своих ЦОД Meta✴ начала возводить в США палатки, размещая в них чрезвычайно дорогое ИИ-оборудование. По некоторым данным, компания уже построила или находится в процессе строительства трёх дата-центров в рамках подобной концепции, уже вызвавшей ряд саркастических комментариев экспертов, сообщает Tom's Hardware. Площадка в Нью-Олбани (New Albany, Огайо) уже имеет пять зданий, на строительство которых ушло примерно 2–3 года. После этого компания решила сменить концепцию, начав устанавливать на территории пять палаток площадью более 11,6 тыс. м² каждая. Согласно местным муниципальным документам, работы стартовали в апреле 2026 года, а недавние спутниковые снимки показывают, что объекты фактически уже готовы. О стратегии установки палаток для размещения ИИ-оборудования глава Meta✴ Марк Цукерберг (Mark Zuckerberg) объявил ещё в 2025 году, вероятно, стремясь ускорить развёртывание инфраструктуры на фоне растущего спроса. Предполагается, что Meta✴ могла вдохновиться опытом xAI, построившей в 2024 году палаточный ЦОД на 100 тыс. ускорителей за 19 дней. Обычно на проекты подобного масштаба уходят годы. Технология доказала свою эффективность и сегодня применяется на двух площадках, включая одну в Теннесси.
Источник изображения: Cindy Chen/unsplash.com Размещение серверов в палатках, называемых «быстровозводимыми структурами», — один из самых экзотических подходов к строительству ИИ-инфраструктуры. Они не так прочны, как конструкции из бетона и стали, и некоторые сравнивают такой подход с «защитой» гоночного велосипеда за $10 с помощью замка за $9. Тем не менее компания, вероятно, предварительно оценила связанные риски и сочла их приемлемыми по сравнению с потенциальными преимуществами в гонке ИИ. Ещё одним фактором, позволившим Meta✴ быстро развёртывать ЦОД, стала собственная генерация энергии «за счётчиком», с использованием собственных газовых турбин вместо того, чтобы полагаться на магистральные электросети. Примерно то же сделал Илон Маск (Elon Musk) с суперкластером в Мемфисе, изначально обеспечив ему портативные генераторы (вызвавшие активные протесты активистов). Впрочем, в случае с Meta✴ речь идёт о постоянных установках на площадке в Огайо — она должна работать независимо от энергосетей. По имеющимся данным, сейчас ЦОД с собственной генерацией располагают приблизительно 2 ГВт энергетических мощностей, ещё 1 ГВт находится на подходе и станет доступен в текущем году. По информации Cleanview, если текущие проекты будут реализованы по графику, к концу 2027 года мощность подобных объектов может увеличиться до 13 ГВт. Примерно столько же вырабатывали бы 13 обычных АЭС. Сочетание временных (на первый взгляд) сооружений и генераторов на основе авиационных турбин выглядит довольно необычно и, как заявил один из журналистов, «напоминает сцену из фильма „Безумный Макс“». Стоит отметить, что Meta✴ буквально вынуждена ударными темпами строить собственную ИИ-инфраструктуру. В конце мая появилась новость, что Meta✴, возможно, сама начнёт предоставлять сторонним клиентам облачные сервисы, особенно, если у неё появятся избыточные мощности.
09.06.2026 [10:00], Сергей Карасёв
InnoGrit представила контроллер для SSD с интерфейсом PCIe 6.0 вместимостью до 256 ТбайтКитайская компания InnoGrit представила свой первый контроллер для SSD с интерфейсом PCIe 6.0 x4. Изделие IG5686 Crestone предназначено для построения накопителей для дата-центров и облачных платформ, ориентированных ресурсоёмкие ИИ-нагрузки. Контроллер поддерживает стандарт NVMe 2.3. Допускается использование чипов флеш-памяти SLC/MLC/TLC/QLC NAND и SCM. При этом сами SSD могут выполняться в различных форм-факторах, включая E1.S и E3.S. Решение IG5686 Crestone обеспечивает скорость чтения информации до 28 Гбайт/с и скорость записи до 22 Гбайт/с. Величина IOPS (операций ввода/вывода в секунду) при произвольном чтении данных теоретически достигает 7 млн, при произвольной записи — 5 млн. Максимально допустимая вместимость накопителей — 256 Тбайт. Помимо этого, компания InnoGrit разработала контроллер Cascade IG5676 для устройств CXL 3.1 Type-3. Это решение поддерживает высокоскоростную память с низкой задержкой XL-Flash. Возможно создание SSD ёмкостью до 2 Тбайт. В дальнейшем InnoGrit планирует повышать производительность своих контроллеров. Так, к 2027 году компания рассчитывает довести показатель IOPS в передовых устройствах до 25–50 млн путём оптимизации и более глубокой интеграции стандартов PCIe 6.0 и CXL. В 2028 году величина IOPS, как предполагается, приблизится к 100 млн. Это позволит вывести на новый уровень быстродействие платформ хранения данных для ИИ. Нужно отметить, что контроллеры для SSD с интерфейсом PCIe 6.0 проектируют и другие участники рынка. В частности, такое решение недавно продемонстрировала компания Phison. Кроме того, соответствующими разработками занимается Silicon Motion.
09.06.2026 [00:29], Владимир Мироненко
Google заказала у Intel упаковку 3 млн TPU — у TSMC спрос превысил возможности производстваХолдинг Alphabet, материнская структура Google, заключил сделку с Intel, в рамках которой та изготовит для него в 2028 году более 3 млн кастомных TPU. Сообщивший об этом ресурс The Information добавил, что Google в течение нескольких месяцев тестировала технологии Intel, прежде чем принять решение о сделке. The Information отметил, что Intel получает заказы от таких компаний, как Google, в то время как тайваньский производитель микросхем TSMC испытывает трудности с удовлетворением спроса на выпускаемую им продукцию из-за нехватки производственных мощностей. Как пишет Bloomberg, акции Intel недавно достигли рекордного уровня после того, как её прогноз продаж превзошёл ожидания Уолл-стрит, показав, что компания наконец-то извлекает выгоду из бума инвестиций в ИИ. Оптимистичный прогноз свидетельствует о том, что генеральный директор Лип-Бу Тан (Lip-Bu Tan) добился успеха в стремлении вывести компанию из стагнации. После крупных инвестиций в Intel в прошлом году, которые помогли укрепить баланс компании, он теперь выполняет обещание улучшить её операционную деятельность. По данным The Information, NVIDIA также тестирует возможность использования технологии Intel для создания будущего процессора, объединяющего четыре графических чипа в одном блоке. Однако NVIDIA никак не прокомментировала эту публикацию. Вместе с тем остаётся неясным, насколько Google и другие компании будут полагаться на бизнес Intel по производству полупроводников, по сравнению с услугой упаковки, пишет Bloomberg. Последняя услуга включает в себя помещение чипов в корпус и подготовку их к подключению к другим схемам. Intel сообщила инвесторам, что накопила многомиллиардный портфель заказов на работы по упаковке микросхем. Этот этап в производстве полупроводников традиционно имеет меньшее значение и обходится дешевле, чем процесс создания электронных компонентов из кремниевых дисков. Но его важность возросла, поскольку объединение микросхем в одном корпусе всё чаще рассматривается как способ достижения лучшей производительности, особенно в случае компонентов для ЦОД. Как отметил Bloomberg, заказ на 3 млн чипов не изменит финансовое состояние убыточного производственного бизнеса Intel в одночасье. Это эквивалентно объёму производства крупного завода за месяц или даже меньше. Тем не менее обращения крупных компаний, свидетельствующие о готовности доверять Intel реализацию важных задач, помогут укрепить позиции её технологий и повысить шансы на привлечение других клиентов. Ранее стало известно о планах Илона Маска (Elon Musk) использовать технологический процесс Intel следующего поколения 14A для производства чипов на будущем заводе Terafab в Остине (Austin).
08.06.2026 [16:06], Руслан Авдеев
Эстонская Skeleton Technologies представила суперконденсаторные ИБП GrapheneUPS для ИИ ЦОДЭстонский поставщик энергетической инфраструктуры и силовых решений различного назначения — Skeleton Technologies — представил новые ИБП на основе графеновых суперконденсаторов, разработанные специально для ИИ ЦОД, сообщает Datacenter Dynamics. Система GrapheneUPS предназначена для долговременной защиты работы дата-центров. При этом она соответствует требованиям регуляторов к подключению дата-центров к электросети. По данным компании, в отличие от традиционных ИБП, система GrapheneUPS с двойным преобразованием энергии непрерывно преобразует поступающий переменный ток (380–480 В, 50/60 Гц) в постоянный и обратно с использованием SiC/GaN-компонетов, изолируя критически важное ИИ-оборудование от помех в энергосети. Кроме того, ИБП компании способны активно стабилизировать напряжение, например при его падении, перебоях с электроснабжением и других нештатных ситуациях, обеспечивая соответствие требованиям к состоянию сети без необходимости использования дополнительных сетевых стабилизаторов. Skeleton утверждает, что использование новых ИБП благоприятно скажется на эффективности дата-центров. Компания заявляет, что система позволяет на 40 % увеличить вычислительные мощности и значительно сократить требования к энергосети. Стабилизируя кратковременные сбои и компенсируя резкие изменения нагрузки, система способна помочь снизить риск перебоев в работе, защитить чувствительное к перепадам энергии оборудование и оптимизировать энергоснабжение всё более динамичных ИИ-нагрузок. Кроме того, новинка отличается высокой энергетической плотностью — до 242 кВт/м2.
Источник изображения: Skeleton Technologies Skeleton утверждает, что система отличается гибкостью внедрения, может использоваться в «белом» и «сером» пространствах ЦОД, а также за пределами объекта в контейнерном исполнении. Кроме того, она дополняет аккумуляторные энергохранилища ЦОД, обеспечивая дополнительный уровень энергобезопасности в случае сбоев электроснабжения. Система компании способна сглаживать колебания нагрузки в электросетях и ИИ ЦОД менее чем за миллисекунду. Компания заявляет, что её решения позволяют дата-центрам выравнивать спрос на электроэнергию и снижать её потребление. Компания Skeleton была основана в 2009 году в Тарту (Tartu, Эстония). Её первым клиентом стало Европейское космическое агентство (ESA), а впоследствии решения компании стали применять в немецкой автомобильной промышленности, в том числе в автомобилях BMW серий M и i7. Своё первое производство в США компания открыла в Хьюстоне (Houston, штат Техас) ранее в этом году, а в Европе два её завода появились ещё в ноябре 2025 года — объект стоимостью $270 млн в Германии и объект стоимостью $60 млн в Финляндии. В прошлом месяце появились данные о том, что компания привлекла €33 млн ($39 млн) в преддверии планируемого IPO в США в 2027 году.
08.06.2026 [15:33], Руслан Авдеев
Стартап Windrose Electric, разрабатывающий электрические грузовики, представил концепцию ИИ ЦОД на колёсах
hardware
автомобиль
аккумулятор
ии
инференс
контейнер
микро-цод
модульный
цод
электропитание
энергетика
Бельгийский стартап, занимающийся разработкой и выпуском электромобилей, представил концепцию контейнерных мобильных ЦОД. Ранее в этом году компания уже озвучила планы по созданию контейнерных ИИ- и энергетических решений на колёсах, которые можно будет легко доставлять туда, где они необходимы, с использованием её электрогрузовика с полуприцепом — R700, сообщает Datacenter Dynamics. Windrose Electric заявила о премьере новой продуктовой линейки «ИИ в коробке» для хранения электроэнергии, а также «модульного» решения для ИИ-инференса в отдельном контейнере. Сообщалось, что контейнер с вычислительным оборудованием может обеспечить инференс-нагрузки мощностью 500 кВт, а аккумуляторный контейнер способен хранить до 4 МВт·ч. Контейнерные дата-центры и соответствующая инфраструктура уже широко представлены в отрасли ИИ-решений, но обычно они перевозятся на крупных бортовых грузовиках с последующей разгрузкой, тогда как решения Windrose не предусматривают разгрузки и остаются в кузове или на колёсной платформе. Насколько практично подобное решение, пока не вполне понятно. Вычислительный модуль мощностью 500 кВт с питанием только от аккумуляторов ёмкостью 4 МВт·ч израсходует весь запас энергии в течение одного дня, после чего ему потребуется либо новое энергохранилище, либо подключение к внешнему источнику питания.
Источник изображения: Windrose Electric В этом месяце было объявлено, что Windrose работает с китайской энергетической компанией LiFe-Younger над мобильным контейнером для обеспечения ЦОД электроэнергией. В частности, сообщалось о планах разработать контейнерный аккумуляторный модуль с грузовиком-тягачом, обеспечивающим 2 МВт мощности в 20′ контейнере, который способен помочь справиться с нехваткой энергии в электросетях. В качестве энергетического модуля будет использоваться разработка iMContainer компании LiFe-Younger. Основанная в Китае в 2022 году, компания Windrose переместила штаб-квартиру в Бельгию и выпускает мощные электрические грузовики с большим запасом хода для коммерческой логистики. В настоящее время они способны проехать более 670 км без подзарядки с грузом массой 49 т. Основанная в 2016 году компания LiFe-Younger предлагает мобильные и стационарные решения для зарядки электромобилей и системы хранения энергии.
08.06.2026 [10:43], Владимир Мироненко
В Yandex Cloud произошёл сбой в расчёте начисленийВ минувшую пятницу, 5 июня, на платформе Yandex Cloud произошёл сбой, из-за которого в расчёте начислений за ресурсы из Marketplace наблюдались ошибки, а у ряда пользователей были произведены несанкционированные списания за неиспользуемые ресурсы. В Yandex Cloud подтвердили факт сбоя и предупредили пользователей о приостановке обработки биллинга. «Обнаружена ошибка в расчёте начислений для части ресурсов. Для предотвращения некорректных списаний обработка биллинга была временно остановлена. После устранения причины будут выполнены необходимые корректировки начислений», — сообщили в компании. Как указано в описании инцидента, сбой затронул следующие зоны: ru-central1-e, ru-central1-a, ru-central1-b и ru-central1-d. Спустя несколько часов было объявлено об устранении сбоя и начале разблокировки ранее остановленных ресурсов. Компания сообщила, что «команда работает над разблокировкой ошибочно заблокированных биллинг-аккаунтов и корректным отображением детализации», а также что «формируются списки, по которым в ближайшее время будут выполнены возвраты». К концу дня, в 23:56, компания сообщила, что работа систем биллинга восстановлена. До этого Yandex Cloud объявила, что был выполнен возврат всех ошибочно списанных средств. В комментариях на сайте Хабре пользователи отметили, что ошибочные списания в Yandex Cloud были незначительными — в пределах 6–6,5 тыс. руб. Впрочем, в Сети попадаются сообщения о якобы списании заметно более крупных сумм.
08.06.2026 [09:41], Сергей Карасёв
Supermicro представила Arm-серверы для агентного ИИКомпания Supermicro анонсировала серверы с Arm-процессорами, оптимизированные для агентного ИИ. Устройства обеспечивают высокую энергоэффективность и масштабируемость, позволяя формировать стойки высокой плотности. Представлены модели с воздушным и жидкостным охлаждением. В частности, дебютировал сервер ARS-222H-NR типоразмера 2U, допускающий установку двух процессоров Arm AGI с 64, 128 или 136 вычислительными ядрами. Предусмотрены 24 слота для модулей DDR5-8800 суммарным объёмом до 6 Тбайт. Во фронтальной части расположены восемь отсеков для SFF-накопителей (NVMe). Есть пять слотов PCIe 6.0 x16 для карт FHHL, по одному разъёму PCIe 6.0 x8 FHHL и PCIe 6.0 x8 AIOM (OCP 3.0), а также коннектор M.2 22110/2280 для SSD с интерфейсом PCIe 4.0 x1. Применено воздушное охлаждение. Питание обеспечивают два блока мощностью 2700 Вт с сертификатом 80 Plus Titanium. Кроме того, представлен GPU-сервер ARS-522GP-NR формата 5U с поддержкой двух чипов Arm AGI. Эта машина позволяет задействовать до восьми ИИ-ускорителей двойной ширины (восемь слотов PCIe 5.0 x16). Конфигурация включает 24 разъёма для модулей DDR5-8800 (до 6 Тбайт), четыре слота PCIe 5.0 x16 FHHL, по одному слоту PCIe 6.0 x16 FHFL и PCIe 5.0 x8 AIOM (OCP 3.0). Доступны восемь фронтальных отсеков для SFF-накопителей (NVMe) и коннектор M.2 22110/2280 (PCIe 4.0 x1). Задействованы шесть блоков питания мощностью 2700 Вт с сертификатом 80 Plus Titanium и воздушное охлаждение. В свою очередь, модель ARS-242TP-QNR-LCC стандарта 2OU использует четырёхузловую конфигурацию с прямым жидкостным охлаждением D2C (Direct to Chip). Каждый узел рассчитан на два чипа Arm AGI, 24 модуля DDR5-8800 (до 6 Тбайт) и два накопителя M.2 22110/2280 (PCIe 6.0 x4). Кроме того, имеются два слота PCIe 6.0 x16 AIOM (OCP 3.0) и два опциональных фронтальных отсека для накопителей E1.S (PCIe 5.0 x4). Питание осуществляется от централизованного шинопровода. Наконец, анонсирован сервер ARS-212HE-FNR формата 2U с поддержкой одного процессора Arm AGI (до 136 ядер) и 12 модулей DDR5-8800 (до 3 Тбайт). Возможны различные варианты исполнения подсистемы хранения данных, включая четыре или шесть фронтальных отсеков E1.S и шесть тыльных посадочных мест SFF. Стандартная конфигурация предлагает три слота PCIe 6.0 x16 FHFL, по одному слоту PCIe 6.0 x8 FHFL и PCIe 6.0 x16 AIOM (OCP 3.0). Реализован один слот M.2 22110/2280 (PCIe 4.0 x1). Применено воздушное охлаждение. Мощность двух установленных блоков питания с сертификатом 80 Plus Titanium достигает 3200 Вт. У всех новинок диапазон рабочих температур простирается от +10 до +35 °C. Помимо Arm-серверов, компания Supermicro представила 12 новых систем серии X14 на аппаратной платформе Intel Xeon 6+ Clearwater Forest, включая модели ультравысокой плотности. Устройства входят в различные семейства — Hyper, SuperBlade, FlexTwin и GrandTwin. В зависимости от варианта используется форм-фактор 1U, 2U или 6U; доступны версии с воздушным и жидкостным охлаждением.
08.06.2026 [09:35], Владимир Мироненко
Folio Photonics привлёк $8 млн и планирует начать продажи многослойных оптических дисков в 2027 годуРазработчик многослойных оптических дисков Folio Photonics успешно завершил раунд финансирования серии A, в рамках которого привлёк $8 млн инвестиций, сообщил ресурс Blocks & Files. В числе инвесторов — Material Impact и The O.H.I.O. Fund, а также JumpStart Ventures, Pavey Investments, Refinery Ventures и JobsOhio Ventures Fund. В 2019 году компания провела посевной раунд финансирования, благодаря которому привлекла $8 млн. Альфа-версия оптического дисковода была разработана Folio Photonics в 2024 году, а бета-версия второго поколения была представлена в прошлом году. В феврале этого года компания привлекла ещё $2,56 млрд в рамках посевного раунда. Теперь разработка продвинулась достаточно далеко, чтобы убедить инвесторов вложить средства в её дальнейшее развитие в рамках первого полноценного раунда финансирования. Полученные средства компания планирует направить на ускорение перехода от разработки технологий к коммерциализации, в том числе на расширение инженерной и операционной команд в Огайо, где находится её штаб-квартира. Также компания планирует активизировать взаимодействие с крупными партнёрами-гиперскейлерами, обеспечить коммерциализацию платформы архивного хранения и слоя знаний, а также масштабировать подготовку к производству и расширить стратегические отраслевые партнёрства. Разрабатываемые Folio Photonics оптические диски содержат до 32 слоёв при стоимости хранения от $3 за Тбайт данных. Данные хранятся в точках нанофотонной оптической среды в виде флуоресцентных сигналов, генерируемых лазерными импульсами. Диски WORM (Write Once, Read Many) с поддержкой чтения без возможности изменения или удаления данных могут хранить информацию от 50 до 100 лет. Оптические диски Folio Photonics первого поколения могут вмещать от 1 до 2 Тбайт данных, при этом несколько дисков можно устанавливать в один картридж. Компания запатентовала базовую технологию и три года назад привлекла менеджера по инжинирингу для помощи в разработке собственного оптического дисковода. Накопитель и носители информации разработаны с учётом возможности интеграции с существующими производственными экосистемами, что позволит ускорить коммерциализацию решения, запланированную на 2027 год. В Folio считают, что компания сможет изменить текущий рынок архивирования данных, объём которого, по прогнозам, превысит $12 млрд к 2028 году, благодаря превосходству её решения по экономической эффективности и скорости по сравнению с ленточными накопителями. Ожидается, что ИИ будет генерировать огромные объёмы данных, которые необходимо будет архивировать, что значительно увеличит рынок архивирования в будущем. Folio называет это инфраструктурой уровня знаний для эпохи ИИ — фундаментальной инфраструктурой, которая хранит данные, на основе которых обучаются ИИ-модели. Генеральный директор Стивен Сантамария (Steven Santamaria) отметил, что сейчас генерируется больше данных, чем существующая инфраструктура может вместить. «Сегодня существует большой и растущий потенциальный рынок традиционного архивного хранения — и мы намерены занять на нем лидирующие позиции. Но ещё большая возможность заключается в том, что будет дальше: слой знаний, который потребуется искусственному интеллекту. Старые данные — это будущая интеллектуальная информация. GPU генерируют интеллектуальную информацию — Folio сохраняет её», — заявил он. Помимо Folio Photonics также занимаются разработкой решений в сфере архивного хранения данных такие компании, как Biomemory, Cerabyte, Ewigbyte, Holomem, Microsoft (Project Silica) и Optera.
08.06.2026 [09:33], Сергей Карасёв
Чип Qualcomm и два порта 2.5GbE: вышел крошечный одноплатный компьютер Radxa Dragon Q5EКомпания Radxa пополнила ассортимент одноплатных компьютеров моделью Dragon Q5E, выполненной на аппаратной платформе Qualcomm. Новинка может использоваться для построения компактных устройств с ИИ-возможностями, функционирующих под управлением Radxa OS (на основе Debian) или Ubuntu. Изделие имеет размеры всего 65 × 56 мм. Применён процессор Qualcomm Dragonwing QCS6690 с восемью ядрами в конфигурации 1 × Kryo Prime с частотой 2,0 ГГц, 3 × Kryo Gold с частотой 2,0 ГГц и 4 × Kryo Silver с частотой 1,8 ГГц. В состав чипа входят графический ускоритель Qualcomm Adreno GPU 7-Series (1,15 ГГц) и нейропроцессорный узел с ИИ-производительностью до 6 TOPS. Интегрированный VPU-блок обеспечивает возможность кодирования видео 4Kр60 в форматах H.264/H.265 и декодирования материалов 4Kр120 в форматах H.264/HEVC. Реализована поддержка Wi-Fi 7 и Bluetooth 6, а также PCIe 3.0.
Источник изображения: Radxa Одноплатный компьютер может нести на борту до 16 Гбайт LPDDR5. Есть слот для карты microSD и коннектор для подключения флеш-накопителя UFS. Новинка располагает двумя сетевыми портами 2.5GbE RJ45 с опциональной поддержкой PoE, интерфейсом HDMI (1080p90), коннекторами MIPI DSI (4 линии) и MIPI CSI (4 линии, возможно подключение камер с разрешением до 32 Мп), портом USB 3.0 Type-A, а также 40-контактной колодкой GPIO с поддержкой UART, SPI, I2C, I3C и пр. Устройство получает питание через разъём USB Type-C (5 В). Имеется коннектор для подключения вентилятора охлаждения с ШИМ-управлением. Для новинки будет доступен корпус с ребристой верхней поверхностью, выполняющей функции радиатора для отвода тепла.
08.06.2026 [09:00], Владимир Мироненко
FirstVDS запустил vGPU-серверы на базе NVIDIA L40S и сравнил их с физическими GPU в реальных тестахПровайдер FirstVDS запустил тарифы с виртуальными GPU (vGPU) на базе NVIDIA L40S. Теперь в линейке два варианта: можно арендовать физическую видеокарту целиком (доступно с ноября 2025 года) или получить гарантированную долю виртуальной видеокарты. Компания также сравнила обе технологии в тестах и опубликовала результаты: скорость инференса LLM, генерацию видео и потребление видеопамяти. Доступны четыре тарифа vGPU — от 4 до 16 Гбайт видеопамяти. Технология vGPU делит физическую видеокарту на несколько профилей с фиксированной долей ресурсов. Серверы работают на виртуализации KVM с процессорами AMD EPYC. Стоимость — от 299 рублей в сутки. Для сравнения: тарифы с физическим GPU (Passthrough) стартуют от 1150 руб./сутки. В них доступны RTX 4090 и 5090, L4 и L40S — вся видеокарта полностью закрепляется за одной виртуальной машиной. За последние полгода спрос на GPU-серверы вырос кратно — в первую очередь из-за задач, связанных с LLM, генерацией изображений и видео. Но не каждому проекту нужна 100 % мощность физической карты. Разработчики, Data Science-команды и небольшие студии часто ищут более доступный вход с предсказуемой долей ресурсов. vGPU как раз закрывает этот запрос. Никита Попов, директор по продукту FirstVDS: «В ноябре мы закрыли потребность в сырой мощности, запустив GPU Passthrough. Но рынку нужен не только потолок производительности, но и адекватная юнит-экономика. vGPU закрывает именно этот сегмент — снижает порог входа до 300 руб. в сутки. Мы прогнали бенчмарки. Сравнивать виртуалку с выделенной картой в лоб бессмысленно — физика берет свое, чудес не бывает. Наша цель была другой: четко очертить границы применимости. Показать механику, при которой vGPU вытягивает нагрузку, и где проходит черта, за которой пора брать полноценное железо». Что показало тестированиеКомпания протестировала две конфигурации: GPU Passthrough (L40S, 48 Гбайт, 16 ядер CPU) и vGPU 16 Гбайт (8 ядер CPU). В сценариях использовались инференс LLM через llama.cpp (модели Qwen 2.5 и 3.6) и генерация видео через ComfyUI с шаблоном Wan2.2 TI2V 5B Hybrid. Результаты в целом предсказуемы: физическая карта ожидаемо обгоняет виртуальные GPU по производительности. Но обнаружилось два важных нюанса. Во-первых, при тестировании моделей среднего размера (qwen2.5-14b в двух вариантах квантизации — q3_k_m и q4_0) на vGPU-16 и Passthrough оказалось, что при полной загрузке модели в видеопамять скорость генерации токенов практически не отличается. Разница возникает только в смешанном режиме CPU+GPU (до 30–40 слоёв), где vGPU-16 сдерживает вдвое меньшее количество ядер процессора.
Сравнение скорости генерации токенов (qwen2.5-14b) в зависимости от количества слоёв, загруженных в GPU. Passthrough vs vGPU 16 Гбайт Во-вторых, более крупные модели (Qwen3.6-35B) в vGPU-16 полностью не загружаются — памяти не хватает, они работают только в смешанном режиме CPU+GPU со снижением скорости. Генерация видео (ComfyUI) на vGPU-16 тоже работает, но с оговорками: пришлось отключать часть функций и добавлять swap — иначе приложение аварийно завершалось. Время генерации на vGPU-16 ожидаемо выше, чем на Passthrough (для 5-секундного ролика — 293 с против 144). Таким образом, несмотря на общее преимущество физической карты, виртуальный GPU способен решать определённые задачи — например, инференс средних языковых моделей при полной загрузке в видеопамять. Это делает vGPU осмысленным выбором, когда важнее доступная цена. Для более тяжёлых сценариев (крупные модели, комфортная генерация видео без доработок) производительности vGPU может не хватить. Подробные результаты тестирования — в отдельной статье. О компанииFirstVDS — российский провайдер виртуальных серверов. В портфеле — готовые и гибкие конфигурации VPS/VDS: от высокопроизводительных CPU-серверов (линейка «CPU.Турбо 2.0» до 5,7 ГГц) до GPU-решений (Passthrough и vGPU). Также доступны S3-хранилище, домены, SSL и техподдержка 24/7. Дата-центры в Москве, Нидерландах и Казахстане. Более 20 лет на рынке. |
|
