Материалы по тегу: сервер
29.05.2025 [11:22], Сергей Карасёв
Дебютировали российские серверы «Аквариус» AQserv RS на базе Intel Xeon Emerald RapidsКомпания «Аквариус» анонсировала серверы серии AQserv RS типоразмера 2U, выполненные на аппаратной платформе Intel. Устройства, как утверждается, подходят для решения широкого спектра задач — от виртуализации и облачных приложений до ИИ и машинного обучения. Новинки внесены в Единый реестр российской радиоэлектронной продукции Минпромторга РФ. В семействе представлены две модели — AQserv T50 D224RS и AQserv T50 D212RS. Обе они допускают установку двух процессоров Xeon поколения Emerald Rapids или Sapphire Rapids с показателем TDP до 350 Вт. Доступны 32 слота для модулей оперативной памяти DDR5-5600 суммарным объёмом до 8 Тбайт. Присутствуют два сетевых порта 1GbE (Intel i210), два слота расширения PCIe 5.0 и шесть слотов PCIe 4.0, а также разъём OCP 3.0 (PCIe 5.0 x16). В оснащение входит контроллер Aspeed AST 2600. Ключевое различие серверов заключается в организации подсистемы хранения данных. Вариант AQserv T50 D224RS поддерживает в общей сложности до 30 накопителей: это 24 фронтальных и четыре тыльных SFF (SAS/SATA/NVMe) с возможностью горячей замены, а также два внутренних SSD формата M.2 2280/22110 с интерфейсом SATA или PCIe (NVMe). В свою очередь, версия AQserv T50 D212RS рассчитана на 18 накопителей, включая 12 фронтальных устройств LFF (SAS/SATA/NVMe) с горячей заменой, четыре тыльных устройства SFF (SAS/SATA или NVMe) с горячей заменой и два внутренних SSD стандарта M.2 2280/22110. Серверы оснащены четырьмя портами USB 2.0 Type-А (по два спереди и сзади), двумя разъёмами D-Sub (по одному спереди и сзади), последовательным портом, гнёздами RJ45 и выделенным сетевым портом управления. Установлены два блока питания мощностью до 2700 Вт с сертификатом 80 PLUS Platinum / Titanium. Применена система воздушного охлаждения с четырьмя вентиляторами диаметром 80 мм с ШИМ-управлением. Диапазон рабочих температур — от 10 до +35 °C. Заявлена совместимость с РЕД ОС 7.3 и выше, Windows Server 2016/2019, Red Hat Enterprise Linux Server 7.x, SUSE Enterprise Linux Server 12.x и Ubuntu 22.04. Как отмечает разработчик, BMC «Аквариус Командир Лайт» обеспечивает удобное удалённое управление и интеграцию с системами централизованного мониторинга, что значительно упрощает администрирование. Упомянута поддержка различных версий BIOS, включая российскую Numa BIOS.
27.05.2025 [11:48], Сергей Карасёв
Сбербанк инициировал банкротство российского производителя OCP-серверов Gagar>nСбербанк, по сообщению ресурса IT Channel News, направил в арбитражный суд заявление о признании ООО «Гагар.ин» банкротом в связи с возникшей задолженностью. Сама компания также намерена обратиться в суд с заявлением о собственной несостоятельности. ООО «Гагар.ин» — юридическое лицо компании Gagar>n, российского разработчика и производителя OCP-оборудования. Продукты компании входят в реестр Минпромторга России. Gagar>n реализует модель полного цикла, включающую самостоятельную разработку механики, схемотехники, электроники и встроенного ПО. Сбербанк требует от ООО «Гагар.ин» 106,04 млн руб. Кроме того, на этапе рассмотрения в адрес поставщика серверов находятся иски от ряда других компаний, в число которых входят: «Мастерпост» (312,43 тыс. руб.), «Треолан» (2,1 млн руб.), «КМС-Эксперт» (25,25 млн руб.), «Системы автоматизированного неинвазивного исследования» (4,37 млн руб.), «Матрикс электроника» (1,43 млн руб.), «Центр программных разработок РТсофт» (1,9 млн руб.), «Плексфорс» (1,32 млн руб.), ТД «Симметрон электронные компоненты» (почти 10 млн руб.), «О-Си-Эс-Центр» (344,25 тыс. руб.) и «Гран Груп» (4,2 млн руб.). Таким образом, общая сумма требований в рамках исков превышает 157 млн руб. ![]() Источник изображения: Gagar>n По итогам 2024 года ООО «Гагар.ин» получило выручку в размере 579 млн руб., что на 56,9 % меньше по сравнению с предыдущим годом. При этом компания показала чистые убытки на уровне 107 млн руб., тогда как в 2023-м была зафиксирована чистая прибыль в 262 млн руб. В 2024 году среднесписочная численность работников ООО «Гагар.ин» составила 112 человек — это на 12 сотрудников меньше, чем в 2023 году. По состоянию на 31 декабря 2024-го совокупные активы организации составляли 1,6 млрд руб., что на 27,1 млн руб. (на 1,7 %) больше, чем годом ранее.
27.05.2025 [10:00], Владимир Мироненко
Стартовало демо-тестирование отечественных GPU-серверов YADRO G4208P G3YADRO объявила о запуске программы демонстрационного тестирования платформы на базе GPU-сервера G4208P G3, которая сейчас проходит совместные испытания в прикладных сценариях в ИТ-инфраструктуре ключевых технологических партнёров компании. Высокопроизводительная серверная платформа YADRO G4208P G3 в форм-факторе 4U, ориентированная на ЦОД и компании с повышенными требованиями к вычислительным ресурсам, поддерживает установку до восьми GPU двойной ширины (PCIe 5.0 x16) с энергопотреблением до 450 Вт каждый, в том числе с мостиком NVLink Bridge. Сервер поддерживает до двух процессоров с TDP до 350 Вт и до 8 Тбайт оперативной памяти DDR5. Спецификации также включают до 12 накопителей (8 × SAS/SATA, 4 × SAS/SATA/NVMe) с возможностью установки HBA/RAID-контроллера, выделенный порт управления BMC (1GbE RJ45), 11 слотов PCIe 5.0 x16 FHFL и 1 слот OCP 3.0 (PCIe 5.0 x8). За питание отвечают четыре БП (3+1) мощностью 2700 Вт каждый. Сервер оптимизирован под обучение, дообучение и инференс современных ИИ-моделей, позволяя предприятиям создавать собственную ИИ-инфраструктуру в рамках on-premise-развёртываний. Платформа YADRO G4208P G3 способна удовлетворить потребности самых разных заказчиков, обеспечивая высокую производительность и масштабируемость в любых сценариях применения ИИ. В числе ключевых сфер компания указала здравоохранение — для анализа медицинских изображений и диагностики с помощью ИИ; финансовый сектор — при оценке рисков и обработки больших данных; промышленные предприятия — для автоматизации производства и управления процессами; научные и образовательные учреждения — в моделировании и исследованиях; а также медиа и игровую индустрию. Как сообщает компания, платформа успешно прошла серию внутренних тестов в лаборатории YADRO, включая нагрузочные испытания под ИИ-сценарии и термовалидацию, продемонстрировав стабильную работу под высокой вычислительной нагрузкой. В настоящее время сервер G4208P G3 проходит регистрацию в Едином реестре российской радиоэлектронной продукции (ЕРРРП) Минпромторга. В настоящее время доступно демонстрационное тестирование платформы. Подать заявку и ознакомиться с техническими характеристиками можно на официальном сайте YADRO.
26.05.2025 [11:21], Сергей Карасёв
Supermicro представила сервер SYS-822GS-NB3RT на базе NVIDIA HGX B300Компания Supermicro представила модель SYS-822GS-NB3RT на аппаратной платформе NVIDIA HGX B300 (Blackwell Ultra) для ресурсоёмких ИИ-нагрузок. Устройство выполнено в форм-факторе 8U и . Допускается установка двух процессоров Intel Xeon 6500P или 6700P поколения Granite Rapids с высокопроизводительными Р-ядрами. Доступны 32 слота для модулей оперативной памяти DDR5 с поддержкой MRDIMM-8000. Система имеет архитектуру 8-GPU. Во фронтальной части располагаются отсеки для восьми накопителей E1.S (NVMe) с возможностью горячей замены. Кроме того, есть два внутренних слота М.2 для NVMe SSD. Сервер оснащён двумя разъёмами PCIe 5.0 х16 FHHL для DPU NVIDIA BlueField-3. Упомянуты сетевые адаптеры NVIDIA ConnectX-8 SuperNIC. Supermicro позиционирует модель SYS-822GS-NB3RT в качестве передового «строительного блока» для формирования масштабных ИИ-кластеров с воздушным охлаждением. Компания Supermicro также сообщила о том, что в её ассортименте для заказа доступны более 20 систем, поддерживающих установку ускорителей NVIDIA RTX PRO 6000 Blackwell Server Edition с 96 Гбайт памяти GDDR7. Это, в частности, многоузловые серверы SuperBlade, компактные edge-решения, серверы типоразмера 5U с поддержкой до восьми GPU-карт, системы на модульной архитектуре NVIDIA MGX для ИИ-приложений и задач НРС, а также мощные рабочие станции.
24.05.2025 [22:18], Сергей Карасёв
Supermicro представила сервер-микрооблако на базе AMD EPYC GradoКомпания Supermicro представила сервер MicroCloud A+ Server AS-3015MR-H5TNR типоразмера 3U. Эта пятиузловая система (3U5N) ориентирована на организацию облачных вычислений и CDN, поддержание работы потоковых видеосервисов, веб-приложений и пр. Каждый узел рассчитан на установку одного процессора AMD EPYC 4005 Grado в исполнении Socket AM5 (LGA1718) с показателем TDP до 175 Вт (воздушное охлаждение). Кроме того, могут применяться чипы EPYC 4004 и Ryzen 7000/9000, насчитывающие до 16 вычислительных ядер с поддержкой многопоточности. Доступны четыре слота для модулей DDR5-5600 суммарным объёмом до 192 Гбайт. Каждый узел располагает одним слотом PCIe 5.0 x16 FHFL и одним разъёмом PCIe 5.0 x4 Micro-LP или двумя слотами PCIe 5.0 x8 LP. Возможна установка ускорителя NVIDIA L40(S), L4, A16, A2 и A10 или AMD Instinct MI210. Предусмотрены по два посадочных места для накопителей SFF NVMe (PCIe 5.0) и SFF SATA-3. Кроме того, имеется коннектор M.2 M-key для SSD типоразмера 2280/22110 (NVMe). Доступны два порта USB 2.0. Вся система AS-3015MR-H5TNR в целом оборудована четырьмя блоками питания с резервированием мощностью 2000 Вт с сертификатом 80+ Titanium. Задействованы пять вентиляторов охлаждения диаметром 80 мм. Габариты составляют 449 × 775 × 131 мм, масса — 48,76 кг. Диапазон рабочих температур простирается от +10 до +35 °C. Упомянут встроенный модуль TPM 2.0 для обеспечения безопасности.
22.05.2025 [12:43], Сергей Карасёв
ASRock Rack показала серверы NVIDIA HGX B300 и систему XGMRACK GB300 NVL72Компания ASRock Rack в рамках выставки Computex 2025 представила серверы нового поколения, оснащённые ИИ-ускорителями NVIDIA на архитектуре Blackwell. Кроме того, демонстрируются другие индустриальные и корпоративные продукты, включая материнские платы и системы с процессорами AMD и Intel. В число новинок вошёл сервер ASRock Rack 8U16X-GNR2 типоразмера 8U с воздушным охлаждением. Он выполнен на платформе NVIDIA HGX B300. По заявления разработчика, достигается в семь раз более высокая ИИ-производительность по сравнению с сопоставимыми системами, оборудованными ускорителями NVIDIA на архитектуре Hopper. Суммарный объём памяти HBM3e составляет около 2,3 Тбайт. Задействованы сетевые адаптеры NVIDIA ConnectX-8 SuperNIC. Кроме того, ASRock Rack готовит к выпуску сервер 4U16X-GNR2 на базе NVIDIA HGX B300 с жидкостным охлаждением. Обе модели ориентированы на ресурсоёмкие рабочие ИИ-нагрузки, такие как агентные системы, рассуждающие модели и генеративные сервисы. На стенде ASRock Rack представлено стоечная система XGMRACK на основе NVIDIA GB300 NVL72. Она объединяет 36 чипов NVIDIA Grace и 72 ускорителя NVIDIA Blackwell Ultra. Вычислительные и коммутационные узлы используют на 100 % жидкостное охлаждение. Общий объём памяти HBM3e превышает 20 Тбайт. Применяются решения NVIDIA Quantum-X800 InfiniBand и Spectrum-X Ethernet. ASRock Rack также представила серверы на модульной архитектуре NVIDIA MGX для масштабируемых ИИ-приложений и периферийных вычислений. В число таких машин входит модель 4UXGM-GNR2 типоразмера 4U с поддержкой двух процессоров Intel Xeon 6700P, 6500P (Granite Rapids) или Xeon 6700E (Sierra Forest). Доступны 32 слота для модулей оперативной памяти DDR5-6400, 16 посадочных мест для накопителей E1.S с интерфейсом PCIe 5.0 x4, два коннектора М.2 22110/2280 для SSD (PCIe 5.0 x4 и PCIe5.0 x2), восемь слотов PCIe 5.0 x16 FHFL, пять слотов PCIe 5.0 x16 FHHL и один слот PCIe 5.0 x16 HHHL. Установлены контроллер ASPEED AST2600 и четыре блока питания мощностью 1200 Вт с сертификатом 80 PLUS Titanium.
15.05.2025 [15:12], Руслан Авдеев
Потенциал импортозамещения почти исчерпан: АРПЭ выпустила отчёт о состоянии российского рынка серверного оборудованияАссоциация разработчиков и производителей электроники (АРПЭ) России провела исследования рынка серверного оборудования в стране. В подготовке доклада приняли участие «Гравитон», СИЛА, «Тринити», Fplus, BITBLAZE и GS Group, сообщает пресс-служба АРПЭ. Исследование показало, что рынок уже два года подряд сокращается в количественном выражении, за последний год быстрее, чем раньше — в 2024 году продали 147,95 тыс. серверов, на 15,1 % меньше, чем годом ранее. В денежном выражении рынок несколько вырос до $1,78 млрд, что больше год к году на 1,4 %. Рост рынка в денежном выражении исследователи объяснили в основном «технологическими и экономическими составляющими» — переход на использование процессоров новых поколений и более дорогих конфигураций. При этом санкции и без того влияют на издержки — в последние три года выросла как цена серверного оборудования, так и расходы на производство и логистику. Кроме того, многое зависит от курса доллара. После ухода западных компаний, российские производители серверов активно росли благодаря импортозамещению, но теперь рост почти остановился — в 2024 году доля отечественных производителей серверов на рынке составила 43%, что всего на 1,7% больше, чем годом ранее. ![]() Источник изображения: Alexander Smagin/unsplash.com По словам АРПЭ, основным драйвером развития российского производства серверного оборудования в 2022 и 2023 гг. стал уход ключевых иностранных вендоров. Тогда выпуском серверов под собственными брендами занялись десятки компаний, многие из них вложили средства в локальное производство и разработки. Однако потенциал импортозамещения исчерпался довольно быстро, уже в 2024 тренд в России для местных компаний изменился. Сегодня основной моделью работы для российских вендоров является локализация производства в стране серверов, разработанных за рубежом, и ценовая конкуренция не позволяет отечественным производителям выйти «за пределы регулируемых рынков». Другими словами, в обычных коммерческих проектах серверное оборудование обычно просто завозится вендорами из-за границы, но под собственными торговыми марками. Благодаря такой модели российский бизнес сохраняет авторизованные каналы поставок и техподдержки, в то же время не сталкиваясь с барьерами, характерными для параллельного импорта. Как отмечают в РАПЭ, с учётом действующей в России нормативной базы, для локализации производства достаточно покупки конструкторской документации за рубежом у ODM-компаний, с дальнейшим размещением производства в России и включением готового оборудования в Реестр российской промышленной продукции. Фактически речь идёт о монтаже компонентов на печатные платы, изготовлении корпусов, сборке и тестировании оборудования, а использования российской компонентной базы касается лишь позиций, не влияющих на схемотехнику серверных плат. ![]() Источник изображения: Fplus В прошлом году, по данным исследования, многие заказчики стремились снизить закупки нового оборудования вообще, как российского, так и зарубежного, стремясь продлить жизненный цикл уже имеющихся платформ. В текущем году АРПЭ ожидает стагнацию на российском рынке — он должен вырасти, когда действующее оборудование потребует замены. Предполагается, что спрос на российские продукты будут стимулировать регулированием рынка критической информационной инфраструктуры (КИИ), процесс уже идёт в настоящее время. Впрочем, вопрос требует всестороннего изучения. В начале мая Fplus предоставляла информацию о том, что в 2024 году российские корпоративные заказчики приобрели гораздо больше закупали отечественных серверов, чем зарубежных — в примерном соотношении 3:1, несмотря на то что у многих компаний IT-инфраструктура по-прежнему базируется на зарубежном оборудовании.
15.05.2025 [11:49], Сергей Карасёв
vStack и TERA IT готовят HCI ПАК для бизнеса и госсектораРазработчик программного обеспечения vStack (входит в корпорацию ITG) и российский IT-дистрибьютор TERA (TERA IT Distributor) анонсировали совместный проект по выпуску отечественных программно-аппаратных комплексов (ПАК) для виртуализации и управления инфраструктурой. Устройства, как ожидается, заинтересуют клиентов из различных отраслей — от малого бизнеса до крупных государственных предприятий. В качестве аппаратной основы ПАК будут использоваться собственные платформы «Система ИКС» дистрибьютора TERA, включая серверы, СХД и сетевые устройства. Программная составляющая ПАК предполагает применение гиперконвергентной платформы vStack с полной интеграцией слоев вычислений, хранения и сети в единой панели управления. Такая HCI-архитектура, как утверждается, позволит повысить надёжность благодаря сокращению количества точек отказа. Кроме того, упростится администрирование, что позволит уменьшить штат обслуживающего персонала. В зависимости от потребностей заказчика будут предлагаться ПАК в четырёх конфигурациях. Это, в частности, варианты на серверах ИКС S-серии, которая включает компактные одно- и двухпроцессорные системы с пониженным энергопотреблением. Подходят для задач малого и среднего бизнеса, в том числе для соответствия требованиям по хранению данных (СОРМ-3, закон «Яровой»). Корпоративным клиентам, которые работают с виртуализированными инфраструктурами, будут предложены модели на серверах ИКС D- и F-серии — это сбалансированные двухпроцессорные системы с большим объёмом RAM и поддержкой NVMe-накопителей. ![]() Источник изображения: vStack Для высоконагруженных сред и дата-центров подойдут версии с серверами ИКС L- и H-серии с высокой плотностью вычислений. В 2026–2027 гг. появятся ПАК с серверами ИКС Z-серии (в разработке), ориентированные на госсектор и соответствующие требованиям локализации. «Мы видим стабильный рост спроса на российские IT-продукты, особенно в сфере виртуализации и управления инфраструктурой. Совместный ПАК с TERA даёт компаниям возможность выстраивать надёжные и гибкие IT-системы без привязки к зарубежным технологиям», — говорит генеральный директор vStack.
14.05.2025 [14:55], Сергей Карасёв
Представлена машина баз данных Postgres Pro Machine для высоконагруженных системКомпания Postgres Professional анонсировала машину баз данных Postgres Pro Machine с модульной архитектурой, предназначенную для высоконагруженных систем. Проект по созданию платформы реализуется в партнёрстве с российским разработчиком и производителем IT-оборудования Delta Computers. В производство машины Postgres Professional инвестирует более 1,5 млрд руб. Утверждается, что Postgres Pro Machine — первая в России платформа, которая может объединять четыре типа разных СУБД. В их число входят высоконагруженные базы данных, обработка аналитических запросов, оркестрация большого количества СУБД среднего размера и горизонтальное масштабирование (шардирование). При этом управлять всеми типами баз данных можно будет через единый графический интерфейс. Конструкция Postgres Pro Machine предусматривает наличие ряда модулей: OLTP, DBaaS, HTAP, OLAP, а также блоков управления, хранения, коммутации и питания. Модуль OLTP, который станет доступен в III квартале текущего года, отвечает за такие функции, как работа с большими высоконагруженными базами, высокоскоростной интерконнект, синхронная реплика с минимальной задержкой. ![]() Источник изображения: Postgres Professional В свою очередь, модуль DBaaS (выйдет в I четверти 2026 года) обеспечит работу с большим количеством баз данных, бесшовное управление средой виртуализации, автоматизацию процессов управления, конфигурирования и масштабирования. Модуль HTAP (появится во II квартале 2026-го) будет включать горизонтальное масштабирование с использованием шардирования, работу с базами данных размером 2 Пбайт и более, строгие гарантии изоляции и согласованности данных на базе технологии Postgres Pro. Задачами модуля OLAP (станет доступен в III четверти 2026 года) названы: высокопроизводительная аналитика для данных (2 Пбайт и более), реализация ETL-задач, партицирование больших исторических данных, ведение полной истории изменений, строгие гарантии изоляции и согласованности данных на базе технологии Postgres Pro. Модуль управления в числе прочего обеспечит мониторинг всех компонентов и отказоустойчивое исполнение. Задачи блока хранения — резервное копирование баз данных, хранение шаблонов виртуальных машин, интеграция со всеми продуктами экосистемы Postgres Pro. Модуль коммутации и питания предоставит выделенную сеть для управления оборудованием, централизованное питание по ОСР-стандарту, коммутацию с интерфейсами 100 Гбит/с и 400 Гбит/с. Стойка с оборудованием имеет стандартную ширину 600 мм и использует трёхфазное питание. Отмечается, что благодаря глубокой синергии аппаратного уровня и программного обеспечения Postgres Pro Machine обеспечит рост быстродействия на 30 % и более по сравнению с существующими решениями. Компоненты системы работают на базе Postgres Pro Enterprise и поддерживают всю функциональность, доступную в соответствующем релизе. Среди возможностей — встроенная отказоустойчивость, пулер и балансировка соединений, резервное копирование и восстановление. ![]() Модули DBaaS, HTAP и OLAP поддерживают горизонтальное масштабирование — при необходимости можно добавлять новые вычислительные узлы. Модуль OLTP горизонтально не масштабируется, но можно задействовать несколько таких блоков параллельно. Postgres Pro Machine использует единую модель авторизации и разграничения доступа на всех уровнях — от управления оборудованием до доступа к виртуальным машинам. Интеграция со службой корпоративного каталога выполняется на этапе пусконаладочных работ. «Сейчас большинство российских компаний вынуждены поддерживать несколько различных технологических стеков для работы с базами данных — СУБД на виртуальных машинах; базы данных, работающие без дополнительного слоя виртуализации; аналитические СУБД; СУБД размером более 150 Тбайт. Postgres Pro Machine закроет все эти возможности в рамках одной системы, что обеспечит существенную экономию времени, денег и человеческих ресурсов заказчика», — отмечает заместитель генерального директора Postgres Professional.
12.05.2025 [17:27], Владимир Мироненко
Облако.ру предлагает ИИ-системы, которые позволят запускать даже мощные ИИ-моделиВедущий российский поставщик решений для облачной инфраструктуры Облако.ру предлагает различные специализированные интегрированные решения для обработки ресурсоёмких нагрузок, включая обучение и запуск ИИ-моделей. GPU-серверы, доступные в Облако.ру, отлично справляются со сложными задачами с использованием больших объёмов данных и вычислений. Использование услуг по аренде вычислительных мощностей позволяет избежать существенных капитальных затрат. Главное отличие GPU от CPU заключается в его способности параллельно выполнять множество операций, распределяя задачи между своими ядрами, что предоставляет ему возможность выполнения громадных объёмов вычислений, лежащих в основе ИИ, в гораздо более короткие сроки и обеспечивает значительное преимущество в таких областях, как обработка изображений и видео, научное моделирование, машинное обучение, где используются большие наборы данных и сложные алгоритмы. Изначально созданные для обработки изображений GPU стали крайне важными для ИИ-индустрии, позволяя обучать и развёртывать продвинутые ИИ модели, обеспечивающие широкие возможности в сфере ИИ — от распознавания изображений до обработки естественного языка. Благодаря ускорению процессов обучения и инференса использование серверных GPU позволяет разрабатывать и развёртывать модели ИИ быстрее и эффективнее, чего невозможно добиться, используя только классические CPU. А по мере роста сложности ИИ-моделей потребность в GPU будет только расти. Так, для локального запуска компактной версии популярной ИИ-модели DeepSeek R1 8B, разработанной посредством дистилляции нейросеть Llama 3.2 и демонстрирующей высокую эффективность в задачах текстовой генерации, обработки естественного языка, создания программного кода и анализа данных, потребуется система с 4 Гбайт VRAM (видеопамяти) для инференса с низкой и целочисленной точностью вычислений (FP8/INT8), 8 Гбайт VRAM для инференса с половинной точностью (FP16) и 16 Гбайт VRAM для инференса с полной точностью (FP32). Точность вычислений влияет на качество и скорость ответов ИИ-модели. Если же использовать DeepSeek R1 8B в качестве основы для собственных моделей, ориентированных на конкретные бизнес-задачи, то при обучении с низкой и целочисленной точностью (FP8/INT8) потребуется система с 8 Гбайт VRAM, при обучении с половинной точностью (FP16) — с 16 Гбайт VRAM, а и при обучении с полной точностью (FP32) — с 32 Гбайт VRAM. С увеличением количества параметров модели, определяющих её «эрудицию» и знания о мире или предметной области, одновременно растут и требования к доступной памяти и вычислительной мощности GPU. Кроме того, т.н. размышляющие модели, к которым относится и семейство DeepSeek R1, тем лучше и оперативнее отвечают на запросы, чем больше им доступно ресурсов. Предлагаемые Облако.ру системы позволяют запускать не только базовые модели уровня DeepSeek R1 8B, которым требуется 8–12 Гбайт VRAM, но и более мощные ИИ-модели, такие как DeepSeek R1 14B, которая подходит для большинства профессиональных рабочих процессов. DeepSeek R1 14B, содержащая 14 млрд параметров и созданая с помощью метода дистилляции модели Qwen 2.5, предназначена для решения сложных задач, требующих высокой точности и производительности, таких, как написание сложных текстов, анализ больших объёмов данных, написание кода уровня Senior и т.д. Для инференса с использованием DeepSeek R1 14B с низкой и целочисленной точностью (FP8/INT8) потребуется система с 7 Гбайт VRAM, с полной точностью (FP32) — с 28 Гбайт VRAM. Для обучения с низкой и целочисленной точностью (FP8/INT8) требуется система с 14 Гбайт VRAM, с половинной точностью (FP16) — с 28 Гбайт VRAM, с полной точностью (FP32) — с 56 Гбайт VRAM. Облако.ру предлагает различные системы с серверными GPU, которые способны удовлетворить нужды практически любого заказчика. Доступны системы с самыми простыми ускорителями NVIDIA T4, с ускорителями среднего класса 3 × RTX6000 (суммарно 72 Гбайт) и с ускорителями топового уровня. К последним относятся конфигурации сразу с восемью PCIe-ускорителями с суммарным объёмом памяти 640 Гбайт, 1 Тбайт системной памяти и парой 24-ядерных AMD EPYC 9224. А для самых требовательных заказчиков предлагается платформа с восемью ускорителями, объединёнными быстрой шиной (900 Гбайт/с) и 1128 Гбайт VRAM, которые работают как единое целое. Компанию им составляют два 48-ядерных Intel Xeon Platinum 8558 и 2 Тбайт RAM. При этом во всех случаях речь идёт именно о физических серверах, что гарантирует полную доступность всех вычислительных ресурсов. |
|