Материалы по тегу: source

07.05.2025 [18:13], Сергей Карасёв

Вышла операционная система «Альт Рабочая станция К» 11.0: Wayland по умолчанию и мегавыпуск KDE Plasma 6

«Базальт СПО» выпустила операционную систему «Альт Рабочая станция К» 11.0. Среди ключевых изменений — графическая среда KDE Plasma 6 с расширенными настройками интерфейса и поддержкой Wayland, технология шифрования дисков LUKS2.

Кастомизация интерфейса

В ОС «Альт Рабочая станция К» 11.0 графическая платформа KDE Plasma обновлена до версии 6.

KDE Plasma обеспечивает большой набор настроек интерфейса. Пользователь может:

  • Изменять внешний вид, расположение, конфигурацию панели управления, и даже размещать на рабочем столе несколько панелей;
  • Добавлять и удалять виджеты;
  • Изменять цветовые темы;
  • Задавать комбинации клавиш для различных действий.

Разобраться с настройками рабочей среды поможет приложение-«экскурсовод» «Помощник первого запуска». Его назначение — познакомить пользователя с интерфейсом и особенностями рабочего окружения.

 Источник изображений: «Базальт СПО»

Источник изображений: «Базальт СПО»

Инструменты администратора

Добавлен модуль Fortinet SSLVPN, защищающий чувствительную информацию от несанкционированного доступа даже в общественных сетях Wi-Fi. Модуль использует протокол SSL/TLS (Transport Layer Security) для шифрования всех передаваемых данных.

Модуль kio-admin позволяет редактировать системные файлы и файлы конфигурации в графическом интерфейсе через файловый менеджер Dolphin с правами суперпользователя.

Обновилась поддержка Secure Boot, позволяющего установить на один компьютер ОС «Альт Рабочая станция К» и Windows, что может быть удобно в период постепенной замены импортной ОС на российскую.

Добавлено приложение для изготовления копий операционных систем «Копидел». Образ в формате ISO создаётся в несколько кликов, и далее его можно тиражировать через физические носители и/или через сеть.

Графика и производительность

В «Альт Рабочей станции К» 11.0 основная сессия использует Wayland, а сессия Xorg (X11) является дополнительной.

«Графическая подсистема определяет, как операционная система работает с экранами и устройствами ввода, как отображаются приложения, — поясняет директор по продукту Олег Щавелев. — Раньше для этих задач по умолчанию использовался сервер Xorg, однако сейчас он устарел и на смену пришла более перспективная технология Wayland. Она увеличивает быстродействие и "отзывчивость" графики, обеспечивает более быстрое и плавное открытие приложений и применение визуальных эффектов, усиливает безопасность».

Среди преимуществ Wayland — функции управления жестами и мультитач на устройствах с сенсорными экранами, которой нет в Xorg.

Wayland поддерживает HDR (High Dynamic Range Imaging), что делает рабочую среду более красочной.

Ядро 6.12 LTS и драйверы NVIDIA

В операционной системе ядро Linux обновлено до версии 6.12 LTS (Long-term-support — ядро с долгосрочной поддержкой). Оно обеспечивает совместимость с современным оборудованием, которое можно будет использовать в течение всего срока амортизации, и таким образом увеличить рентабельность инвестиций в инфраструктуру.

Добавлены драйверы для новых видеокарт NVIDIA 570.133.07 с улучшенной поддержкой Wayland. Они позволяют раскрыть максимальную производительность NVIDIA в 3D-рендеринге, задачах искусственного интеллекта и играх.

Усилена безопасность

С помощью технологии шифрования дисков LUKS2 выполняется шифрование дисковых разделов при установке. Оно обеспечивает защиту данных, например, при утере устройства.

Графическая подсистема Wayland изолирует приложения друг от друга, они не могут «подсматривать» содержимое других окон или перехватывать ввод, что повышает безопасность операционной системы.

Творчество и досуг

Звуковую подсистему PulseAudio сменила более функциональная PipeWire. Она позволяет использовать рабочую станцию для записи музыкальных инструментов с минимальной задержкой, обеспечивает более тонкую настройку аудиовходов.

Модуль FFmpeg обновлен до версии 7.1. В нём появилась полноценная поддержка нового стандарта сжатия видео VVC (H.266), который обеспечивает такое же качество картинки как H.265/HEVC, но при вдвое меньшем размере файла. Это особенно полезно для 4K/8K видео и стриминга.

В FFmpeg 7.1 добавлено ускорение через Vulkan — видео быстрее обрабатывается на видеокартах. Теперь корректно обрабатываются цветовые диапазоны — меньше пересвеченных/затемнённых участков при конвертации между разными стандартами.

Обеспечена поддержка шлемов виртуальной реальности, в том числе через беспроводное подключение.

Добавлена утилита для оптимизации игр gamemode. Она позволяет настраивать системные параметры для разных игр, не затрагивая системные настройки в целом.

Доступна электронная подпись

Добавлено приложение «Сургуч» для работы со встроенными электронными цифровыми подписями. «Сургуч» работает с документами в формате PDF и совместим с популярным в России криптопровайдером КриптоПро CSP.

Браузеры, включённые в дистрибутив, поддерживают криптографические алгоритмы ГОСТ: по умолчанию устанавливается Chromium, дополнительно доступен Яндекc Браузеp.

Приобретение и лицензирование

«Альт Рабочая станция К» 11.0 предназначена для апробации и сбора обратной связи по изменениям в пользовательском интерфейсе на различных устройствах и периферии. Операционная система свободно распространяется для некоммерческого использования и тестирования. Подробности о возможностях ОС — в документации.

Обратная связь принимается через:

Условия лицензирования указаны на сайте «Базальт СПО» на странице продукта.

Постоянный URL: http://servernews.ru/1122461
30.04.2025 [15:30], Сергей Карасёв

«Базальт СПО» первой на российском рынке выпустила ОС с графической средой GNOME 47.4

«Базальт СПО» выпустила операционную систему «Альт Рабочая станция» 11.0 с новой графической оболочкой GNOME. Также добавлены новые приложения для системных администраторов и пользователей, поддержка современного оборудования, расширена линейка совместимых принтеров.

GNOME выбирают по всему миру

Главное новшество релиза — графическая оболочка GNOME, пришедшая на смену устаревшей MATE.

Директор по продуктам «Базальт СПО» Олег Щавелев отметил, что рабочее окружение GNOME является признанным корпоративным стандартом по всему миру. Согласно исследованию компании Lansweeper от 2024 года, операционные системы с GNOME используют 78 % пользователей Linux в корпоративном сегменте.

«Мы первыми на российском рынке выбрали GNOME 47. Эта версия позволяет создавать приложения, которые одинаково работают на ноутбуках, десктопах и мобильных устройствах — система сама подстраивается под размер экрана и тип устройства, автоматически настраивает светлые и тёмные темы. Это удешевляет и ускоряет разработку, а также повышает качество приложений», — добавил Олег Щавелев.

Благодаря большому количеству участников сообщества GNOME уже создано множество свободных пользовательских приложений, основанных на данных технологиях, и продолжается их активная разработка. Среди участников сообщества есть и сотрудники «Базальт СПО».

2 профиля рабочего стола

В «Альт Рабочей станции» предусмотрены 2 профиля оформления рабочего стола.

«Наша команда разработала ALT Panelmoded — сервис, позволяющий переключаться между двумя профилями оформления системы — "GNOME" и "Панельный". Первый предлагает обычное для пользователей GNOME оформление, напоминающее интерфейс мобильных устройств. Второй призван обеспечивать максимально плавный и комфортный переход пользователей с графических окружений MATE, Xfce, KDE, Cinnamon и ОС Windows», — объясняет релиз-менеджер операционной системы Семён Фомченков.

ALT Panelmoded запоминает настройки пользователей и сохраняет их при переключении на другой профиль, подчеркнул релиз-менеджер.

Выбрать оформление при первом запуске системы поможет приложение-экскурсовод ALT Tour. Помощник познакомит пользователя с интерфейсом и особенностями разных вариантов оформления рабочего окружения.

 Слева — профиль оформления «GNOME», справа — «Панельный». Источник изображения: «Базальт СПО»

Слева — профиль оформления «GNOME», справа — «Панельный». Источник изображения: «Базальт СПО»

Каждый профиль поддерживает светлую и тёмную темы, позволяет настроить персональный стиль визуального оформления. Новые фирменные обои и наборы иконок придают системе современный и эстетичный вид.

Функции управления жестами и мультитач

В «Альт Рабочую станцию» дополнительно к графической подсистеме Xorg (X11) добавлена более современная Wayland. Она поддерживает функции управления жестами и мультитач на устройствах с сенсорными экранами, недоступные в Xorg.

В Wayland приложения изолированы друг от друга, не могут «подсматривать» содержимое других окон или перехватывать ввод, что повышает безопасность операционной системы.

Чтобы запустить приложение, совместимое только с Xorg, достаточно выйти из сеанса пользователя и вновь войти, переключившись на соответствующую сессию.

Расширен список поддерживаемого оборудования

В операционной системе существенно расширен список поддерживаемого оборудования за счёт обновлённого ядра 6.12 и добавления драйверов. Это процессоры Intel 14-го поколения, принтеры и многое другое.

Добавлены драйверы для новых видеокарт NVIDIA версии 570.133.07 с улучшенной поддержкой Wayland, позволяющие использовать все достоинства графической подсистемы. Они поставляются в составе дистрибутива и поддерживаются разработчиками «Базальт СПО».

Работа внешних накопителей и док-станций стала более стабильной благодаря расширенной поддержке портов USB и Thunderbolt.

Релиз «Альт Рабочей станции» 11.0 выпущен для архитектур x86_64 и AArch64 (ARMv8). Идёт работа над созданием версии операционной системы для процессоров «Эльбрус».

Десятки программ для офисных задач

В новый релиз включены десятки программ для выполнения повседневных задач в офисе. Среди них:

  • «Сургуч» — приложение для работы со встроенными электронными цифровыми подписями;
  • «Сканер Документов» — с большим количеством дополнительных настроек и понятным интерфейсом;
  • Planify — планировщик задач с синхронизацией через Nextcloud и Todoist.

Облегчена работа администраторов

Добавилось много приложений, облегчающих работу системных администраторов и ИТ-специалистов, в том числе:

  • «Копидел» — для изготовления копий операционных систем;
  • GNOME Boxes — для простого создания виртуальных машин с поддержкой 3D-ускорения;
  • Ignition — для управления автозапуском приложений и скриптов;
  • «Подключение» — простое подключение к удалённым рабочим столам через RDP и VNC.

Досуг и хобби

«Альт Рабочая станция» удобна и для домашнего применения. В ней доступны программы для просмотра и редактирования мультимедиа, есть браузер и офисные приложения.

Появилась возможность использования шлемов виртуальной реальности, в том числе через беспроводное подключение.

Удобный Центр приложений позволяет устанавливать тысячи программ из хранилища «Альт», а также в формате Flatpak.

Доступен для установки Port Proton — программа для запуска игр, разработанных под ОС Windows.

Функции для лиц с ограниченными возможностями здоровья

Команда разработчиков позаботилась о людях с нарушениями зрения, включив функции, облегчающие пользование системой.

Среди них: чтение с экрана, высокая контрастность, символы состояния переключателей в дополнение к цветовой индикации, увеличение размера текста и курсора, звук при нажатии клавиш, видимые полосы прокрутки, включение и отключение эффектов анимации.

Приобретение и лицензирование

«Альт Рабочая станция» 11.0 предназначена для апробации, выявления ошибок и сбора обратной связи по изменениям в пользовательском интерфейсе на различных устройствах и периферии. Операционная система свободно распространяется для безвозмездного использования физическими лицами и для тестирования.

Обратная связь принимается через:

Чтобы перейти на новую версию с «Альт Рабочей станции» 10, необходимо переустановить систему. Предварительно убедитесь, что в данной версии ОС работает всё необходимое стороннее ПО. Инструмент для миграции без переустановки находится в разработке и будет доступен позже.

До выпуска версии 11.1 рекомендуемой для покупки остается «Альт Рабочая станция» 10.4.

Условия лицензирования указаны на сайте «Базальт СПО» на странице продукта.

Постоянный URL: http://servernews.ru/1122102
21.04.2025 [21:52], Татьяна Золотова

Arenadata приобрела у Orion soft СУБД Proxima DB и переименовала её в Arenadata Prosperity (ADP)

Дочерняя компания разработчика ПО на рынке систем управления и обработки данных Arenadata ООО «Аренадата Софтвер» приобрела интеллектуальные права на продукт Proxima DB у ИТ-компании «Орион» (Orion soft). Команда разработки будет интегрирована в состав персонала «Аренадата Софтвер». Сумма сделки не разглашается.

Стратегическое партнерство компаний позволит Orion soft сфокусироваться на развитии инфраструктурных продуктов, а Arenadata — расширить портфель решений для крупных организаций. Proxima DB переименован в Arenadata Prosperity (ADP). ADP построена на базе open source-технологии PostgreSQL. ADP обеспечивает оперативный мониторинг и анализ для минимизации времени простоя, совместима с платформой «1С», имеет сертификат ФСТЭК (4-й уровень доверия).

В рамках партнерства предусмотрено использование продуктов Orion soft в качестве инфраструктурной основы для решений cloud-native платформы Arenadata One. Это платформа виртуализации zVirt и Kubernetes-решение для управления контейнерами Nova Container Platform. По словам генерального директора группы Arenadata, Arenadata Prosperity усилит присутствие в сегменте СУБД общего назначения для госсектора и корпоративного рынка.

 Источник: Orion soft

Источник: Orion soft

Согласно отчету ЦСР «Рынок систем управления и обработки данных в РФ: текущее состояние и перспективы развития», рынок СУБД общего назначения составляет около 26 % от общего рынка систем управления и обработки данных, который оценивается в 95 млрд руб. на конец 2024 года.

Постоянный URL: http://servernews.ru/1121622
17.04.2025 [11:33], Владимир Мироненко

«Группа Астра» с партнёрами создала СП для развития и продвижения отечественной open source среды разработки OpenIDE

«Группа Астра», Axiom JDK (АО «Аксиом») и Haulmont объявили о создании совместного предприятия «Открытая среда разработки» на паритетных началах в рамках некоммерческого партнёрства с целью развития и вывода на рынок OpenIDE — бесплатной, безопасной, лицензионно чистой среды разработки на базе open source среды IntelliJ IDEA Community Edition, первая версия которой находится на финальной стадии бета-тестирования. Выход стабильной версии OpenIDE с публикацией исходников и открытием баг-трекера намечен на II квартал 2025 года. Согласно графику, в III квартале платформа будет включена в реестр российского ПО.

OpenIDE объединяет и упрощает использование различных инструментов разработки, способствуя экономии ИТ-ресурсов и снижению затрат, оптимизируя процессы разработки и управление лицензиями, что позволяет компаниям более эффективно распределять ресурсы. Платформа позволит решать задачи госсектора и крупного бизнеса, предъявляющих особые требования к безопасности, предсказуемости и технологической независимости.

Как указано в пресс-релизе, запуск платформы стал одним из первых в России масштабных примеров объединения нескольких вендоров для создания бесплатного решения с открытым исходным кодом, соответствующего самым высоким стандартам производительности, надёжности и безопасности.

 Источник изображения: OpenIDE

Источник изображения: OpenIDE

Учредители OpenIDE рассчитывают привлечь партнёров для участия в open source проекте, которые также предложат свои продукты пользователям платформы. В OpenIDE можно создавать Java-проекты на свободной версии платформы Axiom JDK — единственной отечественной тиражируемой JDK. Бесплатная версия плагина Amplicode от Haulmont предоставляет базовую поддержку фреймворка Spring «из коробки». Также «Группа Астра» планирует в ближайшее время предложить удобную интеграцию с платформой для разработки GitFlic.

Ключевые преимущества OpenIDE — открытый исходный код и отсутствие рисков, связанных с использованием зарубежных технологий и размещением инфраструктуры за пределами страны. В ней нет проприетарных компонентов, серверы с дистрибутивами и исходным кодом, как и команда её разработчиков, находятся в России. Что также удобно, функциональность решения можно расширить, подключив соответствующие отечественные плагины через открытый маркетплейс. Благодаря этому обеспечивается гибкость, надёжность и безопасность решения, а также исключаются проблемы с лицензированием, говорят создатели.

Генеральным директором ООО «Открытая среда разработки» назначен Федор Сазонов, который, в частности руководил разработкой решений для работы с ключевыми клиентами в «Сбере». «Создание OpenIDE — это не просто реакция на текущие ограничения, а стратегический шаг. Мы стремимся вырастить полноценную и безопасную экосистему продуктов для российских разработчиков ПО», — заявил Сазонов, выразив уверенность в перспективности проекта, который привлечёт большое количество пользователей.

Постоянный URL: http://servernews.ru/1121415
31.03.2025 [09:54], Сергей Карасёв

Маршрутизатор OpenWrt Two предложит поддержку 10GbE и Wi-Fi 7 за $250

Команда OpenWrt, по сообщению ресурса Liliputing, приступила к созданию маршрутизатора OpenWrt Two, который поступит в продажу в конце текущего года. В разработке новинки принимают участие специалисты компании GL.iNet.

Маршрутизатор OpenWrt One (на изображении) дебютировал в декабре 2024 года. Устройство, спроектированное в сотрудничестве с Banana Pi, несёт на борту процессор MediaTek Filogic 820 (MT7981B) с двумя ядрами Arm Cortex-A53, 1 Гбайт памяти DDR4 и опциональный SSD формата M.2 2242/2230 с интерфейсом PCIe 2.0 x1 (NVMe). Есть сетевые порты 2.5GbE и 1GbE, а также адаптер Wi-Fi 6. Цена составляет около $90.

В основу OpenWrt Two ляжет чип MediaTek Filogic 880 (MT7988), который объединяет четыре ядра Arm Cortex-A73 с частотой до 1,8 ГГц и контроллер памяти DDR3/DDR4 (фактический объём ОЗУ пока не уточняется). Реализована беспроводная связь Wi-Fi 7 (802.11a/b/g/n/ac/ax/be) в частотных диапазонах 2,4, 5 и 6 ГГц. Говорится о поддержке модуляции 4096-QAM.

 Источник изображения: OpenWrt

Источник изображения: OpenWrt

Для новинки по сравнению с оригинальной моделью предусмотрен более широкий набор Ethernet-портов: это 10GbE SFP, 5GbE RJ45, 2.5GbE RJ45 (четыре разъёма) и 1GbE RJ45 (один или два разъёма). Благодаря увеличению количества сетевых гнёзд расширятся функциональные возможности маршрутизатора. В качестве программной платформы, как и прежде, будет применяться OpenWrt — встраиваемая ОС с ядром Linux. По заявлениям разработчиков, это обеспечит возможность модификации и настройки устройства в соответствии с конкретными требованиями. Ожидается, что стоимость OpenWrt Two составит около $250.

Постоянный URL: http://servernews.ru/1120536
24.03.2025 [08:30], Владимир Мироненко

NVIDIA представила проект AI-Q Blueprint Platform для создания продвинутых ИИ-агентов

Признавая, что одних моделей, включая свежие Llama Nemotron с регулируемым «уровнем интеллекта», недостаточно для развёртывания ИИ на предприятии, NVIDIA анонсировала проект AI-Q Blueprint, представляющий собой фреймворк с открытым исходным кодом, позволяющий разработчикам подключать базы знаний к ИИ-агентам, которые могут действовать автономно.

Blueprint был создан с помощью микросервисов NVIDIA NIM и интегрируется с NVIDIA NeMo Retriever, что упрощает для ИИ-агентов извлечение мультимодальных данных в различных форматах. С помощью AI-Q агенты суммируют большие наборы данных, генерируя токены в 5 раз быстрее и поглощая данные петабайтного масштаба в 15 раз быстрее с лучшей семантической точностью.

Проект основан на новом наборе инструментов NVIDIA AgentIQ для бесшовного, гетерогенного соединения между агентами, инструментами и данными, опубликованном на GitHub. Он представляет собой программную библиотеку с открытым исходным кодом для подключения, профилирования и оптимизации команд агентов ИИ, работающих на основе корпоративных данных для создания многоагентных комплексных (end-to-end) систем. Его можно легко интегрировать с существующими многоагентными системами — как по частям, так и в качестве комплексного решения — с помощью простого процесса адаптации, который обеспечивает полную поддержку.

Набор инструментов AgentIQ также повышает прозрачность с полной отслеживаемостью и профилированием системы, что позволяет организациям контролировать производительность, выявлять неэффективность и иметь детальное представление о том, как генерируется бизнес-аналитика. Эти данные профилирования можно использовать с NVIDIA NIM и библиотекой с открытым исходным кодом NVIDIA Dynamo для оптимизации производительности агентских систем.

Благодаря этим инструментам предприятиям будет проще объединять команды ИИ-агентов в таких решениях, как Agentforce от Salesforce, поиск Atlassian Rovo в Confluence и Jira, а также ИИ-платформа ServiceNow для трансформации бизнеса, чтобы устранить разрозненность, оптимизировать задачи и сократить время ответа с дней до часов. AgentIQ также интегрируется с такими фреймворками и инструментами, как CrewAI, LangGraph, Llama Stack, Microsoft Azure AI Agent Service и Letta, позволяя разработчикам работать в своей предпочтительной среде. Azure AI Agent Service интегрирован с AgentIQ для обеспечения более эффективных агентов ИИ и оркестровки многоагентных фреймворков с использованием семантического ядра, которое полностью поддерживается в AgentIQ.

Возможности ИИ-агентов уже широко используются в различных отраслях. Например, платёжная система Visa использует ИИ-агентов для оптимизации кибербезопасности, автоматизируя анализ фишинговых писем в масштабе. Используя функцию профилирования AI-Q, Visa может оптимизировать производительность и затраты агентов, максимально увеличивая роль ИИ в эффективном реагировании на угрозы, сообщила NVIDIA.

Постоянный URL: http://servernews.ru/1120193
24.03.2025 [01:37], Владимир Мироненко

NVIDIA анонсировала ИИ-модели Llama Nemotron с регулируемым «уровнем интеллекта»

NVIDIA анонсировала новое семейство ИИ-моделей Llama Nemotron с расширенными возможностями рассуждения. Основанные на моделях Llama с открытым исходным кодом от Meta Platforms, модели от NVIDIA предназначены для предоставления разработчикам основы для создания продвинутых ИИ-агентов, которые могут от имени своих пользователей независимо или с минимальным контролем работать в составе связанных команд для решения сложных задач.

«Агенты — это автономные программные системы, предназначенные для рассуждений, планирования, действий и критики своей работы», — сообщила Кари Бриски (Kari Briski), вице-президент по управлению программными продуктами Generative AI в NVIDIA на брифинге с прессой, пишет VentureBeat. «Как и люди, агенты должны понимать контекст, чтобы разбивать сложные запросы, понимать намерения пользователя и адаптироваться в реальном времени», — добавила она. По словам Бриски, взяв Llama за основу, NVIDIA оптимизировала модель с точки зрения требований к вычислениям, сохранив точность ответов.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

NVIDIA сообщила, что улучшила новое семейство моделей рассуждений в ходе дообучения, чтобы улучшить многошаговые математические расчёты, кодирование, рассуждения и принятие сложных решений. Это позволило повысить точность ответов моделей до 20 % по сравнению с базовой моделью и увеличить скорость инференса в пять раз по сравнению с другими ведущими рассуждающими open source моделями. Повышение производительности инференса означают, что модели могут справляться с более сложными задачами рассуждений, имеют расширенные возможности принятия решений и позволяют сократить эксплуатационные расходы для предприятий, пояснила компания.

Модели Llama Nemotron доступны в микросервисах NVIDIA NIM в версиях Nano, Super и Ultra. Они оптимизированы для разных вариантов развёртывания: Nano для ПК и периферийных устройств с сохранением высокой точности рассуждения, Super для оптимальной пропускной способности и точности при работе с одним ускорителем, а Ultra — для максимальной «агентской точности» в средах ЦОД с несколькими ускорителями.

Как сообщает NVIDIA, обширное дообучение было проведено в сервисе NVIDIA DGX Cloud с использованием высококачественных курируемых синтетических данных, сгенерированных NVIDIA Nemotron и другими открытыми моделями, а также дополнительных курируемых наборов данных, совместно созданных NVIDIA. Обучение включало 360 тыс. часов инференса с использованием ускорителей H100 и 45 тыс. часов аннотирования человеком для улучшения возможностей рассуждения. По словам компании, инструменты, наборы данных и методы оптимизации, используемые для разработки моделей, будут в открытом доступе, что предоставит предприятиям гибкость в создании собственных пользовательских рвссуждающих моделей.

Одной из ключевых функций NVIDIA Llama Nemotron является возможность включать и выключать опцию рассуждения. Это новая возможность на рынке ИИ, утверждает компания. Anthropic Claude 3.7 имеет несколько схожую функциональность, хотя она является закрытой проприетарной моделью. Среди моделей с открытым исходным кодом IBM Granite 3.2 тоже имеет переключатель рассуждений, который IBM называет «условным рассуждением».

Особенность гибридного или условного рассуждения заключается в том, что оно позволяет системам исключать вычислительно затратные этапы рассуждений для простых запросов. NVIDIA продемонстрировала, как модель может задействовать сложные рассуждения при решении комбинаторной задачи, но переключаться в режим прямого ответа для простых фактических запросов.

NVIDIA сообщила, что целый ряд партнёров уже использует модели Llama Nemotron для создания новых мощных ИИ-агентов. Например, Microsoft добавила Llama Nemotron и микросервисы NIM в Microsoft Azure AI Foundry. SAP SE использует модели Llama Nemotron для улучшения возможностей своего ИИ-помощника Joule и портфеля решений SAP Business AI. Кроме того, компания использует микросервисы NVIDIA NIM и NVIDIA NeMo для повышения точности завершения кода для языка ABAP.

ServiceNow использует модели Llama Nemotron для создания ИИ-агентов, которые обеспечивают повышение производительности и точности исполнения задач предприятий в различных отраслях. Accenture сделала рассуждающие модели NVIDIA Llama Nemotron доступными на своей платформе AI Refinery. Deloitte планирует включить модели Llama Nemotron в свою недавно анонсированную платформу агентского ИИ Zora AI. Atlassian и Box также работают с NVIDIA, чтобы гарантировать своим клиентам доступ к моделям Llama Nemotron.

Постоянный URL: http://servernews.ru/1120173
21.03.2025 [10:09], Владимир Мироненко

«ОС» для ИИ-фабрик: NVIDIA Dynamo ускорит инференс и упростит масштабирование рассуждающих ИИ-моделей

NVIDIA представила NVIDIA Dynamo, преемника NVIDIA Triton Inference Server — программную среду с открытым исходным кодом для разработчиков, обеспечивающую ускорение инференса, а также упрощающую масштабирование рассуждающих ИИ-моделей в ИИ-фабриках с минимальными затратами и максимальной эффективностью. Глава NVIDIA Дженсен Хуанг (Jensen Huang) назвал Dynamo «операционной системой для ИИ-фабрик».

NVIDIA Dynamo повышает производительность инференса, одновременно снижая затраты на масштабирование вычислений во время тестирования. Сообщается, что благодаря оптимизации инференса на NVIDIA Blackwell эта платформа многократно увеличивает производительность рассуждающей ИИ-модели DeepSeek-R1.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

Платформа NVIDIA Dynamo, разработанная для максимизации дохода от токенов для ИИ-фабрик (ИИ ЦОД), организует и ускоряет коммуникацию инференса на тысячах ускорителей, и использует дезагрегированную обработку данных для разделения фаз обработки и генерации больших языковых моделей (LLM) на разных ускорителях. Это позволяет оптимизировать каждую фазу независимо от её конкретных потребностей и обеспечивает максимальное использование вычислительных ресурсов.

При том же количестве ускорителей Dynamo удваивает производительность (т.е. фактически доход ИИ-фабрик) моделей Llama на платформе NVIDIA Hopper. При запуске модели DeepSeek-R1 на большом кластере GB200 NVL72 благодаря интеллектуальной оптимизации инференса с помощью NVIDIA Dynamo количество генерируемых токенов на каждый ускоритель токенов увеличивается более чем в 30 раз, сообщила NVIDIA.

NVIDIA Dynamo может динамически перераспределять нагрузку на ускорители в ответ на меняющиеся объёмы и типы запросов, а также закреплять задачи за конкретными ускорителями в больших кластерах, что помогает минимизировать вычисления для ответов и маршрутизировать запросы. Платформа также может выгружать данные инференса в более доступную память и устройства хранения данных и быстро извлекать их при необходимости.

NVIDIA Dynamo имеет полностью открытый исходный код и поддерживает PyTorch, SGLang, NVIDIA TensorRT-LLM и vLLM, что позволяет клиентам разрабатывать и оптимизировать способы запуска ИИ-моделей в рамках дезагрегированного инференса. По словам NVIDIA, это позволит ускорить внедрение решения на различных платформах, включая AWS, Cohere, CoreWeave, Dell, Fireworks, Google Cloud, Lambda, Meta, Microsoft Azure, Nebius, NetApp, OCI, Perplexity, Together AI и VAST.

NVIDIA Dynamo распределяет информацию, которую системы инференса хранят в памяти после обработки предыдущих запросов (KV-кеш), на множество ускорителей (до тысяч). Затем платформа направляет новые запросы на те ускорители, содержимое KV-кеша которых наиболее близко к новому запросу, тем самым избегая дорогостоящих повторных вычислений.

NVIDIA Dynamo также обеспечивает дезагрегацию обработки входящих запросов, которое отправляет различные этапы исполнения LLM — от «понимания» запроса до генерации — разным ускорителям. Этот подход идеально подходит для рассуждающих моделей. Дезагрегированное обслуживание позволяет настраивать и выделять ресурсы для каждой фазы независимо, обеспечивая более высокую пропускную способность и более быстрые ответы на запросы.

NVIDIA Dynamo включает четыре ключевых механизма:

  • GPU Planner: механизм планирования, который динамически меняет количество ускорителей в соответствии с меняющимися запросами, устраняя возможность избыточного или недостаточного выделения ресурсов.
  • Smart Router: маршрутизатор для LLM, который распределяет запросы по большим группам ускорителей, чтобы минимизировать дорогостоящие повторные вычисления повторяющихся или перекрывающихся запросов, высвобождая ресурсы для обработки новых запросов.
  • Low-Latency Communication Library: оптимизированная для инференса библиотека, которая поддерживает связь между ускорителями и упрощает обмен данными между разнородными устройствами, ускоряя передачу данных.
  • Memory Manager: механизм, который прозрачно и интеллектуально загружает, выгружает и распределяет данные инференса между памятью и устройствами хранения.

Платформа NVIDIA Dynamo будет доступна в микросервисах NVIDIA NIM и будет поддерживаться в будущем выпуске платформы NVIDIA AI Enterprise.

Постоянный URL: http://servernews.ru/1120076
06.03.2025 [18:45], Владимир Мироненко

Китай запустит программу господдержки разработки и внедрения чипов RISC-V

Архитектура RISC-V с открытым исходным кодом, похоже, набирает значительную популярность в Китае, сделал вывод ресурс The Register, назвав в качестве свежего примера анонс процессора XuanTie C930, созданного НИИ Damo Academy (Alibaba Group Holding). Ядро C930 позиционируется как идеальное решение для серверов, ПК и автономных автомобилей.

Особенно важно соответствие профилю RVA23, поскольку это краеугольный камень экосистемы RISC-V. В частности, профиль определяет расширения для гипервизора, которые являются практически необходимыми для серверных и облачных CPU. Как сообщает XuanTie, «C930 использует передовую микроархитектуру для достижения высокой производительности, включая алгоритм прогнозирования ветвлений на основе TAGE, индивидуальный кеш L2, регулируемый механизм предварительной выборки данных и т. д. Показатель производительности C930 в тесте Specint2006 превышает 15/ГГц».

Сообщается, что «типичная конфигурация одного кластера поддерживает четыре ядра» с 64 Кбайт кеша инструкций и данных и L2-кешем на 1 Мбайт. Векторный блок поддерживает расширение RISC-V Vector 1.0, обрабатывает 256-бие векторные регистры и поддерживает вычисления в формате FP16/BF16/FP32/FP64/INT8/INT16/INT32/INT64. Также упомянут блок матричных вычислений. В ходе презентации чипа топ-менеджеры Alibaba Cloud спрогнозировали, что RISC-V станет основной облачной архитектурой в течение 5–8 лет.

 Источник изображений: XuanTie

Источник изображений: XuanTie

По данным Reuters, Пекин планирует запустить государственную программу с целью стимулирования широкого использования RISC-V по всей стране. В настоящее время восемь китайских правительственных агентств занимаются подготовкой постановления, которое будет способствовать распространению чипов на базе RISC-V в Китае. Ранее власти призвали китайские компании отказаться от американских чипов в пользу отечественных. Китайский разработчик процессоров Loongson получил возможность участия в пилотном проекте на поставку 10 тыс. ПК китайские школы и контракт на использование его чипов в вычислительной системе на орбитальной станции «Тяньгун», а Lenovo перенесла свой HCI-стек на архитектуру Loongson.

Академия наук КНР пообещала в 2021 году выпускать новые проекты на основе RISC-V каждые полгода. Хотя эта цель не была достигнута, в феврале 2025 года академия намекнула на готовящийся мощный проект с использованием RISC-V. В 2023 году технологический гигант Baidu исследовал возможность использования чипов на базе RISC-V уровня ЦОД. В том же году Alibaba сообщила о намерении создать чипы RISC-V для различных сфер, от носимых устройств до облаков. Сейчас крупнейшими коммерческими производителями решений на базе RISC-V в Китае являются XuanTie и Nuclei System Technology, пишет Reuters.

На недавнем мероприятии XuanTie было заявлено, что популярность DeepSeek также может стимулировать внедрение RISC-V, поскольку ИИ-модели китайского стартапа эффективно работают на менее мощных чипах. «Даже если решение RISC-V стоимостью ¥10 млн ($1,4 млн) может достичь лишь около 30 % уровня решений NVIDIA или Huawei, три таких комплекта будут всё равно дешевле», — сообщил представитель China Mobile System Integration.

В США уже выразили беспокойство по поводу того, что открытая лицензия RISC-V, позволяющая разработчикам использовать архитектуру бесплатно, обеспечит китайским фирмам возможность применять интеллектуальную собственность, созданную в Америке, для разработки передовых технологий. Недавно господдержку запросил и российский альянс RISC-V.

Постоянный URL: http://servernews.ru/1119336
05.03.2025 [23:05], Татьяна Золотова

Российский альянс разработчиков RISC-V запросил у государства поддержку

Альянс российских разработчиков микроэлектроники RISC-V направил премьер-министру Михаилу Мишустину и в Минпромторг письмо с предложением внести технологии на базе открытой процессорной архитектуры RISC-V в приоритетное направление развития нацпроектов и госпрограмм. Об этом сообщает «Коммерсантъ».

В России альянс по развитию архитектуры RISC-V был создан осенью 2022 года. В письме перечислены практически все доступные формы господдержки. Помимо включения в нацпроекты альянс просит предоставить субсидии на НИОКР для проектов с архитектурой RISC-V и возмещать затраты на патенты для продукции на базе этой архитектуры. Также альянс хочет, чтобы государство стимулировало производство и экспорт продукции RISC-V, субсидировало затраты на ее внедрение, предусмотрело приоритетную закупку оборудования на базе RISC-V с использованием механизма «второй лишний» в госзакупках (когда при наличии хотя бы одного российского производителя или из ЕАЭС автоматически отклоняются заявки иностранных поставщиков).

 Источник изображения: Brian Kostiuk/unsplash.com

Источник изображения: Brian Kostiuk/unsplash.com

RISC-V хоть и открытая архитектура, но лицензию предоставляет международный консорциум RISC-V, основанный в США, а значит, он обязана выполнять санкционные требования в отношении России, сообщил «Коммерсанту» эксперт среди разработчиков процессоров, сославшись на ситуацию 2022 года, когда Великобритания ограничила доступ к спецификациям архитектуры Arm, которую использовали последние процессоры «Байкал». Однако головная некоммерческая организация RISC-V International ещё в 2019 году «сменила прописку» на швейцарскую как раз из-за опасений возможных ограничений со стороны Вашингтона. В октябре 2023 года американские власти уже заявляли, что рассматривают возможность ограничить недружественным компаниям участие в международных сообществах RISC-V.

Помимо юридических рисков участники рынка микроэлектроники называют монополизацию и снижение технологического суверенитета. Так, в МЦСТ (разрабатывает процессоры «Эльбрус» на собственной архитектуре) считают, что запрошенные альянсом преференции должны применяться ко всем отечественным процессорам при условии, что микропроцессоры и их ядра разрабатываются в России.

Постоянный URL: http://servernews.ru/1119297

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus