Сегодня 31 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Nous Research бросил вызов OpenAI — открытая модель Hermes 4 работает быстрее всех и без цензуры

Стартап в области искусственного интеллекта Nous Research без громких анонсов представил семейство больших языковых моделей искусственного интеллекта Hermes 4, способных, по словам разработчика, сравниться с ведущими закрытыми аналогами. Пользователю предлагается всесторонний контроль над ИИ, который в исходном виде почти лишён цензурных ограничений.

 Источник изображений: Nous Research

Источник изображений: Nous Research

В отличие от аналогов в исполнении OpenAI, Google или Anthropic, модель Hermes 4 разрабатывалась для работы с практически любыми запросами без введённых в целях безопасности ограничений, ставших стандартными для коммерческих систем. Hermes 4 работает с использованием механизма гибридных рассуждений, позволяющего пользователю переключаться между быстрыми ответами и глубокими, пошаговыми мыслительными процессами ИИ. При работе ход рассуждений заключается в теги <think> — схожим образом работает OpenAI o1, но в случае моделей от Nous Research обеспечивается полная прозрачность «мыслительного» процесса.

В тесте MATH-500 с активным режимом рассуждений крупнейшая в семействе модель Hermes 4 с 405 млрд параметров набрала 96,3 % и 81,9 % в математическом бенчмарке AIME’24 — не хуже, а то и лучше многих закрытых систем, разработка которых обошлась в миллионы долларов. Она также показала результат 57,1 % в новом тесте RefusalBench, который Nous Research разработала самостоятельно для измерения частоты отказа систем ИИ отвечать на вопросы; GPT-4o показала в нём 17,67 %, Claude Sonnet 4 — 17 %.

Важным нововведением стало применение двух новых обучающих систем: DataForge — генератора синтетических данных на основе графов; и Atropos — фреймворка обучения с подкреплением. В DataForge производятся «случайные блуждания» по ориентированным графам и осуществляются преобразования простых исходных данных в сложные ответы на основе инструкций. Так, система может взять статью из «Википедии» и превратить её в рэп-стихи, а затем сгенерировать вопросы и ответы на основе этого преобразования. Atropos работает как несколько сотен обучающих сред, в которых ИИ отрабатывает определённые навыки — математику, программирование, работу с инструментами и творческие задания; обратная связь поступает только в случае принятия правильных решений. В обучающие данные попадают только проверенные и высококачественные ответы.

При обучении использовались 3,5 млн примеров, требующих рассуждений, и 1,6 млн примеров без рассуждений. Потребовались 192 ИИ-ускорителя Nvidia B200 и 71 616 GPU-часов, то есть при полной загрузке потребовались около 15,5 дня. Nous Research намеренно не стала включать средства цензуры в свои модели, исходя из того, что пользователь должен решать данный вопрос самостоятельно, и это важнее корпоративных политик в отношении контента.

Важным техническим достижением стало решение проблемы со слишком большим объёмом рассуждений. Авторы Hermes 4 обнаружили, что младшая модель с 14 млрд параметров в 60 % случаев рассуждений достигала максимальной длины контекста, попадая, таким образом, в бесконечный цикл. Поэтому на втором этапе обучения модель получила навык останавливать процесс рассуждения на позиции 30 000 токенов. Это помогло сократить число таких инцидентов на значение 65–79 % — при этом качество ответов удалось преимущественно сохранить.

Но некоторые ограничения, характерные для открытых моделей, Nous Research преодолеть не смогла. Несмотря на достойные результаты тестов, модели Hermes 4 требуют значительных вычислительных ресурсов, а пользоваться ими сложнее, чем коммерческими системами. Веса моделей можно бесплатно загрузить с платформы Hugging Face; есть доступ к API через обновлённый интерфейс чата; разработчик также заручился поддержкой Chutes, Nebius и Luminal — компаний, которые специализируются на выводе ИИ.

Hermes 4 — новый кандидат на звание взявшегося ниоткуда перспективного игрока, представляющего альтернативу крупным компаниям. Особый интерес представляет отсутствие ограничений по контенту — Nous Research настаивает, что прозрачность и свобода для пользователя важнее корпоративных ценностей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Is This Seat Taken? — все когда-нибудь сядут. Рецензия 10 мин.
Meta без спроса заполонила свои соцсети ИИ-двойниками Тейлор Свифт, Скарлетт Йоханссон и других знаменитостей 7 ч.
Nous Research бросил вызов OpenAI — открытая модель Hermes 4 работает быстрее всех и без цензуры 8 ч.
Стартап Илона Маска обвинил бывшего сотрудника в краже секретов для OpenAI 10 ч.
xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно 11 ч.
Тестирование крупного обновления Windows 11 25H2 вышло на финишный этап 13 ч.
ЕС всё же оштрафует Google за антиконкурентное поведение, но наказание будет скромным 14 ч.
Meta исправила методику обучения ИИ после скандала с неуместными разговорами с подростками 14 ч.
Кровавый геймплейный трейлер раскрыл дату выхода Bloodthief — ураганного слешера про ненасытного вампира 24 ч.
Новая статья: Inkshade — навстречу бездне. Рецензия 30-08 00:02
В Китае установили самую мощную в мире ветряную турбину — её лопасти поднимаются выше Эйфелевой башни 4 ч.
В блистающих останках умирающей звезды «Джеймс Уэбб» увидел, как могла зарождаться Земля 4 ч.
Nvidia захватила почти четверть рынка GPU для ПК — лидирует Intel, а доля AMD сжалась до 14 % 8 ч.
Realme не будет выпускать складные смартфоны, а сделает ставку на флагманы и пауэрбанки 13 ч.
Китайские учёные создали «всечастотный» чип для 6G — 100 Гбит/с почти в любых условиях 13 ч.
После утечки секретов о 2-нм техпроцессе TSMC предложила другим компаниям свою систему защиты данных 16 ч.
Intel избавилась от части обязательств перед США по «Закону о чипах» 17 ч.
Huawei объявила о полной победе над санкциями США и нацелилась на лидерство в ИИ 17 ч.
Замедление ИИ-бумa обрушило акции американских чипмейкеров 18 ч.
Dell впервые больше заработала на серверах и СХД, чем на ПК и ноутбуках 24 ч.