Заменяет ли Hermes лобстеров? Hermes Agent, обладающий 40 000 звезд, — это больше, чем просто альтернатива OpenClaw.

В предыдущей статье, посвященной переводу слова «упряжь», один из читателей заметил, что его можно было бы назвать «Гермес».

Сначала я подумал, что это игра слов, но оказалось, что действительно существует продукт-агент под названием Hermes, и он весь месяц занимает первое место в списке самых популярных проектов GitHub, набрав в настоящее время 48 000 звезд.

В отличие от недавно ставшего невероятно популярным Agent Lobster, Hermes — это персональный ИИ-помощник, поддерживающий все операционные системы и платформы. В описании Hermes говорится: «Агент, который растет вместе с вами».

Звучит очень дорого, и именно это делает Hermes Agent уникальным.

В нем встроен механизм обучения. OpenClaw использует модификацию конфигурационных файлов для объединения нескольких агентов с целью решения различных сложных задач. Hermes Agent — это платформа для работы с одним агентом, возможности которой будут постоянно улучшаться по мере увеличения времени фактического использования.

Проблема, которую решает это устройство, заключается в том, что пока все обсуждают возможности агента, никто не замечает, что после использования агент ничего не оставляет. Агент Гермеса, с другой стороны, теперь может запоминать, «какие методы сработали».

В социальных сетях также много постов с рекомендациями Hermes Agent, причем некоторые пользователи пишут, что перешли с OpenClaw на Hermes, и это было самым мудрым решением в их жизни.

Некоторые также поделились «документом о Hermes Orange», в котором утверждалось, что Hermes Agent — это серьёзно недооценённый продукт и одна из самых мощных платформ для создания агентов искусственного интеллекта с открытым исходным кодом, доступных в настоящее время.

Hermes Agent был разработан исследовательской группой Nous Research. Если посмотреть на историю релизов на GitHub, то начиная с обновления V0.2.0 в середине марта и заканчивая выпуском V0.8.0 вчера, каждое обновление включает в себя большое количество коммитов и слияний кода, а также практических обновлений функций, что делает его очень активным проектом с открытым исходным кодом.

▲Первый релиз состоялся 25 февраля, https://nousresearch.com/releases

Метод ведения заметок для LLM Wiki, ранее предложенный Карпати и использующий большие языковые модели и инструмент для создания заметок Obsidian для формирования собственной библиотеки знаний и исследований, был немедленно добавлен во встроенные навыки Hermes.

Hermes Agent можно установить не только на компьютеры, но и на телефоны Android через эмулятор терминала Termux. Настройка модели и шлюза аналогична OpenClaw.

Стоит отметить, что Клод пока не "заблокировал" эту функцию; мы по-прежнему можем настраивать большие модели напрямую, войдя в систему как пользователь Claude Pro или более высокого уровня. Кроме того, Hermes Agent также предлагает собственный платный портал Nous Portal.

▲Модель Hermes 4 от исследовательской группы Nous Research

Сегодня платформа Xiaomi MiMo официально объявила о том, что « Xiaomi MiMo интегрирована с ведущей в мире платформой для создания агентов, Hermes Agent, и доступна бесплатно в течение двух недель».

 Официальный сайт агента Hermes: https://hermes-agent.nousresearch.com

Почему OpenClaw является настоящим конкурентом?

Суть OpenClaw заключается в том, чтобы полностью вывести наш ИИ из окна чата и интегрировать его в реальную работу, учебу и жизнь для эффективного выполнения задач. Он может подключаться к WeChat, Enterprise WeChat и Lark, выполнять команды терминала, управлять браузерами, а также помогать нам отправлять электронные письма, управлять расписанием и многое другое.

Однако у OpenClaw есть недостаток: он не может автоматически обучаться и развиваться на основе нашего повседневного использования.

Память OpenClaw статична — мы записываем информацию в конфигурационный файл, он её считывает, сессия завершается, и он считывает её снова в следующий раз. Он не извлекает ничего активно из процесса выполнения и не будет автоматически делать всё правильно в следующий раз только потому, что мы исправили ошибку один раз.

Даже после однократного использования всех рабочих процессов нам все равно нужно напоминать о них, возможно, путем объединения их в навыки или специальных подсказок.

Хотя сейчас существуют специализированные навыки, предназначенные для самообучения OpenClaw, Hermes Agent фокусируется на том, чтобы «лучше понимать вас по мере использования», начиная от цикла обучения базовой архитектуры и заканчивая системой памяти и внутренним выполнением агента.

Особенность Hermes Agent заключается в замкнутом цикле обучения.

После завершения каждой задачи Hermes проверяет, стоит ли записывать значение выполнения. Условия срабатывания специфичны: инструмент вызывается более 5 раз, произошла ошибка в процессе выполнения, которая была исправлена ​​автоматически, пользователь внес корректировки или был выбран тонкий, но эффективный путь. Если выполняется любое из этих условий, будет создан файл Skill в каталоге ~/.hermes/skills.

Как и другие широко используемые навыки на рынке, этот автоматически сгенерированный документ предоставляет рабочий процесс, которому вы можете следовать в следующий раз. Название, описание, шаги и задействованные инструменты четко указаны. Формат соответствует открытому стандарту agentskills.io и теоретически совместим с различными агентами и может использоваться в таких инструментах, как OpenClaw, Claude Code и Cursor.

Файлы навыков не закодированы жестко. Агент Hermes изменит их, если найдет более оптимальный путь во время последующих запусков. Модификации предпочтительно выполнять с помощью патчей, которые передают только старую строку и заменяющее содержимое, а не перезаписывают весь файл.

Этот выбор обусловлен двумя соображениями: полная перезапись может легко уничтожить исходные рабочие части, в то время как патчинг устраняет только проблемные части, что делает его более безопасным и требует меньше токенов.

Память — самая сложная проблема, с которой приходится сталкиваться агентам.

Еще одно отличие от OpenClaw — это система запоминания информации.

Несколько дней назад Милла Йовович, исполнительница главной женской роли в фильме «Обитель зла», и инженер Бен Сигман совместно выпустили инструмент для анализа памяти на основе искусственного интеллекта с открытым исходным кодом MemPalace, который за два дня получил более 23 000 звезд на GitHub.

Его дизайн вдохновлен техниками запоминания, использовавшимися древнегреческими ораторами, которые помещали то, что хотели запомнить, в разные комнаты воображаемого здания и заходили, чтобы забрать это, когда это было необходимо.

Вся система разделена на пять уровней: Крыло (проекты или люди), Зал (типы памяти), Комната (темы), Шкаф (сжатые резюме) и Туннель (межтематические ссылки). MemPalace утверждает, что только эта иерархическая структура повысила точность поиска с 60,9% до 94,8%.

Основной принцип MemPalace: искусственному интеллекту не следует позволять решать, что стоит запоминать. Суждения ИИ ненадежны, поэтому лучше хранить все данные и позволить процессу извлечения определить, что полезно.

В начале этого месяца произошла утечка кода Claude Code, состоящая из 500 000 строк, и еще одно решение проблем с памятью было основано на искусственном интеллекте. Некоторые пользователи сети обнаружили, что Claude использует подход, похожий на сон, применяя функцию Auto Dream для автоматической организации файлов памяти.

Система памяти Гермеса также была специально разработана и состояла из четырех слоев, каждый из которых отвечал за выполнение различных задач и извлекался в разное время.

Первый слой называется постоянной памятью подсказок. Два файла, MEMORY.md и USER.md, хранят контекст, который должен автоматически загружаться в начале каждой сессии. Общий лимит символов составляет всего 3575; это число намеренно уменьшено агентом Hermes, чтобы заставить нас фильтровать данные, а не запихивать всё подряд.

Второй уровень — это архив сессий. Каждая беседа записывается в базу данных SQLite и извлекается с помощью полнотекстового индекса. Когда агенту Hermes требуется исторический контекст, он инициирует запрос, выполняет LLM-сводку результатов поиска и добавляет только те части, которые имеют отношение к текущей задаче.

▲Ссылка на документ: https://hermes-agent.nousresearch.com/docs/user-guide/features/memory

Третий слой — это файл навыков, являющийся результатом описанного выше цикла обучения. По умолчанию система загружает только название навыка и краткое описание, а полный текст загружается по запросу. В результате такой конструкции библиотека навыков может расширяться с 40 до 200 навыков, при этом стоимость контекста остается практически неизменной.

Четвертый слой, называемый Honcho, представляет собой необязательный слой моделирования пользователя, который пассивно накапливает ваши предпочтения, стили общения и знания в предметной области на протяжении всего диалога. Он подходит для сценариев, когда Hermes Agent используется в течение длительного времени в качестве ежедневного личного помощника.

Разделение труда между этими четырьмя уровнями также очень четкое: если что-то должно присутствовать в каждом разговоре, поместите это в первый уровень; если это полезно только тогда, когда появляется в определенной теме, оставьте это во втором уровне для поиска; если это многократно используемый операционный процесс, пусть им займутся на третьем уровне; если это долгосрочный профиль пользователя, передайте его четвертому уровню.

Когда сообщение поступает в Hermes Agent, независимо от того, исходит ли оно от стороннего шлюза, такого как Telegram, или из командной строки, оно попадает в один и тот же синхронный механизм выполнения: генерируется идентификатор задачи, формируются системные подсказки из уровня памяти, определяется приоритет повторного использования кэшированных версий во избежание дублирования, проверяется, не приближается ли длина контекста к пределу перед отправкой, и вызывается модель.

▲Источник изображения: https://mranand.substack.com/p/inside-hermes-agent-how-a-self-improving

Помимо использования цикла обучения для автоматического обновления во время выполнения задачи, Hermes также запускает механизм, называемый «Периодическое подталкивание», в середине каждой сессии.

Без участия пользователя система периодически и автоматически отправляет внутренний запрос агенту, предлагая ему просмотреть недавние операции и определить, какие из них стоит записать в память. Инициатива полностью исходит от пользователя; агент Hermes решает, что сохранить.

Сколько стоит начать работу с Hermes Agent?

Аналогично установке OpenClaw, это можно сделать одной командой в Linux, macOS и WSL2, а также поддерживается на устройствах Android с использованием Termux.

Hermes упомянул, что он не поддерживает нативную Windows, поэтому нам нужно установить WSL2, подсистему Windows для Linux, или WSL, которая представляет собой слой совместимости, позволяющий запускать нативные исполняемые файлы Linux в Windows.

Команда установки автоматически обрабатывает многочисленные зависимости, включая конфигурации для Python 3.11, Node.js v22, ripgrep, ffmpeg, виртуальных сред, глобальных команд и LLM. Интерфейс после установки похож на терминальные инструменты, такие как Claude Code, позволяя взаимодействовать с агентом с помощью специальных команд.

Что касается конфигурации модели, существует широкий выбор поставщиков услуг вывода: Nous Portal (на основе подписки, без необходимости настройки), Anthropic (напрямую использующий Claude, авторизация которого может осуществляться с помощью ключа API или кода Claude), OpenRouter, DeepSeek, Hugging Face, Alibaba Cloud DashScope (серия Qwen), GitHub Copilot и любой интерфейс, совместимый с OpenAI, включая локальные модели Ollam.

Xiaomi также предлагает серию MiMo-V2, включая MiMo-V2-Pro, поддерживающую миллионы контекстных токенов, MiMo-V2-Omni с возможностью полного распознавания модальных окон и модель Flash. Xiaomi также предоставляет двухнедельный бесплатный пробный период с 8 по 22 апреля, позволяющий пользователям обновить Hermes Agent до последней версии и бесплатно получить доступ к большим моделям Xiaomi через портал Nous.

В Hermes Agent также есть модуль вспомогательных моделей, представляющий собой набор облегченных конфигураций моделей в Hermes, специально предназначенных для выполнения «побочных задач». Они не отвечают за основной диалог, но отвечают за множество часто выполняемых критически важных задач, которые не стоит задействовать основную модель.

Например, различным задачам, таким как анализ изображений, извлечение данных с веб-страниц, сопоставление навыков и обработка памяти, будут автоматически назначаться разные модели. По умолчанию вспомогательные задачи будут автоматически обнаруживать и отдавать приоритет использованию Gemini Flash без необходимости ручной настройки.

Это похоже на функцию советника, которую сегодня запустила компания Anthropic; оба механизма подходят для ситуаций, когда основная модель обходится дорого, но вы хотите переключить второстепенные задачи на более дешевые модели. Hermes же, напротив, сделал «многомодельную оркестровку» ключевой частью своей базовой архитектуры.

Что касается платформ обмена сообщениями, список поддерживаемых сервисов аналогичен Openclaw, при этом Telegram, Discord, Slack и Lark относятся к числу наиболее функциональных, поддерживая различные форматы, такие как голосовые сообщения, изображения и файлы. Единый шлюз объединяет все платформы, обеспечивая унифицированное управление сессиями.

Hermes Agent — это не совсем инструмент, который можно установить за несколько минут и быстро ввести в эксплуатацию; это скорее инфраструктура, которую нам необходимо запускать и поддерживать.

Если нам просто нужен ИИ-помощник, которым можно управлять через мессенджер на мобильном телефоне, OpenClaw будет более простым решением: написать конфигурационный файл SOUL.md, запустить его, подключить к Telegram, и всё готово.

Hermes Agent подходит для сценариев с повторяющимися, постоянно меняющимися рабочими процессами, где мы хотим, чтобы агент накапливал опыт на основе привычек использования. Мы ожидаем, что через три месяца агент будет отличаться от агента в первый день.

В социальных сетях некоторые пользователи поделились примерами применения Hermes Agent, включая автоматизацию бизнес-процессов, которая связывает систему управления взаимоотношениями с клиентами (CRM) и базу знаний компании; управление маркетингом, которое автоматизирует создание контента и публикацию в социальных сетях; а также классические проекты в области разработки программного обеспечения, такие как генерация кода.

Применяя эти технологии в различных реальных бизнес-сценариях, мы убеждаемся в одном неоспоримом факте: агенты быстро проникают в реальные производственные среды.

Что касается Hermes, одни говорят, что это всего лишь «облегченная альтернатива» OpenClaw, в то время как другие видят в нем эволюцию систем с одним агентом. В любом случае, эволюция агентов никогда не остановится в рамках, заданных OpenClaw.

Будь то Hermes или OpenClaw, все существующие решения для агентов с открытым исходным кодом по-прежнему имеют свои недостатки. Форма, которая позволила бы агентам по-настоящему проникнуть в массовое использование и стать частью повседневной инфраструктуры для обычных людей, вероятно, еще не сформировалась.

Решение сложных задач, связанных с системой памяти, создает огромные проблемы для безопасности ИИ. Для того чтобы наделить ИИ конечностями, необходимо придумать способ их фиксации, а установка системы Harness слишком сложна и имеет высокий порог вхождения, что, по-видимому, накладывает ряд ограничений.

Можно лишь сказать, что на этот раз Hermes действительно задал Agent новое направление. Компания превратила Agent из инструмента, который используется и затем выбрасывается, в партнера, способного учиться на ошибках и запоминать уроки.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.