Перейти к содержимому
Документация

Возможности · 4 мин чтения

Движки агента: Codex и Hermes

Когда ты даёшь Katchy длинную задачу, прибраться на Desktop, сжать этот PDF на 60 страниц, переименовать каждый скриншот по содержимому, в фоне поднимается движок агента, планирует работу, шаг за шагом выполняет и отчитывается на маленькой карточке-доке. Katchy идёт с двумя движками, которые можно переключать в Настройки → Агент → Движок. Один и тот же UX, один и тот же хоткей, одна и та же модель разрешений. Внутри, разный мозг.

Codex, по умолчанию

Codex, это то, что заводится при первом запуске Katchy. Каждая задача агента уходит на фронтирную модель OpenAI для рассуждений, а собственный встроенный рантайм Katchy ведёт цикл планирования, вызовы инструментов и жизненный цикл карточки-дока. Модель выбирает сама себя под задачу, быстрые правки идут на шустрые модели, длинноконтекстная работа, на самые глубокие.

  • Отполирован из коробки, движок, под который изначально и собирали приложение.
  • Говорит с API OpenAI; нужен твой собственный OPENAI_API_KEY, вставленный в Настройки.
  • Лучше всего на многошаговых задачах, где помогает топовая модель рассуждений: ресёрч, рефакторинги, работа с длинными документами.
  • Платишь за токены OpenAI, обычно центы за задачу, в зависимости от длины.

Hermes, открытая альтернатива

Hermes оборачивает CLI hermes-agent от Nous Research. Katchy тащит с собой весь Python-рантайм (~360 МБ) + установку hermes-agent ЗАПАКОВАННЫМИ внутрь Katchy.app, никакого pip install, никакого Terminal, никакого мастера настройки. Переключаешься на Hermes в Настройках, и следующая задача агента идёт через локальный Python вместо API OpenAI.

  • Полностью локальный цикл агента, планирование, выбор инструментов и самопроверка происходят на твоём Mac.
  • Ноль установки. Рантайм идёт с приложением и подписан + нотаризован как часть сборки.
  • Ключ OpenAI самому агенту не нужен; подсунь свой эндпоинт модели, если хочешь рассуждения фронтирного уровня, или гоняй мелкую локальную модель.
  • Лучше всего для приватной работы, для офлайн-сценариев и для тех, кому интересно, куда движутся открытые инструменты для агентов.
Hermes, это опенсорсный цикл агента от Nous Research, одноимённый проект, никак не связанный со старым JavaScript-движком от Facebook. Запакованный CLI лежит в Katchy.app/Contents/Resources/HermesRuntime, если когда-нибудь захочешь туда заглянуть.

Бок о бок

Оба движка соблюдают один и тот же контракт агента, один и тот же хоткей, одни и те же разрешения, одна и та же карточка-док, один и тот же запрос на деструктивные действия, один и тот же Cmd-Z. Отличается всё, что лежит под слоем UX.

  • Настройка, Codex'у нужен ключ OpenAI; Hermes работает с момента запуска Katchy.
  • Сеть, Codex отправляет каждую задачу на серверы OpenAI; Hermes крутит цикл локально и лезет в сеть, только если ты сам подцепил его к удалённой модели.
  • Стоимость, Codex это плата за токены; у Hermes нулевая стоимость на задачу (платишь один раз, размером загрузки).
  • Скорость, Codex обычно быстрее на первом токене, потому что модели OpenAI крупнее и теплее; Hermes конкурентен на коротких задачах и вне конкуренции в офлайне.
  • Потолок, Codex наследует последние возможности рассуждений OpenAI; Hermes наследует ту открытую модель, на которую ты его нацелил.

Какой выбрать

  1. Начни с Codex. Он не просто так по умолчанию, это движок, под который остальной Katchy и настраивали, и тот, у которого больше шансов с первого раза справиться с чем бы ты в него ни закинул.
  2. Переключись на Hermes, если попадает хоть что-то из этого: не хочешь вставлять ключ OpenAI, работаешь над чем-то достаточно личным, чтобы не гонять по сети, сидишь на шатком соединении или тебе любопытно про открытые инструменты для агентов и хочешь покататься, не выходя из приложения.
  3. Можно переключаться от сессии к сессии, выбор живёт в Настройки → Агент → Движок и срабатывает на следующей задаче агента. Уже бегущие задачи продолжают на том движке, с которого стартовали.

Что одинаково в любом случае

Один и тот же хоткей Control + Option запускает и останавливает агента. Одна и та же карточка-док показывает прогресс. Одни и те же разрешения macOS контролируют каждое чтение файла, клик и команду шелла. Выбор движка, это сантехника; привычки не меняются от того, что ты переключился.

Также доступна как простой markdown.