Возможности · 4 мин чтения
Движки агента: Codex и Hermes
Когда ты даёшь Katchy длинную задачу, прибраться на Desktop, сжать этот PDF на 60 страниц, переименовать каждый скриншот по содержимому, в фоне поднимается движок агента, планирует работу, шаг за шагом выполняет и отчитывается на маленькой карточке-доке. Katchy идёт с двумя движками, которые можно переключать в Настройки → Агент → Движок. Один и тот же UX, один и тот же хоткей, одна и та же модель разрешений. Внутри, разный мозг.
Codex, по умолчанию
Codex, это то, что заводится при первом запуске Katchy. Каждая задача агента уходит на фронтирную модель OpenAI для рассуждений, а собственный встроенный рантайм Katchy ведёт цикл планирования, вызовы инструментов и жизненный цикл карточки-дока. Модель выбирает сама себя под задачу, быстрые правки идут на шустрые модели, длинноконтекстная работа, на самые глубокие.
- Отполирован из коробки, движок, под который изначально и собирали приложение.
- Говорит с API OpenAI; нужен твой собственный OPENAI_API_KEY, вставленный в Настройки.
- Лучше всего на многошаговых задачах, где помогает топовая модель рассуждений: ресёрч, рефакторинги, работа с длинными документами.
- Платишь за токены OpenAI, обычно центы за задачу, в зависимости от длины.
Hermes, открытая альтернатива
Hermes оборачивает CLI hermes-agent от Nous Research. Katchy тащит с собой весь Python-рантайм (~360 МБ) + установку hermes-agent ЗАПАКОВАННЫМИ внутрь Katchy.app, никакого pip install, никакого Terminal, никакого мастера настройки. Переключаешься на Hermes в Настройках, и следующая задача агента идёт через локальный Python вместо API OpenAI.
- Полностью локальный цикл агента, планирование, выбор инструментов и самопроверка происходят на твоём Mac.
- Ноль установки. Рантайм идёт с приложением и подписан + нотаризован как часть сборки.
- Ключ OpenAI самому агенту не нужен; подсунь свой эндпоинт модели, если хочешь рассуждения фронтирного уровня, или гоняй мелкую локальную модель.
- Лучше всего для приватной работы, для офлайн-сценариев и для тех, кому интересно, куда движутся открытые инструменты для агентов.
Бок о бок
Оба движка соблюдают один и тот же контракт агента, один и тот же хоткей, одни и те же разрешения, одна и та же карточка-док, один и тот же запрос на деструктивные действия, один и тот же Cmd-Z. Отличается всё, что лежит под слоем UX.
- Настройка, Codex'у нужен ключ OpenAI; Hermes работает с момента запуска Katchy.
- Сеть, Codex отправляет каждую задачу на серверы OpenAI; Hermes крутит цикл локально и лезет в сеть, только если ты сам подцепил его к удалённой модели.
- Стоимость, Codex это плата за токены; у Hermes нулевая стоимость на задачу (платишь один раз, размером загрузки).
- Скорость, Codex обычно быстрее на первом токене, потому что модели OpenAI крупнее и теплее; Hermes конкурентен на коротких задачах и вне конкуренции в офлайне.
- Потолок, Codex наследует последние возможности рассуждений OpenAI; Hermes наследует ту открытую модель, на которую ты его нацелил.
Какой выбрать
- Начни с Codex. Он не просто так по умолчанию, это движок, под который остальной Katchy и настраивали, и тот, у которого больше шансов с первого раза справиться с чем бы ты в него ни закинул.
- Переключись на Hermes, если попадает хоть что-то из этого: не хочешь вставлять ключ OpenAI, работаешь над чем-то достаточно личным, чтобы не гонять по сети, сидишь на шатком соединении или тебе любопытно про открытые инструменты для агентов и хочешь покататься, не выходя из приложения.
- Можно переключаться от сессии к сессии, выбор живёт в Настройки → Агент → Движок и срабатывает на следующей задаче агента. Уже бегущие задачи продолжают на том движке, с которого стартовали.
Что одинаково в любом случае
Также доступна как простой markdown.