Перейти до вмісту
Документація

Можливості · 4 хв читання

Двигуни агента: Codex і Hermes

Коли ти даєш Katchy довге завдання, прибрати Desktop, стиснути цей PDF на 60 сторінок, перейменувати кожен скриншот за вмістом, у фоні стартує двигун агента, планує роботу, виконує крок за кроком і звітує на маленькій картці в доку. Katchy постачається з двома двигунами, які можна перемикати в Налаштування → Агент → Двигун. Той самий UX, та сама гаряча клавіша, та сама модель дозволів. Інший мозок усередині.

Codex, за замовчуванням

Codex, це те, що запускається першого разу, коли ти відкриваєш Katchy. Він спрямовує кожне завдання агента до передової моделі OpenAI для міркувань, а власний вбудований runtime Katchy веде цикл планування, виклики інструментів і життєвий цикл картки в доку. Модель обирає себе сама за завданням, швидкі правки йдуть до моторніших моделей, робота з довгим контекстом, до глибших.

  • Відполірований з коробки, двигун, навколо якого застосунок будували першим.
  • Розмовляє з API OpenAI; потребує твого власного OPENAI_API_KEY, вставленого в Налаштування.
  • Найкращий на багатокрокових завданнях, які виграють від моделі міркувань верхнього рівня: дослідження, рефакторинги, робота з довгими документами.
  • Платиш за токени OpenAI, зазвичай центи за завдання, залежно від довжини.

Hermes, відкрита альтернатива

Hermes обгортає CLI hermes-agent від Nous Research. Katchy тягне весь runtime Python (~360 MB) + інсталяцію hermes-agent УПАКОВАНИМИ всередину Katchy.app, без pip install, без Terminal, без майстра налаштування. Перемкнися на Hermes у Налаштуваннях, і наступне завдання агента побіжить через локальний Python замість API OpenAI.

  • Повністю локальний цикл агента, планування, вибір інструментів і самоперевірка відбуваються на твоєму Mac.
  • Нуль інсталяції. Runtime іде з застосунком і підписаний + нотаризований як частина збірки.
  • Самому агенту ключ OpenAI не потрібен; принеси свій ендпойнт моделі, якщо хочеш міркування топового рівня, або ганяй меншу локальну модель.
  • Найкращий для приватної роботи, для офлайн-дружніх процесів і для всіх, кому цікаво, куди йдуть відкриті інструменти для агентів.
Hermes, це опенсорсний цикл агента від Nous Research, той самий проєктний нейм, повністю не пов'язаний зі старим JavaScript-двигуном від Facebook. Упакований CLI лежить у Katchy.app/Contents/Resources/HermesRuntime, якщо колись захочеш зазирнути.

Пліч-о-пліч

Обидва двигуни поважають той самий контракт агента, та сама гаряча клавіша, ті самі дозволи, та сама картка в доку, той самий запит на деструктивну дію, той самий Cmd-Z. Відрізняється все, що нижче шару UX.

  • Налаштування, Codex'у потрібен ключ OpenAI; Hermes працює з моменту запуску Katchy.
  • Мережа, Codex шле кожне завдання на сервери OpenAI; Hermes крутить цикл локально й лізе в мережу лише якщо ти сам приплів його до віддаленої моделі.
  • Вартість, Codex це плата за токени; у Hermes нульова вартість за завдання (платиш один раз, розміром завантаження).
  • Швидкість, Codex зазвичай швидший на першому токені, бо моделі OpenAI більші й тепліші; Hermes конкурентний на коротких завданнях і поза конкуренцією для офлайну.
  • Стеля, Codex успадковує найновішу здатність OpenAI міркувати; Hermes успадковує ту відкриту модель, на яку ти його націлив.

Який обрати

  1. Почни з Codex. Він за замовчуванням не просто так, це двигун, під який налаштовували решту Katchy, і той, що з найбільшою ймовірністю з першого разу впорається з усім, що ти в нього кинеш.
  2. Перемкнися на Hermes, якщо тебе чіпляє щось із цього: не хочеш вставляти ключ OpenAI, працюєш над чимось достатньо приватним, щоб краще не пускати по дроту, сидиш на хисткому з'єднанні, або цікавишся відкритими інструментами для агентів і хочеш покататися, не виходячи з застосунку.
  3. Можна перемикатися від сесії до сесії, вибір живе в Налаштування → Агент → Двигун і спрацьовує на наступному завданні агента. Завдання, що вже біжать, продовжують на тому двигуні, з яким стартували.

Що залишається однаковим у будь-якому разі

Та сама гаряча клавіша Control + Option запускає і зупиняє агента. Та сама картка в доку показує прогрес. Ті самі дозволи macOS контролюють кожне читання файлу, клік і команду shell. Вибір двигуна, це сантехніка; твої звички не змінюються, коли ти перемикаєшся.

Доступна також як звичайний markdown.