Přejít na obsah
Dokumentace

Funkce · 4 min čtení

Agent engines: Codex a Hermes

Když Katchy předáš delší úkol, ukliď plochu, shrň tenhle 60stránkový PDF, přejmenuj všechny screenshoty podle obsahu, na pozadí se rozjede agent engine, naplánuje práci, krok po kroku ji odpracuje a na malé dokové kartě se ozve s výsledkem. Katchy přichází se dvěma enginy, mezi kterými se přepneš v Nastavení → Agent → Engine. Stejný UX, stejná zkratka, stejný model oprávnění. Pod kapotou jiný mozek.

Codex, výchozí

Codex je to, co běží, když Katchy otevřeš poprvé. Každý agentský úkol směruje na špičkový OpenAI model pro uvažování a používá vlastní bundlovaný runtime Katchy na plánovací smyčku, volání nástrojů a životní cyklus dokové karty. Model si vybírá sám podle úkolu, rychlé úpravy jdou na svižnější modely, práce s dlouhým kontextem putuje na ty hlubší.

  • Vyladěné rovnou z krabice, engine, kolem kterého se aplikace stavěla jako první.
  • Mluví s OpenAI API; potřebuje tvůj vlastní OPENAI_API_KEY vlepený do Nastavení.
  • Nejlepší na vícekrokové úkoly, kterým prospěje špičkový reasoning model: research, refaktoring, práce s dlouhými dokumenty.
  • Platí se OpenAI za tokeny, typicky pár centů za úkol, podle délky.

Hermes, otevřená alternativa

Hermes obaluje hermes-agent CLI od Nous Research. Katchy přibaluje celý Python runtime (~360 MB) + instalaci hermes-agent BUNDLOVANOU přímo uvnitř Katchy.app, žádný pip install, žádný Terminal, žádný setup wizard. V Nastavení přepneš na Hermes a další agentský úkol běží přes lokální Python místo přes OpenAI API.

  • Plně lokální agentská smyčka, plánování, výběr nástrojů i sebekontrola se dějí na tvém Macu.
  • Nulová instalace. Runtime jede s aplikací a je podepsaný + notarizovaný jako součást buildu.
  • Pro samotného agenta není potřeba OpenAI klíč; přines si vlastní model endpoint, jestli chceš reasoning ze špičky, nebo si pusť menší lokální model.
  • Nejlepší pro citlivou práci, offline workflow a každého, koho zajímá, kam míří otevřený agentský tooling.
Hermes je open-source agentská smyčka od Nous Research, stejné jméno projektu, ale úplně nesouvisí se starým JavaScript enginem od Facebooku. Bundlované CLI najdeš v Katchy.app/Contents/Resources/HermesRuntime, kdybys mu chtěl kouknout pod kapotu.

Vedle sebe

Oba enginy drží stejnou agentskou smlouvu, stejnou zkratku, stejná oprávnění, stejnou dokovou kartu, stejné ptaní u destruktivních akcí, stejné Cmd-Z. Liší se všechno pod UX vrstvou.

  • Nastavení, Codex potřebuje OpenAI klíč; Hermes jede ve chvíli, kdy Katchy nastartuje.
  • Síť, Codex posílá každý úkol na servery OpenAI; Hermes točí smyčku lokálně a do sítě sáhne, jenom když ho na vzdálený model sám napojíš.
  • Cena, Codex je platba za tokeny; Hermes nestojí za úkol nic (zaplatil jsi jednou, velikostí stahování).
  • Rychlost, Codex je obvykle rychlejší na první token, protože modely OpenAI jsou větší a teplejší; Hermes je konkurenceschopný na krátkých úkolech a nepřekonatelný offline.
  • Strop, Codex dědí nejnovější reasoning od OpenAI; Hermes dědí, na jaký otevřený model ho namíříš.

Který si vybrat

  1. Začni s Codexem. Není výchozí jen tak, je to engine, proti kterému se zbytek Katchy ladil, a ten, který nejspíš zvládne, co po něm hodíš, hned na první dobrou.
  2. Přepni na Hermes, jestli platí cokoliv z následujícího: nechceš lepit OpenAI klíč, pracuješ na něčem natolik soukromém, že to nechceš posílat po drátě, jsi na vrtkavém připojení nebo tě zajímá otevřený agentský tooling a chceš ho vyzkoušet, aniž bys opouštěl aplikaci.
  3. Mezi nimi můžeš pinkat per session, volba sedí v Nastavení → Agent → Engine a platí od příštího agentského úkolu. Rozjeté úkoly doběhnou na enginu, který je nastartoval.

Co je v obou stejné

Stejná zkratka Control + Option agenta startuje i zastavuje. Stejná doková karta ukazuje postup. Stejná macOS oprávnění hlídají každé čtení souboru, kliknutí a shellový příkaz. Volba enginu je instalatérština, tvoje návyky se přepínáním nemění.

K dispozici také jako prostý markdown.