Funktionen · 4 Min. Lesezeit
Agent-Engines: Codex und Hermes
Wenn du Katchy eine lange Aufgabe übergibst, den Schreibtisch aufräumen, dieses 60-seitige PDF zusammenfassen, jeden Screenshot nach Inhalt umbenennen, startet im Hintergrund eine Agent-Engine, plant die Arbeit, führt Schritt für Schritt aus und meldet sich auf einer kleinen Dock-Karte zurück. Katchy bringt zwei Engines mit, die du in Einstellungen → Agent → Engine wechseln kannst. Gleiche UX, gleicher Hotkey, gleiches Berechtigungsmodell. Unten drunter ein anderes Gehirn.
Codex, die Voreinstellung
Codex ist das, was beim ersten Öffnen von Katchy läuft. Es leitet jede Agent-Aufgabe für das Reasoning an ein Frontier-Modell von OpenAI weiter und nutzt Katchys eigene gebündelte Runtime für die Planungsschleife, Tool-Aufrufe und den Lebenszyklus der Dock-Karte. Das Modell wählt sich passend zur Aufgabe, schnelle Edits gehen an schnellere Modelle, Arbeit mit langem Kontext landet bei den tieferen.
- Out of the box poliert, die Engine, um die die App zuerst gebaut wurde.
- Spricht mit der API von OpenAI; braucht deinen eigenen OPENAI_API_KEY, eingefügt in Einstellungen.
- Am stärksten bei mehrstufigen Aufgaben, die von einem Top-Reasoning-Modell profitieren: Recherche, Refactors, Arbeit mit langen Dokumenten.
- Pay-per-Token an OpenAI, meist Cents pro Aufgabe, je nach Länge.
Hermes, die offene Alternative
Hermes umhüllt die hermes-agent CLI von Nous Research. Katchy bringt die komplette Python-Runtime (~360 MB) + die hermes-agent-Installation GEBÜNDELT in Katchy.app mit, kein pip install, kein Terminal, kein Setup-Assistent. Wechsle in den Einstellungen auf Hermes und die nächste Agent-Aufgabe läuft über das lokale Python statt über die OpenAI-API.
- Vollständig lokale Agent-Schleife, Planung, Tool-Auswahl und Selbstprüfung passieren alle auf deinem Mac.
- Null Installation. Die Runtime ist Teil der App und wird im Build signiert + notarisiert.
- Kein OpenAI-Key für den Agenten selbst nötig; bring deinen eigenen Modell-Endpunkt mit, wenn du Frontier-Reasoning willst, oder fahre ein kleineres lokales Modell.
- Am stärksten bei datenschutzsensibler Arbeit, offline-freundlichen Workflows und für alle, die neugierig sind, wohin sich offenes Agent-Tooling entwickelt.
Seite an Seite
Beide Engines halten sich an denselben Agent-Vertrag, gleicher Hotkey, gleiche Berechtigungen, gleiche Dock-Karte, gleiche Rückfrage bei destruktiven Aktionen, gleiches Cmd-Z. Was sich unterscheidet, liegt alles unter der UX-Ebene.
- Setup, Codex braucht einen OpenAI-Key; Hermes funktioniert in dem Moment, in dem Katchy startet.
- Netzwerk, Codex schickt jede Aufgabe an die Server von OpenAI; Hermes fährt die Schleife lokal und geht nur ans Netzwerk, wenn du ihn an ein Remote-Modell angeschlossen hast.
- Kosten, Codex ist Pay-per-Token; Hermes hat null Kosten pro Aufgabe (du zahlst einmal, in Download-Größe).
- Geschwindigkeit, Codex ist beim ersten Token meist schneller, weil die Modelle von OpenAI größer und warm sind; Hermes ist bei kurzen Aufgaben konkurrenzfähig und für Offline-Einsatz unschlagbar.
- Obergrenze, Codex erbt die jeweils neueste Reasoning-Fähigkeit von OpenAI; Hermes erbt, worauf immer du ihn als offenes Modell ausrichtest.
Welche solltest du nehmen
- Fang mit Codex an. Es ist aus gutem Grund die Voreinstellung, die Engine, gegen die der Rest von Katchy abgestimmt wurde, und die mit der höchsten Chance, das, was du ihr beim ersten Versuch hinwirfst, zu erledigen.
- Wechsle zu Hermes, wenn eines davon zutrifft: du willst keinen OpenAI-Key einfügen, du arbeitest an etwas, das privat genug ist, dass du es lieber nicht über die Leitung schickst, du hast eine wacklige Verbindung, oder du bist neugierig auf offenes Agent-Tooling und willst es testen, ohne die App zu verlassen.
- Du kannst pro Sitzung zwischen ihnen umschalten, die Wahl wohnt in Einstellungen → Agent → Engine und greift bei der nächsten Agent-Aufgabe. Laufende Aufgaben bleiben auf der Engine, mit der sie gestartet sind.
Was so oder so gleich bleibt
Auch verfügbar als reines Markdown.