Funktionen · 4 Min. Lesezeit
Agent-Modus
Der Agent-Modus ist die Oberfläche für alles, was größer ist als ein Satz Arbeit. Sag „hey Agent“ oder formuliere eine Aufgabe, die offensichtlich mehrere Schritte braucht, Katchy startet eine Hintergrundsitzung, die plant, ausführt, ihre Arbeit prüft und das Ergebnis auf einer kleinen Dock-Karte neben deinem Mauszeiger anzeigt.
Was ein Agent kann
- Dateien lesen und schreiben, überall wo du Zugriff erteilt hast.
- Shell-Befehle ausführen, git, npm, curl, python, alles was in deinem PATH ist.
- Apps öffnen, klicken, ziehen, tippen (mit aktiviertem Computer Use).
- Das Web durchsuchen und Links folgen.
- Erinnerung behalten, jede abgeschlossene Aufgabe wird protokolliert, damit künftige Sitzungen wissen, was passiert ist.
Was ein Agent nicht kann
- Etwas anfassen, das außerhalb der macOS-Berechtigungen liegt, die du erteilt hast.
- Zugangsdaten benutzen, die er nicht bekommen hat.
- Ein Katchy-Beenden überleben, beim Schließen der App werden laufende Agenten sauber gestoppt.
Die Dock-Karte
Während ein Agent arbeitet, siehst du eine kleine Karte neben dem Mauszeiger mit:
- Dem Aufgabentitel (automatisch erzeugt, Substantiv zuerst, z. B. „Erinnerungen aufräumen“, nicht „Könntest du bitte…“)
- Aktuellem Stand, Plant / Führt aus / Schreibt Antwort / Fertig
- Einer Live-Zeile mit dem zuletzt ausgeführten Shell-Befehl oder Assistenten-Snippet
- Vorgeschlagenen nächsten Aktionen, wenn die Aufgabe fertig ist
Klick auf die Karte für das volle Gesprächsprotokoll, oder drück Stopp / Schließen, ohne das Dashboard zu öffnen.
Stimme + Agent kombinieren
Die beiden Modi sind dafür gebaut, zusammen zu laufen. Stimme ist der Vordergrund (eine Frage, eine Antwort); Agenten sind der Hintergrund (lange Aufgaben). Ein typischer Ablauf:
- Stimme: „was blockiert diesen Test?“
- Antwort lesen. Nachdenken.
- Übergeben: „hey Agent, fix den fehlenden Import in auth/session.ts und lass den Test nochmal laufen.“
- An der nächsten Sache weiterarbeiten. Die Dock-Karte blinkt, wenn er fertig ist.
Destruktive Aktionen fragen erst nach
Auch verfügbar als reines Markdown.
Weiter bei Funktionen
Agent-Engines: Codex und Hermes
Zwei Engines treiben den Agent-Modus an. Codex ist die polierte Voreinstellung. Hermes ist die offene, vollständig lokale Alternative. Hier erfährst du, wann welche gewinnt.