Katchy is a free menu-bar AI assistant for macOS. Hold Control and Option, talk, and Katchy answers questions about whatever is on your screen, routing each one to the best of GPT, Claude, or Gemini.

Four modes from one hotkey: push-to-talk voice, screen-aware answers that see what is on your Mac, a cursor overlay that points right at the answer, and background agents that handle multi-step tasks across Files, Mail, the browser, and AppleScript.

How much does Katchy cost?

Katchy is free forever with gentle in-app ads. Katchy Pro shows far fewer ads and unlocks unlimited questions and agent runs for €19.99 per month or €215.89 per year (about 10% cheaper than monthly).

Yes. Katchy is free forever, including 100 questions and 35 agent runs a month across all three AI models. Pro lifts those limits and shows fewer ads.

What do I need to run Katchy?

macOS 14.2 or later on Apple Silicon or Intel, and about 860 MB of space. No account or sign-up is needed to download it.

Which AI models does Katchy use?

GPT, Claude, and Gemini. Katchy routes each question to whichever model handles it best, all from one menu-bar app.

Katchy is local-first. Transcription runs on-device where possible, and your screen is only captured when you ask for help; it never leaves your Mac unless a question needs it.

Download it free for macOS at heyyykatchy.com/download.

← Dokumentation

Funktionen · 4 Min. Lesezeit

Agent-Engines: Codex und Hermes

Wenn du Katchy eine lange Aufgabe übergibst, den Schreibtisch aufräumen, dieses 60-seitige PDF zusammenfassen, jeden Screenshot nach Inhalt umbenennen, startet im Hintergrund eine Agent-Engine, plant die Arbeit, führt Schritt für Schritt aus und meldet sich auf einer kleinen Dock-Karte zurück. Katchy bringt zwei Engines mit, die du in Einstellungen → Agent → Engine wechseln kannst. Gleiche UX, gleicher Hotkey, gleiches Berechtigungsmodell. Unten drunter ein anderes Gehirn.

#Codex, die Voreinstellung

Codex ist das, was beim ersten Öffnen von Katchy läuft. Es leitet jede Agent-Aufgabe für das Reasoning an ein Frontier-Modell von OpenAI weiter und nutzt Katchys eigene gebündelte Runtime für die Planungsschleife, Tool-Aufrufe und den Lebenszyklus der Dock-Karte. Das Modell wählt sich passend zur Aufgabe, schnelle Edits gehen an schnellere Modelle, Arbeit mit langem Kontext landet bei den tieferen.

Out of the box poliert, die Engine, um die die App zuerst gebaut wurde.
Spricht mit der API von OpenAI; braucht deinen eigenen OPENAI_API_KEY, eingefügt in Einstellungen.
Am stärksten bei mehrstufigen Aufgaben, die von einem Top-Reasoning-Modell profitieren: Recherche, Refactors, Arbeit mit langen Dokumenten.
Pay-per-Token an OpenAI, meist Cents pro Aufgabe, je nach Länge.

#Hermes, die offene Alternative

Hermes umhüllt die hermes-agent CLI von Nous Research. Katchy bringt die komplette Python-Runtime (~360 MB) + die hermes-agent-Installation GEBÜNDELT in Katchy.app mit, kein pip install, kein Terminal, kein Setup-Assistent. Wechsle in den Einstellungen auf Hermes und die nächste Agent-Aufgabe läuft über das lokale Python statt über die OpenAI-API.

Vollständig lokale Agent-Schleife, Planung, Tool-Auswahl und Selbstprüfung passieren alle auf deinem Mac.
Null Installation. Die Runtime ist Teil der App und wird im Build signiert + notarisiert.
Kein OpenAI-Key für den Agenten selbst nötig; bring deinen eigenen Modell-Endpunkt mit, wenn du Frontier-Reasoning willst, oder fahre ein kleineres lokales Modell.
Am stärksten bei datenschutzsensibler Arbeit, offline-freundlichen Workflows und für alle, die neugierig sind, wohin sich offenes Agent-Tooling entwickelt.

Hermes ist die Open-Source-Agent-Schleife von Nous Research, selber Projektname, hat nichts mit Facebooks alter JavaScript-Engine zu tun. Die gebündelte CLI liegt unter Katchy.app/Contents/Resources/HermesRuntime, falls du sie dir mal ansehen willst.

#Seite an Seite

Beide Engines halten sich an denselben Agent-Vertrag, gleicher Hotkey, gleiche Berechtigungen, gleiche Dock-Karte, gleiche Rückfrage bei destruktiven Aktionen, gleiches Cmd-Z. Was sich unterscheidet, liegt alles unter der UX-Ebene.

Setup, Codex braucht einen OpenAI-Key; Hermes funktioniert in dem Moment, in dem Katchy startet.
Netzwerk, Codex schickt jede Aufgabe an die Server von OpenAI; Hermes fährt die Schleife lokal und geht nur ans Netzwerk, wenn du ihn an ein Remote-Modell angeschlossen hast.
Kosten, Codex ist Pay-per-Token; Hermes hat null Kosten pro Aufgabe (du zahlst einmal, in Download-Größe).
Geschwindigkeit, Codex ist beim ersten Token meist schneller, weil die Modelle von OpenAI größer und warm sind; Hermes ist bei kurzen Aufgaben konkurrenzfähig und für Offline-Einsatz unschlagbar.
Obergrenze, Codex erbt die jeweils neueste Reasoning-Fähigkeit von OpenAI; Hermes erbt, worauf immer du ihn als offenes Modell ausrichtest.

#Welche solltest du nehmen

Fang mit Codex an. Es ist aus gutem Grund die Voreinstellung, die Engine, gegen die der Rest von Katchy abgestimmt wurde, und die mit der höchsten Chance, das, was du ihr beim ersten Versuch hinwirfst, zu erledigen.
Wechsle zu Hermes, wenn eines davon zutrifft: du willst keinen OpenAI-Key einfügen, du arbeitest an etwas, das privat genug ist, dass du es lieber nicht über die Leitung schickst, du hast eine wacklige Verbindung, oder du bist neugierig auf offenes Agent-Tooling und willst es testen, ohne die App zu verlassen.
Du kannst pro Sitzung zwischen ihnen umschalten, die Wahl wohnt in Einstellungen → Agent → Engine und greift bei der nächsten Agent-Aufgabe. Laufende Aufgaben bleiben auf der Engine, mit der sie gestartet sind.

#Was so oder so gleich bleibt

Dasselbe Control + Option-Kürzel startet und stoppt den Agenten. Dieselbe Dock-Karte zeigt den Fortschritt. Dieselben macOS-Berechtigungen gaten jedes Lesen einer Datei, jeden Klick und jeden Shell-Befehl. Die Engine-Wahl ist Klempnerarbeit, deine Gewohnheiten ändern sich beim Wechsel nicht.

Auch verfügbar als reines Markdown.