Zum Inhalt springen
Dokumentation

Grundlagen · 3 Min. Lesezeit

Sprachmodus

Im Sprachmodus verbringst du 80 % deiner Katchy-Zeit. Tastenkürzel halten, fragen, zuhören. Kein Chatfenster, kein Copy-Paste, kein Tab-Wechsel. Die Augen bleiben bei deiner Arbeit.

Die Schleife

  1. Halte Control + Option.
  2. Sprich einen Satz, eine Frage, eine Aufgabe, eine Klarstellung.
  3. Loslassen. Katchy macht einen Schnappschuss deines Bildschirms, wählt das passende Modell und antwortet dir ins Ohr.
  4. Wenn ein UI-Element für die Antwort wichtig ist, fliegt der Mauszeiger dorthin.

Probier’s

ControlOption

Wo er glänzt

  • Kurze „was ist das“-Fragen zu allem, was gerade auf dem Bildschirm ist.
  • Sich selbst noch erwischen vor einem Tippfehler oder einem falschen Klick.
  • Dichten Text durchgehen, „fass diesen Absatz zusammen.“
  • Pair-Programming-Stupser, „ist das der richtige Hook?“
  • Wenn die Hände frei bleiben müssen, Küche, Gym, Skizzenblock.

Wann du lieber in den Agent-Modus wechselst

Der Sprachmodus ist dialogisch und synchron, Katchy liest, denkt, antwortet, und die Sache ist durch. Sobald du dich zweimal „und dann“ sagen hörst, willst du den Agent-Modus (siehe verlinkter Artikel), der kann minutenlang laufen, Dateien anfassen, Apps öffnen und sich melden, wenn er fertig ist.

Transkriptions-Optionen

Standardmäßig nutzt Katchy Apples On-Device-Spracherkennung, kein Audio verlässt jemals den Mac. In Einstellungen → Stimme kannst du auf einen Cloud-Anbieter (Deepgram oder AssemblyAI) umschalten, wenn du bei längeren Fragen schnellere Transkription willst; eigenen Key mitbringen.

Auch verfügbar als reines Markdown.