Przejdź do treści
Dokumentacja

Funkcje · 4 min czytania

Tryb agenta

Tryb agenta jest dla wszystkiego, co jest większe niż jedno zdanie roboty. Powiedz „hej agencie” albo rzuć zadanie, które wyraźnie wymaga kilku kroków, Katchy odpala sesję w tle, która planuje, wykonuje, sprawdza swoją pracę i pokazuje wynik na małej karcie doku obok kursora.

Co potrafi agent

  • Czytać i zapisywać pliki wszędzie tam, gdzie dałeś dostęp.
  • Odpalać polecenia powłoki, git, npm, curl, python, cokolwiek masz w PATH.
  • Otwierać aplikacje, klikać, przeciągać, pisać (z włączonym Computer Use).
  • Przeszukiwać sieć i podążać za linkami.
  • Trzymać pamięć, każde skończone zadanie ląduje w logu, żeby kolejne sesje wiedziały, co się działo.

Czego agent nie potrafi

  • Ruszać niczego poza uprawnieniami macOS, które mu nadałeś.
  • Używać poświadczeń, których mu nie dałeś.
  • Przeżyć zamknięcia Katchy, wyłączenie aplikacji czysto zatrzymuje wszystkich pracujących agentów.

Karta doku

Gdy agent pracuje, obok kursora widzisz małą kartę z:

  • Tytułem zadania (generowanym automatycznie, rzeczownikiem na początku, np. „Porządek w Przypomnieniach”, nie „Czy mógłbyś łaskawie…”)
  • Aktualnym etapem, Planowanie / Wykonywanie / Składanie odpowiedzi / Gotowe
  • Żywą linią kroków z ostatnim poleceniem powłoki albo fragmentem od asystenta
  • Propozycjami kolejnych kroków po zakończeniu zadania

Kliknij kartę, żeby zobaczyć pełny zapis rozmowy, albo wciśnij Stop / Odrzuć bez otwierania panelu.

Głos + agent razem

Te dwa tryby są pomyślane, żeby chodzić razem. Głos jest na pierwszym planie (jedno pytanie, jedna odpowiedź); agenci w tle (długie zadania). Typowa pętla:

  1. Głosem: „co blokuje ten test?”
  2. Przeczytaj odpowiedź. Pomyśl.
  3. Przekaż dalej: „hej agencie, dorzuć brakujący import w auth/session.ts i odpal test jeszcze raz.”
  4. Pracuj dalej nad następną rzeczą. Karta doku miga, kiedy agent kończy.

Destrukcyjne ruchy najpierw pytają

Skasować, wysłać, opublikować, nadpisać, destrukcyjne ruchy domyślnie proszą o potwierdzenie. Cała reszta jest do cofnięcia zwykłym Cmd + Z. Agenta zatrzymasz w każdej chwili tym samym skrótem Control + Option.

Dostępne także jako zwykły markdown.

Następnie w Funkcje

Silniki agenta: Codex i Hermes

Tryb agenta napędzają dwa silniki. Codex to wypolerowany domyślny. Hermes to otwarta, w pełni lokalna alternatywa. Tu jest, kiedy każdy z nich wygrywa.