Przejdź do treści
Dokumentacja

Funkcje · 4 min czytania

Silniki agenta: Codex i Hermes

Kiedy oddajesz Katchy długie zadanie, uporządkuj pulpit, streść tego 60-stronicowego PDF-a, zmień nazwy wszystkich screenshotów po zawartości, w tle odpala się silnik agenta, planuje robotę, wykonuje krok po kroku i melduje na małej karcie doku. Katchy przychodzi z dwoma silnikami, które przełączysz w Ustawienia → Agent → Silnik. To samo UX, ten sam skrót, ten sam model uprawnień. Inny mózg pod spodem.

Codex, domyślny

Codex jest tym, co odpala się przy pierwszym uruchomieniu Katchy. Każde zadanie agenta kieruje do frontierowego modelu OpenAI do myślenia, a do obsługi pętli planowania, wywołań narzędzi i cyklu życia karty doku używa własnego, wbudowanego runtime'u Katchy. Model wybiera się sam pod zadanie, szybkie poprawki idą do szybszych modeli, robota z długim kontekstem do tych głębszych.

  • Wypolerowany od razu, silnik, wokół którego aplikacja była zbudowana od początku.
  • Gada z API OpenAI; wymaga twojego OPENAI_API_KEY wklejonego w Ustawieniach.
  • Najlepszy do zadań wieloetapowych, którym pomaga topowy model rozumujący: research, refaktoryzacja, robota z długimi dokumentami.
  • Płatność za token do OpenAI, zwykle grosze za zadanie, zależnie od długości.

Hermes, otwarta alternatywa

Hermes opakowuje CLI hermes-agent od Nous Research. Katchy dowozi cały runtime Pythona (~360 MB) + instalację hermes-agent WBUDOWANE w Katchy.app, nie ma żadnego pip install, żadnego Terminala, żadnego kreatora konfiguracji. Przełącz na Hermesa w Ustawieniach i następne zadanie agenta poleci przez lokalnego Pythona zamiast API OpenAI.

  • W pełni lokalna pętla agenta, planowanie, dobór narzędzi i sprawdzanie samego siebie dzieją się w całości na twoim Macu.
  • Zero instalacji. Runtime jedzie razem z aplikacją i jest podpisany + notaryzowany w ramach buildu.
  • Sam agent nie wymaga klucza OpenAI; przynieś swój endpoint modelu, jeśli chcesz rozumowania z górnej półki, albo odpal mniejszy model lokalny.
  • Najlepszy do roboty wrażliwej na prywatność, do przepływów offline-friendly i dla każdego, kto jest ciekawy, dokąd zmierzają otwarte narzędzia agentowe.
Hermes to otwartoźródłowa pętla agenta od Nous Research, ta sama nazwa projektu, kompletnie nic wspólnego ze starym silnikiem JavaScript od Facebooka. Wbudowany CLI mieszka pod Katchy.app/Contents/Resources/HermesRuntime, gdybyś kiedyś chciał zajrzeć.

Obok siebie

Oba silniki trzymają się tego samego kontraktu agenta, ten sam skrót, te same uprawnienia, ta sama karta doku, to samo pytanie przed destrukcyjnym ruchem, ten sam Cmd-Z. Różni się wszystko poniżej warstwy UX.

  • Setup, Codex potrzebuje klucza OpenAI; Hermes działa w chwili, gdy Katchy się uruchamia.
  • Sieć, Codex wysyła każde zadanie na serwery OpenAI; Hermes kręci pętlę lokalnie i dotyka sieci tylko wtedy, gdy podpiąłeś go pod zdalny model.
  • Koszt, Codex płaci się za token; Hermes ma zerowy koszt za zadanie (płacisz raz, w rozmiarze pobrania).
  • Szybkość, Codex zwykle szybciej oddaje pierwszy token, bo modele OpenAI są większe i rozgrzane; Hermes nadąża przy krótkich zadaniach i nie ma sobie równych offline.
  • Sufit, Codex dziedziczy najnowsze zdolności rozumowania OpenAI; Hermes dziedziczy taki otwarty model, na jaki go skierujesz.

Który wybrać

  1. Zacznij od Codeksa. Jest domyślny nie bez powodu, to silnik, pod który reszta Katchy była strojona, i ten, który najpewniej za pierwszym podejściem ogarnie to, co mu rzucisz.
  2. Przełącz na Hermesa, jeśli któreś z poniższych trafia: nie chcesz wklejać klucza OpenAI, pracujesz nad czymś na tyle prywatnym, że wolisz nie puszczać tego po drucie, jesteś na słabym łączu albo jesteś ciekaw otwartych narzędzi agentowych i chcesz je przetestować bez wychodzenia z aplikacji.
  3. Możesz przełączać się między nimi w obrębie sesji, wybór mieszka w Ustawienia → Agent → Silnik i wchodzi w życie przy następnym zadaniu agenta. Zadania w locie dalej lecą na silniku, który je odpalił.

Co zostaje takie samo tak czy siak

Ten sam skrót Control + Option startuje i zatrzymuje agenta. Ta sama karta doku pokazuje postęp. Te same uprawnienia macOS pilnują każdego odczytu pliku, kliknięcia i polecenia powłoki. Wybór silnika to hydraulika, twoje nawyki nie zmieniają się, gdy przełączasz.

Dostępne także jako zwykły markdown.