Hoppa till innehåll
Dokumentation

Funktioner · 4 min läsning

Agentmotorer: Codex och Hermes

När du lämnar över en lång uppgift till Katchy, städa skrivbordet, sammanfatta den här 60-sidors PDF:en, döpa om varje skärmdump efter innehåll, startar en agentmotor i bakgrunden, planerar arbetet, exekverar steg för steg och rapporterar tillbaka på ett litet dockkort. Katchy levereras med två motorer som du kan växla mellan i Inställningar → Agent → Engine. Samma UX, samma snabbtangent, samma behörighetsmodell. Olika hjärna under huven.

Codex, standardvalet

Codex är det som kör första gången du öppnar Katchy. Det routar varje agentuppgift till en frontier-modell från OpenAI för resonemang och använder Katchys egna medföljande runtime för att hantera planeringsslingan, verktygsanrop och dockkortets livscykel. Modellen plockar sig själv utifrån uppgiften, snabba redigeringar går till snabbare modeller, arbete med lång kontext routas till de djupare.

  • Polerad ur lådan, motorn som appen först byggdes runt.
  • Pratar med OpenAI:s API; kräver din egen OPENAI_API_KEY inklistrad i Inställningar.
  • Bäst på flerstegsuppgifter som drar nytta av en toppklassad resonemangsmodell: research, refactors, arbete med långa dokument.
  • Pay-per-token till OpenAI, vanligtvis cent per uppgift, beroende på längd.

Hermes, det öppna alternativet

Hermes lindar runt hermes-agent CLI:n från Nous Research. Katchy levererar hela Python-runtimen (~360 MB) + hermes-agent-installationen MEDFÖLJANDE i Katchy.app, ingen pip install, ingen Terminal, ingen setup-guide. Växla till Hermes i Inställningar och nästa agentuppgift kör via det lokala Python istället för OpenAI-API:t.

  • Helt lokal agentslinga, planeringen, verktygsvalet och självkontrollen sker allt på din Mac.
  • Noll installation. Runtimen följer med appen och är signerad + notariserad som en del av bygget.
  • Ingen OpenAI-nyckel krävs för själva agenten; ta med din egen modell-endpoint om du vill ha frontier-klassens resonemang, eller kör en mindre lokal modell.
  • Bäst för integritetskänsligt arbete, offline-vänliga flöden, och alla som är nyfikna på vart öppen agentverktyg är på väg.
Hermes är open source-agentslingan från Nous Research, samma projektnamn, helt orelaterat till Facebooks gamla JavaScript-motor. Den medföljande CLI:n bor på Katchy.app/Contents/Resources/HermesRuntime om du någonsin vill kika på den.

Sida vid sida

Båda motorerna lyder samma agentkontrakt, samma snabbtangent, samma behörigheter, samma dockkort, samma fråga vid destruktiva åtgärder, samma Cmd-Z. Det som skiljer sig ligger allt under UX-lagret.

  • Setup, Codex behöver en OpenAI-nyckel; Hermes funkar i det ögonblick Katchy startar.
  • Nätverk, Codex skickar varje uppgift till OpenAI:s servrar; Hermes kör slingan lokalt och rör nätverket bara om du har kopplat den till en fjärrmodell.
  • Kostnad, Codex är pay-per-token; Hermes har noll kostnad per uppgift (du betalar en gång, i nedladdningsstorlek).
  • Hastighet, Codex är oftast snabbare på första token eftersom OpenAI:s modeller är större och varma; Hermes är konkurrenskraftig för korta uppgifter och oslagbar för offlinebruk.
  • Tak, Codex ärver OpenAI:s senaste resonemangsförmåga; Hermes ärver vilken öppen modell du än pekar den på.

Vilken ska du välja

  1. Börja med Codex. Den är inte standard utan anledning, det är motorn resten av Katchy är trimmad mot, och den som sannolikast klarar det du kastar på den vid första försöket.
  2. Byt till Hermes om något av följande träffar: du vill inte klistra in en OpenAI-nyckel, du jobbar på något privat nog att du hellre inte skickar det över tråden, du sitter på en skakig anslutning, eller du är nyfiken på öppen agentverktyg och vill provköra utan att lämna appen.
  3. Du kan växla mellan dem per session, valet bor i Inställningar → Agent → Engine och slår igenom vid nästa agentuppgift. Pågående uppgifter fortsätter på den motor de startade på.

Vad som är sig likt oavsett

Samma Control + Option-snabbtangent startar och stoppar agenten. Samma dockkort visar framsteg. Samma macOS-behörigheter gatar varje filläsning, klick och skalkommando. Motorvalet är rörmokeri, dina vanor ändras inte när du byter.

Finns även som ren markdown.