Gå til indhold
Dokumentation

Funktioner · 4 min. læsning

Agentmotorer: Codex og Hermes

Når du afleverer en lang opgave til Katchy, ryd skrivebordet op, opsummer denne 60-siders PDF, omdøb hvert screenshot efter indhold, starter en agentmotor i baggrunden, lægger en plan, udfører trin for trin og melder tilbage på et lille dock-kort. Katchy leveres med to motorer, du kan skifte mellem under Indstillinger → Agent → Motor. Samme UX, samme genvejstast, samme tilladelsesmodel. Forskellig hjerne nedenunder.

Codex, standarden

Codex er det, der kører første gang, du åbner Katchy. Den ruter hver agentopgave til en frontier-OpenAI-model til ræsonnement og bruger Katchys egen indbyggede runtime til at håndtere planlægningsløkken, værktøjsopkald og dock-kortets livscyklus. Modellen vælger sig selv ud fra opgaven, hurtige rettelser går til de hurtigere modeller, arbejde med lang kontekst rutes til de dybere.

  • Poleret fra start, motoren, appen oprindeligt blev bygget op omkring.
  • Snakker med OpenAIs API; kræver din egen OPENAI_API_KEY indsat i Indstillinger.
  • Bedst til opgaver med flere trin, der har gavn af en topklasses ræsonnementsmodel: research, refaktorering, arbejde med lange dokumenter.
  • Betaling per token til OpenAI, typisk øre per opgave, afhængigt af længden.

Hermes, det åbne alternativ

Hermes pakker hermes-agent CLI'en fra Nous Research ind. Katchy leverer hele Python-runtimet (~360 MB) + hermes-agent-installationen INDLEJRET i Katchy.app, der er ingen pip install, ingen Terminal, ingen opsætningsguide. Skift til Hermes i Indstillinger, og den næste agentopgave kører gennem den lokale Python i stedet for OpenAI-API'en.

  • Fuldt lokal agentløkke, planlægning, værktøjsvalg og selvtjek sker alt sammen på din Mac.
  • Nul installation. Runtime'et leveres med appen og er signeret + notariseret som en del af buildet.
  • Ingen OpenAI-nøgle krævet til selve agenten; medbring dit eget modelendepunkt, hvis du vil have frontier-ræsonnement, eller kør en mindre lokal model.
  • Bedst til privatlivsfølsomt arbejde, offline-venlige flows og enhver, der er nysgerrig efter, hvor åbne agentværktøjer er på vej hen.
Hermes er den open source-agentløkke fra Nous Research, samme projektnavn, fuldstændig urelateret til Facebooks gamle JavaScript-motor. Den indbyggede CLI bor i Katchy.app/Contents/Resources/HermesRuntime, hvis du nogensinde vil kigge på den.

Side om side

Begge motorer overholder den samme agentkontrakt, samme genvejstast, samme tilladelser, samme dock-kort, samme prompt før destruktive handlinger, samme Cmd-Z. Det, der adskiller sig, er alt under UX-laget.

  • Opsætning, Codex kræver en OpenAI-nøgle; Hermes virker i det øjeblik Katchy starter.
  • Netværk, Codex sender hver opgave til OpenAIs servere; Hermes kører løkken lokalt og rører kun nettet, hvis du har koblet den til en fjernmodel.
  • Pris, Codex er betaling per token; Hermes har nul pris per opgave (du betaler én gang, i downloadstørrelse).
  • Hastighed, Codex er som regel hurtigere på første token, fordi OpenAIs modeller er større og varmere; Hermes er konkurrencedygtig på korte opgaver og uovertruffen offline.
  • Loft, Codex arver OpenAIs nyeste ræsonnementsevne; Hermes arver den åbne model, du peger den på.

Hvilken bør du vælge

  1. Start med Codex. Den er standarden af en grund, det er motoren, resten af Katchy er tunet op imod, og den mest sandsynlige til at håndtere det, du smider efter den, i første forsøg.
  2. Skift til Hermes, hvis noget af dette rammer: du har ikke lyst til at indsætte en OpenAI-nøgle, du arbejder med noget privat nok til, at du helst ikke vil sende det over nettet, du er på en ustabil forbindelse, eller du er nysgerrig efter åbne agentværktøjer og vil prøvekøre dem uden at forlade appen.
  3. Du kan skifte mellem dem per session, valget bor under Indstillinger → Agent → Motor og træder i kraft ved næste agentopgave. Igangværende opgaver kører videre på den motor, der startede dem.

Hvad er det samme uanset hvad

Samme Control + Option-genvej starter og stopper agenten. Samme dock-kort viser fremdrift. Samme macOS-tilladelser styrer hver fillæsning, klik og shell-kommando. Motorvalget er rørarbejde, dine vaner ændrer sig ikke, når du skifter.

Findes også som ren markdown.