Pereiti prie turinio
Dokumentai

Funkcijos · 4 min skaitymo

Agentų varikliai: Codex ir Hermes

Kai paduodi Katchy ilgą užduotį, sutvarkyti Desktop'ą, apibendrinti šitą 60 puslapių PDF, pervadinti kiekvieną ekrano nuotrauką pagal turinį, fone užsiveda agento variklis, suplanuoja darbą, vykdo žingsnis po žingsnio ir praneša rezultatą mažoje doko kortelėje. Katchy turi du variklius, kuriuos gali keisti Nustatymai → Agentas → Variklis. Ta pati UX, tas pats karštasis klavišas, tas pats leidimų modelis. Skirtingos smegenys apačioje.

Codex, numatytasis

Codex yra tas, kuris paleidžiamas, kai pirmą kartą atidarai Katchy. Jis kiekvieną agento užduotį siunčia samprotavimui į OpenAI ribinį modelį, o Katchy savai sukurta vykdyklė tvarko planavimo ciklą, įrankių iškvietimus ir doko kortelės gyvavimą. Modelis pasirenkamas pats pagal užduotį, greitiems redagavimams atitenka greitesni modeliai, ilgo konteksto darbai keliauja į gilesnius.

  • Nugludintas iš dėžės, variklis, aplink kurį pirmiausia ir buvo statoma programa.
  • Kalba su OpenAI API; reikia savo OPENAI_API_KEY, įklijuoto į Settings.
  • Geriausiai veikia daugiapakopėms užduotims, kurioms naudingas pirmos klasės samprotavimo modelis: tyrimai, refaktorinimai, ilgų dokumentų darbai.
  • Mokama OpenAI už tokeną, paprastai centai už užduotį, priklauso nuo ilgio.

Hermes, atviras pakaitalas

Hermes apgaubia hermes-agent CLI iš Nous Research. Katchy atsineša visą Python vykdyklę (~360 MB) + hermes-agent įdiegimą supakuotą Katchy.app viduje, jokio pip install, jokio Terminal, jokio sąrankos vediklio. Settings perjunk į Hermes ir kita agento užduotis bėgs per vietinį Python vietoje OpenAI API.

  • Visiškai vietinis agento ciklas, planavimas, įrankių parinkimas ir savitikra vyksta tavo Mac'e.
  • Nulio diegimo. Vykdyklė ateina kartu su programa ir yra pasirašyta + notarizuota kaip dalies kūrimo.
  • Pačiam agentui OpenAI rakto nereikia; atsinešk savo modelio adresą, jei nori ribinės klasės samprotavimo, arba paleisk mažesnį vietinį modelį.
  • Geriausia privatumui jautriam darbui, neprisijungus draugiškiems srautams ir tiems, kuriems įdomu, kur eina atviri agentų įrankiai.
Hermes yra atviro kodo agento ciklas iš Nous Research, to paties pavadinimo projektas, visiškai nesusijęs su sena Facebook JavaScript varikline. Supakuotas CLI gyvena Katchy.app/Contents/Resources/HermesRuntime, jei kada norėsi pasižiūrėti.

Greta vienas šalia kito

Abu varikliai laikosi to paties agento kontrakto, to paties karštojo klavišo, tų pačių leidimų, tos pačios doko kortelės, to paties klausimo apie destruktyvų veiksmą, to paties Cmd-Z. Skiriasi viskas po UX sluoksniu.

  • Sąranka, Codex'ui reikia OpenAI rakto; Hermes veikia tą akimirką, kai Katchy užsileidžia.
  • Tinklas, Codex kiekvieną užduotį siunčia į OpenAI serverius; Hermes ciklas sukasi vietoje ir į tinklą lenda tik tuomet, jei pats pajungei prie nutolusio modelio.
  • Kaina, Codex moki už tokeną; Hermes neturi kainos už užduotį (sumoki kartą, atsisiuntimo dydžiu).
  • Greitis, Codex paprastai greitesnis pirmajam tokenui, nes OpenAI modeliai didesni ir įšildyti; Hermes konkurentingas trumpoms užduotims ir nepralenkiamas neprisijungus.
  • Lubos, Codex paveldi naujausias OpenAI samprotavimo galimybes; Hermes paveldi tai, į kokį atvirą modelį jį nukreipi.

Kurį pasirinkti

  1. Pradėk nuo Codex. Jis numatytasis ne be priežasties, variklis, pagal kurį buvo derinama likusi Katchy dalis, ir tas, kuris greičiausiai susidoros su tuo, ką jam pateiksi iš pirmo karto.
  2. Pereik prie Hermes, jei pataikai į vieną iš šių: nenori klijuoti OpenAI rakto, dirbi su tokiu privačiu dalyku, kad geriau jo nesiųsti tinklu, esi prastame ryšyje, arba smalsu, kaip jaučiasi atviri agentų įrankiai, ir nori juos išbandyti neišeidamas iš programos.
  3. Tarp jų gali šokinėti per sesijas, pasirinkimas gyvena Nustatymai → Agentas → Variklis ir įsigalioja kitai agento užduočiai. Vykstančios užduotys baigia bėgti tuo varikliu, kuriuo prasidėjo.

Kas lieka tas pats abiem atvejais

Tas pats Control + Option derinys paleidžia ir sustabdo agentą. Ta pati doko kortelė rodo pažangą. Tie patys macOS leidimai prižiūri kiekvieną failo skaitymą, paspaudimą ir komandų eilutės komandą. Variklio pasirinkimas, tai vamzdynas; tavo įpročiai nesikeičia, kai perjungi.

Taip pat pasiekiamas kaip paprastas markdown.