Funzioni · 4 min di lettura
Motori d'agente: Codex e Hermes
Quando passi a Katchy un task lungo, riordina la Scrivania, riassumi questo PDF da 60 pagine, rinomina ogni screenshot in base al contenuto, un motore d'agente parte in background, pianifica il lavoro, lo esegue passo dopo passo e ti aggiorna in una piccola dock card. Katchy include due motori che puoi scambiare in Impostazioni → Agente → Motore. Stessa UX, stesso tasto rapido, stesso modello di permessi. Cervello diverso sotto.
Codex, il default
Codex è quello che parte la prima volta che apri Katchy. Indirizza ogni task d'agente a un modello frontier di OpenAI per il ragionamento, e usa il runtime di Katchy stesso per gestire il ciclo di pianificazione, le chiamate agli strumenti e il ciclo di vita della dock card. Il modello si sceglie da solo in base al task, le modifiche rapide vanno ai modelli più veloci, il lavoro a contesto lungo viene indirizzato a quelli più profondi.
- Levigato out of the box, il motore attorno al quale l'app è stata costruita per prima.
- Parla con l'API di OpenAI; serve la tua OPENAI_API_KEY incollata in Impostazioni.
- Imbattibile sui task a più passaggi che beneficiano di un modello di ragionamento di prima fascia: ricerca, refactor, lavoro su documenti lunghi.
- Pagamento a token verso OpenAI, tipicamente pochi centesimi a task, a seconda della lunghezza.
Hermes, l'alternativa aperta
Hermes incarta il CLI hermes-agent di Nous Research. Katchy spedisce l'intero runtime Python (~360 MB) + l'installazione di hermes-agent IMPACCHETTATI dentro Katchy.app, niente pip install, niente Terminal, niente procedura guidata. Passa a Hermes in Impostazioni e il prossimo task d'agente gira sul Python locale anziché sull'API di OpenAI.
- Ciclo d'agente completamente locale, pianificazione, scelta degli strumenti e auto-verifica avvengono tutte sul tuo Mac.
- Zero installazione. Il runtime viaggia con l'app ed è firmato + notarizzato come parte del build.
- Nessuna chiave OpenAI richiesta per l'agente stesso; porta il tuo endpoint di modello se vuoi ragionamento di prima fascia, oppure fai girare un modello locale più piccolo.
- Imbattibile per lavoro sensibile alla privacy, flussi pensati per l'offline, e per chiunque sia curioso di dove sta andando il tooling aperto d'agenti.
Fianco a fianco
Entrambi i motori rispettano lo stesso contratto d'agente, stesso tasto rapido, stessi permessi, stessa dock card, stesso prompt per le azioni distruttive, stesso Cmd-Z. Quello che cambia è tutto ciò che sta sotto lo strato di UX.
- Setup, Codex richiede una chiave OpenAI; Hermes funziona dal momento in cui Katchy parte.
- Rete, Codex manda ogni task ai server di OpenAI; Hermes esegue il ciclo in locale e tocca la rete solo se l'hai cablato a un modello remoto.
- Costo, Codex si paga a token; Hermes ha costo zero per task (paghi una volta sola, in dimensione di download).
- Velocità, Codex è di solito più rapido sul primo token perché i modelli OpenAI sono più grandi e più caldi; Hermes regge bene sui task brevi ed è imbattibile per l'uso offline.
- Soffitto, Codex eredita l'ultima capacità di ragionamento di OpenAI; Hermes eredita qualunque modello aperto gli punti contro.
Quale dovresti scegliere
- Parti da Codex. È il default per un motivo, è il motore su cui è stato tarato il resto di Katchy, e quello con più probabilità di gestire al primo colpo qualunque cosa tu gli lanci.
- Passa a Hermes se ti scatta una di queste: non vuoi incollare una chiave OpenAI, stai lavorando su qualcosa abbastanza privato da non volerlo mandare in rete, sei su una connessione ballerina, oppure sei curioso del tooling aperto d'agenti e vuoi provarlo senza uscire dall'app.
- Puoi alternare tra i due per sessione, la scelta vive in Impostazioni → Agente → Motore e ha effetto sul prossimo task d'agente. I task in corso continuano a girare sul motore che li ha avviati.
Cosa resta uguale in entrambi i casi
Disponibile anche come markdown puro.