Fonctions · 4 min de lecture
Moteurs d'agent : Codex et Hermes
Quand tu confies une tâche longue à Katchy, range le Bureau, résume ce PDF de 60 pages, renomme chaque capture d'écran selon son contenu, un moteur d'agent démarre en arrière-plan, planifie le travail, exécute étape par étape et te fait un rapport sur une petite carte du dock. Katchy embarque deux moteurs que tu peux échanger dans Réglages → Agent → Moteur. Même UX, même raccourci, même modèle de permissions. Cerveau différent en dessous.
Codex, le défaut
Codex, c'est ce qui tourne la première fois que tu ouvres Katchy. Il route chaque tâche d'agent vers un modèle OpenAI de pointe pour le raisonnement, et utilise le runtime maison de Katchy pour gérer la boucle de planification, les appels d'outils et le cycle de vie de la carte du dock. Le modèle se choisit tout seul selon la tâche, les éditions rapides partent vers des modèles plus véloces, le travail à long contexte est routé vers les plus profonds.
- Poli dès la sortie de la boîte, le moteur autour duquel l'app a été conçue en premier.
- Parle à l'API OpenAI ; il lui faut ta propre OPENAI_API_KEY collée dans Réglages.
- Imbattable sur les tâches multi-étapes qui profitent d'un modèle de raisonnement de premier rang : recherche, refactors, travail sur documents longs.
- Paiement au token côté OpenAI, typiquement quelques centimes par tâche, selon la longueur.
Hermes, l'alternative ouverte
Hermes enveloppe le CLI hermes-agent de Nous Research. Katchy embarque tout le runtime Python (~360 MB) + l'installation de hermes-agent EMPAQUETÉS dans Katchy.app, pas de pip install, pas de Terminal, pas d'assistant de configuration. Passe à Hermes dans Réglages et la prochaine tâche d'agent tourne via le Python local au lieu de l'API OpenAI.
- Boucle d'agent entièrement locale, la planification, le choix des outils et l'auto-vérification se passent tous sur ton Mac.
- Zéro installation. Le runtime est livré avec l'app, signé et notarisé dans le build.
- Pas de clé OpenAI exigée pour l'agent lui-même ; amène ton propre endpoint de modèle si tu veux du raisonnement haut de gamme, ou fais tourner un plus petit modèle local.
- Imbattable pour le travail sensible à la vie privée, les workflows compatibles hors-ligne, et toute personne curieuse de voir où va le tooling d'agents ouvert.
Côte à côte
Les deux moteurs respectent le même contrat d'agent, même raccourci, mêmes permissions, même carte du dock, même invite pour les actions destructives, même Cmd-Z. Ce qui diffère, c'est tout ce qui est sous la couche d'UX.
- Setup, Codex a besoin d'une clé OpenAI ; Hermes fonctionne dès que Katchy démarre.
- Réseau, Codex envoie chaque tâche aux serveurs d'OpenAI ; Hermes fait tourner la boucle en local et ne touche au réseau que si tu l'as câblé sur un modèle distant.
- Coût, Codex se paie au token ; Hermes a un coût zéro par tâche (tu paies une fois, en taille de téléchargement).
- Vitesse, Codex est généralement plus rapide au premier token parce que les modèles d'OpenAI sont plus gros et plus chauds ; Hermes tient la route sur les tâches courtes et est imbattable hors-ligne.
- Plafond, Codex hérite de la dernière capacité de raisonnement d'OpenAI ; Hermes hérite du modèle ouvert que tu lui pointes.
Lequel choisir
- Commence par Codex. C'est le défaut pour une raison, c'est le moteur sur lequel le reste de Katchy a été calé, et le plus susceptible d'encaisser du premier coup ce que tu lui jettes.
- Passe à Hermes si l'une de ces situations te parle : tu n'as pas envie de coller une clé OpenAI, tu travailles sur quelque chose d'assez privé pour ne pas vouloir l'envoyer sur le fil, ta connexion est instable, ou tu es curieux du tooling d'agents ouvert et tu veux l'essayer sans sortir de l'app.
- Tu peux basculer entre les deux par session, le choix vit dans Réglages → Agent → Moteur et prend effet à la prochaine tâche d'agent. Les tâches en cours continuent sur le moteur qui les a démarrées.
Ce qui ne change pas, quoi qu'il arrive
Aussi disponible en markdown brut.