Funciones · 4 min de lectura
Motores de agente: Codex y Hermes
Cuando le pasas a Katchy una tarea larga (ordena el Escritorio, resume este PDF de 60 páginas, renombra cada captura por su contenido), un motor de agente arranca en segundo plano, planifica el trabajo, lo ejecuta paso a paso y te avisa en una pequeña tarjeta del dock. Katchy trae dos motores que puedes intercambiar en Ajustes → Agente → Motor. Misma experiencia, mismo atajo, mismo modelo de permisos. Distinto cerebro por debajo.
Codex: el predeterminado
Codex es lo que se ejecuta la primera vez que abres Katchy. Enruta cada tarea de agente a un modelo de OpenAI de primer nivel para razonar, y usa el runtime propio de Katchy para gestionar el bucle de planificación, las llamadas a herramientas y el ciclo de vida de la tarjeta del dock. El modelo se elige solo según la tarea: las ediciones rápidas van a modelos más veloces, y el trabajo de contexto largo se enruta a los más profundos.
- Pulido desde el primer minuto: es el motor con el que nació la app.
- Habla con la API de OpenAI; necesita tu propia OPENAI_API_KEY pegada en Ajustes.
- Su fuerte son las tareas de varios pasos que se benefician de un modelo de razonamiento de primer nivel: investigación, refactors, trabajo con documentos largos.
- Pago por tokens a OpenAI: normalmente unos céntimos por tarea, según la longitud.
Hermes: la alternativa abierta
Hermes envuelve el CLI hermes-agent de Nous Research. Katchy trae el runtime de Python entero (~360 MB) + la instalación de hermes-agent EMPAQUETADOS dentro de Katchy.app: nada de pip install, nada de Terminal, nada de asistente de configuración. Cambia a Hermes en Ajustes y la próxima tarea de agente corre por el Python local en vez de por la API de OpenAI.
- Bucle de agente totalmente local: planificación, selección de herramientas y autocomprobación pasan en tu Mac.
- Cero instalación. El runtime viaja con la app y se firma + notariza como parte del build.
- No hace falta clave de OpenAI para el propio agente; trae tu propio endpoint de modelo si quieres razonamiento de primera, o ejecuta un modelo local más pequeño.
- Su fuerte: trabajo sensible a la privacidad, flujos preparados para offline y quien tenga curiosidad por hacia dónde va el tooling abierto de agentes.
Codo con codo
Los dos motores cumplen el mismo contrato de agente: mismo atajo, mismos permisos, misma tarjeta del dock, mismo aviso para acciones destructivas, mismo Cmd-Z. Lo que cambia es todo lo que hay por debajo de la capa de UX.
- Configuración: Codex necesita una clave de OpenAI; Hermes funciona en cuanto arranca Katchy.
- Red: Codex manda cada tarea a los servidores de OpenAI; Hermes corre el bucle en local y solo toca la red si lo has cableado a un modelo remoto.
- Coste: Codex se paga por tokens; Hermes tiene coste cero por tarea (pagas una vez, en tamaño de descarga).
- Velocidad: Codex suele ser más rápido al primer token porque los modelos de OpenAI son más grandes y están más calientes; Hermes compite bien en tareas cortas y es insuperable en offline.
- Techo: Codex hereda la última capacidad de razonamiento de OpenAI; Hermes hereda el modelo abierto al que lo apuntes.
Cuál te toca elegir
- Empieza con Codex. Es el predeterminado por una razón: es el motor con el que se afinó el resto de Katchy y el que tiene más papeletas de resolver a la primera lo que le tires.
- Cámbiate a Hermes si te toca alguna de estas: no quieres pegar una clave de OpenAI, estás con algo lo bastante privado como para no mandarlo por la red, vas con conexión inestable o tienes curiosidad por el tooling abierto de agentes y quieres probarlo sin salir de la app.
- Puedes alternar por sesión: la elección vive en Ajustes → Agente → Motor y se aplica en la próxima tarea de agente. Las tareas en marcha siguen con el motor con el que empezaron.
Lo que no cambia, elijas lo que elijas
También disponible como markdown sin formato.