Funciones · 4 min de lectura
Modo Agente
El Modo Agente es la superficie para cualquier cosa que pase de una frase de trabajo. Di «hola agente» o lanza una tarea que claramente necesita varios pasos: Katchy abre una sesión en segundo plano que planifica, ejecuta, revisa su trabajo y te muestra el resultado en una tarjeta junto al cursor.
Lo que puede hacer un agente
- Leer y escribir archivos allí donde le hayas dado acceso.
- Ejecutar comandos de shell: git, npm, curl, python y todo lo que tengas en tu PATH.
- Abrir apps, hacer clic, arrastrar y escribir (con Computer Use activado).
- Buscar en la web y seguir enlaces.
- Conservar memoria: cada tarea terminada queda registrada para que las sesiones futuras sepan qué pasó antes.
Lo que no puede hacer un agente
- Tocar nada fuera de los permisos de macOS que le hayas concedido.
- Usar credenciales que no le hayas dado.
- Sobrevivir al cierre de Katchy: cerrar la app detiene los agentes en marcha de forma limpia.
La tarjeta del dock
Mientras un agente trabaja verás una tarjeta pequeña junto al cursor con:
- El título de la tarea (autogenerado, empezando por un sustantivo: por ejemplo «Limpieza de Recordatorios», no «¿Podrías por favor…?»).
- La fase actual: Planificando / Ejecutando / Redactando respuesta / Hecho.
- Una línea en vivo con el último comando de shell o fragmento del asistente.
- Sugerencias de próximos pasos cuando la tarea termina.
Haz clic en la tarjeta para ver el registro completo de la conversación, o pulsa Detener / Descartar sin abrir el panel.
Combinar voz y agente
Los dos modos están pensados para usarse juntos. La voz es el primer plano (una pregunta, una respuesta); los agentes, el fondo (tareas largas). Un bucle típico:
- Voz: «¿qué está bloqueando este test?».
- Lee la respuesta. Piensa.
- Pasa el relevo: «hola agente, arregla el import que falta en auth/session.ts y vuelve a lanzar el test».
- Sigue con lo siguiente. La tarjeta del agente parpadea cuando termina.
Las acciones destructivas piden confirmación
También disponible como markdown sin formato.
Siguiente en Funciones
Motores de agente: Codex y Hermes
El Modo Agente funciona con dos motores. Codex es el predeterminado, pulido y listo para usar. Hermes es la alternativa abierta y totalmente local. Aquí tienes cuándo gana cada uno.