Saltar al contenido
Documentación

Funciones · 4 min de lectura

Modo Agente

El Modo Agente es la superficie para cualquier cosa que pase de una frase de trabajo. Di «hola agente» o lanza una tarea que claramente necesita varios pasos: Katchy abre una sesión en segundo plano que planifica, ejecuta, revisa su trabajo y te muestra el resultado en una tarjeta junto al cursor.

Lo que puede hacer un agente

  • Leer y escribir archivos allí donde le hayas dado acceso.
  • Ejecutar comandos de shell: git, npm, curl, python y todo lo que tengas en tu PATH.
  • Abrir apps, hacer clic, arrastrar y escribir (con Computer Use activado).
  • Buscar en la web y seguir enlaces.
  • Conservar memoria: cada tarea terminada queda registrada para que las sesiones futuras sepan qué pasó antes.

Lo que no puede hacer un agente

  • Tocar nada fuera de los permisos de macOS que le hayas concedido.
  • Usar credenciales que no le hayas dado.
  • Sobrevivir al cierre de Katchy: cerrar la app detiene los agentes en marcha de forma limpia.

La tarjeta del dock

Mientras un agente trabaja verás una tarjeta pequeña junto al cursor con:

  • El título de la tarea (autogenerado, empezando por un sustantivo: por ejemplo «Limpieza de Recordatorios», no «¿Podrías por favor…?»).
  • La fase actual: Planificando / Ejecutando / Redactando respuesta / Hecho.
  • Una línea en vivo con el último comando de shell o fragmento del asistente.
  • Sugerencias de próximos pasos cuando la tarea termina.

Haz clic en la tarjeta para ver el registro completo de la conversación, o pulsa Detener / Descartar sin abrir el panel.

Combinar voz y agente

Los dos modos están pensados para usarse juntos. La voz es el primer plano (una pregunta, una respuesta); los agentes, el fondo (tareas largas). Un bucle típico:

  1. Voz: «¿qué está bloqueando este test?».
  2. Lee la respuesta. Piensa.
  3. Pasa el relevo: «hola agente, arregla el import que falta en auth/session.ts y vuelve a lanzar el test».
  4. Sigue con lo siguiente. La tarjeta del agente parpadea cuando termina.

Las acciones destructivas piden confirmación

Eliminar, enviar, publicar, sobrescribir: las acciones destructivas piden confirmación por defecto. El resto lo puedes deshacer con el típico Cmd + Z. Detén al agente cuando quieras con el mismo atajo Control + Option.

También disponible como markdown sin formato.

Siguiente en Funciones

Motores de agente: Codex y Hermes

El Modo Agente funciona con dos motores. Codex es el predeterminado, pulido y listo para usar. Hermes es la alternativa abierta y totalmente local. Aquí tienes cuándo gana cada uno.