Katchy is a free menu-bar AI assistant for macOS. Hold Control and Option, talk, and Katchy answers questions about whatever is on your screen, routing each one to the best of GPT, Claude, or Gemini.

Four modes from one hotkey: push-to-talk voice, screen-aware answers that see what is on your Mac, a cursor overlay that points right at the answer, and background agents that handle multi-step tasks across Files, Mail, the browser, and AppleScript.

How much does Katchy cost?

Katchy is free forever with gentle in-app ads. Katchy Pro shows far fewer ads and unlocks unlimited questions and agent runs for €19.99 per month or €215.89 per year (about 10% cheaper than monthly).

Yes. Katchy is free forever, including 100 questions and 35 agent runs a month across all three AI models. Pro lifts those limits and shows fewer ads.

What do I need to run Katchy?

macOS 14.2 or later on Apple Silicon or Intel, and about 860 MB of space. No account or sign-up is needed to download it.

Which AI models does Katchy use?

GPT, Claude, and Gemini. Katchy routes each question to whichever model handles it best, all from one menu-bar app.

Katchy is local-first. Transcription runs on-device where possible, and your screen is only captured when you ask for help; it never leaves your Mac unless a question needs it.

Download it free for macOS at heyyykatchy.com/download.

← Documentación

Funciones · 4 min de lectura

Motores de agente: Codex y Hermes

Cuando le pasas a Katchy una tarea larga (ordena el Escritorio, resume este PDF de 60 páginas, renombra cada captura por su contenido), un motor de agente arranca en segundo plano, planifica el trabajo, lo ejecuta paso a paso y te avisa en una pequeña tarjeta del dock. Katchy trae dos motores que puedes intercambiar en Ajustes → Agente → Motor. Misma experiencia, mismo atajo, mismo modelo de permisos. Distinto cerebro por debajo.

#Codex: el predeterminado

Codex es lo que se ejecuta la primera vez que abres Katchy. Enruta cada tarea de agente a un modelo de OpenAI de primer nivel para razonar, y usa el runtime propio de Katchy para gestionar el bucle de planificación, las llamadas a herramientas y el ciclo de vida de la tarjeta del dock. El modelo se elige solo según la tarea: las ediciones rápidas van a modelos más veloces, y el trabajo de contexto largo se enruta a los más profundos.

Pulido desde el primer minuto: es el motor con el que nació la app.
Habla con la API de OpenAI; necesita tu propia OPENAI_API_KEY pegada en Ajustes.
Su fuerte son las tareas de varios pasos que se benefician de un modelo de razonamiento de primer nivel: investigación, refactors, trabajo con documentos largos.
Pago por tokens a OpenAI: normalmente unos céntimos por tarea, según la longitud.

#Hermes: la alternativa abierta

Hermes envuelve el CLI hermes-agent de Nous Research. Katchy trae el runtime de Python entero (~360 MB) + la instalación de hermes-agent EMPAQUETADOS dentro de Katchy.app: nada de pip install, nada de Terminal, nada de asistente de configuración. Cambia a Hermes en Ajustes y la próxima tarea de agente corre por el Python local en vez de por la API de OpenAI.

Bucle de agente totalmente local: planificación, selección de herramientas y autocomprobación pasan en tu Mac.
Cero instalación. El runtime viaja con la app y se firma + notariza como parte del build.
No hace falta clave de OpenAI para el propio agente; trae tu propio endpoint de modelo si quieres razonamiento de primera, o ejecuta un modelo local más pequeño.
Su fuerte: trabajo sensible a la privacidad, flujos preparados para offline y quien tenga curiosidad por hacia dónde va el tooling abierto de agentes.

Hermes es el bucle de agente open source de Nous Research: mismo nombre, sin ninguna relación con el viejo motor JavaScript de Facebook. El CLI empaquetado vive en Katchy.app/Contents/Resources/HermesRuntime por si alguna vez quieres echarle un ojo.

#Codo con codo

Los dos motores cumplen el mismo contrato de agente: mismo atajo, mismos permisos, misma tarjeta del dock, mismo aviso para acciones destructivas, mismo Cmd-Z. Lo que cambia es todo lo que hay por debajo de la capa de UX.

Configuración: Codex necesita una clave de OpenAI; Hermes funciona en cuanto arranca Katchy.
Red: Codex manda cada tarea a los servidores de OpenAI; Hermes corre el bucle en local y solo toca la red si lo has cableado a un modelo remoto.
Coste: Codex se paga por tokens; Hermes tiene coste cero por tarea (pagas una vez, en tamaño de descarga).
Velocidad: Codex suele ser más rápido al primer token porque los modelos de OpenAI son más grandes y están más calientes; Hermes compite bien en tareas cortas y es insuperable en offline.
Techo: Codex hereda la última capacidad de razonamiento de OpenAI; Hermes hereda el modelo abierto al que lo apuntes.

#Cuál te toca elegir

Empieza con Codex. Es el predeterminado por una razón: es el motor con el que se afinó el resto de Katchy y el que tiene más papeletas de resolver a la primera lo que le tires.
Cámbiate a Hermes si te toca alguna de estas: no quieres pegar una clave de OpenAI, estás con algo lo bastante privado como para no mandarlo por la red, vas con conexión inestable o tienes curiosidad por el tooling abierto de agentes y quieres probarlo sin salir de la app.
Puedes alternar por sesión: la elección vive en Ajustes → Agente → Motor y se aplica en la próxima tarea de agente. Las tareas en marcha siguen con el motor con el que empezaron.

#Lo que no cambia, elijas lo que elijas

El mismo atajo Control + Option arranca y detiene al agente. La misma tarjeta del dock muestra el avance. Los mismos permisos de macOS filtran cada lectura de archivo, clic y comando de shell. La elección de motor es fontanería: tus hábitos no cambian al cambiarlo.

También disponible como markdown sin formato.