Katchy is a free menu-bar AI assistant for macOS. Hold Control and Option, talk, and Katchy answers questions about whatever is on your screen, routing each one to the best of GPT, Claude, or Gemini.

Four modes from one hotkey: push-to-talk voice, screen-aware answers that see what is on your Mac, a cursor overlay that points right at the answer, and background agents that handle multi-step tasks across Files, Mail, the browser, and AppleScript.

How much does Katchy cost?

Katchy is free forever with gentle in-app ads. Katchy Pro shows far fewer ads and unlocks unlimited questions and agent runs for €19.99 per month or €215.89 per year (about 10% cheaper than monthly).

Yes. Katchy is free forever, including 100 questions and 35 agent runs a month across all three AI models. Pro lifts those limits and shows fewer ads.

What do I need to run Katchy?

macOS 14.2 or later on Apple Silicon or Intel, and about 860 MB of space. No account or sign-up is needed to download it.

Which AI models does Katchy use?

GPT, Claude, and Gemini. Katchy routes each question to whichever model handles it best, all from one menu-bar app.

Katchy is local-first. Transcription runs on-device where possible, and your screen is only captured when you ask for help; it never leaves your Mac unless a question needs it.

Download it free for macOS at heyyykatchy.com/download.

← Documentação

Recursos · 4 min de leitura

Motores de agente: Codex e Hermes

Quando entregas uma tarefa longa ao Katchy, arruma o Ambiente de Trabalho, resume este PDF de 60 páginas, renomeia cada captura pelo conteúdo, um motor de agente arranca em segundo plano, planeia o trabalho, executa passo a passo e dá conta do recado num pequeno cartão da dock. O Katchy traz dois motores que podes trocar em Definições → Agente → Motor. Mesma experiência, mesmo atalho, mesmo modelo de permissões. Cérebro diferente por baixo.

#Codex, o predefinido

O Codex é o que corre da primeira vez que abres o Katchy. Encaminha cada tarefa de agente para um modelo de fronteira da OpenAI para raciocínio, e usa o runtime próprio do Katchy para tratar do ciclo de planeamento, das chamadas a ferramentas e do ciclo de vida do cartão da dock. O modelo escolhe-se sozinho consoante a tarefa, edições rápidas vão para modelos mais rápidos, trabalho de contexto longo é encaminhado para os mais profundos.

Polido logo à saída, o motor à volta do qual a app foi construída primeiro.
Fala com a API da OpenAI; precisa da tua própria OPENAI_API_KEY colada em Definições.
Imbatível em tarefas de vários passos que beneficiam de um modelo de raciocínio de topo: investigação, refactors, trabalho com documentos longos.
Pagamento por token à OpenAI, tipicamente cêntimos por tarefa, conforme a duração.

#Hermes, a alternativa aberta

O Hermes embrulha o CLI hermes-agent da Nous Research. O Katchy traz o runtime de Python inteiro (~360 MB) + a instalação do hermes-agent EMPACOTADOS dentro do Katchy.app, sem pip install, sem Terminal, sem assistente de configuração. Muda para o Hermes em Definições e a próxima tarefa de agente corre pelo Python local em vez de pela API da OpenAI.

Ciclo de agente totalmente local, o planeamento, a seleção de ferramentas e a auto-verificação acontecem todos no teu Mac.
Zero instalação. O runtime viaja com a app e é assinado + notarizado como parte do build.
Sem necessidade de chave da OpenAI para o próprio agente; traz o teu próprio endpoint de modelo se quiseres raciocínio de topo, ou corre um modelo local mais pequeno.
Imbatível para trabalho sensível à privacidade, fluxos preparados para offline e quem tenha curiosidade pelo rumo das ferramentas abertas de agentes.

Hermes é o ciclo de agente open source da Nous Research, mesmo nome de projeto, completamente sem relação com o antigo motor JavaScript do Facebook. O CLI empacotado vive em Katchy.app/Contents/Resources/HermesRuntime caso algum dia queiras espreitar.

#Lado a lado

Os dois motores obedecem ao mesmo contrato de agente, mesmo atalho, mesmas permissões, mesmo cartão da dock, mesmo aviso para ações destrutivas, mesmo Cmd-Z. O que difere é tudo o que está por baixo da camada de UX.

Configuração, o Codex precisa de uma chave da OpenAI; o Hermes funciona no momento em que o Katchy arranca.
Rede, o Codex envia cada tarefa para os servidores da OpenAI; o Hermes corre o ciclo localmente e só toca a rede se o ligares a um modelo remoto.
Custo, o Codex paga-se por token; o Hermes tem custo zero por tarefa (pagas uma vez, em tamanho de download).
Velocidade, o Codex costuma ser mais rápido no primeiro token porque os modelos da OpenAI são maiores e estão mais quentes; o Hermes aguenta-se bem em tarefas curtas e é insuperável em offline.
Tecto, o Codex herda a mais recente capacidade de raciocínio da OpenAI; o Hermes herda o modelo aberto a que o apontares.

#Qual deves escolher

Começa pelo Codex. É o predefinido por uma razão, é o motor com o qual o resto do Katchy foi afinado, e o mais provável de aguentar à primeira tudo o que lhe atires.
Muda para o Hermes se alguma destas te encaixar: não queres colar uma chave da OpenAI, estás a trabalhar em algo suficientemente privado para preferires não o mandar pela rede, andas com ligação instável, ou tens curiosidade pelas ferramentas abertas de agentes e queres experimentar sem sair da app.
Podes alternar entre eles por sessão, a escolha vive em Definições → Agente → Motor e produz efeito na próxima tarefa de agente. As tarefas em curso continuam no motor que as iniciou.

#O que não muda, escolhas o que escolheres

O mesmo atalho Control + Option arranca e pára o agente. O mesmo cartão da dock mostra o progresso. As mesmas permissões do macOS filtram cada leitura de ficheiro, clique e comando de shell. A escolha do motor é canalização, os teus hábitos não mudam quando mudas de motor.

Também disponível como markdown simples.