Ir para o conteúdo
Documentação

Recursos · 4 min de leitura

Motores de agente: Codex e Hermes

Quando entregas uma tarefa longa ao Katchy, arruma o Ambiente de Trabalho, resume este PDF de 60 páginas, renomeia cada captura pelo conteúdo, um motor de agente arranca em segundo plano, planeia o trabalho, executa passo a passo e dá conta do recado num pequeno cartão da dock. O Katchy traz dois motores que podes trocar em Definições → Agente → Motor. Mesma experiência, mesmo atalho, mesmo modelo de permissões. Cérebro diferente por baixo.

Codex, o predefinido

O Codex é o que corre da primeira vez que abres o Katchy. Encaminha cada tarefa de agente para um modelo de fronteira da OpenAI para raciocínio, e usa o runtime próprio do Katchy para tratar do ciclo de planeamento, das chamadas a ferramentas e do ciclo de vida do cartão da dock. O modelo escolhe-se sozinho consoante a tarefa, edições rápidas vão para modelos mais rápidos, trabalho de contexto longo é encaminhado para os mais profundos.

  • Polido logo à saída, o motor à volta do qual a app foi construída primeiro.
  • Fala com a API da OpenAI; precisa da tua própria OPENAI_API_KEY colada em Definições.
  • Imbatível em tarefas de vários passos que beneficiam de um modelo de raciocínio de topo: investigação, refactors, trabalho com documentos longos.
  • Pagamento por token à OpenAI, tipicamente cêntimos por tarefa, conforme a duração.

Hermes, a alternativa aberta

O Hermes embrulha o CLI hermes-agent da Nous Research. O Katchy traz o runtime de Python inteiro (~360 MB) + a instalação do hermes-agent EMPACOTADOS dentro do Katchy.app, sem pip install, sem Terminal, sem assistente de configuração. Muda para o Hermes em Definições e a próxima tarefa de agente corre pelo Python local em vez de pela API da OpenAI.

  • Ciclo de agente totalmente local, o planeamento, a seleção de ferramentas e a auto-verificação acontecem todos no teu Mac.
  • Zero instalação. O runtime viaja com a app e é assinado + notarizado como parte do build.
  • Sem necessidade de chave da OpenAI para o próprio agente; traz o teu próprio endpoint de modelo se quiseres raciocínio de topo, ou corre um modelo local mais pequeno.
  • Imbatível para trabalho sensível à privacidade, fluxos preparados para offline e quem tenha curiosidade pelo rumo das ferramentas abertas de agentes.
Hermes é o ciclo de agente open source da Nous Research, mesmo nome de projeto, completamente sem relação com o antigo motor JavaScript do Facebook. O CLI empacotado vive em Katchy.app/Contents/Resources/HermesRuntime caso algum dia queiras espreitar.

Lado a lado

Os dois motores obedecem ao mesmo contrato de agente, mesmo atalho, mesmas permissões, mesmo cartão da dock, mesmo aviso para ações destrutivas, mesmo Cmd-Z. O que difere é tudo o que está por baixo da camada de UX.

  • Configuração, o Codex precisa de uma chave da OpenAI; o Hermes funciona no momento em que o Katchy arranca.
  • Rede, o Codex envia cada tarefa para os servidores da OpenAI; o Hermes corre o ciclo localmente e só toca a rede se o ligares a um modelo remoto.
  • Custo, o Codex paga-se por token; o Hermes tem custo zero por tarefa (pagas uma vez, em tamanho de download).
  • Velocidade, o Codex costuma ser mais rápido no primeiro token porque os modelos da OpenAI são maiores e estão mais quentes; o Hermes aguenta-se bem em tarefas curtas e é insuperável em offline.
  • Tecto, o Codex herda a mais recente capacidade de raciocínio da OpenAI; o Hermes herda o modelo aberto a que o apontares.

Qual deves escolher

  1. Começa pelo Codex. É o predefinido por uma razão, é o motor com o qual o resto do Katchy foi afinado, e o mais provável de aguentar à primeira tudo o que lhe atires.
  2. Muda para o Hermes se alguma destas te encaixar: não queres colar uma chave da OpenAI, estás a trabalhar em algo suficientemente privado para preferires não o mandar pela rede, andas com ligação instável, ou tens curiosidade pelas ferramentas abertas de agentes e queres experimentar sem sair da app.
  3. Podes alternar entre eles por sessão, a escolha vive em Definições → Agente → Motor e produz efeito na próxima tarefa de agente. As tarefas em curso continuam no motor que as iniciou.

O que não muda, escolhas o que escolheres

O mesmo atalho Control + Option arranca e pára o agente. O mesmo cartão da dock mostra o progresso. As mesmas permissões do macOS filtram cada leitura de ficheiro, clique e comando de shell. A escolha do motor é canalização, os teus hábitos não mudam quando mudas de motor.

Também disponível como markdown simples.