功能 · 4 分钟阅读
Agent 引擎:Codex 与 Hermes
当你把一项长任务交给 Katchy ,清理桌面、把这份 60 页 PDF 总结一下、按内容把每张截图重命名,一个 agent 引擎会在后台启动,规划工作、一步一步执行,再用一张小小的停靠卡向你汇报。Katchy 内置两种引擎,可以在「设置 → Agent → Engine」里切换。同一套 UX、同一个快捷键、同一套权限模型。区别只在底下那颗大脑。
Codex , 默认选项
你第一次打开 Katchy 时跑的就是 Codex。它把每个 agent 任务的推理交给前沿的 OpenAI 模型,由 Katchy 自带的运行时来处理规划循环、工具调用和停靠卡的生命周期。模型会根据任务自己挑,快活儿走更快的模型,长上下文的活儿走更深的模型。
- 开箱即用,已经打磨过,这款应用一开始就是围绕这个引擎搭起来的。
- 走的是 OpenAI 的 API;需要你把自己的 OPENAI_API_KEY 粘到「设置」里。
- 最适合那种需要顶级推理模型的多步骤任务:调研、重构、长文档处理。
- 按 token 向 OpenAI 付费,通常每个任务也就几美分,看长度。
Hermes , 开源的那一种
Hermes 是 Nous Research 的 hermes-agent CLI 的封装。Katchy 直接把整套 Python 运行时(约 360 MB)+ hermes-agent 安装包一起塞进了 Katchy.app 里,不用 pip install、不用 Terminal、不用安装向导。在「设置」里切到 Hermes,下一次 agent 任务就会走本地 Python 而不是 OpenAI API。
- 完整的本地 agent 循环,规划、工具选择、自我检查全部在你的 Mac 上发生。
- 零安装。运行时随应用一起打包,构建时一并完成签名 + 公证。
- agent 本身不需要 OpenAI 密钥;想要前沿级推理就接上自己的模型端点,也可以直接跑一个小一点的本地模型。
- 最适合涉及隐私的工作、需要离线的场景,以及任何想试试开源 agent 工具走到哪一步的人。
Hermes 是 Nous Research 推出的开源 agent 循环,只是名字相同,跟 Facebook 当年那款 JavaScript 引擎完全没关系。想看的话,内置的 CLI 就在 Katchy.app/Contents/Resources/HermesRuntime 里。
并排比一比
两种引擎都遵守同一份 agent 契约,同一个快捷键、同一套权限、同一张停靠卡、同样的破坏性操作提示、同样的 Cmd-Z。不一样的全在 UX 层下面。
- 上手,Codex 需要一把 OpenAI 密钥;Hermes 在 Katchy 启动那一刻就能用。
- 网络,Codex 会把每个任务发到 OpenAI 的服务器;Hermes 在本地跑循环,只有当你把它接到远程模型时才会上网。
- 成本,Codex 按 token 计费;Hermes 单任务成本为零(你只为下载体积付一次)。
- 速度,Codex 通常首 token 更快,因为 OpenAI 的模型更大也更「热」;Hermes 在短任务上能打平手,离线场景下无可替代。
- 天花板,Codex 直接继承 OpenAI 最新的推理能力;Hermes 继承的是你给它指的那个开源模型的能力。
你该选哪一个
- 先用 Codex。它做默认是有原因的,Katchy 的其它部分就是围着它调出来的,你随手扔过去什么活儿,它一次接住的概率最高。
- 出现下面任何一条就切到 Hermes:你不想粘贴 OpenAI 密钥;你正在做某件足够私密、不想通过网络传出去的事;网络不太稳;或者你单纯好奇开源 agent 工具,想在不离开应用的前提下试一试。
- 你可以按会话来回切,这个选项在「设置 → Agent → Engine」里,下一次 agent 任务就会生效。已经在跑的任务会继续走它一开始用的那个引擎。
不管选哪个,都不会变的部分
同一个 Control + Option 快捷键启动和停止 agent。同一张停靠卡显示进度。同一套 macOS 权限把守每一次文件读取、点击和命令行调用。引擎选择只是底层管线,你切换它,你的使用习惯不需要跟着变。
也可作为 纯 markdown.