コンテンツにスキップ
ドキュメント

機能 · 4 分で読了

エージェントエンジン: Codex と Hermes

長めの仕事を Katchy に渡したとき, デスクトップを片付けて、60ページの PDF を要約して、スクリーンショットを内容に応じてリネームして, バックグラウンドでエージェントエンジンが立ち上がり、計画を組み、ステップごとに実行して、小さなドックカードに結果を返します。Katchy には2つのエンジンが同梱されていて、設定 → Agent → Engine で切り替えられます。UX も、ホットキーも、権限モデルも同じ。中の脳みそだけが違います。

Codex, デフォルト

Codex は Katchy を最初に開いたときに動くエンジンです。各エージェントタスクの推論はフロンティアの OpenAI モデルに任せ、計画ループやツール呼び出し、ドックカードのライフサイクルは Katchy 同梱のランタイムが担います。モデルはタスクに応じて自動で選ばれます, 軽い編集なら速いモデル、長コンテキストの仕事なら深いモデルへ。

  • 箱を開けた瞬間から洗練されている, アプリが最初に作り込まれたエンジンです。
  • OpenAI の API と話します。設定に自分の OPENAI_API_KEY を貼る必要があります。
  • トップクラスの推論モデルが効くマルチステップ作業に最適, 調査、リファクタリング、長文ドキュメント処理。
  • OpenAI へのトークン従量課金, 通常は1タスクあたり数セント、長さによります。

Hermes, オープンな代替

Hermes は Nous Research の hermes-agent CLI をラップしたものです。Katchy は Python ランタイム一式(約 360 MB)と hermes-agent のインストール一式を Katchy.app の中に同梱しています, pip install も、Terminal も、セットアップウィザードもありません。設定で Hermes に切り替えれば、次のエージェントタスクは OpenAI API ではなくローカルの Python を通って動きます。

  • 完全ローカルのエージェントループ, 計画、ツール選択、セルフチェックが全部 Mac の上で起こります。
  • インストール作業ゼロ。ランタイムはアプリと一緒に同梱され、ビルド時に署名 + 公証されています。
  • エージェント本体に OpenAI のキーは不要。フロンティア級の推論が欲しければ自分のモデルエンドポイントを繋げばよく、小さなローカルモデルを走らせるのもありです。
  • プライバシー重視の作業、オフラインでも回るワークフロー、そしてオープンなエージェント周りの行く末が気になる人に最適。
Hermes は Nous Research によるオープンソースのエージェントループです, プロジェクト名は同じですが、Facebook の昔の JavaScript エンジンとはまったく関係ありません。同梱の CLI 本体は Katchy.app/Contents/Resources/HermesRuntime に置いてあるので、覗いてみたければどうぞ。

横に並べてみる

どちらのエンジンも同じエージェント契約に従います, 同じホットキー、同じ権限、同じドックカード、同じ破壊的操作の確認、同じ Cmd-Z。違うのは UX より下の層だけです。

  • セットアップ, Codex は OpenAI キーが必要。Hermes は Katchy を起動したその瞬間から動きます。
  • ネットワーク, Codex は各タスクを OpenAI のサーバーに送ります。Hermes はループをローカルで回し、ネットに触るのはリモートモデルを繋いだ場合だけです。
  • コスト, Codex はトークン従量課金。Hermes は1タスクあたりのコストがゼロ(ダウンロードサイズで一度払うだけ)。
  • 速さ, 最初のトークンが返るまでは、OpenAI のモデルが大きく温まっている分 Codex のほうがたいてい速いです。Hermes は短いタスクなら張り合えますし、オフライン用途では文句なしです。
  • 天井, Codex は OpenAI の最新の推論能力をそのまま継ぎます。Hermes は指定したオープンモデルの能力をそのまま継ぎます。

どちらを選ぶか

  1. まずは Codex から。デフォルトなのには理由があります, Katchy の残りの部分がチューニングされた相手であり、最初の一撃で何を投げても処理しきる確率が一番高いエンジンです。
  2. 次のどれかが刺さるなら Hermes に切り替え:OpenAI のキーを貼りたくない、ネットに流したくないくらいプライベートな作業をしている、回線が不安定、あるいはオープンなエージェント周りに興味があってアプリから出ずに試したい。
  3. セッションごとに切り替えても構いません, 選択は 設定 → Agent → Engine にあり、次のエージェントタスクから効きます。実行中のタスクは、それを始めたエンジンの上で走り続けます。

どちらを選んでも変わらないもの

同じ Control + Option のホットキーでエージェントを起動・停止できます。同じドックカードに進捗が出ます。同じ macOS の権限が、すべてのファイル読み込み、クリック、シェルコマンドの前に立ちます。エンジンの選択は配管の話, 切り替えても、あなたの操作習慣は変わりません。

次の形式でも提供しています: プレーンな Markdown.