コンテンツにスキップ
ドキュメント

機能 · 4 分で読了

Agent Mode

Agent Mode は、1文では収まらない作業のための場所です。「ねえ、エージェント」と呼びかけるか、明らかに複数ステップが必要なタスクを話すと、Katchy がバックグラウンドセッションを立ち上げます。計画して、実行して、セルフチェックして、結果はカーソル横の小さなドックカードに表示します。

エージェントができること

  • アクセスを許可した場所であれば、どこでもファイルの読み書きができます。
  • シェルコマンドの実行, git、npm、curl、python、PATH 上にあるものなら何でも。
  • アプリを開く、クリック、ドラッグ、入力(Computer Use を有効にしている場合)。
  • Web 検索とリンクのフォロー。
  • メモリの保存, 完了したタスクはすべて記録され、次のセッションが過去の経緯を把握できます。

エージェントができないこと

  • あなたが許可した macOS の権限の外側に触ること。
  • 渡されていない認証情報を使うこと。
  • Katchy の終了をまたいで動き続けること。アプリを閉じれば、実行中のエージェントはきれいに停止します。

ドックカード

エージェントが動いている間、カーソルの隣に小さなカードが出ます。表示されるのは:

  • タスクのタイトル(自動生成、名詞始まり, 例「リマインダー整理」、「お願いできますか…」ではなく)
  • 現在のステージ, 計画中 / 実行中 / 返答を作成中 / 完了
  • 最新のシェルコマンドやアシスタントの一節を映すライブのステップ行
  • タスク完了時に提案される次のアクション

カードをクリックすれば会話ログの全文が見られますし、ダッシュボードを開かずに停止 / 閉じるを押すこともできます。

Voice と Agent の組み合わせ

この2つのモードは一緒に使うように設計されています。Voice はフォアグラウンド(1問1答)、Agent はバックグラウンド(長めの作業)。典型的なループはこんな感じです:

  1. Voice で:「このテストが通らないのは何が原因?」
  2. 答えを読む。考える。
  3. Agent に引き渡す:「ねえエージェント、auth/session.ts の足りない import を直して、テストを再実行して」
  4. 次の作業に取りかかる。完了するとエージェントのドックカードが光って知らせます。

破壊的な操作は必ず確認します

削除、送信、公開、上書き, 破壊的な動作はデフォルトで確認を求めます。それ以外はいつもの Cmd + Z で取り消せます。エージェントの停止は同じ Control + Option ホットキーでいつでもどうぞ。

次の形式でも提供しています: プレーンな Markdown.

次の項目: 機能

エージェントエンジン: Codex と Hermes

Agent Mode を動かすエンジンは2種類あります。Codex は洗練されたデフォルト。Hermes はオープンで完全ローカルな代替。それぞれが光るタイミングをまとめます。