基本 · 3 分で読了
Voice モード
Voice モードは Katchy の時間の 8 割を過ごすループです。ホットキー長押し、質問、聞く。チャット画面なし、コピペなし、タブの切り替えなし。視線は仕事から離れません。
ループ
- Control + Option を長押しします。
- 1文だけ話します。質問でも、タスクでも、補足でも構いません。
- 離します。Katchy が画面をスナップショットして、最適なモデルを選び、耳元で返します。
- 答えに UI 要素が絡む場合は、カーソルがそこへ飛んでいきます。
押してみて
ControlOption
どこで光るか
- 画面に映っている何かについて「これ何?」とサッと聞きたいとき。
- タイプミスや誤クリックの一歩手前で自分を止めたいとき。
- ぎっしり詰まった文章を「このパラグラフを要約して」と頼みたいとき。
- ペアプロ的な軽い相談, 「ここで使う hook はこれで合ってる?」
- 手が離せない瞬間, キッチン、ジム、スケッチブックの前で。
Agent Mode に切り替えるべきタイミング
Voice モードは会話的で同期的です。Katchy が読み、考え、返し、作業は終わり。「それで次は」と2回言いたくなった瞬間が Agent Mode の出番です(リンク先のドキュメントを参照)。数分動き続け、ファイルを触り、アプリを開き、終わったら報告してくれます。
文字起こしの選択肢
デフォルトでは Katchy は Apple のオンデバイス音声認識を使うので、音声は Mac から一切出ません。長めの質問でもっと速い文字起こしが欲しい場合は、設定 → Voice からクラウドプロバイダ(Deepgram または AssemblyAI)に切り替えられます。キーは自分で用意してください。
次の形式でも提供しています: プレーンな Markdown.