コンテンツにスキップ
ドキュメント

基本 · 3 分で読了

Voice モード

Voice モードは Katchy の時間の 8 割を過ごすループです。ホットキー長押し、質問、聞く。チャット画面なし、コピペなし、タブの切り替えなし。視線は仕事から離れません。

ループ

  1. Control + Option を長押しします。
  2. 1文だけ話します。質問でも、タスクでも、補足でも構いません。
  3. 離します。Katchy が画面をスナップショットして、最適なモデルを選び、耳元で返します。
  4. 答えに UI 要素が絡む場合は、カーソルがそこへ飛んでいきます。

押してみて

ControlOption

どこで光るか

  • 画面に映っている何かについて「これ何?」とサッと聞きたいとき。
  • タイプミスや誤クリックの一歩手前で自分を止めたいとき。
  • ぎっしり詰まった文章を「このパラグラフを要約して」と頼みたいとき。
  • ペアプロ的な軽い相談, 「ここで使う hook はこれで合ってる?」
  • 手が離せない瞬間, キッチン、ジム、スケッチブックの前で。

Agent Mode に切り替えるべきタイミング

Voice モードは会話的で同期的です。Katchy が読み、考え、返し、作業は終わり。「それで次は」と2回言いたくなった瞬間が Agent Mode の出番です(リンク先のドキュメントを参照)。数分動き続け、ファイルを触り、アプリを開き、終わったら報告してくれます。

文字起こしの選択肢

デフォルトでは Katchy は Apple のオンデバイス音声認識を使うので、音声は Mac から一切出ません。長めの質問でもっと速い文字起こしが欲しい場合は、設定 → Voice からクラウドプロバイダ(Deepgram または AssemblyAI)に切り替えられます。キーは自分で用意してください。

次の形式でも提供しています: プレーンな Markdown.