Skip to main content Link Menu Expand (external link) Document Search Copy Copied

English

SpeechDock

SpeechDock

Speak and listen, from anywhere on your Mac.

ダウンロード GitHub


SpeechDockとは?

画面上のあらゆるテキストを音声に — 選択テキスト、直接入力、ペースト、画面からのOCRキャプチャ。見えるテキストなら、SpeechDockが読み上げます。

Macのあらゆる音声をテキストに — マイクからの声、システム全体の音声、特定アプリの音声。Macが聞ける音なら、SpeechDockがリアルタイムで文字起こしします。

メニューバーに常駐し、グローバルホットキーでどこからでもアクセス可能。インストール後すぐに使え、APIキーや追加ダウンロードは不要です。


アーキテクチャ

SpeechDock アーキテクチャ


主な機能

音声認識 (STT)

  • あらゆる音声ソース — マイク、システム音声、特定のアプリ音声
  • リアルタイム文字起こし — 話しながらテキストを確認
  • 字幕モード — プレゼンや会議用のフローティングオーバーレイ
  • クイック入力 — フローティングマイクボタンで即座に音声入力

音声合成 (TTS)

  • あらゆるテキストソース — 直接入力、ペースト、他アプリで選択、画面からOCR
  • 自然な音声 — macOS内蔵またはクラウドプロバイダの音声
  • 速度調整 — リアルタイムで再生速度を調整(0.5x〜2.0x)
  • 音声保存 — 音声をファイルにエクスポート

翻訳

  • オンデバイス翻訳 — APIキー不要(macOS 26以降)
  • 18以上の言語 — 主要言語間で翻訳
  • TTS連携 — 翻訳テキストを自動的に読み上げ

クラウドプロバイダ(オプション)

  • OpenAI — GPT-4o Transcribe、GPT-4o Mini TTS
  • Google Gemini — Gemini 2.5 Flash(STT/TTS)
  • ElevenLabs — Scribe v2(STT)、Eleven v3(TTS)
  • Grok (xAI) — Grok 2(STT/TTS)

動作環境

  • macOS 14.0 (Sonoma) 以降
  • Apple Silicon Mac (M1/M2/M3/M4)

ドキュメント

ページ 説明
基本機能 インストール、STT、TTS、OCR、字幕、ショートカット
高度な機能 クラウドプロバイダ、APIキー、ファイル文字起こし
AppleScript 自動化とスクリプティング

スクリーンショット

STT Panel
音声認識パネル
TTS Panel
音声合成パネル
Quick Transcription
クイック入力 — ボタンをクリックすると録音が停止し、文字起こしテキストがカーソル位置にペーストされます
Subtitle Mode
字幕モード — リアルタイム文字起こしをフローティング字幕として表示

ライセンス

SpeechDockはApache License 2.0の下で公開されています。