FloatSTTは、マイク音声をリアルタイムで文字起こしし、必要なときに浮かぶウィンドウからテキストを貼り付けできるmacOSアプリです。SwiftUIとLocalSpeechAPI(AVFoundation+VAD+ローカルのSpeechフレームワーク)を組み合わせ、シンプルなUIとホットキーで操作できます。
- 常に手前に表示できる最小化されたパネルと、透明なキーボードキャプチャビュー。
- カスタマイズ可能なホットキー(
FloatingPanelControllerとHotKeyManagerにより管理)。 - 音声検知(VAD)とローカルのSpeechフレームワークでリアルタイムにテキストを抽出し、
TextInserterでカーソル位置に注入する仕組み。 - アセットは
nano-banana/配下にAI生成されたアイコンで、いえもんくんの錬処(@iemon_kun)が選定・加工した素材です。
- Xcode 15以上またはSwift 5.9対応の環境を用意。
- ターミナルでこのリポジトリに移動し、依存関係はSwift標準なので特別な準備は不要。
swift buildでビルド、swift run FloatSTTまたはdist/FloatSTT.appを起動して動作を確認。- アプリを配布する際は、
nano-banana/配下のアイコンとREADMEで利用条件を明記。
- 詳しい英語版READMEはREADME.en.mdをご覧ください。
- ライセンスと権利情報はLICENSEにまとめています。
- Notion: 各モジュールの責務は
FloatingOverlayModel.swiftやFloatingPanelController.swift、SettingsWindowController.swiftなどで分割。 build.shやdist/は手動生成の出力フォルダなので.gitignoreに追加済みです。
- アイコン・素材: AI生成素材を、いえもんくんの錬処(@iemon_kun)が選定・加工したもの。
- ライセンス: MIT(詳しくはLICENSE)。