Skip to content

iemon-kun/float-stt

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

FloatSTT

FloatSTTは、マイク音声をリアルタイムで文字起こしし、必要なときに浮かぶウィンドウからテキストを貼り付けできるmacOSアプリです。SwiftUIとLocalSpeechAPI(AVFoundation+VAD+ローカルのSpeechフレームワーク)を組み合わせ、シンプルなUIとホットキーで操作できます。

主な特徴

  • 常に手前に表示できる最小化されたパネルと、透明なキーボードキャプチャビュー。
  • カスタマイズ可能なホットキー(FloatingPanelControllerHotKeyManagerにより管理)。
  • 音声検知(VAD)とローカルのSpeechフレームワークでリアルタイムにテキストを抽出し、TextInserterでカーソル位置に注入する仕組み。
  • アセットはnano-banana/配下にAI生成されたアイコンで、いえもんくんの錬処(@iemon_kun)が選定・加工した素材です。

セットアップと実行

  1. Xcode 15以上またはSwift 5.9対応の環境を用意。
  2. ターミナルでこのリポジトリに移動し、依存関係はSwift標準なので特別な準備は不要。
  3. swift buildでビルド、swift run FloatSTTまたはdist/FloatSTT.appを起動して動作を確認。
  4. アプリを配布する際は、nano-banana/配下のアイコンとREADMEで利用条件を明記。

ドキュメント

  • 詳しい英語版READMEはREADME.en.mdをご覧ください。
  • ライセンスと権利情報はLICENSEにまとめています。

開発メモ

  • Notion: 各モジュールの責務はFloatingOverlayModel.swiftFloatingPanelController.swiftSettingsWindowController.swiftなどで分割。
  • build.shdist/は手動生成の出力フォルダなので.gitignoreに追加済みです。

クレジット

  • アイコン・素材: AI生成素材を、いえもんくんの錬処(@iemon_kun)が選定・加工したもの。
  • ライセンス: MIT(詳しくはLICENSE)。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors