Google Cloud Speech-to-Textを利用して音声ファイルから文字起こしして、ローカルにテキストファイルを保存します
- GCSのアップロード
- 入力ファイル: mp4, m4a, mp3, wav
- Speech-to-Textが読みやすいようにFLACファイルへの変換
- docker
docker-compose build
-
GCP サービスアカウントのJSONファイルをカレントフォルダに設置してください
$ service-account.json
-
設定ファイルを作成してください
$ touch instance/application.cfg
-
設定のファイルの記述
- GCSのバケット名
- 音声適正ブースト(https://cloud.google.com/speech-to-text/docs/boost?hl=ja)
GCS_BUCKET_NAME = 'example-bucket' SELECTED_PHRASES = [{"phrases": ["例"], "boost": 20}]
docker-compose up -d
- data/input_fileフォルダに文字起こししたい動画・音声を設置してください。
- ブラウザで http://localhost:5000 にアクセス
- acronhub(https://github.com/acronhub)