Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

文字起こしがまるまる欠落している時間がある #23

Open
MitsukiUsui opened this issue Mar 10, 2023 · 0 comments
Open
Labels
bug Something isn't working

Comments

@MitsukiUsui
Copy link
Member

MitsukiUsui commented Mar 10, 2023

2023年03月09日(木)の参議院 農林水産委員会の1:50:00付近で、野村大臣が答弁をしているが、まるまる文字起こしが行われていない。この部分は音声が小さく、VADの音量フィルタリングのステップで除かれてしまったことが原因だと思われる。
https://politylink.jp/clip/1276/

VADの閾値を下げることで、この部分も認識するようになる可能性はある。ただ、それにより雑音部分が閾値を超えるようになると、Whisperの文字起こしに悪影響が出る可能性もある。音量の閾値を固定値で決めるのではなく、音声ファイルによって動的に切り替える仕組みが必要かもしれない。

あとは、そもそもこのような文字起こしの欠落がどれくらいの頻度で起きているのかも認識する必要がある。これは、今後公式の国会議事録が公開されたときに比較することで、検出できる可能性が高い。

@MitsukiUsui MitsukiUsui added the bug Something isn't working label Mar 10, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

1 participant