音声が全く変換されない場合や、変換後の音声が変な状態になっている場合、音声変換プロセスの中のどこで問題が起こっているかを切り分ける必要があります。
ここでは、どの部分で問題が起こっているかを大まかに切り分ける方法を説明します。
VC Client は、図のように GUI(クライアント)が音声をマイクから拾い、サーバで変換を行う構成となっています。
VC Client は図中の3か所で音声がどのような状態になっているかを確認することができます。 正常な状態の音声が録音されている場合は、そこまでの処理はうまくいっていたということになり、それ以降のところで問題を探せばよいことになります(問題の切り分けといいます)。
Analyzer の Sampling を start させた状態で音声変換を開始してください。ある程度音声を入力した後に Sampling をストップすると in/out に再生ボタンが表示されます。
- in には前述の図の(1)の音声が録音されています。マイクから入力された音声がそのままサーバで録音されているはずなので、ユーザの音声が録音されていれば OK です。
- out には前述の図の(2)の音声が録音されています。AI による変換後の音声が録音されているはずです。
AudioOutput の output record を start させた状態で音声変換を開始してください。ある程度音声を入力した後に stop すると.wav ファイルがダウンロードされます。この.wav ファイルはサーバから受信した変換後の音声が録音されているはずです。
前述の図の(1)~(3)のどこまで想定された音声が録音されているかを把握したら、想定された音声が録音された場所以降で問題がないかを検討してください。
音声ファイルを入力して変換できるか確認してみてください。
例えばこちらのファイルを使用してみてください。
- sample_jvs001 from JVS
- sample_jvs001 from JVS-MuSiC
マイク入力自体に問題がある可能性があります。録音ソフトなどを用いてマイク入力を確認してみてください。 また、こちらの録音サイトは VCClient の姉妹品であり、ほぼ同等のマイク入力処理が行われているため参考になります。(インストール不要。ブラウザのみで動きます。)