如下代码那里有个潜在BUG,当音频的采样点小于采样窗口大小时,会出现如下异常,
librosa.util.exceptions.ParameterError: Input is too short (n=532) for frame_length=533 导致生成lam的json失败。建议可以对这个参数做个长度判断控制一下,可以暂时解决该问题。

engines>infer.py line 171
volume = librosa.feature.rms(y=audio, frame_length=int(1 / 30 * ssr), hop_length=int(1 / 30 * ssr))[0]
替换成
volume = librosa.feature.rms(y=audio, frame_length=min(int(1 / 30 * ssr), len(audio)), hop_length=int(1 / 30 * ssr))[0]
可以暂时解决该问题,当然官方可以更全面的考虑一下如何修改。