WaveNet vocoder

A Pytorch implementation of the WaveNet vocoder, which can generate raw speech samples conditioned on mel spectrograms. This task refers to a speech synthesis problem, when we need to reconstruct an audio signal from a mel spectrogram.

Usage

You can download my pretrained model or train your own. Settings for calculating mel spectrograms can be found here:

from config import MelSpectrogramConfig
from src.preprocessing import MelSpectrogram

featurizer = MelSpectrogram(MelSpectrogramConfig()).to(device)
mel_spectrogram = featurizer(audio_wav)

Then, prediction:

predicted_audio = model.inference(mel_spectrogram)

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
src		src
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
config.py		config.py
inference.py		inference.py
requirements.txt		requirements.txt
run_docker.sh		run_docker.sh
train.py		train.py
wavenet.pth		wavenet.pth

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

WaveNet vocoder

Usage

About

Releases

Packages

Languages

tabisheva/wavenet-vocoder

Folders and files

Latest commit

History

Repository files navigation

WaveNet vocoder

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages