HeyDittoNet

Spoken "Hey Ditto" activation using CNN-LSTM model. Model trained on both synthetic and real human voices along with samples of background noise from various scenes around the world.

Getting Started

Install required packages: pip install -r requirements.txt
Run: python main.py to test activation on your default mic.

Model Architecture

CNN-LSTM model architecture below with 99% testing accuracy on roughly 30,000 audio samples:

Training Metrics

CNN-LSTM Training Loss:

Name		Name	Last commit message	Last commit date
Latest commit History 180 Commits
data		data
images		images
models		models
.DS_Store		.DS_Store
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
activation_requests.py		activation_requests.py
convert_tflite.py		convert_tflite.py
hey_ditto_net_embeddings.py		hey_ditto_net_embeddings.py
main.py		main.py
reinforce_from_samples.py		reinforce_from_samples.py
requirements.txt		requirements.txt
sample-recorder.py		sample-recorder.py
speaker_recognition.py		speaker_recognition.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

HeyDittoNet

Getting Started

Model Architecture

Training Metrics

About

Releases 1

Packages

Contributors 2

Languages

License

omarzanji/ditto_activation

Folders and files

Latest commit

History

Repository files navigation

HeyDittoNet

Getting Started

Model Architecture

Training Metrics

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Contributors 2

Languages

Packages