GitHub

In diesem Projekt geht es grob darum, dass etwas eingesprochen werden kann in einer von 50+ Sprachen, dies dann ins englische übersetzt wird und durch KI ein Bild zu diesem Text generiert wird. Das ist möglich durch die OpenAI API mit Whisperer und dem Image Generating Model.

Vorbereitung: Die benötigten Libraries sollten alle im requirements.txt stehen und sollten bereits im venv vorhanden sein. Es wurde mit Python3.9 getestet. Zusätzlich wird ein API Key benötigt da es kostenpflichtig ist und darüber verrechnet wird. Den API Key einfach in apiKey.txt ablegen. Zusaätzlich muss der Pfad zum Python interpreter in startup.py abgelegt werden.

Kurze Anleitung:

Projekt start durch startup.py, es erscheint ein Screen mit einem "Start" Button, den drücken, danach erscheint eine Benutzeroberfläche mit einem roten Button in der mitte. Sobald dieser gedrückt wird wird eine Audioaufnahme gestartet welche nach 10 Sekunden endet. Diese ercheint nach kurzem Warten auf dem Bildschirm und nach weiteren 10 Sekunden erscheint das dazugehörige Bild. Dieser Screen wird gespeichert mit einem Timestamp in /imgOnLayout.

Im Moment ist drucken deaktiviert, zum aktivieren muss printHandler.py bearbeitet werden.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.idea		.idea
__pycache__		__pycache__
build/main		build/main
images		images
imgOnLayout		imgOnLayout
localImgSave		localImgSave
venv		venv
README.md		README.md
apiKey.txt		apiKey.txt
audioProcessing.py		audioProcessing.py
file.wav		file.wav
gui.py		gui.py
imageProcessing.py		imageProcessing.py
main.py		main.py
printHandler.py		printHandler.py
requirements.txt		requirements.txt
screenshot.png		screenshot.png
startup.py		startup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

hannesmoehring/speechToImageWindows

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages