Speech-to-Text using OpenAI Whisper 🎤➡️📝

This project demonstrates automatic speech recognition (ASR) using OpenAI Whisper, a state-of-the-art model for transcribing speech into text.
It works with .wav audio files and outputs accurate transcriptions.

📁 Dataset / Audio File

Name: Custom audio file (34210__acclivity__i-am-female.wav)
Format: .wav
Usage: Used to test Whisper’s transcription capabilities

🧠 Model

Model Used: Whisper (small)
Library: openai-whisper
Task: Speech-to-Text transcription
Language Support: Multilingual

🛠️ Requirements

Install required Python libraries using:

pip install openai-whisper
pip install torch

▶️ How to Run

Upload Audio File

Example: 34210__acclivity__i-am-female.wav

Transcribe with Whisper

import whisper

Load model

model = whisper.load_model("small")

Transcribe audio

result = model.transcribe("34210__acclivity__i-am-female.wav")

Print text

print("📝 Transcription:", result["text"])

Output

The model will return the spoken text from the audio file.

📊 Results

Sample Audio (34210__acclivity__i-am-female.wav): "I am female"

Model: Whisper Small

Accuracy: High for clear recordings

📈 Possible Extensions

Batch transcription for multiple .wav files

Real-time speech recognition using a microphone

Language detection & translation with Whisper

Integration into AI assistants or chatbots

🤖 Author

Muhammad Rayan Shahid
AI Enthusiast | YouTuber at ByteBrilliance AI

⭐ GitHub Repo

Stay tuned for more projects on AI, ML, DL, and Computer Vision!

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
34210__acclivity__i-am-female.wav		34210__acclivity__i-am-female.wav
README.md		README.md
speech_to_text_translator.ipynb		speech_to_text_translator.ipynb
transcription.txt		transcription.txt
translation.txt		translation.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Speech-to-Text using OpenAI Whisper 🎤➡️📝

📁 Dataset / Audio File

🧠 Model

🛠️ Requirements

Load model

Transcribe audio

Print text

🤖 Author

⭐ GitHub Repo

About

Uh oh!

Releases

Packages

Languages

RayanAIX/Speech-to-Text-Translator

Folders and files

Latest commit

History

Repository files navigation

Speech-to-Text using OpenAI Whisper 🎤➡️📝

📁 Dataset / Audio File

🧠 Model

🛠️ Requirements

Load model

Transcribe audio

Print text

🤖 Author

⭐ GitHub Repo

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages