- На серверной стороне должна быть реализована возможность распознавания голосовых сообщений с помощью API асинхронного распознавания (Yandex SpeechKit).
- Приложение должно иметь возможность записывать голосовые сообщения в режиме реального времени и отправлять их на сервер для распознавания.
- Приложение должно иметь возможность распознавать голосовые сообщения, сохраненные в формате аудиофайла, и выводить результат на экран.
- Для работы приложения необходимо получить API-ключ от сервиса API асинхронного распознавания (Yandex SpeechKit).
- Приложение должно предоставлять пользователю возможность записи голосовых сообщений и отправки их на сервер для распознавания.
- Приложение должно иметь возможность распознавания голосовых сообщений в формате аудиофайла.
- Приложение должно выводить результат распознавания голосовых сообщений на экран/консоль.
- Код должен быть выложен на GitHub и содержать инструкцию по запуску приложения.
Клонируем репозиторий:
git clone https://github.com/alexander-kurchin/hackathon-eksmo-backend-test
Создаём виртуальное окружение:
cd hackathon-eksmo-backend-test
python -m venv venv && . venv/scripts/activate
pip install -r requirements.txt
Создаём файл .env и помещаем туда свой API-ключ по аналогии с .envexample.
Запись и распознавание 5-секундной речи через микрофон:
python microphone.py
Либо сами устанавливаете длительность записи:
python microphone.py --time <seconds>
Распознавание аудиофайла example_audiofile.wav:
python audiofile.py
Распознавание вашего аудиофайла:
python audiofile.py --path <path>