Este projeto é um chatbot de transcrição de áudio que usa Whisper para transcrição e integra com um modelo de linguagem (LLM) para ajudar os usuários com as transcrições de áudio. O chatbot pode processar comandos via hotkeys do teclado.
Python 3.6+
pynput
para interação com o tecladowhisper_live
para transcrição de áudio. Para mais instruções sobre como rodar o servidor de transcrição, clique aqui.langchain
,langchain_groq
,langchain_ollama
para interação com o modelo de linguagempython-dotenv
para gerenciamento de variáveis de ambienteOllama
instalado no seu computador (caso queira rodar modelos locais).
- Clone o repositório e navegue até o diretório do projeto.
- Instale os pacotes Python necessários:
pip install -r requirements.txt
- Certifique-se de ter o Ollama ou Groq rodando na sua máquina.
- Crie um arquivo .env no diretório raiz do projeto com as variáveis de ambiente necessárias.
Executando o Projeto
- Atualize o script com o endereço IP e a porta corretos para o TranscriptionClient.
- Inicie o script:
python seu_script.py