📌 Transcripcion_AI es un sistema avanzado que convierte audios en texto con Azure Speech-to-Text, identifica diferentes hablantes con diarización y analiza la conversación con OpenAI para extraer información clave en formato JSON.
✅ Transcripción de audio con Microsoft Azure
✅ Diarización de hablantes para separar quién dice qué
✅ Análisis de insights con OpenAI (GPT)
✅ Generación de JSON estructurado con información clave
✅ Código modular y escalable para integraciones futuras
- 🟢 Python - Lenguaje principal del proyecto
- 🔷 Azure Cognitive Services - Para Speech-to-Text
- 🤖 OpenAI API - Para análisis de texto e insights
- 🗄️ JSON - Para almacenar resultados estructurados
Transcripcion_AI/
│── transcripcion/
│ ├── __init__.py
│ ├── transcriber.py
│
│── procesamiento/
│ ├── __init__.py
│ ├── openai_processor.py
│
│── app.py
│── config.py # Archivo de configuración (usa el config.example.py)
│── requirements.txt
│── Audio.wav
│── README.md
│── LICENSE.txt🔹 Centros de llamadas: Automatización del análisis de conversaciones
🔹 Empresas financieras: Detección de necesidades de clientes
🔹 Atención al cliente: Extracción de insights para mejorar el servicio
Abre una terminal y ejecuta los siguientes comandos para clonar el repositorio y acceder a la carpeta del proyecto:
git clone https://github.com/TU-USUARIO/Transcripcion_AI.git
cd Transcripcion_AIEjecuta el siguiente comando:
pip install -r requirements.txtAbre el archivo config.py y reemplaza las claves con las tuyas:
SPEECH_KEY = "TU_AZURE_KEY"
SPEECH_REGION = "eastus"
OPENAI_API_KEY = "TU_OPENAI_KEY"Ejecuta el siguiente comando para iniciar la transcripción:
python app.py