Este es mi proyecto final para el curso de Data Science. El objetivo de este proyecto es realizar un análisis de datos del conjunto "Telco Customer Churn". En él se explorará el conjunto de datos para analizar los factores que influyen en la tasa de abandono de los clientes de una empresa de telecomunicaciones.
La tasa de abandono de clientes (o churn rate, en inglés) es una métrica importante para cualquier empresa de servicios, ya que el costo de adquirir un nuevo cliente suele ser mayor que el de retener a uno existente. Por lo tanto, identificar los factores que influyen en la tasa de abandono de los clientes puede ayudar a la empresa a implementar estrategias efectivas para retener a sus clientes actuales y atraer a nuevos.
En este proyecto, se explorará el conjunto de datos "Telco Customer Churn" utilizando herramientas y técnicas de análisis de datos y modelado predictivo. Se buscará responder preguntas específicas, como:
- ¿Cuáles son los factores que influyen en la tasa de abandono de los clientes?
- ¿Hay alguna relación entre la duración del contrato y la tasa de abandono?
- ¿Cómo afecta el tipo de servicio contratado a la tasa de abandono?
- ¿Qué tan precisos son los modelos de predicción para identificar a los clientes con mayor probabilidad de abandonar?
Para responder a estas preguntas, se realizará un análisis exploratorio de datos, se creará un modelo predictivo utilizando técnicas de aprendizaje automático y se evaluará su precisión. Además, se utilizarán técnicas de optimización de hiperparámetros para mejorar la precisión del modelo. Finalmente, se seleccionará el mejor modelo y se presentarán recomendaciones para reducir la tasa de abandono de los clientes.
El conjunto de datos utilizado en este proyecto se llama "Telco Customer Churn". Este conjunto de datos contiene información sobre clientes de una empresa de telecomunicaciones, incluyendo información demográfica, servicios contratados, duración del contrato, tipo de facturación y tasa de abandono. El conjunto de datos consta de 7.043 observaciones y 21 variables.
Este proyecto fue realizado por Jose Zacarías Flores, como proyecto final para el curso de Data Science.