-
Notifications
You must be signed in to change notification settings - Fork 1
Commit
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Merge pull request #1 from mirelemborges/main
adiciona habilidade 3:segmentacion rfm en el programa de data
- Loading branch information
Showing
55 changed files
with
529 additions
and
43 deletions.
There are no files selected for viewing
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
52 changes: 52 additions & 0 deletions
52
DAT/00_desafio_datos/00_01_desafiospotify/00_01_desafiospotfy_ES.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,52 @@ | ||
# Desafío de Análisis de Datos: Canciones Más Escuchadas en Spotify 2023 | ||
|
||
## Descripción | ||
|
||
En este desafío, te enfrentarás al análisis de un conjunto de datos que contiene información sobre las canciones más escuchadas en Spotify en 2023. El objetivo principal es explorar y analizar estos datos para identificar la variable que tiene la mayor correlación con el número de streams de cada canción. También se espera que encuentres y compartas otros hallazgos interesantes derivados de los datos. | ||
|
||
## Objetivos del Desafío | ||
|
||
- Explorar los datos de las canciones más populares en Spotify en 2023. | ||
- Identificar y analizar la variable que tiene mayor correlación con el número de streams. | ||
- Comunicar los hallazgos a través de visualizaciones y análisis claros. | ||
|
||
## Base de datos | ||
|
||
[Aqui](https://docs.google.com/spreadsheets/d/1oKBbMfNDk7Cvrcl5zG_iHVFjWYOWwQ1CG42WyS4l31A/copy?) puedes hacer download de la base de datos y descripción de las variables. | ||
|
||
## Pasos para Realizar el Análisis | ||
|
||
1. **Exploración Inicial de los Datos**: Familiarízate con las variables disponibles en el conjunto de datos. Algunas variables comunes pueden incluir nombre de la canción, artista, género, duración, popularidad, y número de streams, entre otras. | ||
|
||
2. **Análisis de Correlación**: Examina la relación entre el número de streams y otras variables clave para encontrar cuál tiene la mayor correlación. | ||
|
||
3. **Visualización de los Resultados**: Utiliza gráficos y tablas para representar visualmente los hallazgos y facilitar la interpretación de los datos. | ||
|
||
4. **Conclusiones y Recomendaciones**: A partir de los análisis y visualizaciones, elabora conclusiones sobre los factores que influyen en la popularidad de las canciones y propón recomendaciones basadas en los datos. | ||
|
||
## Tips para el Análisis | ||
|
||
- **Usa gráficos de dispersión** para explorar la relación entre el número de streams y otras variables. Esto puede ayudarte a visualizar patrones y posibles correlaciones. | ||
|
||
- **Aplica la fórmula de correlación** en tu herramienta de análisis (por ejemplo, `CORREL` en spreadsheets) para cuantificar la fuerza de la relación entre el número de streams y cada variable. | ||
|
||
- **Explora otras relaciones** que puedan ofrecer hallazgos interesantes, como la relación entre el género musical y la popularidad o la duración de la canción y los streams. | ||
|
||
- **Analiza las distribuciones de datos** para obtener una visión más completa, como el rango de popularidad o duración de las canciones más escuchadas. | ||
|
||
## Ejemplo de Herramientas y Técnicas | ||
|
||
- **Spreadsheets**: Si utilizas una hoja de cálculo, puedes crear gráficos de dispersión y aplicar la fórmula de correlación (`=CORREL()`) para cada variable en comparación con el número de streams. | ||
- **Python o R**: Si prefieres utilizar un lenguaje de programación, puedes utilizar bibliotecas como `Pandas` y `Matplotlib` en Python o `ggplot2` en R para realizar análisis estadísticos y crear visualizaciones avanzadas. | ||
|
||
## Entrega del desafio | ||
|
||
En discord, en el canal del desafio, comparta: | ||
|
||
1. **Un archivo con el análisis completo** que incluya tablas y gráficos. | ||
2. **Una breve descripción de tus hallazgos principales** y conclusiones, especificando cuál variable se encontró que tiene la mayor correlación con el número de streams. | ||
3. **Recomendaciones basadas en el análisis**, si encuentras patrones adicionales interesantes. | ||
|
||
--- | ||
|
||
¡Buena suerte y disfruta del proceso de descubrimiento a través de los datos! |
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,20 @@ | ||
# Usando IA para verbalizar tu aprendizaje | ||
|
||
La verbalización del aprendizaje, es decir, expresar en palabras lo que hemos aprendido (oralmente o por escrito), desempeña un papel crucial en la consolidación y validación del conocimiento. Este proceso activa diversas áreas cerebrales relacionadas con la memoria, el lenguaje y la metacognición, facilitando una comprensión más profunda y duradera. | ||
|
||
**Metacognición y autorregulación:** Expresar el conocimiento en palabras nos permite reflexionar sobre nuestro propio proceso de aprendizaje, identificar vacíos en la comprensión y ajustar nuestras estrategias cognitivas. Este monitoreo metacognitivo es fundamental para un aprendizaje efectivo y autónomo. | ||
|
||
Si bien pensamos que en muchos casos lo idea, es hacer este ejercicio junto a otra(s) persona(s), una manera simple y efectiva de hacerlo de manera individual es usar un modelo LLM de IA. Acá te dejamos uns propuesta/ejemplo de "prompt" (instrucción para el modelo LLM) con 5 preguntas enfocadas para principiantes sobre el método RFM: | ||
|
||
> Actúa como una tutora o instructora que evalúa la comprensión del concepto RFM en una estudiante principiante. Haz las siguientes preguntas, una a la vez, y da retroalimentación inmediata y simple para cada respuesta de la estudiante: | ||
> | ||
> 1. ¿Qué es el método RFM y para qué se utiliza? | ||
> 2. ¿Qué significa cada variable en RFM: Recencia, Frecuencia y Valor Monetario? | ||
> 3. ¿Por qué es importante la variable de Recencia en la segmentación de clientes? | ||
> 4. ¿Cómo se asignan puntuaciones a cada variable en RFM? | ||
> 5. ¿Cómo se interpretan las puntuaciones RFM para tomar decisiones de negocio?” | ||
> | ||
> Usa respuestas cortas y aclara cualquier malentendido antes de pasar a la siguiente pregunta. | ||
Puede usar Gemini, Chat GPT, Mea AI, etc. | ||
|
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,17 @@ | ||
# ◼️ Módulo 1: Segmentación de Clientes con el Modelo RFM | ||
|
||
**Tiempo:** ⏱️️ 5min | ||
|
||
--- | ||
|
||
## Introducción | ||
|
||
En este módulo, descubrirás la segmentación de clientes mediante el análisis RFM, una técnica que permite clasificar a los clientes en función de su comportamiento. | ||
|
||
A través del modelo RFM, comenzarás a identificar patrones y a entender mejor la relación de los clientes con el negocio, aunque **en este punto** el análisis será bastante básico. | ||
|
||
## Lo que aprenderás | ||
|
||
* Qué es el modelo RFM y cómo se utiliza en la segmentación de clientes. | ||
* Definiciones y características de las variables Recencia, Frecuencia y Valor Monetario. | ||
* Técnicas para clasificar y agrupar clientes en segmentos manejables según el modelo RFM. |
13 changes: 13 additions & 0 deletions
13
DAT/03_segmentation/01_rfm/activities/01_01_01_dat_conceptorfm_CONFIG.json
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,13 @@ | ||
{ | ||
"difficulty": 1, | ||
"learning": 2, | ||
"time": 4, | ||
"directions": { | ||
"ES": "<p>💡 Evaluación: Recuerda que puedes pedir la evaluación de una compañera antes de terminar tu reto y compartir la URL. Hazlo en el canal *-ayuda</p><p>💬 Comparte el enlace a tu trabajo final en el hilo de Discord y reacciona con ✅ para marcar tu progreso.</p><p>No olvides dejar el enlace público para que tus compañeras puedan verlo.</p>", | ||
"PT": "null" | ||
}, | ||
"discord_URL": { | ||
"ES": "https://discord.com/channels/1209273049304666113/1306335790174961684", | ||
"PT": "null" | ||
} | ||
} |
69 changes: 69 additions & 0 deletions
69
DAT/03_segmentation/01_rfm/activities/01_01_01_dat_conceptorfm_ES.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,69 @@ | ||
# Reto 1.1: Fundamentos del modelo RFM | ||
|
||
**Dificultad:** 🌻 | ||
|
||
**Aprendizaje:** 🍯🍯 | ||
|
||
**Tiempo:** ⏱️️⏱️️⏱️️⏱️️ 3-5 hrs. | ||
|
||
|
||
--- | ||
|
||
|
||
## Meta de Aprendizaje | ||
|
||
Aprenderás a identificar en un conjunto de datos las variables necesarias para el análisis de clientes mediante el método RFM. Para lograrlo, primero profundizarás en el concepto de esta técnica de segmentación y deberás unir dos tablas de datos con una fórmula. Con esto, estarás preparada para aplicar la técnica de forma efectiva en los siguientes retos. | ||
|
||
## Descripción | ||
|
||
Revisa los contenidos disponibles en los materiales proporcionados, así como la base de datos, y asegúrate de que eres capaz de responde a las siguientes preguntas antes de unir las tablas y generar columnas para las variables RFM: | ||
|
||
1. ¿Qué es RFM? | ||
2. ¿Cuáles variables tengo en mi base de datos para realizar este análisis? | ||
3. ¿Cuál variable o conjunto de variables corresponde a Recencia, cuál a Frecuencia y cuál a Monto? | ||
4. ¿Puedo utilizar alguna fórmula para combinar variables y obtener una única columna para Frecuencia y otra para Monto? | ||
5. ¿Cómo "traigo" los datos de la base de datos de transacciones para la base de datos principal y poder así usar alguna fórmula para calcular la Recencia? | ||
|
||
|
||
### Cumples con la meta de aprendizaje si: | ||
|
||
- [x] Logras responder para ti misma a todas las preguntas planteadas en la descripción. | ||
- [x] Logras unir las dos bases de datos a través de una fórmula. | ||
- [x] Logras obtener una columna que represente la Recencia, una para Frecuencia y otra para Monto. | ||
|
||
|
||
## Insumos para tu aprendizaje | ||
<!-- Los enlaces a topics, hay que ponerlos usando este patrón //PATH_TO_THIS_SCRIPT:?lang=XX&track=XXX&skill=XXXXXX&module=XXXXXX//rfm_prompt_ES.md--> | ||
<!-- luego será compeltado por el script en python del repo en GH --> | ||
- [📄 Texto: Base de Datos 1 y descripción de Variables](https://docs.google.com/spreadsheets/d/1nE1yZuE-bzZ2Ot4xjbq3zADqTcNXnNA4_ksE7uYE2JI/copy?). | ||
- [📄 Texto: Base de Datos 2 con la fecha de la ultima compra del cliente](https://docs.google.com/spreadsheets/d/1lM0f0Pu78rq4t-eHCHnPo0T8lIS0F4bs22WS4gtCQWk/copy?). | ||
- [📄 Texto: Concepto segmentación de clientes](https://docs.google.com/document/d/1I3_bay1ymFa0iMRz6W_C_mpmnahMdMs5_0UEiKf1jTo/edit?usp=sharing). | ||
- [📺 Video: Podcast segmentación de clientes](https://open.spotify.com/episode/23JZkyLP28b2U9E9LIEaWV). | ||
- [📄 Texto: Unir tablas en Google Sheets](https://docs.google.com/document/d/1mPYh7wmMmqUl5k8lACskw7Jav315NVZHrNymf6NwJss/edit?usp=sharing). | ||
- [📄 Texto: Documentación VLOOKUP](https://support.google.com/docs/answer/3093318?hl=es). | ||
- [📄 Video: El uso de las fórmulas INDEX + MATCH](https://www.youtube.com/watch?v=QzCVTurf5vs). | ||
- [🤖 🤝 Texto: Usando IA para entender mejor RFM](//PATH_TO_THIS_SCRIPT:?lang=XX&track=XXX&skill=XXXXXX&module=XXXXXX//rfm_prompt_ES.md) | ||
|
||
|
||
## Pauta de Trabajo | ||
|
||
- Crea una copia del archivo en el que trabajaste en los retos anteriores y agrega una hoja (sheet) con el nombre de este reto. Recuerda que en este reto tenemos dos archivos con los datos necesarios para realizar el análisis. Puedes probar la fórmula [IMPORTRANGE](https://www.loom.com/share/80681eee41704fd1a919a8fabde781ac?sid=9fc7ea93-1ef5-4fa5-b691-3bed2e363b1d) para traer los datos de un archivo a otro, o simplemente copiar y pegar los datos. | ||
- Lee las descripciones de las variables que se encuentran en el archivo de la base de datos. | ||
- Revisa el concepto de RFM y asegúrate de comprender qué significa Recencia, Frecuencia y Monto. | ||
- Identifica las variables que puedes utilizar para segmentar los clientes por Recencia, Frecuencia y Monto. | ||
- Utiliza las fórmulas VLOOKUP o INDEX+MATCH para traer la fecha de la última compra de acuerdo con el id_cliente. | ||
- Calcula lo necesario para obtener una única columna que indique los días transcurridos desde la última compra. | ||
- Suma el Monto y la Frecuencia de compra, tanto en línea como en tienda. | ||
- Tienes libertad para probar y analizar los datos como prefieras. | ||
- **Asegúrate de comprender lo que estás haciendo.** No te limites solo a las preguntas planteadas; **explora, analiza, prueba**, y busca nuevas formas de abordar el problema. | ||
|
||
Aquí tienes algunos resultados de referencia para asegurarte de que vas por buen camino con tu análisis. | ||
|
||
![image](https://raw.githubusercontent.com/Laboratoria/digitaljumpstart-curriculum/main/DAT/00_assets/image_solucion_rfm.png) | ||
|
||
Tip: Utiliza la fórmula DATE y la fecha del último día del año de 2023 para calcular la Recencia. | ||
|
||
--- | ||
|
||
¡Diviértete y disfruta del proceso de aprendizaje! Recuerda que sentirte confundida o desorientada es parte natural del proceso. | ||
|
13 changes: 13 additions & 0 deletions
13
DAT/03_segmentation/01_rfm/activities/01_01_02_dat_cuartil_CONFIG.json
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,13 @@ | ||
{ | ||
"difficulty": 1, | ||
"learning": 2, | ||
"time": 4, | ||
"directions": { | ||
"ES": "<p>💡 Evaluación: Recuerda que puedes pedir la evaluación de una compañera antes de terminar tu reto y compartir la URL. Hazlo en el canal *-ayuda</p><p>💬 Comparte el enlace a tu trabajo final en el hilo de Discord y reacciona con ✅ para marcar tu progreso.</p><p>No olvides dejar el enlace público para que tus compañeras puedan verlo.</p>", | ||
"PT": "null" | ||
}, | ||
"discord_URL": { | ||
"ES": "https://discord.com/channels/1209273049304666113/1306336264722845696", | ||
"PT": "null" | ||
} | ||
} |
59 changes: 59 additions & 0 deletions
59
DAT/03_segmentation/01_rfm/activities/01_01_02_dat_cuartil_ES.md
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Original file line number | Diff line number | Diff line change |
---|---|---|
@@ -0,0 +1,59 @@ | ||
# Reto 1.2: Cálculo de cuartiles para puntuación RFM | ||
|
||
**Dificultad:** 🌻 | ||
|
||
**Aprendizaje:** 🍯🍯 | ||
|
||
**Tiempo:** ⏱️️⏱️️️⏱️️️⏱️️ 3-5 hrs. | ||
|
||
|
||
--- | ||
|
||
## Meta de Aprendizaje | ||
|
||
Aprenderás a asignar puntuaciones a cada variable RFM para poder separar clientes en grupos. Para lograrlo, primero tendrás que entender qué son los cuartiles, cómo y para qué se utilizan y cómo aplicarlos en esta técnica de segmentación de clientes. | ||
|
||
## Descripción | ||
|
||
Vas a calcular los cuartiles para cada una de las variables (R, F y M) que utilizamos para clasificar a los clientes según RFM y asignar a cada variable de cada cliente, su cuartil correspondiente. Todo esto se hará mediante fórmulas como **CUARTIL** e **IF**. | ||
|
||
Los cuartiles dividen un conjunto de datos ordenados en cuatro partes iguales. Son útiles para analizar distribuciones y detectar patrones en datos. | ||
|
||
### Cumples con la meta de aprendizaje si: | ||
|
||
- [x] Calculas los cuartiles para Recencia, Frecuencia y Monto. | ||
- [x] Asignas a cada cliente el cuartil correspondiente de Recencia, Frecuencia y Monto. | ||
|
||
## Insumos para tu aprendizaje | ||
|
||
- [📄 Texto: Concepto de Cuartil, Decil y Percentil](https://docs.google.com/document/d/1uF-h0giCJjWO6HjSkVP1pIAM1UG6ar2aaFLARWvHdGg/edit?usp=sharing). | ||
- [📺 Video:Video concepto de Cuartil](https://www.loom.com/share/6d80794b67d14d048dfbf112e67e4a79?sid=dad30d47-6aca-400e-8a40-db990f68a311). | ||
- [📄 Texto: Documentación fórmula QUARTILE](https://support.google.com/docs/answer/3094041?hl=es). | ||
- [📄 Texto: Documentación fórmula IF](https://support.google.com/docs/answer/3093364?hl=es). | ||
- [📄 Texto: Documentación fórmula IFS](https://support.google.com/docs/answer/7014145?hl=es). | ||
|
||
## Pauta de Trabajo | ||
|
||
- Al mismo archivo del reto anterior, agrégale una hoja (sheet) con el nombre de este. | ||
|
||
- Crea una tabla donde puedas calcular los cuartiles para Recencia, Frecuencia y Monto, como en este ejemplo: | ||
![image](https://raw.githubusercontent.com/Laboratoria/digitaljumpstart-curriculum/main/DAT/00_assets/ejemplo_cuartil.png) | ||
|
||
- Usa la fórmula **IF** ou **IFS** para asignar el cuartil correspondiente a cada cliente. | ||
|
||
- Tienes libertad para probar y analizar los datos como prefieras. | ||
|
||
- **Asegúrate de comprender lo que estás haciendo.** No te limites solo a las preguntas planteadas; analiza, prueba y explora. | ||
|
||
- Pon especial atención en entender cuándo debes asignar la puntuación más alta y cuándo la más baja para cada variable. | ||
|
||
Aquí tienes un ejemplo para que puedas verificar cómo va tu progreso: | ||
|
||
![image](https://raw.githubusercontent.com/Laboratoria/digitaljumpstart-curriculum/main/DAT/00_assets/image_solucion_rfm.png) | ||
|
||
--- | ||
|
||
¡Diviértete y disfruta del proceso de aprendizaje! Recuerda que sentirte confundida o aturdida es una parte natural del proceso. | ||
|
||
--- | ||
|
Oops, something went wrong.