Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

1️⃣ DEDUPLICATION: Choix parent en amont dans le clustering #1266

Open
wants to merge 9 commits into
base: main
Choose a base branch
from

Conversation

maxcorbeau
Copy link
Contributor

@maxcorbeau maxcorbeau commented Jan 27, 2025

1️⃣ DEDUPLICATION: Choix parent en amont dans le clustering

Carte Notion : DEDUPLICATION - Choix parent en amont dans le clustering

  • 💡 quoi: déplacer la logique de sélection du parent pour la dédup de:
    • actuellement en aval (voir scripts/deduplication)
    • vers l'amont (dans dags/cluster)
  • 🎯 pourquoi: pour que la suggestion de clustering contienne également la proposition de nouveau parent:
    • aider à la prise de décision métier en ayant un max d'info au niveau de la suggestion
    • augmenter la fiabilité de nos pipelines en intégrant aux suggestions tous les changements nécessaires (et ne pas se reposer sur d'autres logiques à posteriori qui rendent la visibilité, testing, et debugging bcp + complexes)
  • 🤔 comment:
    • cluster_acteurs_choose_new_parents: nouvelle fonction business qui va choisir les nouveaux parents à partir d'un dataframe de clusters

➡️ A faire (cette PR)

  • test unitaires
  • intégrer cluster_acteurs_choose_new_parents à la tâche Airflow de suggestion

📆 A faire (prochaine PR)

  • Même pourquoi: on va également déplacer la logique de dédup d'enrichissement du parent en amont

@maxcorbeau maxcorbeau changed the title 1️⃣ DEDUPLICATION: Sélection du nouveau parent 1️⃣ DEDUPLICATION: Choix parent en amont dans le clustering Jan 27, 2025
@maxcorbeau maxcorbeau marked this pull request as ready for review February 5, 2025 14:50
@maxcorbeau maxcorbeau requested a review from a team as a code owner February 5, 2025 14:50
@maxcorbeau maxcorbeau requested review from kolok and fabienheureux and removed request for a team February 5, 2025 14:50
Copy link

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

1 participant