Projet réalisé dans le cadre de la formation Data analyst chez OpenClassRooms.
Data analyst chez 'La poule qui chante', une entreprise française d’agroalimentaire. Son activité principale est l’élevage et la vente de poulets sous le label “Poulet Agriculture Biologique”. La direction souhaite évaluer la possibilité de se développer à l'international.
- Analyse complète depuis la collecte en passant par le nettoyage jusqu'à une analyse post réduction des dimensions des données.
- Proposer une analyse des groupements de pays que l’on peut cibler pour exporter nos poulets.
Données issues de :
- FAO
- Banque Mondiale
- Agence Bio
- Institut de recherche de l'agriculture biologique fiBL
- Processus de recherche et de collecte des données (analyse Pestel)
- Prétraitements, Features engineering et transformation de données
- Réduction de dimension des données en variables synthétiques (ACP)
- Classification des pays en groupes (CAH et méthode K-Means)
- Proposition de pays où exporter
- Notebook Python contenant la préparation et le nettoyage des données;
- Notebook Python contenant l’ACP, les clusterings effectués et les différentes visualisations.
- Présentation pour le COMEX
- Réaliser des analyses multivariées pour comprendre la corrélation entre les variables
- Réduire la dimension du jeu de données pour optimiser le temps d'apprentissage des modèles
- Exploiter un modèle d'apprentissage afin d'en apprendre davantage sur les données
- Sélectionner les variables pertinentes d'un modèle d'apprentissage (réduction de variables, features engineering)