Les données sont disponibles ici temporairement.
La direction générale des finances publiques publie tous les semestres le dataset Demandes de valeurs foncières qui fournit sur les 5 dernières années l'ensemble des transactions immobilières à partir des actes notariés sur le territoire métropolitain (hors Alsace, Moselle et Mayotte). Ce dataset contient la valeur à laquelle le bien a été vendu, le type de transaction, les caractéristiques des biens (surface, localisation, nombre de pièce) etc. Les données sont accessibles ici;
Nous nous sommes concentrés sur Paris (en dépit d'avoir 64 go de RAM 😢) pour prédire la valeur d'un bien (en fonction de ses caractéristiques) en enrichissant le dataset avec :
- les données FiLoSoFi publié par l'INSEE qui fournissent des informations sur les caractéristiques des ménages au sein d'un carroyage (de 200m pour notre part), disponible ici.
- les critères d'appréciation et les notes de Paris par arrondissement (noté par les habitants). Ces informations ont été scrappé sur le site Ville-idéale. Le script qui permet de scrapper est disponilbe ici
- les données sur les équipements à proximité des logements. Le dataset est disponible ici. Un gros travail a été nécessaire pour rattacher ces données à la table DVF que vous retrouverez ici.
Modèle | RMSE | Gagnant |
---|---|---|
LightGBM | 140786.01 | 👑 |
SVR | 205309.53 | 😢 |
RandomForest | 143325.41 | 😢 |
Nous avons développé dans le cadre de ce projet un dashboard intéractif pour mettre en avant les principales variables disponibles dans notre dataset dont voici un aperçu :
Il est disponible sur cette page et en app ici.