Chargement des données essentielles de la commande publique en base de données et production de statistiques.
Version 2.0.1
Rappel de ce que sont les données essentielles de la commande publique (ou DECP) sur le blog de data.gouv.fr.
L'objectif de ce projet est d'exploiter les données essentielles de la commande publique (DECP) et de les rendre intelligibles.
Projets connexes :
- jq pour requêter le fichier JSON (disponible dans les dépôts Ubuntu)
- une instance MongoDB et
mongoimport
pour le chargement - pouvoir exécuter des scripts bash
- ansible pour initialiser MongoDB
Pour commencer, vous devez faire une copie de config/config_template.sh
en config/config.sh
.
cp config/config_template.sh config/config.sh
Puis éditez le contenu de config/config.sh
pour configurer l'accès à votre base de données MongoDB.
La base de données configurée dans config/config.sh
.
Ensuite, vous pouvez initialiser la base de données (suppression/création des collections, création de l'index textuel) :
./dbInit.sh
Si vous partez d'une base vide, vous pouvez en plus créer les utilisateurs et activer l'authentification avec :
./dbInit.sh fromScratch
./sourceStats.sh
./load-in-db.sh
Vous pouvez :
- m'écrire un mail à colin@maudry.com
- me trouver sur Twitter (@col1m)
- intéragir avec ce dépôt sur Github (issues, pull request).
Le code source de ce projet est publié sous licence Unlicense.
- ajout de la gestion de redirection (
curl -L
) pour la récupréation des DECP
- migration du code d'agrégation vers decp-rama
- production de stats
- correction d'un bug dans la fusion des JSON
- ajout des données de e-marchespublics.com
- couvertures des trois datasets de l'AIFE
- gestion des sources de données qui ne nécessitent pas de conversion
- amélioration du workflow (get > convert > fix > package > load-in-db)
- correction d'une anomalie dans les données
marches-publics.info
(certains marchés n'ont pas de_type
) - nouvelles données dans
/json
- ajout d'un script de (ré)initialisation de MongoDB
- support des données publiées sur marches-publics.info (
marches-publics.info
) - ajout de la date du dernier téléchargement dans les métadonnées
- amélioration de la scructure des scripts
- ajout de
all.sh
, pour traiter intégralement une source (sauf le chargement en base de données)
- support des données PES marché publiées sur data.gouv.fr (
data.gouv.fr_pes
)