foerderportal-scraper
Automatisiert Verbundprojekt Daten des Förderkatalogs der Bundesregierung herunterladen.
csvedit.py zur Erstellung von Target / Node Tabellen für bspw. Gephi
usage: crawler.py [-h] -s [STADT [STADT ...]]
[-b [BUNDESLAND [BUNDESLAND ...]]] [-l LAUFZEIT] [-lfd]
[-t THREADS]
arguments:
-h, --help show this help message and exit
-s [STADT [STADT ...]], --stadt [STADT [STADT ...]]
Stadt/Gemeinde
-b [BUNDESLAND [BUNDESLAND ...]], --bundesland [BUNDESLAND [BUNDESLAND ...]]
Bundesland
-l LAUFZEIT, --laufzeit LAUFZEIT
Laufzeit von
-lfd, --lfdvorhaben Nur lfd. Vorhaben
-t THREADS, --threads THREADS
Parallele Threads
Benötigt Geckodriver und Firefox
-
Download
Geckodriver
In den selben Ordner wie die crawler.py verschieben
-
Crawler Starten
-
Nach dem Crawlen : csvedit.py Starten (erstellt kartesisches Produkt aller im ordner Output liegenden Datensätze)