Skip to content

Commit

Permalink
Make data science exercise ready.
Browse files Browse the repository at this point in the history
  • Loading branch information
wichmann committed Jun 18, 2022
1 parent c90e5a4 commit b54b092
Show file tree
Hide file tree
Showing 5 changed files with 88 additions and 34 deletions.
7 changes: 4 additions & 3 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -9,9 +9,9 @@
* Tic-Tac-Toe mit GUI ☑️
* URL-Shortener implementieren ☑️
* Server-Backup durchführen ☑️
* Datenbank erstellen und abfragen
* Veranstaltungsdatenbank mit Web-App ☑️
* Relationale Datenbank anbinden ☑️
* HTTP-Monitoring einrichten
* HTTP-Monitoring einrichten ☑️
* Datenauswertung durchführen
* Diagramme für Messprotokoll erstellen
* Turtle-Grafiken erstellen
Expand All @@ -20,5 +20,6 @@

## Weitere mögliche Aufgaben

* Musikdaten mit der Spotify-API abfragen
* Telegram-Bot programmieren (https://www.heise.de/hintergrund/Programmieren-Mikro-Blog-per-Telegram-Messenger-Bot-befuellen-6328492.html)
* Spotify-API abfragen
* Klassen-Diagramme und ER-Modelle mit graphviz erstellen
31 changes: 0 additions & 31 deletions datenauswertung.py

This file was deleted.

38 changes: 38 additions & 0 deletions datenauswertung_aufgabe.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,38 @@

"""
Die Datei datenauswertung.csv enthält den Anteil der Internetnutzer in ver-
schiedenen Ländern an der Gesamtbevölkerung über die Jahre von 2002 bis 2021
(Datenquelle: Statistikdatenbank der Weltbank [1]). Es soll für eine ausge-
wählte Anzahl von Ländern ein Liniendiagramm erstellt werden, das den Verlauf
des Anteils über die gegebenen Jahre darstellt.
Mögliche Erweiterungen:
Hilfen:
* Einführung in die Bibliothek "pandas" [2]
* Artikel von heise zu "Analyse von Open Data mit Pandas" [3]
* Artikel aus der c't "Mit Python und Pandas die eigenen Einkaufsdaten analysieren" [4]
* Beispieldaten von den Machern der Bibliothek "pandas" [5]
Bibliotheken:
* pandas -
pip install pandas
* matplotlib - Erstellung von Diagrammen
pip install matplotlib
Quellen:
[1] https://databank.worldbank.org/data/reports.aspx?dsid=2&series=IT.NET.USER.ZS
[2] https://pandas.pydata.org/docs/getting_started/intro_tutorials/index.html
[3] https://www.heise.de/hintergrund/Analyse-von-Open-Data-mit-Pandas-5049049.html
[4] https://www.heise.de/ratgeber/Mit-Python-und-Pandas-die-eigenen-Einkaufsdaten-analysieren-6668748.html
[5] https://github.com/pandas-dev/pandas/tree/main/doc/data
"""


import pandas as pd
import matplotlib.pyplot as plt


daten = pd.read_csv('datenauswertung_daten.csv', index_col='Country Code')
gesuchte_laender = ['Germany', 'United States', 'France', 'Poland', 'United Kingdom', 'Sweden', 'Switzerland']
File renamed without changes.
46 changes: 46 additions & 0 deletions datenauswertung_lösung.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,46 @@

"""
Die Datei datenauswertung.csv enthält den Anteil der Internetnutzer in ver-
schiedenen Ländern an der Gesamtbevölkerung über die Jahre von 2002 bis 2021
(Datenquelle: Statistikdatenbank der Weltbank [1]). Es soll für eine ausge-
wählte Anzahl von Ländern ein Liniendiagramm erstellt werden, das den Verlauf
des Anteils über die gegebenen Jahre darstellt.
Mögliche Erweiterungen:
Hilfen:
* Einführung in die Bibliothek "pandas" [2]
* Artikel von heise zu "Analyse von Open Data mit Pandas" [3]
* Artikel aus der c't "Mit Python und Pandas die eigenen Einkaufsdaten analysieren" [4]
* Beispieldaten von den Machern der Bibliothek "pandas" [5]
Bibliotheken:
* pandas -
pip install pandas
* matplotlib - Erstellung von Diagrammen
pip install matplotlib
Quellen:
[1] https://databank.worldbank.org/data/reports.aspx?dsid=2&series=IT.NET.USER.ZS
[2] https://pandas.pydata.org/docs/getting_started/intro_tutorials/index.html
[3] https://www.heise.de/hintergrund/Analyse-von-Open-Data-mit-Pandas-5049049.html
[4] https://www.heise.de/ratgeber/Mit-Python-und-Pandas-die-eigenen-Einkaufsdaten-analysieren-6668748.html
[5] https://github.com/pandas-dev/pandas/tree/main/doc/data
"""


import pandas as pd
import matplotlib.pyplot as plt


daten = pd.read_csv('datenauswertung_daten.csv', index_col='Country Code')
gesuchte_laender = ['Germany', 'United States', 'France', 'Poland', 'United Kingdom', 'Sweden', 'Switzerland']
zeitreihe_deutschland = daten[daten['Country Name'].isin(gesuchte_laender)]
zeitreihe_deutschland = zeitreihe_deutschland.drop(['Series Name', 'Series Code', 'Country Name'], axis=1)
kurve = zeitreihe_deutschland.transpose().plot()
plt.xlabel('Jahre')
plt.title('Anteil der Internetnutzer in verschiedenen Ländern')
plt.ylabel('Anteil Internetnutzer in Prozent')
plt.grid()
plt.show()

0 comments on commit b54b092

Please sign in to comment.