diff --git a/404.html b/404.html index 14af331..34a4931 100644 --- a/404.html +++ b/404.html @@ -1,2 +1,2 @@ 404 Page not found -

Error

Woops. Looks like this page doesn't exist ¯\_(ツ)_/¯.

Go to homepage

Page not found!

\ No newline at end of file +

Error

Woops. Looks like this page doesn't exist ¯\_(ツ)_/¯.

Go to homepage

Page not found!

\ No newline at end of file diff --git a/basics/basic_terms/index.html b/basics/basic_terms/index.html index 00f88a3..23a2276 100644 --- a/basics/basic_terms/index.html +++ b/basics/basic_terms/index.html @@ -1,7 +1,7 @@ Grundbegriffe der Statistik :: Zertifikatskurs Data Librarian - Modul 3 - Daten analysieren und darstellen -

Grundbegriffe der Statistik

Für den statistischen Teil dieses Moduls ist ein gewisses Grundvokabular und Verständnis von allgemeinen Beispielen notwendige Voraussetzung.

Daher ist in der Moodle-Kursumgebung das Einführungskapitel des Buchs Statistik: Der Weg zur Datenanalyse zum alleinigen persönlichen Gebrauch hinterlegt.1

Der Text gibt einen Einstieg in die Aufgaben und Anwendungsbereiche der Statistik und erklärt die grundlegenden Begriffe, mit denen Daten und Datensätze charakterisiert werden können. Nach der Lektüre solltest Du beispielsweise die folgenden Fragen beantworten können:

  • Was ist Statistik? Was macht Statistik?
  • Welche grundlegenden Begriffe werden in der Statistik verwendet?
  • Wie kann das Messniveau für Spalten eines Datensatzes bestimmt werden?

2.1 Grundbegriffe (60 Min)

Beantworte und diskutiere die folgenden Fragen konkret für den in Einheit 1 heruntergeladenen San Francisco Library Usage Datensatz. Notiere Deine Ergebnisse in Stichpunkte.

  1. Wie viele Merkmale besitzt der Datensatz?
  2. Wie groß ist die Stichprobengröße des Datensatzes?
  3. Wer oder was sind die Merkmalsträger?
  4. Von wann bis wann wurden die Daten erhoben?
  5. Wie lässt sich die Grundgesamtheit beschreiben? Handelt es sich um eine Vollerhebung?
  6. Welche Merkmale sind stetig? Welche diskret?
  7. Welchem Skalenniveau entsprechen die einzelnen Merkmale (Nominal-, Ordinal- oder Metrische Skala)?
  8. Enthält der Datensatz fehlende Werte?
  9. Handelt es sich um Querschnitts-, Längsschnitss- oder Paneldaten?

Über das oben genannte Kapitel hinaus sind auch die englischen Lehrbücher von OpenIntro zu empfehlen. Sie können kostenlos auf der Webseite heruntergeladen werden. Für diesen Kurs sind insbesondere die ersten zwei Kapitel des Buchs Introductory Statistics with Randomization and Simulation 2 relevant. Auch diese Literaturhinweise sind in der Moodle-Kursumgebung hinterlegt.


  1. Fahrmeir, Ludwig, Christian Heumann, Rita Künstler, Iris Pigeot, and Gerhard Tutz. Statistik: Der Weg zur Datenanalyse. Springer-Verlag, 2016, https://www.springer.com/de/book/9783662503713↩︎

  2. Diez, David, Christopher Barr, and Mine Cetinkaya-Rundel. Introductory Statistics with Randomization and Simulation, 2014, https://www.openintro.org/stat/textbook.php↩︎

\ No newline at end of file +
\ No newline at end of file diff --git a/basics/index.html b/basics/index.html index d4a9b57..2b20d9e 100644 --- a/basics/index.html +++ b/basics/index.html @@ -1,7 +1,7 @@ Grundbegriffe der Statistik und Einführung in Pandas :: Zertifikatskurs Data Librarian - Modul 3 - Daten analysieren und darstellen -

19.02.2024 – 24.02.2024

Grundbegriffe der Statistik und Einführung in Pandas

Diese Einheit gibt in einem ersten Teil eine Einführung in die Aufgaben und grundlegenden Begriffe der angewandten Statistik. Im zweiten (mehr praktischen) Teil wird das pandas Paket vorgestellt und gezeigt, wie Datensätze eingelesen und bearbeitet werden können. Manche Lektionen und Aufgaben sind als Exkurs markiert. Diese Aufgaben sind für Interessierte und dauern meist etwas länger oder sind schwieriger zu lösen.

Die Projektaufgabe fasst die in dieser Einheit gelernten Inhalte in Form einer konkreten Aufgabenstellung zusammen, wie sie in der Praxis vorkommen könnte. Nach Bearbeitung aller einzelnen Aufgaben dieser Einheit ist die Projektaufgabe einfach zu bearbeiten.

Ziele

  • Kenntnisse des statistischen Grundvokabulars und Anwendung auf die Beschreibung eines Datensatzes
  • Ein- und Auslesen von Datensätzen als DataFrames in Python
  • Filtern von DataFrames nach Spalten oder Zeilen
  • Erstellung neuer Variablen

    Projektaufgabe: Grundlagen der Datenanalyse in Python

    Die Pressestelle der San Francisco Public Library möchte einen Online-Artikel zum Kundenstamm der Bibliothek erstellen. Dazu hat sie Dir einen Datensatz geschickt, den Du auswerten sollst.

    1. Erstelle eine Beschreibung des Datensatzes unter Verwendung des statistischen Grundvokabulars.
    2. Lies den Datensatz ein.
    3. Bereinige den Datensatz von fehlenden Werten und berechne die neue Variable Membership Duration.

    Die bearbeitete Projektaufgabe kannst Du in Deinem Git-Repositorium als Notebook bzw. Markdown-Datei speichern.

\ No newline at end of file +
\ No newline at end of file diff --git a/basics/pandas/columns/index.html b/basics/pandas/columns/index.html index 7b4dbcb..13debd4 100644 --- a/basics/pandas/columns/index.html +++ b/basics/pandas/columns/index.html @@ -1,7 +1,7 @@ Auswahl und Erstellung von Spalten :: Zertifikatskurs Data Librarian - Modul 3 - Daten analysieren und darstellen -