Skip to content

AljoschaDataAnalyst/Abschlussprojekt-Python-Praesentation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

🐍 Python Abschlussprojekt – Analyse globaler Stellenanzeigen

Dieses Projekt wurde im Rahmen der Data SmartPoint Academy erstellt.
Ziel war es, mithilfe von Python eine umfangreiche Sammlung internationaler Stellenanzeigen zu untersuchen, aufzubereiten und visuell darzustellen – mit dem Fokus darauf, zu verstehen, wo, wie und in welchen Rollen weltweit am häufigsten gesucht wird.


🎯 Ziel des Projekts

Das Ziel war es, die mit Python erlernten Methoden praxisnah einzusetzen – von der Datenbereinigung über explorative Analysen bis hin zur Visualisierung.
Im Mittelpunkt stand der Umgang mit echten, ungeschliffenen Daten und die Fähigkeit, daraus relevante Muster und Erkenntnisse zu gewinnen.


📊 Datensatz

Der Datensatz umfasst tausende Stellenausschreibungen aus verschiedenen Plattformen und enthält u. a. folgende Informationen:

  • Jobtitel, Unternehmen, Standorte und Länder
  • Angaben zu Gehältern (pro Jahr und pro Stunde)
  • Skills und Qualifikationen
  • Veröffentlichungsplattformen
  • Art der Beschäftigung (Vollzeit, Teilzeit etc.)
  • Remote-Status der Stelle
  • Zeitliche Einordnung der Ausschreibungen

Die Daten stammen aus mehreren Quellen und wurden vor der Analyse zunächst gründlich geprüft und angepasst, um eine konsistente Auswertung zu ermöglichen.


🔧 Datenbereinigung & Vorbereitung

Bevor es an die Analyse ging, wurden die Daten strukturell aufbereitet und in eine saubere Form gebracht. Zu den wichtigsten Schritten zählten:

  • Ersetzen fehlender Werte in Schlüsselfeldern (z. B. durch logische Annahmen wie „Search Location“)
  • Umbenennen und Vereinheitlichen der Spalten für bessere Lesbarkeit
  • Entfernen irrelevanter oder fehlerhafter Einträge
  • Formatierung von Datumsangaben für zeitbasierte Auswertungen
  • Kategorisierung von Jobrollen und Arbeitszeitmodellen
  • Erste Plausibilitätsprüfungen und Mustererkennung (z. B. Ausreißer in Gehaltsangaben)

📈 Analyse & Visualisierung

Die Analyse und Visualisierung erfolgte mit Pandas, Matplotlib und Seaborn.
Dabei wurden unter anderem folgende Fragestellungen untersucht:

  • In welchen Ländern gibt es die meisten Stellenausschreibungen?
  • Welche Jobtitel sind besonders gefragt – und welche kaum vertreten?
  • Wie sieht das Verhältnis zwischen Remote und nicht-Remote aus?
  • Welche Skills werden besonders oft verlangt?
  • Wie sind Gehälter verteilt – und welche Rollen verdienen am meisten?
  • Gibt es saisonale Unterschiede bei der Anzahl der Ausschreibungen?
  • Welche Unternehmen schreiben am häufigsten aus – und wo?

Die Ergebnisse wurden zusätzlich in einer begleitenden PowerPoint-Präsentation (Projekt Python.pptx) zusammengefasst – inklusive Diagrammen, Screenshots und einer Auswahl besonders interessanter Erkenntnisse.


🧠 Erkenntnisse

  • Vollzeit dominiert: Der Großteil der Ausschreibungen entfällt auf Full-Time-Stellen
  • Remote-Arbeit ist möglich, aber noch nicht Standard: Nur ca. 18 % der Jobs sind Remote
  • SQL ist King: Häufigster geforderter Skill in den Ausschreibungen
  • „Data Analyst“ überall gesucht – aber „Cloud Engineer“? Kaum
  • Gehälter schwanken stark je nach Region und Rolle
  • Starke Unterschiede zwischen Ländern: USA führt, andere wie Australien oder Spanien sind kaum vertreten
  • Klassischer Dezember-Effekt: Weniger Ausschreibungen zum Jahresende

📂 Hinweis zum Datensatz

Der verwendete Datensatz wurde im Rahmen einer Schulung zur Verfügung gestellt und basiert auf öffentlich zugänglichen Übungsdaten von Kaggle.
Aus lizenzrechtlichen Gründen wird der Datensatz in diesem Repository nicht veröffentlicht.


🧠 Echte Daten. Echte Fehler. Echte Analyse.

Perfekt? Muss es nicht sein.
Ein paar kleine Eigenheiten und Unschärfen wurden bewusst nicht bereinigt – weil man daran sieht, wie man mit realen Daten arbeitet: nicht alles ist sauber, nicht alles passt auf den ersten Blick.
Und wer in den Fehlern was erkennt, hat die Analyse schon verstanden. 😄

About

Datenanalyse globaler Stellenanzeigen mit Python, Pandas & Seaborn

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published