Python für Datenanalyse & Data Science

Wir bieten zwei unabhängige Selbstlern-Workshops an:

Beide sind derzeit nur auf Deutsch verfügbar und passwortgeschützt. Details siehe unten.

Data Analyst mit Python

Selbstständiger E-Learning-Kurs für Anfänger (Deutsch).

Keine Vorkenntnisse in Programmierung, Datenverarbeitung oder Statistik nötig. Ziel ist es, die Grundlagen zu vermitteln, um als Data Analyst zu arbeiten: den gesamten Datenverarbeitungsprozess beherrschen – vom Import über Bereinigung bis hin zu Analyse und Visualisierung – um datenbasierte Entscheidungen zu treffen.

Format & Umfang

  • Start: flexibel, jederzeit
  • Zugangsdauer: 4 Monate
  • Lernzeit: ca. 100 Stunden (empfohlen: ~6 Std./Woche)
  • Kurssprache: Deutsch

Inhalte (Auszug)

  • Python-Setup & Basics: Datentypen, Variablen, Kontrollstrukturen, Datenstrukturen, Funktionen/Module
  • NumPy: Arrays, Operationen, Indizierung, Slicing
  • pandas: Series/DataFrames, Import/Export, Selektion/Filter/Sortierung, Datentypen, Pivot/Melt, Merge/Join
  • Visualisierung: Matplotlib & Seaborn (Scatter, Box, Bar, Dashboards)
  • Deskriptive Statistik: Lage-/Streuungsmaße, Quantile
  • Praxis: Jupyter, Datenbereinigung, fehlende Werte, Arbeiten mit realen Datensätzen
  • Best Practices für den Alltag als Data Analyst

Pakete & Preise

  • Grundversion – 49,90 € (inkl. 19 % MwSt.)

    Vollständiger Zugang (>40 Kapitel), integrierte Auto-Übungen, Hilfe bei technischen Problemen

  • Plus – 179,90 € (inkl. 19 % MwSt.)

    Alles aus der Grundversion plus drei Leistungskontrollen mit Feedback, Zertifikat bei erfolgreicher Absolvierung

Beispielkapitel (PDF-Screenshot): Download

Vollständige Kapitelübersicht

Übersicht

1. Einführung

  • 1.1 Python
  • 1.2 Data Analytics
  • 1.3 Python für Data Analytics
  • 1.4 Installation
  • 1.5 Jupyter Notebook

2. Grundlagen

  • 2.1 Operatoren & Funktionen
  • 2.2 Datentypen
  • 2.3 Variablen
  • 2.4 Sammlungen
    • 2.4.1 Listen
    • 2.4.2 Tuples
    • 2.4.3 Sets
    • 2.4.4 Dictionaries
  • 2.5 If-Else & Loops
  • 2.6 Probleme

3. NumPy

  • 3.1 Arrays
  • 3.2 Funktionen

4. Deskriptive Statistik

  • 4.1 Deskriptive Statistik
  • 4.2 MW & Histogramm
  • 4.3 Median
  • 4.4 Punktdiagramme
  • 4.5 Quantile & Box-Plots
  • 4.6 Var, StdAbw & Balken
  • 4.A Module installieren

AUFGABE I

5. Pandas

  • 5.1 Pandas & JupyterLab
  • 5.2 Series & DataFrames
  • 5.3 Daten importieren
  • 5.4 Strings & Method Chaining
  • 5.5 Data Wrangling
    • 5.5.1 Spalten selektieren
    • 5.5.2 Zeilen filtern
    • 5.5.3 Spalten bearbeiten
  • 5.6 Fehlwerte
  • 5.7 Gruppieren & Aggregieren

AUFGABE II

6. mehr DataViz

  • 6.1 Vergleiche
  • 6.2 Exportieren
  • 6.3 Formen etc.
  • 6.4 Mehr zu Farben
  • 6.5 Facetten
  • 6.6 Dashboards
  • 6.7 Verschiedenes

7. mehr Data Wrangling

  • 7.1 Pivot & Melt
  • 7.2 Merge & Join
  • 7.3 Export

ABSCHLUSSPROJEKT

Kontakt:

Data Analyst mit Python


Data Scientist mit Python

Aufbaukurs (Deutsch) mit Live-Webinaren und Prüfungsleistungen.

Dieser Kurs richtet sich an Teilnehmende mit soliden Grundlagen in Python, NumPy und pandas (z. B. aus dem Data-Analyst-Kurs). In 26 Wochen werden fortgeschrittene statistische Methoden, Machine Learning Verfahren und professionelle Workflows vermittelt.

Format & Umfang

  • Start: flexibel, nach Vereinbarung
  • Dauer: 26 Wochen
  • Lernzeit: ca. 10 Stunden pro Woche (2 Std. Live-Webinare + 8 Std. Selbststudium)
  • Prüfung: 3 benotete Prüfungsleistungen
  • Kurssprache: Deutsch

Inhalte (Auszug)

  • Statistische Datenanalyse: Korrelation, lineare/multiple/polynomiale Regression, p-Werte & Konfidenzintervalle, t-Tests, ANOVA/ANCOVA, Modellannahmen & Residuenanalyse
  • Machine Learning – Classification: Logistische Regression, Decision Trees, Random Forest, k-Nearest Neighbors, Support Vector Machines, Kreuzvalidierung, Grid Search & Hyperparameter-Optimierung
  • Machine Learning – Unsupervised: Principal Component Analysis (PCA), Clustering (k-Means)
  • Data Engineering (Exkurs): HTTP-APIs, SQL-Datenbankabfragen, Big Data Grundlagen
  • Datenvisualisierung: Erweiterte matplotlib/seaborn Techniken, Heatmaps, publikationstaugliche Grafiken
  • Professionelle Dokumentation: Quarto für Reports, fortgeschrittener Excel-Export

Verwendete Pakete: scikit-learn, statsmodels, scipy.stats, matplotlib, seaborn, pandas, numpy, requests, sqlite3, pyspark, Quarto

Pakete & Preise

  • Grundversion – 79,90 € (inkl. 19 % MwSt.)

    Vollständiger Zugang (>40 Kapitel), integrierte Auto-Übungen, Hilfe bei technischen Problemen

  • Plus – 199,90 € (inkl. 19 % MwSt.)

    Alles aus der Grundversion plus drei Leistungskontrollen mit Feedback, Zertifikat bei erfolgreicher Absolvierung

Beispielkapitel (PDF-Screenshot): Download

Vollständige Kapitelübersicht

1. Einführung

  • 1.1 Übersicht
  • 1.2 Teams-Meetings
  • 1.3 Data Science

2. Überfälliges zuerst

  • 2.1 Eigene Funktionen
  • DV.1 matplotlib fig, ax

3. Klassische Statistik

  • 3.1 Statistik
  • 3.2 Korrelation
  • DV.2 Heatmap etc.
  • 3.3 p-Wert & Signifikanz
  • 3.4 Konfidenzintervalle
  • DV.3 Legenden etc.
  • 3.5 Lineare Regression
  • 3.6 Multiple Lin. Reg.
  • 3.7 Polynomregression
  • 3.8 Matrix Notation
  • 3.9 t-test
  • 3.10 ANOVA

AUFGABE 1

4. Data Engineering (Exkurs)

  • 4.1 HTTP APIs
  • 4.2 SQL
  • 4.3 Big Data

3. Fortsetzung

  • 3.11 Modellannahmen
  • 3.12 2-way ANOVA
  • 3.13 ANCOVA
  • DV.4 Größe & Platz
  • DV.5 Text

5. Machine Learning: Classification

  • 5.1 Logistische Regression
  • 5.2 Klassifikation bewerten
  • 5.3 Kreuzvalidierung
  • 5.4 Decision Tree

AUFGABE 2

5. Fortsetzung

  • 5.5 Klassifikationsgrenzen
  • 5.6 Random Forest
  • 5.7 k-Nearest-Neighbors
  • 5.8 Support Vector Machines
  • 5.9 Grid Search

6. Machine Learning: Unsupervised

  • 6.1 PCA
  • 6.2 Clustering

ABSCHLUSSPROJEKT

7. Weitere

  • 7.1 Mehr Excel
  • 7.2 Quarto
  • 7.3 Deep Learning Ausblick

Kontakt:

Data Scientist mit Python