Python für Datenanalyse & Data Science

Wir bieten zwei unabhängige Selbstlern-Workshops an:

Beide sind derzeit nur auf Deutsch verfügbar und passwortgeschützt. Details siehe unten.

Data Analyst mit Python

Selbstständiger E-Learning-Kurs für Anfänger (Deutsch).

Keine Vorkenntnisse in Programmierung, Datenverarbeitung oder Statistik nötig. Ziel ist es, die Grundlagen zu vermitteln, um als Data Analyst zu arbeiten: den gesamten Datenverarbeitungsprozess beherrschen - vom Import über Bereinigung bis hin zu Analyse und Visualisierung - um datenbasierte Entscheidungen zu treffen.

Format & Umfang

Start: flexibel, jederzeit
Zugangsdauer: 4 Monate
Lernzeit: ca. 100 Stunden (empfohlen: ~6 Std./Woche)
Kurssprache: Deutsch

Inhalte (Auszug)

Python-Setup & Basics: Datentypen, Variablen, Kontrollstrukturen, Datenstrukturen, Funktionen/Module
NumPy: Arrays, Operationen, Indizierung, Slicing
pandas: Series/DataFrames, Import/Export, Selektion/Filter/Sortierung, Datentypen, Pivot/Melt, Merge/Join
Visualisierung: Matplotlib & Seaborn (Scatter, Box, Bar, Dashboards)
Deskriptive Statistik: Lage-/Streuungsmaße, Quantile
Praxis: Jupyter, Datenbereinigung, fehlende Werte, Arbeiten mit realen Datensätzen
Best Practices für den Alltag als Data Analyst

Pakete & Preise

Grundversion - 49,90 € (inkl. 19 % MwSt.)

Vollständiger Zugang (>40 Kapitel), integrierte Auto-Übungen, Hilfe bei technischen Problemen
Plus - 179,90 € (inkl. 19 % MwSt.)

Alles aus der Grundversion plus drei Leistungskontrollen mit Feedback, Zertifikat bei erfolgreicher Absolvierung

Beispielkapitel (PDF-Screenshot): Download

Vollständige Kapitelübersicht

Übersicht

1. Einführung

1.1 Python
1.2 Data Analytics
1.3 Python für Data Analytics
1.4 Installation
1.5 Jupyter Notebook

2. Grundlagen

2.1 Operatoren & Funktionen
2.2 Datentypen
2.3 Variablen
2.4 Sammlungen
- 2.4.1 Listen
- 2.4.2 Tuples
- 2.4.3 Sets
- 2.4.4 Dictionaries
2.5 If-Else & Loops
2.6 Probleme

3. NumPy

3.1 Arrays
3.2 Funktionen

4. Deskriptive Statistik

4.1 Deskriptive Statistik
4.2 MW & Histogramm
4.3 Median
4.4 Punktdiagramme
4.5 Quantile & Box-Plots
4.6 Var, StdAbw & Balken
4.A Module installieren

AUFGABE I

5. Pandas

5.1 Pandas & JupyterLab
5.2 Series & DataFrames
5.3 Daten importieren
5.4 Strings & Method Chaining
5.5 Data Wrangling
- 5.5.1 Spalten selektieren
- 5.5.2 Zeilen filtern
- 5.5.3 Spalten bearbeiten
5.6 Fehlwerte
5.7 Gruppieren & Aggregieren

AUFGABE II

6. mehr DataViz

6.1 Vergleiche
6.2 Exportieren
6.3 Formen etc.
6.4 Mehr zu Farben
6.5 Facetten
6.6 Dashboards
6.7 Verschiedenes

7. mehr Data Wrangling

7.1 Pivot & Melt
7.2 Merge & Join
7.3 Export

ABSCHLUSSPROJEKT

Kontakt: central@biomath.de

Data Analyst mit Python

Data Scientist mit Python

Aufbaukurs (Deutsch) mit Live-Webinaren und Prüfungsleistungen.

Dieser Kurs richtet sich an Teilnehmende mit soliden Grundlagen in Python, NumPy und pandas (z. B. aus dem Data-Analyst-Kurs). In 26 Wochen werden fortgeschrittene statistische Methoden, Machine Learning Verfahren und professionelle Workflows vermittelt.

Format & Umfang

Start: flexibel, nach Vereinbarung
Dauer: 26 Wochen
Lernzeit: ca. 10 Stunden pro Woche (2 Std. Live-Webinare + 8 Std. Selbststudium)
Prüfung: 3 benotete Prüfungsleistungen
Kurssprache: Deutsch

Inhalte (Auszug)

Statistische Datenanalyse: Korrelation, lineare/multiple/polynomiale Regression, p-Werte & Konfidenzintervalle, t-Tests, ANOVA/ANCOVA, Modellannahmen & Residuenanalyse
Machine Learning - Classification: Logistische Regression, Decision Trees, Random Forest, k-Nearest Neighbors, Support Vector Machines, Kreuzvalidierung, Grid Search & Hyperparameter-Optimierung
Machine Learning - Unsupervised: Principal Component Analysis (PCA), Clustering (k-Means)
Data Engineering (Exkurs): HTTP-APIs, SQL-Datenbankabfragen, Big Data Grundlagen
Datenvisualisierung: Erweiterte matplotlib/seaborn Techniken, Heatmaps, publikationstaugliche Grafiken
Professionelle Dokumentation: Quarto für Reports, fortgeschrittener Excel-Export

Verwendete Pakete: scikit-learn, statsmodels, scipy.stats, matplotlib, seaborn, pandas, numpy, requests, sqlite3, pyspark, Quarto

Pakete & Preise

Grundversion - 79,90 € (inkl. 19 % MwSt.)

Vollständiger Zugang (>40 Kapitel), integrierte Auto-Übungen, Hilfe bei technischen Problemen
Plus - 199,90 € (inkl. 19 % MwSt.)

Alles aus der Grundversion plus drei Leistungskontrollen mit Feedback, Zertifikat bei erfolgreicher Absolvierung

Beispielkapitel (PDF-Screenshot): Download

Vollständige Kapitelübersicht

1. Einführung

1.1 Übersicht
1.2 Teams-Meetings
1.3 Data Science

2. Überfälliges zuerst

2.1 Eigene Funktionen
DV.1 matplotlib fig, ax

3. Klassische Statistik

3.1 Statistik
3.2 Korrelation
DV.2 Heatmap etc.
3.3 p-Wert & Signifikanz
3.4 Konfidenzintervalle
DV.3 Legenden etc.
3.5 Lineare Regression
3.6 Multiple Lin. Reg.
3.7 Polynomregression
3.8 Matrix Notation
3.9 t-test
3.10 ANOVA

AUFGABE 1

4. Data Engineering (Exkurs)

4.1 HTTP APIs
4.2 SQL
4.3 Big Data

3. Fortsetzung

3.11 Modellannahmen
3.12 2-way ANOVA
3.13 ANCOVA
DV.4 Größe & Platz
DV.5 Text

5. Machine Learning: Classification

5.1 Logistische Regression
5.2 Klassifikation bewerten
5.3 Kreuzvalidierung
5.4 Decision Tree

AUFGABE 2

5. Fortsetzung

5.5 Klassifikationsgrenzen
5.6 Random Forest
5.7 k-Nearest-Neighbors
5.8 Support Vector Machines
5.9 Grid Search

6. Machine Learning: Unsupervised

6.1 PCA
6.2 Clustering

ABSCHLUSSPROJEKT

7. Weitere

7.1 Mehr Excel
7.2 Quarto
7.3 Deep Learning Ausblick

Kontakt: central@biomath.de

Data Scientist mit Python