Wir bieten zwei unabhängige Selbstlern-Workshops an:
Beide sind derzeit nur auf Deutsch verfügbar und passwortgeschützt. Details siehe unten.
Data Analyst mit Python
Selbstständiger E-Learning-Kurs für Anfänger (Deutsch).
Keine Vorkenntnisse in Programmierung, Datenverarbeitung oder Statistik nötig. Ziel ist es, die Grundlagen zu vermitteln, um als Data Analyst zu arbeiten: den gesamten Datenverarbeitungsprozess beherrschen – vom Import über Bereinigung bis hin zu Analyse und Visualisierung – um datenbasierte Entscheidungen zu treffen.
Format & Umfang
- Start: flexibel, jederzeit
- Zugangsdauer: 4 Monate
- Lernzeit: ca. 100 Stunden (empfohlen: ~6 Std./Woche)
- Kurssprache: Deutsch
Inhalte (Auszug)
- Python-Setup & Basics: Datentypen, Variablen, Kontrollstrukturen, Datenstrukturen, Funktionen/Module
- NumPy: Arrays, Operationen, Indizierung, Slicing
- pandas: Series/DataFrames, Import/Export, Selektion/Filter/Sortierung, Datentypen, Pivot/Melt, Merge/Join
- Visualisierung: Matplotlib & Seaborn (Scatter, Box, Bar, Dashboards)
- Deskriptive Statistik: Lage-/Streuungsmaße, Quantile
- Praxis: Jupyter, Datenbereinigung, fehlende Werte, Arbeiten mit realen Datensätzen
- Best Practices für den Alltag als Data Analyst
Pakete & Preise
-
Grundversion – 49,90 € (inkl. 19 % MwSt.)
Vollständiger Zugang (>40 Kapitel), integrierte Auto-Übungen, Hilfe bei technischen Problemen
-
Plus – 179,90 € (inkl. 19 % MwSt.)
Alles aus der Grundversion plus drei Leistungskontrollen mit Feedback, Zertifikat bei erfolgreicher Absolvierung
Beispielkapitel (PDF-Screenshot): Download
Vollständige Kapitelübersicht
Übersicht
1. Einführung
- 1.1 Python
- 1.2 Data Analytics
- 1.3 Python für Data Analytics
- 1.4 Installation
- 1.5 Jupyter Notebook
2. Grundlagen
- 2.1 Operatoren & Funktionen
- 2.2 Datentypen
- 2.3 Variablen
-
2.4 Sammlungen
- 2.4.1 Listen
- 2.4.2 Tuples
- 2.4.3 Sets
- 2.4.4 Dictionaries
- 2.5 If-Else & Loops
- 2.6 Probleme
3. NumPy
- 3.1 Arrays
- 3.2 Funktionen
4. Deskriptive Statistik
- 4.1 Deskriptive Statistik
- 4.2 MW & Histogramm
- 4.3 Median
- 4.4 Punktdiagramme
- 4.5 Quantile & Box-Plots
- 4.6 Var, StdAbw & Balken
- 4.A Module installieren
AUFGABE I
5. Pandas
- 5.1 Pandas & JupyterLab
- 5.2 Series & DataFrames
- 5.3 Daten importieren
- 5.4 Strings & Method Chaining
-
5.5 Data Wrangling
- 5.5.1 Spalten selektieren
- 5.5.2 Zeilen filtern
- 5.5.3 Spalten bearbeiten
- 5.6 Fehlwerte
- 5.7 Gruppieren & Aggregieren
AUFGABE II
6. mehr DataViz
- 6.1 Vergleiche
- 6.2 Exportieren
- 6.3 Formen etc.
- 6.4 Mehr zu Farben
- 6.5 Facetten
- 6.6 Dashboards
- 6.7 Verschiedenes
7. mehr Data Wrangling
- 7.1 Pivot & Melt
- 7.2 Merge & Join
- 7.3 Export
ABSCHLUSSPROJEKT
Kontakt: central@biomath.de
Data Scientist mit Python
Aufbaukurs (Deutsch) mit Live-Webinaren und Prüfungsleistungen.
Dieser Kurs richtet sich an Teilnehmende mit soliden Grundlagen in Python, NumPy und pandas (z. B. aus dem Data-Analyst-Kurs). In 26 Wochen werden fortgeschrittene statistische Methoden, Machine Learning Verfahren und professionelle Workflows vermittelt.
Format & Umfang
- Start: flexibel, nach Vereinbarung
- Dauer: 26 Wochen
- Lernzeit: ca. 10 Stunden pro Woche (2 Std. Live-Webinare + 8 Std. Selbststudium)
- Prüfung: 3 benotete Prüfungsleistungen
- Kurssprache: Deutsch
Inhalte (Auszug)
- Statistische Datenanalyse: Korrelation, lineare/multiple/polynomiale Regression, p-Werte & Konfidenzintervalle, t-Tests, ANOVA/ANCOVA, Modellannahmen & Residuenanalyse
- Machine Learning – Classification: Logistische Regression, Decision Trees, Random Forest, k-Nearest Neighbors, Support Vector Machines, Kreuzvalidierung, Grid Search & Hyperparameter-Optimierung
- Machine Learning – Unsupervised: Principal Component Analysis (PCA), Clustering (k-Means)
- Data Engineering (Exkurs): HTTP-APIs, SQL-Datenbankabfragen, Big Data Grundlagen
- Datenvisualisierung: Erweiterte matplotlib/seaborn Techniken, Heatmaps, publikationstaugliche Grafiken
- Professionelle Dokumentation: Quarto für Reports, fortgeschrittener Excel-Export
Verwendete Pakete: scikit-learn, statsmodels, scipy.stats, matplotlib, seaborn, pandas, numpy, requests, sqlite3, pyspark, Quarto
Pakete & Preise
-
Grundversion – 79,90 € (inkl. 19 % MwSt.)
Vollständiger Zugang (>40 Kapitel), integrierte Auto-Übungen, Hilfe bei technischen Problemen
-
Plus – 199,90 € (inkl. 19 % MwSt.)
Alles aus der Grundversion plus drei Leistungskontrollen mit Feedback, Zertifikat bei erfolgreicher Absolvierung
Beispielkapitel (PDF-Screenshot): Download
Vollständige Kapitelübersicht
1. Einführung
- 1.1 Übersicht
- 1.2 Teams-Meetings
- 1.3 Data Science
2. Überfälliges zuerst
- 2.1 Eigene Funktionen
- DV.1 matplotlib fig, ax
3. Klassische Statistik
- 3.1 Statistik
- 3.2 Korrelation
- DV.2 Heatmap etc.
- 3.3 p-Wert & Signifikanz
- 3.4 Konfidenzintervalle
- DV.3 Legenden etc.
- 3.5 Lineare Regression
- 3.6 Multiple Lin. Reg.
- 3.7 Polynomregression
- 3.8 Matrix Notation
- 3.9 t-test
- 3.10 ANOVA
AUFGABE 1
4. Data Engineering (Exkurs)
- 4.1 HTTP APIs
- 4.2 SQL
- 4.3 Big Data
3. Fortsetzung
- 3.11 Modellannahmen
- 3.12 2-way ANOVA
- 3.13 ANCOVA
- DV.4 Größe & Platz
- DV.5 Text
5. Machine Learning: Classification
- 5.1 Logistische Regression
- 5.2 Klassifikation bewerten
- 5.3 Kreuzvalidierung
- 5.4 Decision Tree
AUFGABE 2
5. Fortsetzung
- 5.5 Klassifikationsgrenzen
- 5.6 Random Forest
- 5.7 k-Nearest-Neighbors
- 5.8 Support Vector Machines
- 5.9 Grid Search
6. Machine Learning: Unsupervised
- 6.1 PCA
- 6.2 Clustering
ABSCHLUSSPROJEKT
7. Weitere
- 7.1 Mehr Excel
- 7.2 Quarto
- 7.3 Deep Learning Ausblick
Kontakt: central@biomath.de