Kursbeschreibung
Die wichtigsten Themen im Überblick
- AutoML passend einsetzen und typische Fallstricke vermeiden
- Train, Validation und Test sauber für robuste Modelle trennen
- Datenqualität, Labels und Features gezielt verbessern
- AutoML für Tabular Data mit sinnvollen Metriken steuern
- Textklassifikation und Forecasting praxisnah umsetzen
- Overfitting, Bias und Leakage früh erkennen
- Modelle mit SHAP und Feature Importance erklären
- Deployment, Monitoring und Retraining kontrolliert planen
Zielgruppe
- Data Analysts und BI-Profis, die schneller zu belastbaren ML-Modellen kommen wollen
- Data Scientists, die AutoML kontrolliert in ihren Workflow integrieren möchten
- Product Owner und Projektleitende in Datenprojekten, die Ergebnisse bewerten und abnehmen müssen
- ML Engineers und DevOps-nahe Rollen, die AutoML in Betrieb bringen und überwachen
- Für alle, die AutoML nicht als Blackbox nutzen, sondern als steuerbaren Prozess etablieren wollen
Voraussetzung für die Schulung
- Grundverständnis von Machine Learning (Train/Test, Overfitting, gängige Metriken).
- Basiskenntnisse im Umgang mit Daten (Tabellen, einfache Transformationen).
Kursinhalte
- AutoML richtig einordnen
- Wann AutoML passt und wann nicht
- Typische Fallstricke: Leakage, Bias, Overfitting
- AutoML im Vergleich zu klassischem ML-Workflow
- Datenqualität als Erfolgshebel
- Problem- und Zieldefinition, Label-Qualität
- Train/Validation/Test sauber aufsetzen
- Feature-Engineering vs. Auto-Feature-Generation
- Umgang mit Imbalance, Missing Values, Ausreißern
- AutoML für Tabular Data
- Baseline-Modelle und sinnvolle Metriken
- Search Space, Time Budget, Early Stopping
- Cross-Validation, Holdout-Strategien
- Interpretierbarkeit: Feature Importance, SHAP
- AutoML für Text und Zeitreihen
- Textklassifikation und Embeddings pragmatisch nutzen
- Forecasting: Backtesting und Rolling Windows
- Saisonalität, Drift und Datenlücken
- Modellbewertung, Robustheit, Fairness
- Fehleranalyse statt nur Score-Jagd
- Stabilitätstests und Sensitivitätschecks
- Fairness-Indikatoren und Risikoabschätzung
- Von Experiment zu Betrieb (MLOps light)
- Reproduzierbarkeit: Seeds, Pipelines, Artefakte
- Model Registry, Versionierung, Freigaben
- Monitoring: Drift, Performance, Data Quality
- Rollback-Strategien und Retraining-Trigger





















