Kursbeschreibung
Zielgruppe
- ML Engineers und Data Scientists mit Trainingsverantwortung
- IT-Security-Verantwortliche, die ML-Pipelines absichern
- Data Engineers und Plattform-Teams (MLOps)
- Datenschutzbeauftragte und Compliance-Funktionen mit KI-Bezug
- Für alle, die eigene KI-Modelle trainieren und Daten, Modelle sowie Pipelines belastbar schützen wollen
Voraussetzung für die Schulung
- Grundverständnis von ML-Workflows (Datenaufbereitung, Training, Artefakte).
- Basiswissen zu Zugriffskontrolle und Logs ist hilfreich, aber nicht zwingend.
Kursinhalte
- Bedrohungsmodell für KI-Training
- Angriffsflächen: Daten, Pipeline, Artefakte, Zugriffe
- Threat Modeling mit konkreten Abuse-Cases
- Risiken: Data Poisoning, Exfiltration, Insider
- Security-KPIs für ML-Projekte
- Datenschutz und Compliance im Trainingskontext
- DSGVO-Grundlagen: Zweckbindung, Minimierung, Löschung
- PII-Erkennung und sensible Datenklassen
- Auftragsverarbeitung, TOMs, Audit-Nachweise
- Umgang mit Daten aus Drittsystemen
- Datenaufbereitung mit Schutzmechanismen
- Maskierung, Pseudonymisierung, Tokenisierung
- Sampling-Strategien und Datenminimierung
- Labeling-Prozesse: sichere Rollen und Freigaben
- Qualitätschecks gegen Poisoning
- Sichere Trainingsumgebungen und Zugriffskontrolle
- Isolierung: Netzwerksegmente, Secrets, IAM
- Least Privilege für Daten, Jobs und Artefakte
- Logging, Monitoring, Anomalieerkennung
- Backup, Restore und sichere Löschkonzepte
- Supply-Chain-Security für ML
- Risiken in Python-Paketen, Container-Images, Base-Images
- Signierung, SBOM, Vulnerability Scans
- Reproduzierbare Trainingsläufe
- Freigabeprozesse für Dependencies
- Modellartefakte, Leakage und sichere Veröffentlichung
- Model Inversion und Membership Inference verstehen
- Prompt- und Output-Leakage bei GenAI-Workflows
- Policies für Sharing, Registry, Versionierung
- Red-Teaming-Checks vor Deployment





















