Kursbeschreibung
Zielgruppe
- Softwareentwicklerinnen und Softwareentwickler, die ML-Modelle als APIs bereitstellen
- Data Scientists, die ihre Modelle in AWS oder Azure produktiv bringen wollen
- ML Engineers und DevOps Engineers mit Verantwortung für Deployment und Betrieb
- IT-Architektinnen und IT-Architekten, die Cloud-native KI-Architekturen bewerten
- Alle, die KI-Workloads auf AWS/Azure planen, deployen und betreiben wollen
Voraussetzung für die Schulung
- Grundverständnis von Cloud-Konzepten (z.B. IAM/Rollen, Storage, Netzwerk) und Container-Grundlagen.
- Erste Berührung mit Machine Learning (Begriffe wie Training, Inferenz, Modell) ist hilfreich.
Kursinhalte
- Cloud-native KI-Architekturen verstehen
- Unterschied: Notebook-Prototyp vs. produktiver Service
- Compute-Optionen: CPU, GPU, Managed Services
- Referenzarchitekturen für Inferenz und Training
- Datenflüsse, Latenz und Skalierung
- AWS- und Azure-Bausteine für ML richtig zuordnen
- Training und Hosting: SageMaker vs. Azure Machine Learning
- Container: ECR/ECS/EKS vs. ACR/AKS
- Storage und Data Lake: S3 vs. ADLS
- Messaging und Events: SQS/SNS vs. Service Bus/Event Grid
- Von Code zu Deployment: Container, APIs, Endpoints
- Inference-API als REST-Service (FastAPI/Flask Prinzip)
- Docker-Images bauen, versionieren, ausrollen
- Autoscaling, Rolling Updates, Blue-Green Prinzip
- Batch Inference vs. Real-time Inference
- MLOps-Grundlagen: Reproduzierbarkeit und Governance
- Experiment-Tracking, Model Registry, Artefakte
- CI/CD für ML: Pipeline-Schritte und Gates
- Feature Store und Datenversionierung (Prinzipien)
- Freigaben, Reviews, Audit-Trails
- Security, Compliance und Responsible AI
- IAM/RBAC, Least Privilege, Secrets Handling
- Netzwerk: Private Endpoints, VPC/VNet Muster
- Verschlüsselung, Schlüsselmanagement, Datenzugriff
- Risiken: Prompt Injection, Data Leakage, Model Abuse
- Monitoring, Kosten und Betrieb
- Observability: Logs, Metrics, Traces, Alerts
- Model Monitoring: Drift, Datenqualität, Performance
- Kostenhebel: Spot/Reserved, Right-Sizing, Skalierung
- SLOs, Incident-Playbooks, Runbooks





















