Kursbeschreibung
Zielgruppe
- Cloud Architects und Solution Architects mit KI-Verantwortung
- ML Engineers, MLOps Engineers und Platform Engineers
- IT-Security und Governance-Verantwortliche für KI-Workloads
- IT-Leitung, Product Owner und FinOps, die Plattform-Entscheidungen absichern
- Für alle, die KI-Workloads in der Cloud belastbar planen, vergleichen und betreiben wollen
Voraussetzung für die Schulung
- Grundverständnis von Cloud-Konzepten (Netzwerk, IAM, Compute, Storage).
- Erste Berührung mit ML/LLM-Workloads oder MLOps ist hilfreich, aber nicht zwingend.
Kursinhalte
- Plattform-Entscheidung: Was wirklich zählt
- Workload-Typen: Training, Fine-Tuning, Inferenz, RAG
- Entscheidungskriterien: Time-to-Value, Lock-in, Skills, Compliance
- Referenzarchitekturen und Anti-Patterns
- Compute für KI: GPU, TPU und skalierbare Cluster
- GPU-Instanzen, Scheduling, Spot/Preemptible Strategien
- Distributed Training: Daten- und Modellparallelität
- Beschleuniger-Ökosystem: Treiber, Container, Images
- Storage und Datenwege: schnell, sicher, bezahlbar
- Objekt-, Block- und File-Storage für KI-Pipelines
- High-Throughput Datenzugriff, Caching, Datenlokalität
- Lifecycle, Versionierung, Verschlüsselung, Schlüsselmanagement
- Netzwerk und Sicherheit: Zero Trust für KI-Workloads
- VPC/VNet, Private Endpoints, Egress-Kontrolle
- Identity und Zugriff: IAM-Rollen, Least Privilege
- Secret Management und sichere Service-to-Service Kommunikation
- MLOps und Plattformdienste: von Notebook bis Produktion
- Managed ML-Plattformen und ihre Grenzen
- Model Registry, Feature Store, Experiment Tracking
- CI/CD für Modelle, Canary, Shadow, Rollback
- LLM-Betrieb: RAG, Vektorsuche und Inferenz-Architektur
- Vektor-Datenbanken und Suchdienste im Vergleich
- Serving: Autoscaling, Batching, Quantisierung, Caching
- Guardrails, Content-Filter, Prompt- und Kontextschutz
- Kosten, FinOps und Kapazitätsplanung
- Kostenmodelle: On-Demand, Reserved, Savings Plans, Commitments
- GPU-Kosten senken: Right-Sizing, Spot, Scheduling, Abschalten
- Messgrößen: Cost per Token, Cost per Experiment, Unit Economics





















