Kursbeschreibung
Zielgruppe
- Cloud- und Plattformverantwortliche mit KI-Workloads
- ML Engineers, Data Engineers, MLOps Engineers
- Produktverantwortliche für KI-Funktionen
- IT-Controlling, Finance und FinOps-Practitioner
- Alle, die KI-Cloud-Kosten planbar steuern wollen, ohne Delivery zu blockieren
Voraussetzung für die Schulung
- Grundverständnis von Cloud-Services und Kostenabrechnung (Accounts/Subscriptions, Compute, Storage).
- Hilfreich: erster Kontakt mit ML- oder GenAI-Workloads, ist aber keine Pflicht.
Kursinhalte
- Kostenlogik von KI-Cloud-Services verstehen
- Training vs. Inference: typische Kostentreiber
- GPU, Storage, Netzwerk, Managed Services
- Token, Requests, Kontextfenster bei LLMs
- Warum Tagging bei KI-Projekten oft scheitert
- FinOps-Grundlagen, Rollen und Entscheidungswege
- FinOps Framework: Inform, Optimize, Operate
- Rollenmodell: Product, Engineering, Finance
- Showback, Chargeback, Kostenstellenlogik
- Policy statt Einzelfreigaben
- Kosten-Transparenz aufbauen: Daten, Tags, Allocation
- Tagging-Standards und Naming-Konventionen
- Allocation für Shared Services und Plattformen
- Cost Categories, Labels, Accounts, Subscriptions
- Finanzsicht: CapEx/OpEx, Forecasting-Basics
- Budgets, Alerts und Guardrails für KI-Workloads
- Budget-Strukturen: Teams, Produkte, Umgebungen
- Alerting: Schwellen, Anomalien, Forecast Alerts
- Quotas, Rate Limits, Spend Limits
- Genehmigungsprozesse mit klaren Kriterien
- Optimierung: Quick Wins für GenAI und ML
- Right-Sizing und Scheduling von GPU-Workloads
- Spot/Preemptible, Reservations, Savings Plans
- Caching, Batch-Inference, Kontext-Strategien
- Storage-Lifecycle, Datenhaltung, Egress reduzieren
- KPI-Set: Kosten mit Produktwert verbinden
- Cost per Request, Cost per Token, Cost per User
- Unit Economics und SLOs für Kosten
- FinOps-Reporting: Management-taugliche Views
- Roadmap: von Pilot zu skalierbarem Betrieb





















