Kursbeschreibung
Zielgruppe
- Softwareentwicklerinnen und Softwareentwickler in agilen Produktteams
- Tech Leads, Engineering Managerinnen und Engineering Manager
- Cloud Engineers und Plattform-Teams mit Serverless-Verantwortung
- DevOps- und SRE-nahe Rollen, die GenAI betreiben sollen
- Für alle, die KI-Features als serverlose Services planbar liefern und betreiben wollen
Voraussetzung für die Schulung
- Solide Erfahrung in der Entwicklung von Web-APIs oder Backend-Services sowie Grundverständnis von Cloud-Konzepten.
- Grundkenntnisse zu LLMs sind hilfreich, aber nicht zwingend.
Kursinhalte
- Serverless AI Architektur, die wirklich skaliert
- Event-driven Design: Trigger, Queues, Streams
- Compute-Modelle: Functions, Containers, Jobs
- Cold Starts, Concurrency, Timeouts
- Kostenmodelle: Pay-per-use richtig kalkulieren
- LLM-Integration ohne Monolith
- API-Gateways, Auth, Rate Limits
- Prompt- und Template-Strategien für Teams
- RAG-Bausteine: Retrieval, Embeddings, Re-Ranking
- Tool-Calling und Funktionsaufrufe robust umsetzen
- Datenflüsse, Governance und Sicherheit
- PII, Secrets, Key-Management, Token-Handling
- Mandantenfähigkeit und Datenabgrenzung
- Audit-Logs, Nachvollziehbarkeit, Policies
- Threat Modeling für GenAI-Workloads
- Qualität messbar machen: Evals, Tests, Observability
- Automatisierte Evals: Goldens, Rubrics, Regression
- Prompt-Unit-Tests und Contract-Tests
- Tracing, Metrics, Log-Korrelation
- Guardrails: Output-Filter, Policy-Checks
- Delivery in agilen Teams: von Story bis Release
- Definition of Done für KI-Features
- CI/CD für Prompts, Configs und Modelle
- Feature Flags, Canary, Rollback
- Runbooks, Incident Response, SLOs
- Praxis-Lab: Ein Serverless AI Service als Blueprint
- End-to-End Flow: Ingest, Retrieve, Generate
- Asynchrone Verarbeitung mit Queue/Worker
- Cost- und Latency-Tuning
- Produktionsreife Übergabe an Betrieb





















