Kursbeschreibung
Zielgruppe
- Softwareentwicklerinnen und Softwareentwickler, die KI-Funktionen produktiv bereitstellen wollen
- Cloud Engineers und DevOps Engineers, die serverlose Plattformen für AI-Workloads designen
- Solution Architects, die Referenzarchitekturen und Governance definieren
- Product Owner und technische Projektleitungen, die Aufwand, Risiken und Kosten realistisch einschätzen müssen
- Alle, die Serverless AI verstehen und in eigene Use-Cases übertragen wollen
Voraussetzung für die Schulung
- Grundverständnis von Web-APIs (HTTP, JSON) und grundlegenden Cloud-Konzepten.
- Erste Erfahrung mit Skripting oder Programmierung ist hilfreich, aber nicht zwingend.
Kursinhalte
- Serverless-Grundlagen für KI-Workloads
- FaaS, BaaS, Event-Driven Architecture: Begriffe und Abgrenzung
- Cold Starts, Concurrency, Timeouts: typische Grenzen verstehen
- Kostenmodelle: Pay-per-Use, Requests, Compute, Egress
- Wann Serverless für AI passt und wann nicht
- AI-APIs und Inferenz in Serverless-Architekturen
- Aufbau eines Inference-Endpunkts über Functions und Managed AI Services
- Prompting-Grundlagen und Output-Validierung in produktiven Flows
- Batch vs. Realtime: Latenz, Durchsatz, Queue-Patterns
- Fallbacks, Retries und Idempotenz für robuste KI-Aufrufe
- Events, Queues und Orchestrierung
- Trigger: HTTP, Cron, Storage-Events, Message Queues
- Fan-out/Fan-in, Worker-Pattern, Dead-Letter-Queues
- Workflows: Zustandsmaschinen für mehrstufige KI-Pipelines
- Rate Limits und Backpressure sauber lösen
- Daten, Storage und Security für Serverless AI
- Secrets-Handling, IAM/Rollen, Least Privilege
- PII, Logging, Datenminimierung und Aufbewahrungsfristen
- Verschlüsselung, Netzwerkgrenzen und sichere Endpunkte
- Grundlagen: Vektorsuche als Managed-Komponente einbinden
- Observability, Qualität und Betrieb ohne Serverbetrieb
- Tracing, strukturierte Logs, Metriken für Latenz und Kosten
- Prompt- und Response-Telemetrie: was du messen solltest
- Testing: Contract-Tests, Mocking von AI-APIs, Replay
- Rollouts, Versionierung und Feature Flags für Prompts
- Deployment und Governance
- Infrastructure as Code: reproduzierbare Umgebungen
- CI/CD für Functions und Workflows
- Guardrails: Policies, Quotas, Budget Alerts
- Referenzarchitekturen für typische Serverless-AI-Use-Cases





















