Kursbeschreibung
Zielgruppe
- ML Engineers und AI Engineers mit Agenten-Projekten
- DevOps- und SRE-Teams, die Agenten betreiben
- IT-Security und Compliance in KI-Vorhaben
- Tech Leads und Architektinnen und Architekten für Plattformen
- Für alle, die KI-Agenten kontrollierbar, sicher und messbar betreiben wollen.
Voraussetzung für die Schulung
- Grundverständnis von APIs, Logs und Web-Services
- Erste Berührung mit LLMs oder KI-Agenten ist hilfreich, aber nicht zwingend
Kursinhalte
- Agenten verstehen, Risiken erkennen
- Agenten-Architekturen: Planner, Executor, Tool-Use
- Failure Modes: Halluzinationen, Tool-Missbrauch, Prompt-Injection
- Bedrohungsmodell für Agenten-Workflows
- Observability für Agenten statt Chat-Logs
- Tracing von Runs, Steps, Tools und Entscheidungen
- Strukturierte Events, Correlation IDs, Session-Kontext
- KPIs: Erfolgsquote, Abbrüche, Retry-Schleifen
- Guardrails und Policy Enforcement
- Allow-/Deny-Listen für Tools, Daten und Aktionen
- Output-Validierung: Schemas, Constraints, Redaction
- Human-in-the-Loop bei kritischen Aktionen
- Security: Daten, Identitäten, Secrets
- Least Privilege für Agenten und Tool-Accounts
- Secrets Handling, Token-Lebenszyklen, Rotation
- PII-Schutz, Data Loss Prevention, Logging-Hygiene
- Qualität messen: Evals, Tests, Regressionen
- Offline-Evals für Agentenaufgaben und Tool-Calls
- Golden Tasks, Rubrics, automatische Checks
- Regression Monitoring nach Modell- oder Prompt-Updates
- Cost, Rate Limits und Stabilität
- Budgeting pro Run, Team, Use Case
- Token- und Tool-Kosten sichtbar machen
- Circuit Breaker, Timeouts, Backoff-Strategien
- Incident Response für Agenten
- Run-Replay, Root-Cause-Analyse, Audit-Trails
- Alarmierung: Anomalien, Policy-Verstöße, Datenabfluss
- Rollbacks, Kill-Switch, sichere Degradationspfade





















