Kursbeschreibung
Zielgruppe
- Data Engineers und Analytics Engineers
- Machine-Learning Engineers und MLOps Engineers
- Softwarearchitektinnen und Softwarearchitekten
- Backend-Entwicklerinnen und Backend-Entwickler mit KI-Bezug
- Für alle, die NoSQL als Datenbasis für RAG, Feature Stores oder Echtzeit-Inferenz robust aufsetzen wollen
Voraussetzung für die Schulung
- Grundverständnis von Datenbanken und API-basierten Anwendungen
- Hilfreich: erste Berührung mit Machine Learning, RAG oder Data Pipelines
Kursinhalte
- NoSQL-Auswahl für KI-Workloads
- Dokument, Key-Value, Wide-Column, Graph, Vector: wofür welches Modell
- Lese- und Schreibprofile: Training, Serving, Streaming
- CAP, Konsistenzlevel und Latenz als Designparameter
- Cloud-Managed vs. Self-Hosted: Betrieb und Kosten
- Datenmodellierung, die KI wirklich hilft
- Schema-on-read vs. Schema-Governance
- Denormalisierung, Aggregates und Query-first Design
- Versionierung von Features und Trainingsdaten
- TTL, Soft Deletes und Datenlebenszyklen
- Vector Search und RAG-Datenhaltung
- Embeddings speichern: Dimensionen, Metadaten, Filter
- Index-Typen (z. B. HNSW) und Recall vs. Latenz
- Chunking, Deduplizierung und Re-Embedding Strategien
- Hybrid Search: Keyword plus Vektor
- Streaming, Events und inkrementelle Updates
- Event Sourcing Grundlagen und typische Stolperfallen
- Idempotenz, Upserts und Exactly-once Illusionen
- Change Data Capture (CDC) für Feature Updates
- Backfills und Reprocessing ohne Datenchaos
- Performance, Kosten und Zuverlässigkeit
- Partitionierung, Hot Keys und Sharding-Strategien
- Caching, Read-Models und Materialized Views
- Load- und Latenztests für Retrieval und Inferenz
- Observability: Metriken, Tracing, Slow Queries
- Security, Governance und Compliance
- Mandantenfähigkeit, Row-Level Security und Tokenization
- PII in Trainingsdaten: Minimierung und Zugriffskontrollen
- Auditierbarkeit, Datenherkunft und Reproduzierbarkeit
- Backup, Restore und Disaster Recovery





















