Kursbeschreibung
Zielgruppe
- Data Engineers und Analytics Engineers
- Softwareentwicklerinnen und Softwareentwickler mit Such- oder API-Verantwortung
- Data Scientists und ML Engineers, die Retrieval bewerten wollen
- IT-Architektinnen und IT-Architekten für Wissens- und Suchsysteme
- Für alle, die semantische Suche und RAG produktionsnah aufbauen wollen
Voraussetzung für die Schulung
- Grundverständnis von Datenbanken, APIs und JSON
- Erste Berührung mit Suche oder LLM-Anwendungen ist hilfreich, aber nicht zwingend
Kursinhalte
- Von Keyword zu Semantik: Sucharchitektur
- Suchintentionen, Relevanz und Messbarkeit
- Hybrid Search: BM25 plus Vektorsuche
- Index-Strategien für strukturierte und unstrukturierte Daten
- Fehlerbilder: Drift, Halluzinationen, Datenlücken
- Embeddings und Vektordatenbanken in der Praxis
- Chunking-Strategien, Overlap, Metadaten
- Embedding-Modelle auswählen und evaluieren
- Vektorindizes: HNSW, IVF, PQ verständlich
- Update- und Re-Embedding-Strategien
- RAG-Pipelines für Datenbankwissen
- Retriever-Design: Filter, Facets, Security
- Re-Ranking mit Cross-Encodern
- Prompting für zitierfähige Antworten
- Antwortformate: Tabellen, JSON, Quellen
- Qualität, Tests und Observability
- Goldensets, Offline-Evaluation, A/B-Tests
- Relevanzmetriken: DCG, MRR, Recall@k
- Tracing, Logging, Kostenkontrolle
- Guardrails: PII, Policies, Prompt-Injection
- Integration in bestehende Systeme
- API-Design, Caching, Latenzbudgets
- Rollen, Rechte, Mandantenfähigkeit
- ETL/ELT und Dokumenten-Pipelines
- Betrieb: Versionierung, Rollback, Monitoring
- Use Cases und Musterlösungen
- Wissensdatenbank, Tickets, CRM, Verträge
- Suche über SQL-Tabellen plus Dokumente
- Mehrsprachigkeit und Domänenbegriffe
- Roadmap: von Pilot zu Produktion





















