Kursbeschreibung
In diesem Seminar lernst Du, wie Du leistungsfähige KI-Anwendungen mit semantischer Suche, Vektordatenbanken und Retrieval-Augmented Generation praxisnah aufbaust. Du verstehst, wie Embeddings, Chunking, Ähnlichkeitsmetriken und moderne Retrieval-Methoden zusammenspielen, um präzise, kontextbezogene Antworten aus eigenen Unternehmensdaten zu erzeugen.
Die wichtigsten Themen im Überblick
- Semantische Suche mit Embeddings praxisnah umsetzen
- Vektordatenbanken wie Qdrant und Pinecone einrichten
- RAG-Architekturen für Enterprise AI entwickeln
- LangChain und LlamaIndex für Retrieval Workflows nutzen
- Halluzinationen durch Grounding und Prompt Engineering senken
- Hybrid Search, Re-Ranking und Query Expansion anwenden
- RAG-Qualität mit RAGAS messen und gezielt verbessern
- Vektor-Indizes skalieren und Latenzen optimieren
Zielgruppe
- Softwareentwickler und Softwareentwicklerinnen
- Data Scientists und ML Engineers
- Softwarearchitekten und Softwarearchitektinnen
- Alle, die LLMs mit eigenen Daten verbinden wollen
Voraussetzung für die Schulung
- Solide Kenntnisse in Python
- Grundverständnis von APIs (REST)
- Erste Erfahrungen mit LLMs
Kursinhalte
Grundlagen der Semantischen Suche
- Funktionsweise von High-Dimensional Vector Spaces
- Embeddings generieren (OpenAI, Hugging Face)
- Chunking-Strategien: Fixed-size vs. Semantisch
- Bedeutung von Cosine Similarity und Euclidean Distance
Vektordatenbanken in der Praxis
- Marktüberblick: Pinecone, Weaviate, Milvus, Qdrant
- Setup und Konfiguration einer Vektordatenbank
- Indizierungsalgorithmen (HNSW, IVF) verstehen
- Metadaten-Filterung für präzise Ergebnisse
Retrieval-Augmented Generation (RAG)
- Architekturmuster für RAG-Applikationen
- Orchestrierung mit LangChain und LlamaIndex
- Prompt Engineering für kontextbezogene Antworten
- Vermeidung von Halluzinationen durch Grounding
Advanced Retrieval Techniken
- Hybrid Search: Keyword-basierte und semantische Suche kombinieren
- Re-Ranking Methoden für bessere Relevanz
- Query Expansion und Multi-Query Ansätze
- Parent-Child Document Retrieval
Produktivsetzung und Evaluierung
- RAGAS Framework zur Qualitätsmessung (Treue, Relevanz)
- Umgang mit Datenschutz und Datensicherheit
- Latenzoptimierung und Caching-Strategien
- Skalierung von Vektor-Indizes




