Kursbeschreibung
Zielgruppe
- Data Analysts und Data Engineers, die Dokumentdaten nutzbar machen
- Softwareentwicklerinnen und Softwareentwickler, die LLM-Features produktivisieren
- Fachverantwortliche aus Legal, Einkauf, Revision, Compliance
- Produktmanagerinnen und Produktmanager für Dokument-Workflows
- Für alle, die aus Dokumenten prüfbare Fakten mit Quellenbelegen gewinnen wollen
Voraussetzung für die Schulung
- Grundverständnis von APIs und Datenformaten wie JSON
- Erfahrung mit Dokumentprozessen oder Datenanalyse ist hilfreich
Kursinhalte
- Use Cases, Grenzen, Erfolgskriterien
- Dokumenttypen: PDF, E-Mail, Scans, Office
- Qualitätsziele: Genauigkeit, Abdeckung, Nachvollziehbarkeit
- Risiken: Halluzinationen, Datenschutz, Bias
- Dokument-Ingestion und Vorverarbeitung
- Parsing, OCR-Optionen, Layout-Erhalt
- Chunking-Strategien für lange Dokumente
- Metadaten: Seiten, Absätze, Tabellen, Anhänge
- Informations-Extraktion mit LLMs
- Schema-basierte Extraktion (JSON), Validierung
- Entitäten, Beträge, Fristen, Pflichten, Risiken
- Mehrstufige Prompts und Self-Check
- RAG für Belege und Quellenstellen
- Embeddings, Vektorsuche, Re-Ranking
- Zitate mit Seiten- und Abschnittsverweisen
- Kontextfenster, Top-k, Deduplizierung
- Zusammenfassungen, die auditierbar sind
- Executive Summary vs. Fachzusammenfassung
- Claim-Evidence-Format: Aussage plus Beleg
- Konflikte und Unsicherheiten markieren
- Qualitätssicherung und Tests
- Gold-Set, Stichproben, Review-Workflows
- Messgrößen: Extraktions-Accuracy, Coverage, Latency
- Prompt-Regressionstests und Versionierung
- Security, Compliance und Betrieb
- PII-Handling, Redaction, Zugriffskonzepte
- Logging, Monitoring, Kostenkontrolle
- Deployment-Optionen: API, On-Prem, Hybrid





















