Kursbeschreibung
Zielgruppe
- Data Engineers und Analytics Engineers
- Machine-Learning- und KI-Engineers
- Softwareentwicklerinnen und Softwareentwickler mit Datenfokus
- Data Architects und Plattformverantwortliche
- Für alle, die Knowledge Graphs und Neo4j für RAG, Empfehlungen oder Fraud Detection einsetzen wollen
Voraussetzung für die Schulung
- Grundverständnis von Datenmodellen und Abfragen (SQL hilft, ist aber nicht Pflicht).
- Erste Berührung mit KI/ML oder LLM-Anwendungen ist hilfreich.
Kursinhalte
- Graph Thinking für KI-Anwendungsfälle
- Warum Graphen bei Kontext, Beziehungen und Erklärbarkeit gewinnen
- Use Cases: RAG mit Knowledge Graph, Empfehlungen, Fraud, Entitäten und Beziehungen
- Graph vs. Relational vs. Vektorstore: sinnvolle Kombinationen
- Neo4j Essentials: Modellierung, Import, Performance
- Property-Graph-Modell: Knoten, Beziehungen, Labels, Properties
- Datenmodellierung für KI: Ontologie-light, IDs, Zeit, Provenienz
- Import-Pipelines: CSV, APIs, ETL-Patterns und Datenqualität
- Indexe, Constraints, Cardinality und typische Performance-Fallen
- Cypher, das wirklich sitzt
- Lesen, Schreiben, Upserts: MERGE-Strategien ohne Duplikate
- Pfadabfragen, Pattern Matching und Aggregationen
- Subqueries, Parameterisierung und wiederverwendbare Query-Patterns
- Profiling: EXPLAIN/PROFILE, Query Tuning
- Graph Data Science für ML und KI
- Zentrale Algorithmen: PageRank, Community Detection, Similarity
- Feature Engineering aus Graphen: Embeddings und Nachbarschaftsmerkmale
- Train/Predict-Workflows und Evaluierung für reale Daten
- Knowledge Graph + Vektorsuche + LLM (GraphRAG)
- Entity Linking und Relationship Extraction als Datenpipeline
- Hybrid Retrieval: Graph Traversal plus Vektorähnlichkeit
- Kontextaufbau mit Quellen, Zitaten und Zugriffskontrolle
- Qualitätsmessung: Halluzinationen reduzieren, Antworten prüfen
- Betrieb, Sicherheit und Architektur
- Rollen, Rechte, Mandantenfähigkeit und sensible Daten im Graph
- Backup/Restore, Monitoring, Kapazitätsplanung
- Architekturpatterns: Event-getriebene Updates, CDC, Batch vs. Streaming





















