Kursbeschreibung
Zielgruppe
- IT-Administratoren und DevOps-Verantwortliche, die lokale KI-Services bereitstellen
- Softwareentwicklerinnen und Softwareentwickler, die LLMs in Tools integrieren
- Data- und AI-Engineers, die RAG und Evaluation aufsetzen
- IT-Sicherheitsverantwortliche, die Datenschutz und Risiken bewerten
- Für alle, die Open-Source-LLMs lokal betreiben und produktiv nutzen wollen
Voraussetzung für die Schulung
- Grundverständnis von IT-Systemen (Dateisystem, Prozesse, Netzwerk) und sicherer Umgang mit der Kommandozeile.
- Hilfreich sind Basiskenntnisse in Python oder einer Skriptsprache, aber nicht zwingend.
Kursinhalte
- LLM-Grundlagen für Open-Source-Stacks
- Transformer, Token, Kontextfenster, Sampling verständlich einordnen
- Inferenz vs. Training, Quantisierung und ihre Grenzen
- Modellformate und Laufzeit-Ökosystem: GGUF, safetensors
- Lokale Laufzeit einrichten und vergleichen
- llama.cpp und Ollama: Installation, Modelle, Updates
- CPU vs. GPU: VRAM, RAM, Durchsatz, Latenz
- Basis-Tuning: Kontext, Temperatur, Top-p, Wiederholungsstrafen
- Prompting, das reproduzierbar funktioniert
- System-, Entwickler- und Nutzer-Prompts sauber trennen
- Strukturierte Ausgaben: JSON, Tabellen, feste Schemas
- Fehlerbilder: Halluzinationen, Prompt Injection, Overconfidence
- RAG lokal: Wissen anbinden statt raten
- Chunking, Embeddings, Retrieval, Re-Ranking als Pipeline
- Lokale Vektordatenbanken und Dateiquellen (PDF, Markdown)
- Qualität messen: Trefferquote, Zitierbarkeit, Kontextbudget
- Evaluation und Betrieb
- Qualitätskriterien: Faktentreue, Konsistenz, Stil, Sicherheit
- Testsets, Prompt-Regression, einfache Benchmarks
- Logging, Datenschutz, Modell- und Prompt-Versionierung
- Use-Cases, Grenzen, ächste Schritte
- Assistenz für Schreiben, Analyse, Code-Reviews, Support-Entwürfe
- Wann Cloud-Modelle sinnvoller sind, wann lokal gewinnt
- Roadmap: Tools, Fine-Tuning-Optionen, Governance





















