LLM Self-Hosting und Deployment Kurs

Kursbeschreibung

Kurs-ID:KKC_0299
Kursdauer:3 Tage

Ein LLM auf eigener Hardware zu betreiben ist dann sinnvoll, wenn du Kontrolle über Daten, Kosten und Betriebsrisiken brauchst. In diesem Seminar baust du dir das Know-how auf, um genau das umzusetzen: von der Auswahl eines geeigneten Modells bis zum stabilen Betrieb eines Inferenzdienstes mit klaren SLAs. Du beginnst mit den Grundlagen der Architektur und leitest aus konkreten Use Cases technische Anforderungen ab. Danach sizingst du die Infrastruktur: Du kalkulierst VRAM, RAM, Storage und Netzwerk, verstehst die Auswirkungen von Quantisierung und Kontextlänge und lernst, wie du mit Messungen statt Annahmen planst. Dabei geht es nicht nur um maximale Tokens/s, sondern um verlässliche P95-Latenz, Fehlerquoten und Verhalten unter Last. Im praktischen Teil setzt du ein Deployment mit gängigen Serving-Stacks wie vLLM, llama.cpp oder TGI um. Du lernst, wie du Modelle in passenden Formaten bereitstellst, Konfigurationen versionierst und Updates so ausrollst, dass du jederzeit zurück kannst. Du implementierst OpenAI-kompatible APIs, damit Teams den Dienst schnell integrieren. Sicherheit und Governance sind fest eingebaut: Netzwerkgrenzen, Authentifizierung, Autorisierung, TLS, Logging und konkrete Maßnahmen gegen Prompt Injection und ungewollte Datenweitergabe. Zum Abschluss baust du Observability auf, definierst Runbooks und planst Kapazitätserweiterungen. Wenn du zusätzlich internes Wissen einbinden willst, setzt du eine RAG-Erweiterung um und lernst, Retrieval-Qualität und Antworttreue messbar zu machen.

Die wichtigsten Themen im Überblick

LLM Self-Hosting on-premises sicher planen
Hardware für LLM-Inferenz belastbar dimensionieren
VRAM, GPU-Auslastung und Latenz präzise berechnen
Modelle, Formate und Quantisierung passend auswählen
LLMs mit vLLM, TGI und Kubernetes deployen
Zugriffe mit AuthN/AuthZ, TLS und Audit Logs absichern
Tokens/s, P95-Latenz und Tokenkosten überwachen
RAG mit Embeddings, Vektordatenbank und Guardrails betreiben

Zielgruppe

IT-Administratoren und Platform Engineers, die On-Prem-Services betreiben
ML Engineers und MLOps Engineers mit Inferenz-Verantwortung
DevOps Engineers, die Container und Kubernetes betreuen
Security Engineers, die Datenabfluss und Zugriff absichern
Für alle, die LLMs ohne externe API-Abhängigkeit produktiv nutzen wollen

Voraussetzung für die Schulung

Grundkenntnisse in Linux und Container-Konzepten (Docker-Grundbegriffe)
Hilfreich: Basiswissen zu GPUs und Netzwerken, aber nicht zwingend

Kursinhalte

Architektur & Entscheidungsgrundlagen
- Use Cases, Datenklassen, Compliance-Treiber
- Inferenz-Stack: Runtime, Model-Format, Serving
- GPU vs. CPU, VRAM-Budget, Throughput-Latenz
- Make-or-buy: Cloud, Hybrid, On-Prem
Hardware sizing ohne Rätselraten
- VRAM-Kalkulation: Parameter, Quantisierung, KV-Cache
- Batching, Kontextlänge, Parallelität
- Storage, RAM, PCIe, Netzwerk, Kühlung
- Messgrößen: Tokens/s, P95-Latenz, Auslastung
Modelle & Formate für Self-Hosting
- GGUF, safetensors, Container-Images
- Quantisierung (z.B. 4-bit/8-bit) und Qualitätschecks
- Prompt-Templates, System Prompts, Tool-Use
- Modellwahl nach Sprache, Kontext, Lizenz
Serving & Deployment
- vLLM, llama.cpp, Text Generation Inference (TGI)
- Docker/Compose und Kubernetes-Grundmuster
- Rolling Updates, Canary, Versionierung
- API-Design: OpenAI-kompatible Endpoints
Sicherheit, Zugriff & Datenkontrolle
- Netzwerksegmentierung, Zero-Trust-Bausteine
- AuthN/AuthZ, Secrets, TLS, Audit Logs
- Prompt Injection: Risiken und Gegenmaßnahmen
- Data Residency, Protokollierung, Aufbewahrung
Beobachtbarkeit & Betrieb
- Monitoring: GPU/CPU, VRAM, Queue, Errors
- Tracing für Latenz und Bottlenecks
- Kapazitätsplanung und Kosten pro 1.000 Tokens
- Runbooks: Incident, Rollback, Notfallplan
RAG als produktionsnahes Add-on
- Chunking, Embeddings, Vektordatenbank-Optionen
- Retrieval-Qualität messen (Recall, Faithfulness)
- Guardrails: Quellenpflicht, Zitieren, Policies
- Offline-Indexing und Update-Strategien

Termin finden

Plätze frei Wenige Plätze frei Nicht buchbar

21 Standorte erwarten dich

Als bundesweit tätiger und renommierter Seminaranbieter bietet dir die Kebel Training GmbH ein umfangreiches Angebot an IT-Schulungen und Soft-Skills Trainings an. Unser LLM Self-Hosting und Deployment Kurs findet als Präsenzseminar in Berlin, Bremen, Dortmund, Dresden, Düsseldorf, Erfurt, Essen, Frankfurt, Hamburg, Hannover, Koblenz, Köln, Krefeld, Leipzig, München, Münster, Nürnberg, Regensburg, Saarbrücken, Siegen und Stuttgart statt.

Alternativ kann deine Fortbildung als Inhouse-Schulung bei dir vor Ort, Workshop und als Live Online Training organisiert werden.

Zur Standortübersicht

eKomi Seminarbewertungen für www.kebel.de

eKomi Bewertungen

Qualität ist bei Kebel kein Versprechen, sondern belegbar. Deshalb setzen wir auf das unabhängige Bewertungsportal eKomi. Nach jeder Schulung – online oder in Präsenz – erhalten unsere Teilnehmer:innen die Möglichkeit, uns anonym und freiwillig zu bewerten.

Mit über 1.600 Bewertungen in den letzten 12 Monaten zählen wir zu den bestbewerteten Anbietern für IT-Weiterbildungen. Alle Bewertungen, ob positiv oder kritisch, fließen transparent in unsere offizielle Bewertungsstatistik ein und bilden die Grundlage unserer eKomi Trust-Zertifikate.

Für dich als Personalverantwortliche, IT-Fachkraft oder Entscheider:in bedeutet das: verifizierte Teilnehmerstimmen, geprüfte Qualität und maximale Transparenz bei der Auswahl deines Weiterbildungspartners.

Zum Bewertungsportal

Kebel Training – Das spricht dafür…

Über 1.200 Kurse im Portfolio
Wähle deinen passenden Kurs zu einem festen Termin und erhalte dein Zertifikat. Lerne Live Online oder in Präsenz. Unser Kebel Team berät dich kostenlos und unverbindlich.
Seminarprogramm entdecken
Durchführungs- und Qualitätsgarantie
Dein Seminar findet garantiert statt, wenn es von uns bestätigt wurde – schon ab dem ersten Teilnehmenden. Und falls du nicht zufrieden warst, kannst du es kostenlos wiederholen.
Firmenschulungen nach Maß – In Präsenz, Live Online oder hybrid
Wir richten unsere Trainings individuell nach euren Anforderungen und Zielen aus. Auf Wunsch kann eure Schulung vor Ort als Inhouse- Schulung organisiert werden.
Mehr als 30 Jahre Schulungserfahrung
Seit 1995 planen wir erfolgreich und zuverlässig Weiterbildungen im IT- und Soft-Skills Bereich.
21 Standorte in deiner Nähe
Deutschlandweit stehen dir unsere modernen Schulungszentren für deine berufliche Fortbildung zur Verfügung.
21 Schulungszentren
Familienunternehmen in zweiter Generation
Als Familienunternehmen in zweiter Generation verbinden wir Tradition mit Zukunft.

FAQ

Ja, nach erfolgreicher Teilnahme am LLM Self-Hosting und Deployment Kurs erhältst Du ein Teilnahmezertifikat. Dieses bestätigt Deine erweiterten Kenntnisse im professionellen Einsatz von LLM Self-Hosting und Deployment Kurs .

Ja, wir garantieren die Durchführung aller von uns bestätigten Termine. Der LLM Self-Hosting und Deployment Kurs findet auch bereits ab einem Teilnehmer statt, sodass Du Deine Weiterbildung sicher und zuverlässig planen kannst.

Ja, wir bieten den LLM Self-Hosting und Deployment Kurs als Inhouse Training oder Firmenschulung an. Zusätzlich kann die Schulung auch als Online-Firmenschulung durchgeführt werden. Inhalte, Prozesse und Schwerpunkte passen wir individuell an die Anforderungen Deines Unternehmens an.

Unser Kebel Team hilft dir gerne weiterKostenlose Beratung

Du hast Fragen zu unseren Kursen und Schulungen, du möchtest eine individuelle Beratung oder uns einfach ein Feedback geben? Wir sind von montags bis freitags von 8:00 bis 17:00 Uhr für dich telefonisch erreichbar. Alternativ nutze gerne unser Kontakt-Formular.

LLM Self-Hosting und Deployment Kurs

Kursbeschreibung

Die wichtigsten Themen im Überblick

Zielgruppe

Voraussetzung für die Schulung

Kursinhalte

Termin finden

21 Standorte erwarten dich

eKomi Bewertungen

Kebel Training – Das spricht dafür…

Über 1.200 Kurse im Portfolio

Durchführungs- und Qualitätsgarantie

Firmenschulungen nach Maß – In Präsenz, Live Online oder hybrid

Mehr als 30 Jahre Schulungserfahrung

21 Standorte in deiner Nähe

Familienunternehmen in zweiter Generation

FAQ

Erhältst Du nach dem Kurs ein Zertifikat?

Gibt es eine Durchführungsgarantie?

Bieten Sie den Kurs auch als Inhouse Training oder Firmenschulung an?

Unser Kebel Team hilft dir gerne weiterKostenlose Beratung