Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses

Baue eine belastbare Datenbasis für KI: vom Rohdaten-Import bis zu kuratierten, sicheren Trainingsdaten in der Cloud.

Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses
Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses

Kursbeschreibung

  • Kurs-ID:KKC_0167
  • Kursdauer:2 Tage
In vielen Organisationen existieren Data Lake und Data Warehouse nebeneinander, aber KI-Teams kämpfen trotzdem mit widersprüchlichen Zahlen, fehlender Historie oder Daten, die nicht für Training und Inferenz taugen. Dieses Seminar zeigt dir, wie du Cloud-Datenmanagement so organisierst, dass aus Rohdaten verlässliche, sichere und wiederverwendbare Datenprodukte entstehen. Du beginnst mit einer klaren Einordnung der Plattform-Optionen: Data Lake, Data Warehouse und Lakehouse. Du lernst, welche Workloads wohin gehören, wie sich Compute- und Storage-Entkopplung in der Cloud auf Skalierung auswirkt und welche Anti-Patterns zu Kostenexplosionen führen. Danach baust du eine Ingestion-Strategie auf, die Landing Zone, Raw und Curated sauber trennt, und du verstehst die Auswirkungen von ETL und ELT. Inkrementelle Loads und CDC-Konzepte helfen dir, Aktualität zu erreichen, ohne alles ständig neu zu laden. Ein weiterer Schwerpunkt ist die Modellierung: Du strukturierst Daten für Analytics und KI, setzt Historisierung mit Slowly Changing Dimensions um und achtest auf korrekte Zeitfenster, damit Features später reproduzierbar sind. Governance wird konkret: Data Catalog, Lineage, Verantwortlichkeiten, Qualitätschecks und Sicherheitsmodelle bis hin zu Row- und Column-Level Security sowie DSGVO-relevanten Maßnahmen. Zum Abschluss verbindest du Technik und Betrieb: Du wählst passende Dateiformate, planst Partitionierung und Clustering, nutzt ACID-Tabellen im Lake und definierst, wie Trainingsdaten-Sets versioniert bereitgestellt werden. Damit schaffst du die Grundlage für stabile KI-Pipelines und belastbare Auswertungen.

Zielgruppe

  • Data Engineers und Analytics Engineers
  • Data Architects und Cloud Architects
  • BI-Verantwortliche und Data Product Owner
  • ML Engineers und AI Engineers mit Datenverantwortung
  • Für alle, die Data Lakes und Data Warehouses als Grundlage für KI in der Cloud aufbauen oder verbessern wollen.

Voraussetzung für die Schulung

  • Grundverständnis von Datenbanken und SQL ist hilfreich.
  • Erste Berührungspunkte mit Cloud-Services oder Analytics-Projekten sind von Vorteil.

Kursinhalte

  • KI braucht Daten: Architektur-Entscheidungen
    • Data Lake, Data Warehouse, Lakehouse: Abgrenzung und Einsatz
    • Batch vs. Streaming: wann welche Pipeline sinnvoll ist
    • Compute- und Storage-Entkopplung in der Cloud
    • Typische Anti-Patterns, die KI-Projekte ausbremsen
  • Datenaufnahme und -integration
    • Ingestion-Muster: Landing Zone, Raw, Curated
    • ELT vs. ETL und Auswirkungen auf Qualität und Kosten
    • CDC-Grundlagen und inkrementelle Loads
    • Umgang mit semi-strukturierten Daten (JSON, Logs)
  • Datenmodellierung für Analytics und KI
    • Star Schema, Data Vault: wann es sich lohnt
    • Feature-taugliche Daten: Aggregationen, Zeitbezug, Leakage
    • Dimensionen, Slowly Changing Dimensions (SCD)
    • Semantische Schicht und Self-Service-Analytics
  • Datenqualität, Governance und Sicherheit
    • Data Quality Checks: Vollständigkeit, Plausibilität, Drift
    • Data Catalog, Lineage und Ownership
    • IAM, Rollenmodelle, Row- und Column-Level Security
    • DSGVO-Praxis: Pseudonymisierung, Aufbewahrung, Löschung
  • Formate, Tabellen und Performance
    • Parquet, ORC, JSON: Auswirkungen auf Kosten und Laufzeit
    • Partitionierung, Clustering und Dateigrößen
    • ACID-Tabellen im Lake (z. B. Delta/Apache Iceberg/Hudi)
    • Abfrage-Optimierung und Kostenkontrolle
  • Bereitstellung für KI-Workloads
    • Trainingsdaten-Sets reproduzierbar bereitstellen
    • Feature Store Grundlagen und wann er sinnvoll ist
    • Offline/Online-Serving: Datenpfade für Inferenz
    • Monitoring: Datendrift, Schema-Änderungen, SLAs

Termin finden

Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses
15.06. - 16.06.2026 Online
1.450 € netto
Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses
14.09. - 15.09.2026 Online
1.450 € netto
Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses
14.12. - 15.12.2026 Online
1.450 € netto
Plätze frei Wenige Plätze frei Nicht buchbar

Firmenschulung anfragen

  • Unternehmensinterne Trainings für mehrere Mitarbeitende
  • Direkt vor Ort oder online – Zeit und Reisekosten sparen
  • Kostenvorteil ab dem 3. Teilnehmer

ekomi Bewertungen

Qualität ist bei Kebel kein Versprechen, sondern belegbar. Deshalb setzen wir auf das unabhängige Bewertungsportal eKomi. Nach jeder Schulung – online oder in Präsenz – erhalten unsere Teilnehmer:innen die Möglichkeit, uns anonym und freiwillig zu bewerten.

Mit über 1.000 Bewertungen in den letzten 12 Monaten zählen wir zu den bestbewerteten Anbietern für IT-Weiterbildungen.  Alle Bewertungen, ob positiv oder kritisch, fließen transparent in unsere offizielle Bewertungsstatistik ein und bilden die Grundlage unserer eKomi Trust-Zertifikate.

Für dich als Personalverantwortliche, IT-Fachkraft oder Entscheider:in bedeutet das: verifizierte Teilnehmerstimmen, geprüfte Qualität und maximale Transparenz bei der Auswahl Ihres Weiterbildungspartners.

Zum Bewertungsportal

Seminarberatung zum Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses

Unser Kebel Team berät dich gerne kostenlos und unverbindlich für dein Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses. Wir unterstützen dich gerne dabei, den passenden Kurs und das optimale Lernformat für deine Weiterbildung zu finden

Über 1200 Kurse

Entdecke jetzt unser vielseitiges Kursportfolio und finde die passende Schulung für dein Team.

FAQ

Ja, nach erfolgreicher Teilnahme am Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses erhältst Du ein Teilnahmezertifikat. Dieses bestätigt Deine erweiterten Kenntnisse im professionellen Einsatz von Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses .

Ja, wir garantieren die Durchführung aller von uns bestätigten Termine. Der Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses findet auch bereits ab einem Teilnehmer statt, sodass Du Deine Weiterbildung sicher und zuverlässig planen kannst.

Ja, wir bieten den Cloud-Datenmanagement für KI Kurs: Lakes & Warehouses als Inhouse Training oder Firmenschulung an. Zusätzlich kann die Schulung auch als Online-Firmenschulung durchgeführt werden. Inhalte, Prozesse und Schwerpunkte passen wir individuell an die Anforderungen Deines Unternehmens an.