Datenanalyse mit MotherDuck und DuckDB: Aus CSV zu Insights in 5 Minuten

30.9.2025 | 7 Minuten Lesezeit

CSV-Dateien sind der ewige Klassiker im Datenaustausch. Auch wenn modernere Formate wie JSON und Parquet ihren Platz erobern, bleiben die einfachen, aber robusten Comma Separated Values das Rückgrat vieler Daten-Workflows. Aber Hand aufs Herz: Wer hat sich nicht schon mal gequält, als ein riesiger Datensatz das Lieblings-Tool wie Excel in die Knie zwang? Genau hier kommen DuckDB und MotherDuck ins Spiel.

Dieser Post zeigt dir, wie du mit dieser Power-Kombination selbst gigantische CSV-Dateien blitzschnell analysierst. Das Beste daran? Du brauchst keine aufwändige Server-Infrastruktur. Einfach SQL, direkter Zugriff auf deine Dateien und schon hast du aus rohen Daten wertvolle Erkenntnisse gewonnen. Bereit für eine neue Art der Datenanalyse?

Vom Gigabyte zu Insights: CSVs parsen mit DuckDB

Setup

Falls du DuckDB noch nicht installiert hast, installiere bitte die DuckDB CLI auf deinem Rechner. Die Anleitung findest du hier: DuckDB Installation.

Der Datensatz

Wir nutzen den bekannten New York City Taxi-Datensatz, genauer die Daten der Yellow Taxis von 2023, die hier verfügbar sind. Mit rund 38,3 Millionen Einträgen und einer Größe von 3,78 GB ist er der perfekte Testfall. Eine solche Dateigröße ist für Tools wie Microsoft Excel meist viel zu groß und genau hier kommt die Power von DuckDB und MotherDuck ins Spiel.

[!NOTE]
In MotherDuck gibt es eine sample_data Datenbank, die New York City Taxidaten für Dezember 2022 enthält, was ungefähr 10 % des Datenvolumens darstellt, welches wir in diesem Post verwenden.

Den Datensatz laden

DuckDB unterstützt zwei Modi: In-Memory und Persistent. Um den Datensatz in eine dauerhafte DuckDB-Datenbank zu laden, erstelle zuerst die nyc_taxi.duckdb Datenbank. Führe dazu folgenden Befehl aus:

1duckdb nyc_taxi.duckdb

Sobald die Datenbank erstellt ist, lade den Datensatz mit dem nächsten Befehl innerhalb der DuckDB CLI.

1.timer on
2CREATE TABLE nyc_yellow_taxi_trips AS FROM '2023_Yellow_Taxi_Trip_Data_20250903.csv';

Je nach Rechner-Power dauert das nur wenige Sekunden. Auf einem Mac M3 wird der gesamte 3,78 GB große Datensatz mit über 38 Millionen Einträgen in ungefähr 3,5 Sekunden geladen, was die beeindruckende Performance von DuckDB unterstreicht.

1Run Time (s): real 3.540 user 38.143785 sys 1.770184

Erste Abfrage: Die Fahrtdauer berechnen

Sobald die Daten geladen sind, können wir unsere erste Abfrage starten. Wir berechnen die Fahrtdauer, also die Differenz zwischen tpep_dropoff_datetime und tpep_pickup_datetime.

1.timer on
2SELECT *, (tpep_dropoff_datetime - tpep_pickup_datetime) AS trip_duration 
3FROM nyc_yellow_taxi_trips;

Das Ergebnis? Die Fahrtdauer für alle 38,3 Millionen Einträge ist in nur etwa einer Sekunde berechnet.

1Run Time (s): real 1.304 user 1.268312 sys 2.229287

Daten anreichern - die Fahrtdauer als neue Spalte speichern

Um für spätere Abfragen, die die Fahrtdauer nutzen, zu vereinfachen, speichern wir diese Werte in einer neuen Spalte. Das geht mit einem einfachen Befehl, der eine neue Spalte namens trip_duration anlegt.

1ALTER TABLE nyc_yellow_taxi_trips
2ADD COLUMN trip_duration INTERVAL;
3UPDATE nyc_yellow_taxi_trips
4SET trip_duration = tpep_dropoff_datetime - tpep_pickup_datetime;

Jetzt nutzen wir die neue Spalte, um die durchschnittliche Fahrtdauer zu berechnen.

1.timer on
2SELECT AVG(trip_duration) FROM nyc_yellow_taxi_trips;

MotherDuck: DuckDB in der Cloud

Die lokale Performance von DuckDB ist beeindruckend, aber wie wäre es, wenn du diese Power mit deinem Team teilen und von überall darauf zugreifen könntest? Das ist der Moment, in dem MotherDuck ins Spiel kommt. Es kombiniert DuckDBs In-Process-Performance mit der Skalierbarkeit und dem Komfort der Cloud.

[!NOTE]
Dafür brauchst du einen MotherDuck Account, den du ganz einfach auf https://motherduck.com erstellen kannst.

Um die CSV-Daten in MotherDuck zu laden, öffne eine neue DuckDB CLI Session mit diesem Befehl:

1duckdb

Anschließend führe die folgenden Befehle in der DuckDB CLI-Shell aus.

[!NOTE]
Wenn du die Umgebungsvariable motherduck_token noch nicht gesetzt hast (wie in der MotherDuck-Doku beschrieben), öffnet sich ein Browserfenster, in dem du den Zugriff der DuckDB CLI auf MotherDuck bestätigen musst.

1ATTACH 'md:';
2CREATE OR REPLACE DATABASE nyc_yellow_taxi_trips;
3USE nyc_yellow_taxi_trips;
4CREATE OR REPLACE TABLE nyc_yellow_taxi_trips AS FROM '2023_Yellow_Taxi_Trip_Data_20250903.csv';

Diese Befehle erstellen eine neue Datenbank nyc_yellow_taxi_trips erstellt und eine neue Tabelle gleichen Namens und lädt die Daten in die neue Tabelle. Dieser Schritt kann je nach Internet-Upload-Geschwindigkeit zwischen zwei und drei Minuten dauern.

[!NOTE]
Dieser Post konzentriert sich auf lokale CSV-Dateien, aber DuckDB/MotherDuck unterstützt auch den Import von CSV-Daten aus verschiedenen Object Storage Systemen, wie AWS S3, Azure Blob Storage und Google Cloud Storage.

Durchschnittliche Fahrtdauer in Abhängigkeit der Passagierzahl

Jetzt kannst du die Daten direkt im Browser analysieren. Gehe in deinem Browser zu https://app.motherduck.com und erstelle ein neues Notebook mit dem Titel nyc_yellow_taxi_trips. Füge in die erste Zelle die SQL-Anweisung aus dem folgenden Block ein und führe sie aus, indem du auf den kleinen Dreieck-Button klickst.

1SELECT passenger_count, AVG(tpep_dropoff_datetime - tpep_pickup_datetime) AS avg_trip_duration 
2FROM nyc_yellow_taxi_trips 
3GROUP BY passenger_count
4ORDER BY passenger_count;

Hängt die Höhe des Trinkgeldes von der Distanz ab?

Für einen Taxifahrer ist das eine entscheidende Frage: Hängt das Trinkgeld von der Länge der Fahrt ab? Dies können wir mit dem folgenden SQL Statement evaluieren:

1SELECT 
2 CASE WHEN trip_distance BETWEEN 0 AND 4 THEN 'short'
3      WHEN trip_distance BETWEEN 4 AND 9 THEN 'medium'
4      WHEN trip_distance > 9 THEN 'long' 
5      END AS trip_length,
6 AVG(fare_amount) AS fare, 
7 AVG(tip_amount) AS tip
8 FROM nyc_yellow_taxi_trips
9 GROUP BY trip_length
10 ORDER BY tip DESC;

Wie du siehst, gilt: Je länger die Fahrt, desto höher das Trinkgeld für den Taxifahrer.

trip_length	fare	tip
long	60.66741257482049	9.713919128310547
medium	29.65654459738106	5.005007720056084
short	12.775505292438215	2.5128599942576764

Die Abholorte mit den längsten Fahrten

Da wir gesehen haben, dass längere Fahrten lukrativer sind (das Trinkgeld ist fast viermal so hoch!), finden wir jetzt die 20 interessantesten Abholorte mit den längsten Durchschnittsfahrten und dem höchsten Durchschnittstrinkgeld. Wir berücksichtigen weiterhin nur Orte mit mehr als 1000 Fahrten.

Führe dasu bitte folgendes SQL-Statement aus:

1SELECT
2    PULocationID,
3    COUNT(*) AS trip_count,
4    AVG(trip_distance) AS avg_trip_distance,
5    AVG(total_amount) AS avg_total_amount,
6    AVG(tip_amount) AS avg_tip_amount
7FROM
8    nyc_yellow_taxi_trips
9GROUP BY
10    PULocationID
11HAVING
12    trip_count > 1000
13ORDER BY
14    avg_tip_amount DESC
15LIMIT 20;

In nur wenigen Millisekunden haben wir die Info aus über 38,3 Millionen Einträgen welches die lukrativsten Standorte sind. Mit diesen Daten kann ein Taxifahrer seinen Gewinn optimieren, indem er sich strategisch in der Nähe der profitabelsten Abholorte positioniert.

Sind Fahrten vom Flughafen profitabler?

Zum Schluss wollen wir herausfinden, ob Fahrten vom Flughafen profitabler sind als andere.

Wir vergleichen dazu das durchschnittliche Trinkgeld für Fahrten vom Flughafen mit dem von anderen Startorten. Zur Vereinfachung betrachten wir nur den Durchschnittspreis, ohne Fahrtdauer oder andere Faktoren. Der Zielort kann das Trinkgeld ebenfalls beeinflussen, was wir hierbei aus Verenfachungsgründen nicht weiter betrachten. Die PULocationID für die drei Flughäfen sind 1, 132, 138.

1SELECT
2    CASE
3        WHEN PULocationID IN (1, 132, 138) THEN 'airport'
4        ELSE 'not_airport'
5    END AS pickup_type,
6    AVG(tip_amount) AS avg_tip_amount,
7    COUNT(*) AS trip_count
8FROM
9    nyc_yellow_taxi_trips
10GROUP BY
11    pickup_type;

Auch hier bekommen wir das Ergebnis in Millisekunden zurück und unsere Annahme erweist sich als korrekt: Das Trinkgeld für Flughafen-Fahrten ist fast dreimal so hoch!

Fazit

DuckDB und MotherDuck revolutionieren die Datenanalyse durch eine hohe Geschwindigkeit und Effizienz, besonders bei großen Datensätzen. Die typischen Hürden von Big Data - wie zeitraubendes Laden und der Bedarf an komplexer Infrastruktur - werden praktisch eliminiert.

Der DuckDB-Vorteil: Schnell und simpel

Mit DuckDB ist das Laden von Gigabytes an Daten keine stundenlange Tortur mehr, sondern eine Sache von Sekunden. Dieser Geschwindigkeitsvorteil gilt auch für Abfragen, die extrem schnell ausgeführt werden und Einblicke in Echtzeit ermöglichen, die früher unerreichbar waren. Das ist ein großer Unterschied zu herkömmlichen CSV-Tools, die unter der Last großer Datensätze oft zusammenbrechen oder lange Zeit brauchen, um große Datenmengen zu verarbeiten.

Traditionelle Data Warehouse-Lösungen sind zwar mächtig, verlangen aber oft eine erhebliche Vorabinvestition in Zeit und Ressourcen. Sie benötigen komplexe Daten-Pipelines, um Daten zu laden, gefolgt von der Bereitstellung und Skalierung von Rechenressourcen, bevor überhaupt die erste Abfrage ausgeführt werden kann. Dieses aufwendige Setup führt oft zu Tagen oder sogar Wochen der Vorbereitung, bevor die eigentliche Analyse beginnen kann.

MotherDuck: Der Cloud-Native-Partner

MotherDuck ergänzt DuckDB, indem es dieses in die Cloud bringt und eine serverless Variante bereitstellt, welche die Datenanalyse weiter vereinfacht. Diese Kombination erlaubt es, dass Nutzer die Power von DuckDBs Engine mit der Skalierbarkeit und Zugänglichkeit einer Cloud-Plattform nutzen können, ohne den operativen Overhead.

Das "First Query" Rennen

Die Stärke von DuckDB und MotherDuck zeigt sich im sogenannten First Query Rennen. Während andere Lösungen noch konfiguriert werden oder gerade erst mit dem Laden der Daten beginnen, haben Nutzer von DuckDB und MotherDuck ihre Analyse oft schon abgeschlossen, entscheidende Einblicke gewonnen und können datengestützte Entscheidungen treffen. Diese Agilität verschafft einen erheblichen Vorteil und ermöglicht schnellere Iterationen und Entscheidungen.

Kurz gesagt, DuckDB und MotherDuck sind nicht nur Tools, sie sind ein Paradigmenwechsel in der Datenanalyse. Sie machen diese zugänglicher, schneller und deutlich unkomplizierter um aus Daten wertvolle Informationen zu extrahieren.

Melde dich zu unserem Hands-on Workshop: Einstieg in MotherDuck an, um die Möglichkeiten von MotherDuck live zu erleben.

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Christian Galsterer

Principle Consultant + People Lead

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Von Inferenz zu Governance: Warum Agent-Metadaten wichtig sind, auch wenn...

Moderne LLMs (Large Language Models) zeigen eine starke Fähigkeit, Bedeutungen aus Spaltennamen abzuleiten. Ein Tool wie Genie kann in der Regel pct_cust_attrit_q als „Churn“ (Abwanderung) auflösen oder rev_mrr_usd allein durch Mustererkennung dem Begriff...

Künstliche Intelligenz
LLM
Big Data
Datenbank

15.5.2026 | 6 Minuten Lesezeit

Niklas Niggemann

Zuverlässige AI Analytics durch Data Quality: Genie Spaces in Databricks

Garbage In, Garbage Out. Dieser Grundsatz der Informatik war noch nie so kritisch wie im Zeitalter der KI. Large Language Models verstärken schlechte Datenqualität nicht, sie verpacken sie in selbstsicher klingenden Formulierungen, die selbst erfahrene...

Generative KI
LLM
Künstliche Intelligenz
Data

7.5.2026 | 8 Minuten Lesezeit

Niklas Niggemann

Ask Your Data(bricks) mit Natural Language

Das derzeit wohl heißeste Thema im Bereich Daten und KI ist die Möglichkeit, mit den eigenen Daten zu sprechen. Das Schreiben von SQL-Abfragen ist bei der Datenexploration alles andere als intuitiv, daher klingt die Möglichkeit, einfach Fragen in natürlicher...

Data
Big Data

16.4.2026 | 9 Minuten Lesezeit

Niklas Niggemann

MotherDuck Dives: Mit natürlicher Sprache zu Live Dashboards

Dives sind interaktive Visualisierungen, die durch natürliche Sprache erstellt werden und direkt auf den Daten in MotherDuck aufbauen. Nutzer beschreiben, was sie sehen möchten, und ein KI-Agent generiert eine persistente, interaktive Komponente, die...

MotherDuck
Data
Data Science
Big Data

9.3.2026 | 8 Minuten Lesezeit

Niklas Niggemann

KI-Pflaster statt KI-Strategie

Die erste Welle ist durch. Copilot-Lizenzen sind gekauft, ein CompanyGPT steht, ein paar Meetings werden per KI zusammengefasst. In vielen Chefetagen stellt sich jetzt die richtige Frage: Was hat das eigentlich gebracht? Die Time-to-Market für die eigenen...

Data
Künstliche Intelligenz

6.3.2026 | 9 Minuten Lesezeit

Marcel Mikl

Narwhals: DataFrame-Agnostic Libraries ohne Dependencies Bauen

Nach der Veröffentlichung unseres Artikels über Ibis wies uns Dr. André Schemaitat auf ein ähnliches Tool mit wachsender Beliebtheit hin – Narwhals. Narwhals beschreibt sich selbst als eine „extrem leichtgewichtige und erweiterbare Kompatibilitätsschicht...

Data
Python
Softwareentwicklung

3.3.2026 | 11 Minuten Lesezeit

Niklas Niggemann

Mit einem ganzheitlichen Ansatz zum KI-Gewinner werden

Viele Unternehmen stehen aktuell vor einer beispiellosen Herausforderung. Anstelle von Experimenten in isolierten Pilotprojekten geht es jetzt darum, Kernprozesse grundlegend für KI neu zu denken. Die Art, wie wir Arbeit erledigen, wie wir Teams strukturieren...

Künstliche Intelligenz
Generative KI
Data

20.2.2026 | 2 Minuten Lesezeit

Lars Rückemann

Ibis: Die richtige Execution-Engine wählen, ohne Logik neu zu schreiben

In unseren bisherigen Benchmarks hat DuckDB bei großen analytischen Workloads Polars und Pandas durchgängig übertroffen. Doch reine Performancevergleiche übersehen eine entscheidende Frage: Was passiert, wenn Sie von lokaler DuckDB-Entwicklung in eine...

MotherDuck
Data
Big Data
Data Science

10.2.2026 | 6 Minuten Lesezeit

Niklas Niggemann

DuckDB vs. Polars: Performance & Memory bei großen Parquet Dateien

Update 02.02.26 – Nach hilfreichen Hinweisen des Polars-Teams auf LinkedIn haben wir unser Benchmark-Setup um eine Polars-Konfiguration erweitert, bei der Async erzwungen wird. Dies wird im Artikel näher erläutert. Unser vorheriger Benchmark verglich...

MotherDuck
Data Science
Data

20.1.2026 | 14 Minuten Lesezeit

Niklas Niggemann

Reifegradanalyse & Roadmap: Der Kompass für deine wirksame Daten- und ...

Dies ist Teil 2 unserer Blog-Serie: 7 Schritte zur wertstiftenden Daten- und KI-Strategie. Den ersten Teil der Blog-Serie könnt ihr hier lesen. Wie können wir die Möglichkeiten von Daten und KI bei uns voll ausschöpfen? Diese Frage hören wir in fast ...

Data
Data Science
Künstliche Intelligenz
Generative KI

10.12.2025 | 5 Minuten Lesezeit

Shirin Elsinghorst

Elena Rüdenauer

Daten- und KI-Strategie entwickeln: In 7 Schritten zum nachhaltigen Gesch...

Wer heute eine wertstiftende Daten- und KI-Strategie entwickeln will, blickt auf gewaltige Prognosen: McKinsey (2023) schätzt das globale Potenzial auf bis zu 25,6 Billionen US-Dollar. Doch Hand aufs Herz: Spürst du diesen Wertbeitrag bereits in deinem...

Data
Data Science
Datenschutz
Big Data
Generative KI
Künstliche Intelligenz

2.12.2025 | 11 Minuten Lesezeit

Shirin Elsinghorst

Elena Rüdenauer

DuckDB vs. DataFrame Bibliotheken

Hinweis: Der folgende Artikel wurde auf Englisch erstellt und nachträglich maschinell auf Deutsch übersetzt. Update 10.12.25 – Nach hilfreichen Hinweisen von Polars-Entwickler Thijs Nieuwdorp nach der ersten Veröffentlichung dieses Artikels konnten ...

MotherDuck
Data
Data Science
Python
Datenbank

1.12.2025 | 10 Minuten Lesezeit

Niklas Niggemann

Vom Datenschatz zum Erkenntnissystem: Ein Multi‑Agenten‑Ansatz mit LLMs

Dieser Artikel ist der zweite Teil meiner Erfahrungen mit Projekten bei denen wir LLMs in Umgebungen mit großen, chaotischen Daten eingesetzt haben. Den ersten Teil findet ihr hier. Viele Unternehmen sitzen auf einem enormen Datenschatz – und können ...

LLM
Data
Data Science
Künstliche Intelligenz
NLP
Generative KI

29.10.2025 | 4 Minuten Lesezeit

Daniel Töws

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

Wer mit Daten arbeitet, kennt den Frust: Dateien, die sich nicht an ihr eigenes Schema halten. CSVs, deren Spalten plötzlich mehrere Werte mit zusätzlichen Trennzeichen enthalten. Datenlager, in denen Tausende Tabellen existieren – mit unvollständiger...

LLM
Data
Künstliche Intelligenz
NLP
Generative KI

27.10.2025 | 6 Minuten Lesezeit

Daniel Töws

DuckDBs Friendly SQL ist ein Game Changer für die Developer Experience

Ich denke nicht, dass irgendjemand überrascht sein wird, wenn ich sage, dass SQL nicht die angenehmste Sprache zum Arbeiten ist. Manche würden sogar so weit gehen zu sagen, dass die Ergonomie von SQL furchtbar ist. Insbesondere bei großen und komplexen...

Data
MotherDuck

14.10.2025 | 11 Minuten Lesezeit

Lennart Hensler

Zero-ETL mit MotherDuck: Ein technischer Deep Dive

MotherDuck, der auf DuckDB aufbauende Cloud-native Service, verändert grundlegend, wie Unternehmen mit Daten arbeiten, die in Cloud-Object-Stores abgelegt sind. Durch den Wegfall klassischer ETL/ELT-Pipelines ermöglicht MotherDuck direkte SQL-Analysen...

MotherDuck
Data

7.10.2025 | 5 Minuten Lesezeit

Hendrik Kamp

5 Gründe, warum wir uns über den Motherduck Launch in AWS Frankfurt freuen

Hinweis: Dieser Blog-Post wurde mit LLM-unterstützung von Englisch auf Deutsch übersetzt. Seit einiger Zeit besteht für europäische Datenteams die zentrale Herausforderung darin, Innovation mit strenger Regulierung in Einklang zu bringen. Häufig erscheinen...

Data
Big Data
Datenbank
News
MotherDuck

24.9.2025 | 5 Minuten Lesezeit

Marcel Mikl

Erstes Data Engineering Projekt mit Databricks Asset Bundles und GitLab...

Einleitung In diesem Artikel geht es um das Aufsetzen eines Datenprojekts mit Databricks Asset Bundles. Wir schauen uns das Basis Setup an und eine typische Projektstruktur, gehen anschließend auf einige wichtige Details und mögliche Stolpersteine und...

Data

15.6.2025 | 10 Minuten Lesezeit

Denis Khaskin

Kategorisierung von Schnittstellen: Data Interface Quadrants (DIQs)

In der heutigen schnelllebigen und datengesteuerten Welt stehen Unternehmen vor einer zunehmend komplexen Herausforderung: Wie können Datenschnittstellen so gestaltet, implementiert und verwaltet werden, dass sie sowohl den unmittelbaren betrieblichen...

API
Data

30.1.2025 | 9 Minuten Lesezeit

Daniel Kocot

Miriam Greis

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

In einem gemeinsamen Projekt haben Tom Scholz und ich Machine Learning (ML) Services gebaut, um einem Kunden bei der Analyse von Dokumenten zu helfen. Eine Proof-Of-Concept Lösung war schnell gebaut, die es nun zu operationalisieren gilt. Hierbei war...

Machine Learning
Python
Data
Data Science

12.9.2024 | 27 Minuten Lesezeit

Patrick Soschinski

Tom Scholz

Datenanalyse mit MotherDuck und DuckDB: Aus CSV zu Insights in 5 Minuten

Vom Gigabyte zu Insights: CSVs parsen mit DuckDB

Setup

Der Datensatz

Den Datensatz laden

Erste Abfrage: Die Fahrtdauer berechnen

Daten anreichern - die Fahrtdauer als neue Spalte speichern

MotherDuck: DuckDB in der Cloud

Durchschnittliche Fahrtdauer in Abhängigkeit der Passagierzahl

Hängt die Höhe des Trinkgeldes von der Distanz ab?

Die Abholorte mit den längsten Fahrten

Sind Fahrten vom Flughafen profitabler?

Fazit

Der DuckDB-Vorteil: Schnell und simpel

MotherDuck: Der Cloud-Native-Partner

Das "First Query" Rennen

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Artikel in diesem Themenbereich

Von Inferenz zu Governance: Warum Agent-Metadaten wichtig sind, auch wenn...

Zuverlässige AI Analytics durch Data Quality: Genie Spaces in Databricks

Ask Your Data(bricks) mit Natural Language

MotherDuck Dives: Mit natürlicher Sprache zu Live Dashboards

KI-Pflaster statt KI-Strategie

Narwhals: DataFrame-Agnostic Libraries ohne Dependencies Bauen

Mit einem ganzheitlichen Ansatz zum KI-Gewinner werden

Ibis: Die richtige Execution-Engine wählen, ohne Logik neu zu schreiben

DuckDB vs. Polars: Performance & Memory bei großen Parquet Dateien

Reifegradanalyse & Roadmap: Der Kompass für deine wirksame Daten- und ...

Daten- und KI-Strategie entwickeln: In 7 Schritten zum nachhaltigen Gesch...

DuckDB vs. DataFrame Bibliotheken

Vom Datenschatz zum Erkenntnissystem: Ein Multi‑Agenten‑Ansatz mit LLMs

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

DuckDBs Friendly SQL ist ein Game Changer für die Developer Experience

Zero-ETL mit MotherDuck: Ein technischer Deep Dive

5 Gründe, warum wir uns über den Motherduck Launch in AWS Frankfurt freuen

Erstes Data Engineering Projekt mit Databricks Asset Bundles und GitLab...

Kategorisierung von Schnittstellen: Data Interface Quadrants (DIQs)

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

Jetzt für unseren Newsletter anmelden