Vom Datenschatz zum Erkenntnissystem: Ein Multi‑Agenten‑Ansatz mit LLMs

29.10.2025 | 4 Minuten Lesezeit

Dieser Artikel ist der zweite Teil meiner Erfahrungen mit Projekten bei denen wir LLMs in Umgebungen mit großen, chaotischen Daten eingesetzt haben. Den ersten Teil findet ihr hier.

Viele Unternehmen sitzen auf einem enormen Datenschatz – und können ihn dennoch schwer heben. Über Jahre ist eine Plattform mit Tausenden Tabellen gewachsen, die nur für langjährige Experten wirklich sichtbar ist. Wir sollten ein Experiment durchführen: Kann ein LLM-Agent belastbare Analysen zu Produkten, ihren Eigenschaften und den dazugehörigen Marketingaktivitäten auf diesen Daten durchführen? Zum Beispiel Fragen wie: Welche Merkmale prägen erfolgreiche Produkte? Welche Maßnahmen greifen wo? Ein Teilexperiment, das wir durchgeführt haben, war ein selbstgebautes Multi-Agenten System.

Der Agenten-Aufbau

Der Einstieg begann mit Ordnung. Statt die komplette Landschaft zu erfassen, haben wir mit Domain-Experten gezielt einen Kern an Tabellen identifiziert, die für Produkt- und Marketingfragen relevant sind. Zu diesen Tabellen und ihren wichtigsten Spalten entstanden kurze, präzise, durch den Menschen formulierte Beschreibungen: wofür sie stehen, wie sie zusammenhängen, welche typischen Stolperfallen es gibt. Ein LLM half uns, durch Daten-Sampling zusätzliche Strukturtexte zu erzeugen – Verteilungen, Wertebereiche, Join-Hinweise – sodass aus dünner Dokumentation ein kompakter Katalog wurde, der Menschen und Modellen gleichermaßen Orientierung bietet.

Darauf aufbauend entstand die Architektur des Multi-Agenten. Wir trennen Rollen und Verantwortlichkeiten: Ein Retrieval-Agent hat den Datenzugriff – ausschließlich auf Basis der Metadaten und Beschreibungen. Er entscheidet, welche Tabellen und Felder für eine konkrete Frage zu Produkten und Marketing herangezogen werden und formuliert die nötigen SQL-Queries. Die Ergebnisse werden zwischengespeichert, das LLM erhält nur Metadaten, die wichtig sind, um die Daten wiederzufinden. So vermeiden wir, dass das LLM bei großen Ergebnissen durch Halluzination diese verfälscht.

Ein Analyse-Agent erhält dann Zugriff auf die Datenbeschreibungen und den Speicherort, um so Analyseschritte durchzuführen und eine Interpretation der Zahlen zu ermöglichen.

Am Ende werden die Analysen durch einen Reporting-Agenten gesammelt und aufbereitet.

Stolpersteine und Erkenntnisse

Selbst die Menge der vorausgewählten Tabellen stellte sich als zu groß für zuverlässige LLM-Ergebnisse heraus. Zwar haben diese alle in das Kontextfenster gepasst (1 Million Token sind groß genug für mehrere Bücher), aber die Präzision lässt dort dennoch zu wünschen übrig. In der aktuellen Forschung wird hier von „Context Rot“ gesprochen. Die Faustregel ist, nur den wirklich relevanten Kontext zur Verfügung zu stellen. Wir nennen das Context Engineering. In einem mehrstufigen Prozess wurde die Anfrage des LLMs erst klassifiziert, damit danach die Gruppe der Tabellen eingeordnet werden konnte, die benötigt wird. Danach wurde ein weiteres LLM befragt, das die Gruppe genauer kannte und so die richtigen Tabellen vorausgewählt hat. Am Ende erhält der Retrieval-Agent nur die Metainformationen dieser ausgewählten Tabellen, um den Query zu formulieren.

Eine weitere Lehre war, dass Retrieval viel schwieriger ist, als es klingt. Selbst in einem Produkt- und Marketingkontext sind Synonyme, historische Bezeichnungen oder unterschiedliche Logiken für Produktzuordnungen tückisch. Die Suche nach Namen allein greift zu kurz; die relevanten Informationen liegen oft an mehreren Stellen, in verschiedenen Granularitäten.

Darauf haben wir mit zwei Methoden reagiert. Handelt es sich um einen simplen Prozess, hat es gereicht Details hinzuzufügen, wie diese Informationen in der richtigen Reihenfolge durch Joins gefunden werden können. Komplexere aber wieder vorkommende Requests, wie die eindeutige Bestimmung aller Produkte einer Gattung, haben wir durch Code vorbereitet, sodass das LLM nur notwendige Stichwörter füllen oder aus Ergebnislisten auswählen musste. Damit haben wir es geschafft, starre aber wichtige Prozesse mit der Flexibilität und dem gewünschten alternativen Blickwinkel eines Agenten zu vereinbaren.

Das größte Hindernis für uns war am Ende aber die Flexibilität der Agenten. Die gleiche Frage wurde durch das LLM immer anders versucht zu lösen. Das war der stärkste Vorteil, den wir uns erhofft haben: einen neuen, dynamischen Blickwinkel. Aber bei der Implementierung wurde so das richtige Debugging nahezu unmöglich. Des Weiteren mussten nun alle Analysemethoden derart flexibel formuliert werden, dass sie auf jegliche zur Verfügung gestellten Daten passen können und auch mit ständig wechselnder Reihenfolge der Spalten umgehen konnten.

Aufgrund der kurzen Zeit bleibt somit offen, wie wir die Komplexität weiter senken können, ohne an Präzision zu verlieren.

Zusammengefasst haben wir aus diesem und dem vorherigen Projekt wertvolle Erkenntnisse gewinnen können.

Was sich bewährt hat:

Reduktion vor Detailtiefe: Datenraum möglichst früh verkleinern um den Kontext gezielt zu füllen
Annotationen der Daten, zusätzlich zu den maschinennotwendigen Namen und Typen sind unerlässlich. Mein Tipp ist hier: Wenn jemand neu eingestellt wird, und die Grundlage ist gut genug, damit diese Person alleine die Daten verstehen kann, dann befinden wir uns in einer guten Ausgangssituation. Ein LLM nutzt auch natürliche Sprache zum „Verständnis“ und kann diese nutzen.
Struktur statt Freitext: Typisierte, validierte Ausgaben sind die Grundlage für belastbare Automatisierung.
Transparenz als Standard: Quellen, Regeln und Zwischenergebnisse dokumentieren – und zwar so, dass sie maschinell und menschlich prüfbar sind.

Was wir meiden:

„Alles-in-einem“-Prompts. Selbst wenn die Kontextlänge ausreicht, leidet die Präzision.

Fazit

LLMs sind im Data Engineering/Science kein Zauberstab, aber ein echter Hebel. Richtig eingesetzt helfen sie, komplexe Datenlandschaften in verlässliche, nachvollziehbare Ergebnisse zu überführen. Der Schlüssel liegt in der Kombination aus Reduktion der Komplexität, erzwungener Struktur und iterativen Workflows. So wird aus dem Datenchaos kein perfekter Garten – aber ein robustes System, das wächst, skaliert und Ergebnisse liefert, denen man vertrauen kann.

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Daniel Töws

Software Developer

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Daniel Töws

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

Wer mit Daten arbeitet, kennt den Frust: Dateien, die sich nicht an ihr eigenes Schema halten. CSVs, deren Spalten plötzlich mehrere Werte mit zusätzlichen Trennzeichen enthalten. Datenlager, in denen Tausende Tabellen existieren – mit unvollständiger...

LLM
Data
Künstliche Intelligenz
NLP
Generative KI

27.10.2025 | 6 Minuten Lesezeit

Daniel Töws

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Nachdem wir in Teil 1 unserer kleinen Reihe zum AG-Grid-Framework gezeigt haben, wie man damit schnell interaktive Tabellen erstellt, geht es in diesem Beitrag darum, wie man die gleichen Daten auch in Grafiken (wie Balkendiagramme, Pie Charts oder Zeitserien...

React
Frontend
JavaScript
Framework
Softwareentwicklung

2.5.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Die heutige Datenflut hat Software und Frameworks, wie Tableau, D3 und viele andere, hervorgebracht, deren Aufgabe es ist, die Visualisierung von Daten zu verbessern. Doch trotz der teilweise sehr ausgefallenen Darstellungsformen ist manchmal die simple...

Framework
Frontend
JavaScript
React
Softwareentwicklung

17.2.2023 | 6 Minuten Lesezeit

Daniel Töws

Selvarajah Sivarupan

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

LLM
Data
Künstliche Intelligenz
NLP
Generative KI

27.10.2025 | 6 Minuten Lesezeit

Daniel Töws

Wo Vibe Coding hilft – und wo nicht: Ein Praxisbericht

Vibe Coding ist ein Programmieransatz, der so gut wie jede Aufgabe in der Arbeit mit Quellcode – von Verständnis über Erzeugung bis Veränderung – an eine GenAI delegiert und dabei den Ausgaben dieser KIs fast vollständig vertraut. Ausgehend von einem...

Generative KI
Software-Modernisierung
IT-Security

20.10.2025 | 9 Minuten Lesezeit

Patrick Krings

Dr. Florian Rademacher

DuckDBs Friendly SQL ist ein Game Changer für die Developer Experience

Ich denke nicht, dass irgendjemand überrascht sein wird, wenn ich sage, dass SQL nicht die angenehmste Sprache zum Arbeiten ist. Manche würden sogar so weit gehen zu sagen, dass die Ergonomie von SQL furchtbar ist. Insbesondere bei großen und komplexen...

Data
MotherDuck

14.10.2025 | 11 Minuten Lesezeit

Lennart Hensler

Zero-ETL mit MotherDuck: Ein technischer Deep Dive

MotherDuck, der auf DuckDB aufbauende Cloud-native Service, verändert grundlegend, wie Unternehmen mit Daten arbeiten, die in Cloud-Object-Stores abgelegt sind. Durch den Wegfall klassischer ETL/ELT-Pipelines ermöglicht MotherDuck direkte SQL-Analysen...

MotherDuck
Data

7.10.2025 | 5 Minuten Lesezeit

Hendrik Kamp

Datenanalyse mit MotherDuck und DuckDB: Aus CSV zu Insights in 5 Minuten

CSV-Dateien sind der ewige Klassiker im Datenaustausch. Auch wenn modernere Formate wie JSON und Parquet ihren Platz erobern, bleiben die einfachen, aber robusten Comma Separated Values das Rückgrat vieler Daten-Workflows. Aber Hand aufs Herz: Wer hat...

Data
Datenbank
MotherDuck
Big Data

30.9.2025 | 7 Minuten Lesezeit

Christian Galsterer

5 Gründe, warum wir uns über den Motherduck Launch in AWS Frankfurt freuen

Hinweis: Dieser Blog-Post wurde mit LLM-unterstützung von Englisch auf Deutsch übersetzt. Seit einiger Zeit besteht für europäische Datenteams die zentrale Herausforderung darin, Innovation mit strenger Regulierung in Einklang zu bringen. Häufig erscheinen...

Data
Big Data
Datenbank
News
MotherDuck

24.9.2025 | 5 Minuten Lesezeit

Marcel Mikl

Vom Entwickler zum KI-Agenten: Der neue API-Consumer als Persona

Einführung - Wieso Personas?Ein Blick auf den State of the API Report 2024 (Postman Inc, 2024) zeigt einen überwiegenden Anteil von "Engineer or Developer" als Hauptkonsumenten von APIs. Um jedoch zu verstehen, wer diese Entwickler*innen sind und welche...

API
Künstliche Intelligenz
UX/UI

4.9.2025 | 7 Minuten Lesezeit

Benny Burkert

Wie finde ich die richtigen Generative KI Use Cases? 5 Learnings aus der...

Wie finde ich die richtigen Generative KI Use Cases? 5 Learnings aus der PraxisGenerative KI, insbesondere die Verwendung von Large-Language-Models (LLMs), zieht derzeit mit enormer Geschwindigkeit in Unternehmen aller Branchen und Größen ein. Ob Retail...

Generative KI
Künstliche Intelligenz
Produktmanagement
Digitale Produktentwicklung

3.9.2025 | 8 Minuten Lesezeit

Marc Pudelski

Deployment von n8n und ngrok in Minikube

Deployment von n8n in minikube und ngrok Seit einigen Monaten sorgt das Low-Code-Integrationstool n8n für Gesprächsstoff in der Tech-Welt. Angetrieben vom aktuellen Hype um KI-Agenten hat sich das Tool zum Liebling vieler Automatisierungsfans entwickelt...

DevOps
Kubernetes
Künstliche Intelligenz
Integration
Framework

11.8.2025 | 6 Minuten Lesezeit

Benjamin Lüdicke

Erstes Data Engineering Projekt mit Databricks Asset Bundles und GitLab...

Einleitung In diesem Artikel geht es um das Aufsetzen eines Datenprojekts mit Databricks Asset Bundles. Wir schauen uns das Basis Setup an und eine typische Projektstruktur, gehen anschließend auf einige wichtige Details und mögliche Stolpersteine und...

Data

15.6.2025 | 10 Minuten Lesezeit

Denis Khaskin

Vibe coding – Was nun?

Kann man mit KI wirklich Anwendungen erzeugen, ohne selbst coden zu können, mit einem Bruchteil des Aufwands und der Zeit? "Gib dich dem Vibe hin! Erstelle Software nur mit natürlicher Sprache! GenAI ist der Builder. Hör auf, dich zu beschweren und fang...

Künstliche Intelligenz
Generative KI

12.4.2025 | 9 Minuten Lesezeit

Goetz Markgraf

Kategorisierung von Schnittstellen: Data Interface Quadrants (DIQs)

In der heutigen schnelllebigen und datengesteuerten Welt stehen Unternehmen vor einer zunehmend komplexen Herausforderung: Wie können Datenschnittstellen so gestaltet, implementiert und verwaltet werden, dass sie sowohl den unmittelbaren betrieblichen...

API
Data

30.1.2025 | 9 Minuten Lesezeit

Daniel Kocot

Miriam Greis

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Am 27. Januar 2025 erlebte die Technologiebörse einen unerwarteten Einbruch: Der NVIDIA-Aktienkurs fiel um über 17%, wodurch der Konzern zeitweilig fast 600 Milliarden US-Dollar an Börsenwert verlor und damit einen neuen historischen Rekord am Aktienmarkt...

Künstliche Intelligenz
Generative KI
LLM

29.1.2025 | 8 Minuten Lesezeit

Daniel Ladischenski

Wie wir eine KI mit wenigen Worten hacken können

Wie wir eine KI mit wenigen Worten hacken können Künstliche Intelligenz (KI) hat in den letzten Jahren einen erstaunlichen Wandel durchgemacht und ist mittlerweile in vielen Lebensbereichen präsent. Ob in Form von Chatbots, die uns bei alltäglichen Fragen...

IT-Security
Künstliche Intelligenz

27.1.2025 | 4 Minuten Lesezeit

Mehmet Avci

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

In einem gemeinsamen Projekt haben Tom Scholz und ich Machine Learning (ML) Services gebaut, um einem Kunden bei der Analyse von Dokumenten zu helfen. Eine Proof-Of-Concept Lösung war schnell gebaut, die es nun zu operationalisieren gilt. Hierbei war...

Machine Learning
Python
Data
Data Science

12.9.2024 | 27 Minuten Lesezeit

Patrick Soschinski

Tom Scholz

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

Künstliche Intelligenz ist heutzutage in aller Munde. Die Einsatzgebiete sind vielfältig, der "WOW-Faktor" immer gegeben und das Potenzial noch lange nicht ausgeschöpft. Wo wir heute in vielen Bereichen schon unsere früheren Erwartungen übertroffen ...

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

When Business Meets Technology: Vom Datenprodukt zur Datenarchitektur ...

Zusammenfassung Der Data Product Canvas (DPC) ist ein Werkzeug für die leichtgewichtige und iterative Konzeption von Datenprodukten. Dabei steigert er die Effizienz der Produktdefinition, indem er die wesentlichen Einflussbereiche auf Datenprodukte übersichtlich...

Softwarearchitektur
Data
DDD
Digitale Produktentwicklung

6.8.2024 | 21 Minuten Lesezeit

Daniel Engelhardt

Dr. Florian Rademacher

Charge your APIs Volume 28: Verbesserung von Anwendungs- und Datenintegration...

In der heutigen schnelllebigen Welt ist die nahtlose Integration von Anwendungen und Daten entscheidend für den Erfolg eines Unternehmens. In diesem Blogpost werden Konzepte wie die Maslowsche Pyramide, Team Topologies, evolutionäre Architekturen, API...

API
Data
Integration

25.7.2024 | 9 Minuten Lesezeit

Daniel Kocot

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

Ein gutes User Interface zu designen und umzusetzen, ist schwierig. Wir als Full Stack EntwicklerInnen wissen nur zu gut, dass der Teufel im Detail steckt. Einmal ist die Animation schlecht getimed, ein Input schiebt sich über den nächsten, ein Bild...

Künstliche Intelligenz
Generative KI
LLM

18.7.2024 | 12 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

Disclaimer: Dieser Artikel ist Teil einer Serie. Lies am besten zuerst Teil 1 und Teil 2, um auf dem neuesten Stand zu sein. In der traditionellen Softwareentwicklung sind Tests ein essenzieller Bestandteil. Wir nutzen E2E-Tests, Unit- und Integrationstests...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 15 Minuten Lesezeit

Robin Schlenker

Vom Datenschatz zum Erkenntnissystem: Ein Multi‑Agenten‑Ansatz mit LLMs

Der Agenten-Aufbau

Stolpersteine und Erkenntnisse

Fazit

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Beiträge

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

Charts im Browser – Eine Einführung in AG Grid (Teil 2)

Tabellen im Browser – Eine Einführung in AG Grid (Teil 1)

Weitere Artikel in diesem Themenbereich

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

Wo Vibe Coding hilft – und wo nicht: Ein Praxisbericht

DuckDBs Friendly SQL ist ein Game Changer für die Developer Experience

Zero-ETL mit MotherDuck: Ein technischer Deep Dive

Datenanalyse mit MotherDuck und DuckDB: Aus CSV zu Insights in 5 Minuten

5 Gründe, warum wir uns über den Motherduck Launch in AWS Frankfurt freuen

Vom Entwickler zum KI-Agenten: Der neue API-Consumer als Persona

Wie finde ich die richtigen Generative KI Use Cases? 5 Learnings aus der...

Deployment von n8n und ngrok in Minikube

Erstes Data Engineering Projekt mit Databricks Asset Bundles und GitLab...

Vibe coding – Was nun?

Kategorisierung von Schnittstellen: Data Interface Quadrants (DIQs)

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Wie wir eine KI mit wenigen Worten hacken können

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

When Business Meets Technology: Vom Datenprodukt zur Datenarchitektur ...

Charge your APIs Volume 28: Verbesserung von Anwendungs- und Datenintegration...

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

Jetzt für unseren Newsletter anmelden