Der Ralph Wiggum Loop: Autonome Code-Generierung mit frischem Kontext

6.4.2026 | 6 Minuten Lesezeit

Ralph Wiggum ist der einfältige Junge aus den Simpsons, der Sätze sagt wie "I'm learnding!" und Kleber isst. Ausgerechnet er ist jetzt Namensgeber für eine Technik zur autonomen Code-Generierung. Die Idee dahinter: Wenn dir der Gedanke, Code autonom generieren zu lassen, den Magen umdreht, dann ist das genau das Gefühl, das du systematisch adressieren solltest.

Geoffrey Huntley, ein australischer Open-Source-Entwickler, hat die Idee Mitte 2025 entwickelt und ihr den Namen gegeben. Die treibende Frage dahinter war einfach. Wie weit kommt man, wenn man KI-Agenten einfach laufen lässt, ohne ständig einzugreifen?

Der Loop

Der Ralph Loop ist kein Ersatz für einen strukturierten Entwicklungsansatz, sondern ein Ausführungsmotor für einen, den du bereits hast. Die Grundidee ist denkbar einfach:

1while has_more_todos; do
2  code-agent --prompt "Bearbeite den nächsten Task aus todo.md" --non-interactive --yolo
3done

Ein Skript startet den KI-Agenten und übergibt ihm einen Prompt. Sobald der Agent fertig ist und sich beendet, startet das Skript ihn erneut. Wieder mit demselben Prompt, wieder mit frischem Kontext. Nach jedem Durchlauf prüft es, ob noch offene Tasks vorhanden sind. Wenn nicht, beendet sich der Loop.

Konkret funktioniert das mit Agenten wie Claude Code oder OpenCode. Sie lassen sich im Non-Interactive-Modus starten. Prompt rein, autonom abarbeiten, terminieren. Damit der Agent selbstständig arbeiten kann, muss er alle Berechtigungen haben und alles ausführen dürfen. Das ist der --yolo-Modus. Dateien schreiben, Shell-Befehle ausführen, Änderungen vornehmen. Ohne Rückfragen. Sandboxing wird damit essentiell. Der Agent braucht eine isolierte Umgebung, in der er keinen Schaden anrichten kann.

Für einfache Projekte reicht ein minimales Skript. Für komplexere Workflows kannst du dir das Skript von der KI generieren lassen. Vielleicht hat dein Loop mehrere Schritte pro Durchlauf, etwa Implementierung und Review. Vielleicht nutzt du auch ein Spec-Framework wie BMad. Die Grundidee bleibt dieselbe.

Warum ein Loop? Das frischer-Kontext-Prinzip

Context Windows sind der "Arbeitsspeicher" eines LLMs während einer Session. Die Größe ist begrenzt. Die Qualität der Ergebnisse nimmt ab, je mehr davon genutzt wird. Zusätzlich gehen Details verloren, wenn das LLM den Kontext zusammenfassen (Compacting) muss. Das Modell verliert den roten Faden. Halluzinationen nehmen zu, frühere Entscheidungen werden vergessen.

Der Ralph Wiggum Loop löst dieses Problem. Jede Iteration startet einen neuen Prozess mit einem frischen, leeren Kontext. Statt immer mehr Kontext zu akkumulieren, beginnt jede Iteration bei null. Nur die Specs und der Implementierungsplan landen im Kontext, alles andere ist weg. Eine Aufgabe pro Durchlauf, dann Reset.

Wie du mit dem Ralph Wiggum Loop arbeitest

Spezifikationen als Fundament

Der Loop ist nur die Automatisierung. Das Fundament ist eine gute Spezifikation mit einer abhakbaren Aufgabenliste. Im Ralph Loop wird pro Iteration genau eine Aufgabe implementiert, als erledigt markiert und der Agent neu gestartet. Die Aufgaben müssen gut spezifiziert und klar abgrenzbar sein.

Wie du zu dieser Struktur kommst, ist offen. Du erstellst die Spezifikation im Dialog mit der KI. "Ich will X bauen. Stell mir Fragen. Erstelle eine Spezifikation und einen Implementierungsplan." Oder du nutzt ein Framework wie BMad, das diesen Prozess formalisiert und am Ende Stories und Tasks produziert, die abgearbeitet werden können.

Das Format ist zweitrangig. Entscheidend ist: eine Aufgabe, ein Durchlauf.

On the Loop

Kief Morris beschreibt auf martinfowler.com drei Modelle, wie Menschen mit KI-Agenten zusammenarbeiten. Out of the Loop bedeutet, der Mensch definiert nur das Ziel. Den Rest macht der Agent alleine. Das ist "Vibe Coding". In the Loop bedeutet, der Mensch prüft jeden einzelnen Output des Agenten. Das klingt sicher, skaliert aber nicht. Agenten generieren Code schneller, als Menschen ihn reviewen können. Der Mensch wird zum Flaschenhals.

Das dritte Modell ist On the Loop. Statt jeden Output zu inspizieren, baut der Mensch den Rahmen, in dem der Agent arbeitet: Spezifikationen, automatisierte Qualitätsprüfungen, Workflow-Regeln. Wenn das Ergebnis nicht stimmt, wird nicht der Code manuell behoben, sondern der Agent verbessert, sodass das Problem nicht wieder auftritt.

Harness Engineering

Die KI macht Fehler. Die Frage ist nicht, wie du diese Fehler verhinderst, sondern wie der Agent Feedback bekommt und den Fehler selbst behebt.

Stell dir eine Rakete vor, die einen weit entfernten Himmelskörper erreichen soll. Jede Abweichung sorgt dafür, dass sie weit am Ziel vorbeifliegt. Was sie braucht, sind automatische Kurskorrekturen. Automatisierte Tests stellen sicher, dass die Anwendung funktioniert. Security-Scans verhindern, dass unsichere Dependencies in die Anwendung gelangen. Code-Quality-Checks fangen Fehler ab, bevor sie im Build landen. Wenn eine Prüfung fehlschlägt, bekommt der Agent das Feedback und behebt den Fehler.

Morris, Anthropic und OpenAI nennen es Harness Engineering. Huntley nennt es Back Pressure Engineering. Die Begriffe sind unterschiedlich. Die Kernaussage ist dieselbe: Je besser der Rahmen, desto zuverlässiger die Agenten.

Von Attended zu Unattended

Zurück zur Rakete. Am Anfang der Flugbahn sind Kurskorrekturen besonders kritisch, weil sich kleine Abweichungen über die Strecke multiplizieren. Am Anfang startest du den Loop manuell und beobachtest jeden Durchlauf. Du bewertest, ob die automatischen Feedback-Mechanismen greifen. Wenn nicht, passt du die Specs oder den Prompt an. Das ist "Attended". Du sitzt daneben und schaust zu.

Mit der Zeit werden die Kurskorrekturen zuverlässiger. Du investierst in automatisiertes Feedback statt den Agenten manuell zu korrigieren. Irgendwann startest du den Loop abends und schaust morgens, was er gebaut hat. Das ist "Unattended". Du prüfst nur noch das Ergebnis.

Der Übergang ist graduell und erfordert Vertrauen. Es gibt keine feste Regel, wann du bereit bist, die KI alleine arbeiten zu lassen. Nur die Erfahrung, die du durch das Beobachten sammelst.

Ein Beispiel: Eine Ralph Wiggum Zitat-App

Um den Ralph Loop in der Praxis zu testen, habe ich eine kleine App bauen lassen: Umpossible. Eine Web-App, in der man Ralph-Wiggum-Zitate durchstöbern und voten kann.

Die Spec habe ich im Dialog mit der KI erstellt. Meine Anfangsbedingungen waren:

1## Umpossible – Ralph Wiggum Zitat-App
2- Zeigt zufällige Ralph-Wiggum-Zitate mit Staffel und Episode
3- Voting: Upvotes pro Zitat, ein Vote pro Session
4- Zitat-Übersicht mit Filter und Sortierung
5- Admin-Bereich für Zitat-Verwaltung
6- Dark Mode mit System-Erkennung
7- Responsive, barrierefrei (WCAG 2.1 AA)

Alle weiteren Details habe ich mit der KI im Dialog erarbeitet. Die fertige Spec enthält den Tech-Stack, Seitenstruktur, Accessibility-Anforderungen und mehr. Daraus habe ich mit der KI zusammen einen Implementierungsplan mit 16 Phasen generieren lassen. Von der Projektstruktur über Backend-API, Frontend-Komponenten und Barrierefreiheit bis zu Tests und Dokumentation.

Jede Phase wurde in einem eigenen Loop-Durchlauf abgearbeitet. Das Skript dafür ist simpel: Es prüft, ob noch offene Phasen im Plan stehen, startet Claude Code mit dem Prompt, und wiederholt das bis alles erledigt ist. Ein frischer Kontext pro Phase, keine Altlasten aus vorherigen Iterationen. Nach 16 Durchläufen hatte ich eine funktionierende, getestete App. Nach etwa vier Stunden hatte der Loop alle Phasen abgeschlossen. Die API-Kosten für das gesamte Projekt, von der Spezifikation bis zur fertigen Implementierung, lagen bei rund 70 Euro.

I Bent My Wookiee

Ralph stolpert, stürzt, und sagt dann: "I bent my Wookiee." Jeder, der einen KI-Agenten zu lange in einer Session hat arbeiten lassen, kennt das Gefühl. Irgendwann verbiegt sich alles, und dann fällt es hin. Was ich aus dem Experiment mitgenommen habe, lässt sich auf zwei Prinzipien eindampfen: Frische Kontexte halten den Agenten auf Kurs. Der Harness fängt ihn auf, wenn er trotzdem stolpert. Beides klingt trivial. Die Disziplin, es konsequent umzusetzen, ist es nicht. Nimm dir ein kleines Projekt, schreib eine Spec, und lass den Loop laufen. Das Gefühl, morgens auf funktionierenden Code zu schauen, den du nicht selbst geschrieben hast, muss man einmal erlebt haben.

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Johannes Barop

Senior IT-Consultant

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Warum 600 PS auf einem Schotterweg nicht helfen: Das KI-Produktivitäts...

Die 600 PS eines modernen Sportwagens bringen nicht viel, wenn der Untergrund aus einem holprigen Schotterweg besteht. Quelle: Adobe Stock. Stell dir vor, du sitzt in einem hochmodernen Sportwagen mit 600 PS auf einem holprigen Schotterweg: Die schiere...

Künstliche Intelligenz
Softwareentwicklung

21.5.2026 | 4 Minuten Lesezeit

Rainer Vehns

MCP-Server bauen mit Spring AI

Einleitung Das Model Context Protocol (MCP) ist ein offener Standard, der definiert, wie KI-Modelle mit externen Tools, Diensten und Datenquellen kommunizieren. Es ersetzt individuelle Integrationen durch ein einziges, klar definiertes JSON-RPC-2.0-Protokoll...

Künstliche Intelligenz
Softwareentwicklung

17.5.2026 | 4 Minuten Lesezeit

Tobias Trelle

Von Inferenz zu Governance: Warum Agent-Metadaten wichtig sind, auch wenn...

Moderne LLMs (Large Language Models) zeigen eine starke Fähigkeit, Bedeutungen aus Spaltennamen abzuleiten. Ein Tool wie Genie kann in der Regel pct_cust_attrit_q als „Churn“ (Abwanderung) auflösen oder rev_mrr_usd allein durch Mustererkennung dem Begriff...

Künstliche Intelligenz
LLM
Big Data
Datenbank

15.5.2026 | 6 Minuten Lesezeit

Niklas Niggemann

KI als Design-Partner — Entwerfer, Prüfer, Kritiker

Teil der Serie Domain-Driven Design Meets AI. Der vorherige Beitrag stellte den Synergetic Blueprint als strukturierten Prozess vor, der DDD-Methoden zu einem zusammenhängenden End-to-End-Design-Flow verbindet, und legte dar, dass KI jeden seiner Schritte...

14.5.2026 | 12 Minuten Lesezeit

Annegret Junker

Strukturierte Migration mit Claude Code - Context Engineering statt Prompt...

Garbage in, garbage out Im ersten Teil dieser Serie haben wir einen bewusst explorativen Ansatz gewählt: Den kompletten Quellcode hochladen, einmal prompten, schauen was passiert. Das Ergebnis war beeindruckend schnell – aber auch inkonsistent: Drei ...

Künstliche Intelligenz
Software-Modernisierung

12.5.2026 | 18 Minuten Lesezeit

Krisztina Szathmary

Christopher Flocke

Die konsumierbare Domäne: Knowledge Engineering für KI-gestützte Entwicklung

Das alte Versprechen Ende der 70er prägte der Stanford-Informatiker Edward Feigenbaum den Begriff "Knowledge Engineering". Er beschrieb damit den Prozess, Expertenwissen zu extrahieren, zu strukturieren und in einem Software-System nutzbar zu machen....

Generative KI
Künstliche Intelligenz
LLM
Software-Modernisierung
Softwareentwicklung

11.5.2026 | 9 Minuten Lesezeit

Johannes Barop

Benjamin Font Pera

Zuverlässige AI Analytics durch Data Quality: Genie Spaces in Databricks

Garbage In, Garbage Out. Dieser Grundsatz der Informatik war noch nie so kritisch wie im Zeitalter der KI. Large Language Models verstärken schlechte Datenqualität nicht, sie verpacken sie in selbstsicher klingenden Formulierungen, die selbst erfahrene...

Generative KI
LLM
Künstliche Intelligenz
Data

7.5.2026 | 8 Minuten Lesezeit

Niklas Niggemann

16000 Tests in 4 Tagen - Mit Claude Code zu 80% Testabdeckung

Die Ausgangssituation Als wir bei codecentric vor Kurzem bei einem Kunden die Codebasis eines früheren Dienstleisters übernahmen, wurde uns schnell klar, dass dies keine alltägliche Herausforderung werden würde. Backends, Frontends, Batches, Services...

Künstliche Intelligenz
Softwareentwicklung
Testing

5.5.2026 | 11 Minuten Lesezeit

Selvarajah Sivarupan

Kai Lüttmann

Der Synergetic Blueprint revisited — und warum KI alles verändert

Vom Workshop zur laufenden Software — die Lücke, über die niemand spricht Die meisten Teams, die Domain-Driven Design einführen, investieren stark in Workshops. Domain Storytelling Sessions, EventStorming Boards, Context-Mapping-Übungen — die Zusammenarbeit...

28.4.2026 | 8 Minuten Lesezeit

Annegret Junker

Wird Spring Boot obsolet?

Im März 2026 starteten wir in ein Modernisierungs-Projekt bei einem Kunden. Spring Boot war eine übliche Wahl. Es gab eine strategische Setzung. Es gab vorhandenes Know-how. Es gab bestehende Infrastruktur. Das Team stand. Die Arbeit lief an. Einer der...

Generative KI
LLM
Künstliche Intelligenz
Softwareentwicklung
Softwarearchitektur

27.4.2026 | 7 Minuten Lesezeit

Johannes Barop

EXACT Coding: KI-gestützte Entwicklung mit Qualität statt Vibe-Chaos

TL;DR Unkontrolliertes Agentic Coding („Vibe Coding“) liefert schnell Code – und oft Sicherheits- und Wartungsprobleme, sobald Software produktiv gehen soll. EXACT Coding (Example-guided AI-Collaborative Test-driven Coding) bündelt bewährte Praktiken...

Generative KI
Künstliche Intelligenz
Test Driven Development

22.4.2026 | 6 Minuten Lesezeit

Marco Emrich

Ferdinand Ade

AI Governance ohne Theater

Warum Unternehmen nicht an KI scheitern, sondern an ihrer eigenen Entscheidungsordnung Es gibt in deutschen Konzernen keinen Mangel an AI Governance. Es gibt Lenkungskreise, Richtlinien, Prüfprozesse, AI Ethics Boards und Grundsatzpapiere in beeindruckender...

Künstliche Intelligenz
Datenschutz
IT-Governance
Compliance
Regulatorik

7.4.2026 | 14 Minuten Lesezeit

Alexander Rose

Harald Schlüter

Information Retrieval mit Databricks Agents

Durch die Nutzung von großen Sprachmodellen (LLMs) ist es immer einfacher möglich, explorativ Daten zu analysieren. Dabei werden LLM-Agenten genutzt, um Informationen über die vorhandene Datenbasis zu erhalten. In den letzten Jahren hat sich RAG (Retrieval...

Generative KI
Künstliche Intelligenz
LLM

31.3.2026 | 8 Minuten Lesezeit

Stefan Herrmann

AI Code-Tsunami trifft auf QA-Staumauer: Das Ende der eingependelten Geschwindigkeit

Vorab: Dieser Artikel richtet sich gezielt an Teams, die an der Modernisierung und Weiterentwicklung von bestehenden Systemen arbeiten und nicht an Projekte auf der sprichwörtlichen grünen Wiese, wo völlig andere Gesetze gelten. Jeder spricht über den...

Generative KI
Künstliche Intelligenz
DevOps
Test Driven Development
Testing

30.3.2026 | 8 Minuten Lesezeit

Jan Rümenapf

Resilienz in der Softwareentwicklung: Warum wir im KI-Zeitalter einen ...

Resilienz in der Softwareentwicklung: Warum wir im KI-Zeitalter einen neuen Autopiloten brauchen In der modernen IT-Landschaft ist „Resilienz“ längst zu einem Modewort geworden. Jeder möchte sie haben, viele behaupten, sie zu besitzen, doch nur wenige...

Resilienz
DevOps
Generative KI

25.3.2026 | 4 Minuten Lesezeit

Niko Blättermann

AI assisted hacking. Ein Erfahrungsbericht

Motivation Das Thema Agentic Coding gewinnt zunehmend an Bedeutung. KI-Modelle sollen Softwareentwickler nicht nur bei einzelnen Aufgaben unterstützen, sondern in der Lage sein, komplexe Entwicklungsprozesse zu planen, umzusetzen und zu reviewen – mit...

IT-Security
Generative KI
LLM
Künstliche Intelligenz

20.3.2026 | 5 Minuten Lesezeit

David

DeepFake: Erkenne AI Generierte Bilder, in 5 Schritten

Wir leben in einer Zeit, in der ein Bild längst keine Garantie für die Wahrheit mehr ist. KI generierte Inhalte fluten täglich unsere sozialen Medien, Nachrichtenportale und Messenger Gruppen, und die wenigsten Menschen erkennen den Unterschied. Was ...

IT-Security
Künstliche Intelligenz
Generative KI
Search
Google
Datenschutz
Digitalisierung

16.3.2026 | 5 Minuten Lesezeit

Mehmet Avci

Bugs, Refactoring, Tests: Wo Chatbots beim Coden glänzen und wo sie scheitern

Die Suche nach meinem Platz in der KI-Ära Als Softwareentwickler habe ich mich intensiv mit den neuen KI-Möglichkeiten auseinandergesetzt. Dabei drängte sich mir eine zentrale Frage auf: Wie kann mich KI im Alltag wirklich unterstützen? Oder provokanter...

LLM
Softwareentwicklung
Künstliche Intelligenz

9.3.2026 | 7 Minuten Lesezeit

Lennart Golubski

MCP-Server sicher konfigurieren mit Passwortmanager CLIs

MCP Server sind mittlerweile als Erweiterungen für Coding Agents wie Claude Code oder Cursor zu alltäglichen Tools geworden. Doch bei der Konfiguration der MCP Server gibt es oft ein Sicherheitsrisiko. Viele MCP Server brauchen Credentials, API Tokens...

Künstliche Intelligenz
Softwareentwicklung
LLM
IT-Security

9.3.2026 | 4 Minuten Lesezeit

Paul Severin

KI-Lava im Griff: Der 3-Phasen-Plan für professionelle Softwareentwicklung

KI-Tools in der Softwareentwicklung sind mittlerweile allgegenwärtig. Fast wöchentlich erscheinen neue Werkzeuge, Workflows oder Analysen, welche die Transformation unserer Branche beschreiben. Bei codecentric erleben wir diese Veränderung bereits tä...

Künstliche Intelligenz
Softwareentwicklung
LLM

6.3.2026 | 8 Minuten Lesezeit

Denis Stalz-John

Der Ralph Wiggum Loop: Autonome Code-Generierung mit frischem Kontext

Der Loop

Warum ein Loop? Das frischer-Kontext-Prinzip

Wie du mit dem Ralph Wiggum Loop arbeitest

Spezifikationen als Fundament

On the Loop

Harness Engineering

Von Attended zu Unattended

Ein Beispiel: Eine Ralph Wiggum Zitat-App

I Bent My Wookiee

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Artikel in diesem Themenbereich

Warum 600 PS auf einem Schotterweg nicht helfen: Das KI-Produktivitäts...

MCP-Server bauen mit Spring AI

Von Inferenz zu Governance: Warum Agent-Metadaten wichtig sind, auch wenn...

KI als Design-Partner — Entwerfer, Prüfer, Kritiker

Strukturierte Migration mit Claude Code - Context Engineering statt Prompt...

Die konsumierbare Domäne: Knowledge Engineering für KI-gestützte Entwicklung

Zuverlässige AI Analytics durch Data Quality: Genie Spaces in Databricks

16000 Tests in 4 Tagen - Mit Claude Code zu 80% Testabdeckung

Der Synergetic Blueprint revisited — und warum KI alles verändert

Wird Spring Boot obsolet?

EXACT Coding: KI-gestützte Entwicklung mit Qualität statt Vibe-Chaos

AI Governance ohne Theater

Information Retrieval mit Databricks Agents

AI Code-Tsunami trifft auf QA-Staumauer: Das Ende der eingependelten Geschwindigkeit

Resilienz in der Softwareentwicklung: Warum wir im KI-Zeitalter einen ...

AI assisted hacking. Ein Erfahrungsbericht

DeepFake: Erkenne AI Generierte Bilder, in 5 Schritten

Bugs, Refactoring, Tests: Wo Chatbots beim Coden glänzen und wo sie scheitern

MCP-Server sicher konfigurieren mit Passwortmanager CLIs

KI-Lava im Griff: Der 3-Phasen-Plan für professionelle Softwareentwicklung

Jetzt für unseren Newsletter anmelden