Beliebte Suchanfragen
//

Mehr als nur ein Copilot: Die fünf Level der KI-gestützten Softwareentwicklung

12.2.2026 | 9 Minuten Lesezeit

KI-gestützte Softwareentwicklung ist nicht gleich KI-gestützte Softwareentwicklung. Die einen nutzen ChatGPT, um sich Code-Schnipsel erklären zu lassen, die anderen lassen KI-Agenten ganze Features bauen. Wieder andere experimentieren mit Tools, die komplette Anwendungen aus einer Textbeschreibung generieren. Alle reden über "KI beim Programmieren" – aber meinen sie dasselbe?

Meistens nicht. Und genau das ist das Problem. Ohne eine klare Einteilung reden wir oft aneinander vorbei. Erwartungen werden enttäuscht, Potenziale überschätzt oder unterschätzt. Was fehlt, ist ein gemeinsames Modell – so wie die fünf Level des autonomen Fahrens: Vom einfachen Tempomat bis zum vollautonomen Fahrzeug ohne Lenkrad.

Genau diese Frage habe ich mir gestellt, als ich vor einigen Wochen auf einer Konferenz zu AI-Assisted Coding einen Vortrag halten sollte. Ich habe dort ein Fünf-Level-Modell vorgestellt, das die unterschiedlichen Stufen der KI-Unterstützung beim Programmieren beschreibt. Mir hat das Modell für meinen Vortrag geholfen. Und spannenderweise haben die Sprecher in den nachfolgenden Vorträgen das Modell spontan übernommen und ihre eigenen Themen in die Level eingeordnet. "Hier ein Beipiel aus Level 2", hieß es dann, oder "Das, was ich jetzt zeige, bewegt sich zwischen Level 3 und 4." Das hat mir gezeigt, wie hilfreich eine gemeinsame Sprache ist, wenn wir über KI-gestützte Entwicklung sprechen.

Vergleich der 5 Level des autonomen Fahrens mit KI gestützter Softwareentwicklung

Wofür ist so ein Modell nützlich?

Bevor wir in die Details der fünf Level einsteigen, lohnt es sich zu fragen: Wozu brauchen wir überhaupt so eine Einteilung?

Aus meiner Erfahrung hilft das Modell in mehreren Situationen:

Standortbestimmung: "Wo stehen wir heute? Wo wollen wir hin?" – Das Modell bietet einen schnellen Orientierungspunkt. Statt langer Erklärungen kann man sagen: "Wir arbeiten hauptsächlich auf Level 2" und alle wissen, was gemeint ist.

Realistische Erwartungen: KI-gestützte Entwicklung ist kein Wundermittel. Manche glauben, dass KI Entwickler überflüssig macht (siehe dazu meinen Artikel zum Thema Vibe Coding). Andere sind skeptisch, ob KI überhaupt einen Nutzen hat. Das Modell hilft dabei, zu verstehen, dass es unterschiedliche Stufen mit unterschiedlichen Einsatzgebieten, Stärken und Grenzen gibt.

Gemeinsame Sprache: Wie die Anekdote von der Konferenz zeigt, fehlt uns oft ein gemeinsames Vokabular. "KI-gestützte Entwicklung" kann alles Mögliche bedeuten – von ChatGPT-Nutzung bis zu vollautomatischen Code-Generatoren. Das Modell schafft hier Klarheit.

Die fünf Level

Schauen wir uns nun die fünf Level an, und wie sie sich zur Welt des autonomen Fahrens verhalten.

Level 1: AI Code Assistance

Auf Level 1 nutzt du Web-basierte KI-Chats wie ChatGPT oder Claude, um dir Hilfe zu holen. Du stellst eine Frage, bekommst eine Antwort oder ein Code-Beispiel und setzt das Ergebnis manuell in den eigenen Code ein. Den Kontext musst du dabei selbst durch Copy und Paste oder durch Hochladen von Dokumenten erstellen.

Typische Tools: ChatGPT, Claude, Gemini und ähnliche Chat-Interfaces.

Wer macht was? Entwickler schreiben den Code selbst und nutzen die KI als eine Art "StackOverflow on demand". Die KI gibt Tipps, liefert Beispiele oder erklärt Konzepte. Der Entwickler entscheidet, was er oder sie davon übernimmt.

Parallele zum autonomen Fahren: Ein Vergleich könnte der einfache Tempomat beim Autofahren sein. Der Fahrer steuert das Auto vollständig, bekommt aber in bestimmten Situationen Entlastung.

Level 2: AI Code Generation

Auf Level 2 rückt die KI näher an dich als Entwicklerin oder Entwickler heran. IDE-Plugins wie GitHub Copilot schlagen automatisch Code-Vervollständigungen vor, bieten Chat-Funktionen oder können ganze Code-Blöcke auf Basis einer Anweisung generieren (z. B. im "Edit"-Modus). Der Zugriff auf Dateien als Kontext ist erleichtert gegenüber Level 1 und auch die Antwort in einem Chat-Panel kannst du per Klick direkt in den Code einfügen. Im erwähnten "Edit"-Modus kann Github Copilot direkt selbstständig eine Datei lesen und verändern.

Typische Tools: GitHub Copilot, Jetbrains AI Assistance, Continue.dev und ähnliche IDE-Erweiterungen.

Wer macht was? Die KI schlägt aktiv Code vor, während du tippst oder auf Anfrage. Der Entwickler oder die Entwicklerin prüft den Vorschlag kritisch und entscheidet, ob er übernommen, angepasst oder verworfen wird.

Parallele zum autonomen Fahren: Das ist wie ein adaptiver Tempomat, der sich automatisch ans Fahrgeschehen anpasst. Das System reagiert auf die Umgebung, aber der Fahrer behält die volle Kontrolle.

Level 3: Agentic AI Development

Auf Level 3 kommen endlich die viel zitierten KI-Agenten ins Spiel. Du gibst eine Anweisung in natürlicher Sprache, und der Agent übernimmt eine Aufgabe eigenständig: Dateien finden und lesen, Code schreiben, evtl. Tests ausführen und Fehler korrigieren. Der Agent arbeitet mehrere Schritte ab, ohne dass du jeden einzelnen Schritt manuell anstoßen musst.

Typische Tools: Cursor, Windsurf, Claude Code, OpenCode und ähnliche Agenten-Systeme.

Wer macht was? Der Agent führt einfache bis mittelschwere Aufgaben auf Basis eines Prompts aus. Der Entwickler überwacht den Prozess, greift bei Bedarf ein, justiert nach und prüft das Ergebnis.

Parallele zum autonomen Fahren: Das entspricht vielleicht einem Spurhalteassistenten mit automatischem Spurwechsel auf der Autobahn. Das Auto übernimmt dieses Fahrmanöver weitgehend selbst, aber die Fahrerin muss aufmerksam bleiben und gegebenenfalls übernehmen.

Level 4: Spec Driven Development

Auf Level 4 arbeitet ihr beide, Mensch und Maschine, zunächst gemeinsam daran, die Aufgabe zu verstehen und einen detaillierten Plan (Spec) zu erstellem, bevor die KI dann teilweise recht komplexen Code generiert oder bestehenden Code anpasst. Dieser Prozess erlaubt es, größere Features oder Refactorings strukturiert anzugehen. Anders als bisher unterscheidet sich Level 4 nicht durch neue Technik von Level 3, sondern nur durch die Art der Nutzung. Dein Ziel ist es, dem Agenten so viele notwendige Informationen zu geben, wie möglich.

Typische Tools: Dieselben Agentensysteme wie bei Level 3. Allerdings gibt es bei KI-Agenten Unterschiede hinsichtlich der "Hartnäckigkeit". Für Level 4 brauchst du in jedem Fall einen leistungsfähigen Agenten.

Wer macht was? Mensch und KI arbeiten in der Planungsphase eng zusammen. Die KI übernimmt dann die Umsetzung weitgehend selbstständig. Auch die Code-Review kann zunächst automatisiert erfolgen. Die Entwicklerinnen und Entwickler prüfen Zwischenergebnisse und justiert bei Bedarf nach. Das Endergebnis ist in jedem Fall intensiv zu prüfen und auch manuell zu testen.

Parallele zum autonomen Fahren: Das ist wie autonomes Fahren in definierten Bereichen – etwa ein Parkhaus-Parkservice oder automatisches Fahren im Autobahn-Stau. Das Auto übernimmt komplett, aber nur unter bestimmten, klaren Bedingungen. Der Fahrer kann sich in dieser Zeit anderen Dingen widmen.

Wichtig auf Level 4: Spätestens hier wird Sicherheit zum unverzichtbaren Thema, und zwar die Sicherheit deines Rechners und deiner Daten. Ein leistungsfähiger Agent sollte gegenüber dem Rechner, auf dem er läuft, isoliert werden. Containerisierung (z. B. mit Docker) ermöglicht es dem Agenten, frei Tools zu nutzen und Befehle auszuführen, ohne das Host-System zu gefährden. Mehr dazu gleich im Kapitel über "AI Readiness".

Level 5: Autonomous Product Evolution

Auf Level 5 wird ein ganzes Produkt ausschließlich von der KI geschrieben und weiterentwickelt. Der Mensch agiert nur noch über Prompts. Niemand schaut sich den Code mehr an, ja, das ist noch nicht einmal vorgesehen – so wie beim vollautonomen Fahren das Fahrzeug kein Lenkrad besitzt. Die KI übernimmt sämtliche Aufgaben, die bisher von Menschen rund um das Thema Softwareentwicklung erledigt wurden, also neben der Entwicklung auch den Betrieb und das Monitoring des Produktes.

Typische Tools: Derzeit noch weitgehend hypothetisch. Ansätze gibt es bei Tools wie v0, Bolt, Lovable, Emergent oder Replit, die aus natürlichsprachlichen Beschreibungen ganze Anwendungen generieren. Aber diese Systeme erzeugen (noch) keine produktionsreifen Lösungen und können auch noch nicht den Betrieb selbstständig stemmen.

Wer macht was? Die KI macht alles. Der Mensch gibt nur noch die Inhalte vor.

Parallele zum autonomen Fahren: Full Driving Automation – kein Lenkrad, keine Pedale. Das Fahrzeug übernimmt alles. Wie beim AI Assisted Coding ist Level 5 auch bei Autos noch nicht erreicht.

Voraussetzungen für erfolgreichen Einsatz: Die AI Readiness

KI-gestützte Entwicklung ist kein Selbstläufer. Damit der Einsatz nicht schief geht, braucht es bestimmte Voraussetzungen, die sogenannte "AI Readiness". Hiermit ist die Bereitschaft und Befähigung eines Teams gemeint, einer Codebasis und einer Organisation, KI effektiv und ohne Risiken zu nutzen.

Wer KI ohne die richtige Vorbereitung einfach einsetzt, riskiert schlechten Code, Sicherheitslücken oder ineffiziente Prozesse. AI Readiness sorgt dafür, dass die KI auf einem soliden Fundament arbeiten kann.

Hier ein paar Beispiele:

Code-Qualität und Architektur: KI arbeitet am besten mit sauberem, gut strukturiertem Code. Wenn die Codebasis chaotisch ist, produziert die KI ebenfalls chaotischen Code. Eine klare Architektur hilft der KI, den Kontext zu verstehen und passende Lösungen zu generieren. Für Level 3 und 4 sollte sie dem Agenten in Form von Instruction Files bekannt gemacht werden.

Automatisierte Tests: Tests sind das wichtigste Sicherheitsnetz überhaupt. Sie zeigen schnell, ob der von der KI generierte Code funktioniert oder unerwünschte Nebenwirkungen hat. Ohne Tests ist der Einsatz von KI riskant, vor allem ab Level 3. Wichtig ist es daher, wirklich immer Tests erzeugen zu lassen, die generierten Tests sorgfältig zu prüfen und der KI nicht durchgehen zu lassen, diese im Zweifelsfall auszuschalten oder zu löschen, wenn ein Bug hartnäckig bestehen bleibt.

Dokumentation: KI-Systeme nutzen Dokumentation, um den Kontext zu verstehen. README-Dateien, Architektur-Dokumentation und Code-Kommentare helfen der KI, bessere Vorschläge zu machen. Hier hat sich das Markdown-Format durchgesetzt, oftmals gesammelt in einem docs/ Ordner. Aber auch eine Dokumentation im ARC42-Format wird von KIs kompetent verstanden und kann bei Bedarf direkt aktualisiert werden..

Team-Skills und Verständnis: Das Team muss verstehen, wie KI funktioniert und wo ihre Grenzen liegen. KI ist ein Werkzeug, kein Ersatz für Fachwissen. Entwickler müssen in der Lage sein, KI-Vorschläge kritisch zu prüfen. Außerdem ist es sinnvoll, die oben erwähnten Instruction Files im Team gemeinsam abzustimmen und permanent zu optimieren. Definition of Ready oder Definition of Done sind wieder einmal wichtige Leitplanken für guten Code und lauffähige und wartbare Software.

Security und Isolation: Spätestens ab Level 4, wenn Agentensysteme eigenständig arbeiten sollen, wird Sicherheit kritisch. Ein leistungsfähiger Agent sollte gegenüber dem Rechner, auf dem er läuft, abgeschottet werden. Containerisierung (z. B. mit Docker) ermöglicht es dem Agenten, frei Tools zu nutzen und Befehle auszuführen, ohne das Host-System zu gefährden. Andernfalls riskierst Du, dass der Agent durch Prompt Injection dazu gebracht wird, Sicherheitslücken zu erstellen oder geheime Daten nach außen zu schicken. Derartige Angriffsszenarien sind bereits vorgekommen. Ein Agent darf wirklich nur auf diejenigen Daten Zugriff haben, die für das Projekt benötigt werden.

Ein konkrete und sehr handhabbare Lösung für diese Isolierung ist Agentbox, ein Open-Source-Tool, das ein Kollege von mir erstellt hat. Agentbox macht Claude Code und OpenCode sicher in Containern nutzbar. Der Agent kann in einer isolierten Umgebung arbeiten, ohne dass Entwickler Angst haben müssen, dass etwas schiefgeht.

Gesichertes KI-Modell: Im Level 1 und vielleicht noch im Level 2 ist es akzeptabel, mit kostenfreien KI-Modellen zu arbeiten. Aber wenn die von der KI verarbeiteten Code-Blöcke größer werden, ist es wichtig, sich damit zu beschäftigen, welche Zusagen hinsichtlich der Datensicherheit der KI-Provider macht. So sollen die Daten nicht zu Trainingszwecken und auch nicht anderweitig als zur Generierung von Antworten verarbeitet werden. Eine bezahlte Subscription ist Pflicht, nicht nur wegen der Menge an Tokens. Schaut hier unbedingt in die Nutzungsbedingungen der Anbieter, und vergleicht auch die Preislisten.

Fazit

Das Fünf-Level-Modell der KI-gestützten Entwicklung beinhaltet an sich keine Wertung. Level 3 ist nicht automatisch besser als Level 2, jedes Level hat seinen Platz, je nach Kontext, Aufgabe und Anforderungen. Was sich allerdings mit jedem Level steigert, ist die Effizienz. Wer auf Level 4 arbeitet, kann deutlich schneller komplexe Features umsetzen als jemand auf Level 1. Aber das geht nur, wenn die Voraussetzungen stimmen: sauberer Code, Tests, Dokumentation und ein Team, das die KI sinnvoll einzusetzen weiß.

Level 5 – autonome Produktentwicklung ohne manuelle Code-Review – ist wie beim autonomen Fahren: technisch denkbar, aber derzeit noch nicht erreicht. Bis dahin bleibt der Mensch ein unverzichtbarer Teil des Prozesses.

Das Modell dient der Orientierung. Es hilft dabei, eine gemeinsame Sprache zu finden, realistische Erwartungen zu setzen und die richtige Stufe der KI-Unterstützung für die eigene Situation zu wählen. Und genau das hilft uns, wenn wir über die Zukunft der Softwareentwicklung sprechen.

Beitrag teilen

//

Weitere Artikel in diesem Themenbereich

Entdecke spannende weiterführende Themen und lass dich von der codecentric Welt inspirieren.

//
Jetzt für unseren Newsletter anmelden

Alles Wissenswerte auf einen Klick:
Unser Newsletter bietet dir die Möglichkeit, dich ohne großen Aufwand über die aktuellen Themen bei codecentric zu informieren.