Beliebte Suchanfragen
//

Resilienz in der Softwareentwicklung: Warum wir im KI-Zeitalter einen neuen Autopiloten brauchen

25.3.2026 | 4 Minuten Lesezeit

Resilienz in der Softwareentwicklung: Warum wir im KI-Zeitalter einen neuen Autopiloten brauchen

In der modernen IT-Landschaft ist „Resilienz“ längst zu einem Modewort geworden. Jeder möchte sie haben, viele behaupten, sie zu besitzen, doch nur wenige können sie präzise definieren. Oft wird Resilienz mit bloßer Stabilität oder Hochverfügbarkeit verwechselt. Doch wie mein Kollege Uwe Friedrichsen treffend formuliert: „Etwas ist nicht resilient, nur weil es über einen längeren Zeitraum hinweg funktioniert.“ Wahre Resilienz zeigt sich erst dann, wenn das Unerwartete eintritt – wenn die Annahmen unserer Systemarchitektur durch die Realität widerlegt werden.

In diesem Artikel möchte ich beleuchten, warum der Weg zur echten Resilienz so steinig ist, welche Rolle die Konzepte von Uwe Friedrichsen dabei spielen und wie moderne KI-gestützte Plattformen wie IBM Concert uns dabei helfen können, diesen Weg nicht nur zu beschreiten, sondern zu automatisieren.

Das Missverständnis der Stabilität Viele Unternehmen befinden sich auf einer Reise, die Uwe Friedrichsen in seiner Blogserie „Der lange und steinige Weg zur Resilienz“ detailliert beschreibt. Oft bleiben sie jedoch in den frühen Stadien stecken. Sie erreichen die „Feature-Vollständigkeit“ oder ein gewisses „Plateau der Stabilität“, auf dem das System unter normalen Bedingungen zuverlässig läuft. Doch Stabilität ist lediglich die Abwesenheit von Fehlern innerhalb der erwarteten Parameter.

Resilienz hingegen ist die Fähigkeit eines Systems, sich an unerwartete Störungen anzupassen. Denken wir an die globalen Lieferketten: Sie funktionierten jahrelang perfekt, bis ein einziges Schiff im Suezkanal die gesamte Weltwirtschaft aus dem Takt brachte. In der IT ist es nicht anders. Ein latenter Race Condition in einem DNS-Management-System oder eine plötzlich auftretende kritische Sicherheitslücke kann Systeme lahmlegen, die zuvor als „stabil“ galten.

Stabilität: Fehlervermeidung - Verhalten - Bricht bei unerwarteten Lasten/Fehlern zusammen Robustheit: Fehlertoleranz (bei bekannten Fehlern) - Nutzt Retries/Timeouts für bekannte Szenarien Antifragilität: Lernen aus Störungen - Wird durch Stressoren und Fehler besser Resilienz: Adaptive Kapazität - Passt sich an unbekannte, neue Bedrohungen an

Die adaptive Kapazität: Der Flaschenhals der Resilienz

Warum ist echte Resilienz so schwer zu erreichen? Der Grund liegt in der benötigten** adaptiven Kapazität**. Um auf das Unerwartete reagieren zu können, benötigt ein System (oder die Organisation dahinter) Ressourcen, die nicht bereits zu 100 % durch den Normalbetrieb ausgelastet sind. In Zeiten von Fachkräftemangel und explodierender Komplexität durch Microservices und Hybrid-Cloud-Umgebungen ist diese Kapazität jedoch Mangelware.

Hier stoßen rein manuelle Ansätze an ihre Grenzen. Wenn ein Team 80 Stunden benötigt, um eine kritische Sicherheitslücke zu patchen (die sogenannte „Median Time To Patch“), bleibt keine Zeit für proaktive Resilienz-Strategien. Wir verwalten den Mangel, anstatt die Zukunft zu gestalten.

IBM Concert: Der KI-gestützte Autopilot für die Resilienz

An dieser Stelle kommt die Technologie ins Spiel, die ich gerne als den „Autopiloten der IT“ bezeichne. IBM Concert ist eine KI-gestützte Plattform, die genau dort ansetzt, wo menschliche Kapazitäten enden. Sie korreliert Daten aus isolierten Systemen – von der Observability über Security bis hin zur Compliance – und bietet eine anwendungsorientierte Sicht auf den Resilienzstatus.

Ein beeindruckendes Beispiel für die Wirksamkeit dieses Ansatzes liefert die Deutsche Telekom. In einer jüngsten Partnerschaft mit IBM konnte das Unternehmen die Zeit für Patch-Prozesse massiv reduzieren. Durch die intelligente Orchestrierung und Automatisierung sank die „Median Time To Patch“ von 80 Stunden auf nur noch 8 Stunden.

*„Sichere Betriebssysteme bilden die Grundlage für alle Anwendungen. Beim Patchen spielt der Zeitfaktor im KI-Zeitalter eine entscheidende Rolle. Wer verfügbare Updates sofort und automatisch nutzt, kann Sicherheitsrisiken senken.“ – Dr. Peter Leukert, Group CIO der Deutschen Telekom.

Von der Beobachtung zur Handlung (AIOps)

Als Head of Observability bei codecentric sehe ich täglich, dass Daten allein nicht ausreichen. Wir haben genug Dashboards; was wir brauchen, sind Handlungsempfehlungen. IBM Concert nutzt KI-Agenten, um nicht nur Probleme aufzuzeigen, sondern proaktiv Abhilfemaßnahmen vorzuschlagen oder sogar automatisiert durchzuführen.

Dies ist der entscheidende Schritt von der Robustheit zur Resilienz:

Erkennen: Concert versteht die Topologie der Anwendung und erkennt Schwachstellen in Echtzeit. Priorisieren: Die KI bewertet das tatsächliche Geschäftsrisiko, anstatt nur statische CVSS-Scores zu listen. Handeln: Durch automatisierte Workflows werden Patches eingespielt oder Konfigurationen angepasst, bevor ein Ausfall entsteht.

Fazit: Resilienz ist kein Zustand, sondern ein Prozess

Wahre Resilienz in der Software-Resilienz bedeutet, dass wir unsere Systeme so gestalten, dass sie mit dem Unbekannten umgehen können. Die theoretischen Grundlagen von Uwe Friedrichsen geben uns den Kompass vor: Wir müssen über die reine Stabilität hinausdenken und adaptive Kapazitäten schaffen.

Werkzeuge wie IBM Concert sind die Maschinen, die uns diesen Weg ebnen. Sie nehmen uns die repetitive Last des Patch-Managements und der Risikoanalyse ab, damit wir uns auf das Wesentliche konzentrieren können: den Aufbau von Systemen, die nicht nur überleben, sondern in einer volatilen Welt florieren.

Wenn Sie wissen möchten, wie Sie den „Autopiloten“ für Ihre IT-Infrastruktur aktivieren können, lassen Sie uns ins Gespräch kommen. Die Reise zur Resilienz mag steinig sein, aber mit der richtigen Ausrüstung ist der Gipfel erreichbar.

Beitrag teilen

//

Weitere Artikel in diesem Themenbereich

Entdecke spannende weiterführende Themen und lass dich von der codecentric Welt inspirieren.

//
Jetzt für unseren Newsletter anmelden

Alles Wissenswerte auf einen Klick:
Unser Newsletter bietet dir die Möglichkeit, dich ohne großen Aufwand über die aktuellen Themen bei codecentric zu informieren.