Einführung in Computer Vision mit OpenCV und Python

5.6.2017 | 13 Minuten Lesezeit

Computer Vision ist eine spannende Disziplin in der Informatik. Die Forschung beschäftigt sich bereits seit Jahrzehnten mit dem Thema, aber erst durch aktuelle Fortschritte in den Bereichen Big Data und künstliche Intelligenz ergeben sich beeindruckende neue Möglichkeiten. Mittels Cloud-Technologien sowie neuen GPUs wird die Verarbeitung immer billiger und schneller. „Pay-as-you-go-Modelle“ erlauben einen „risikolosen“ Einstieg – ohne große Vorabinvestitionen. Kleine Embedded Systeme (z.B. NVIDIA Jetson) ermöglichen innovative, mobile und smarte Geräte mit hoher Rechenleistung bei geringem Stromverbrauch.

Was heute mit Computer Vision möglich ist, könnt ihr in unserem neuen codecentric.AI YouTube-Channel sehen. Hier fliegen wir mit einer Drohne durch unser Büro in Solingen und werten die Bilder mit Object Detection Algorithmen aus (am besten auf Fullscreen anschauen!): Hier geht es direkt zum Video

Wer mehr über künstliche Intelligenz erfahren möchte, dem empfehlen wir unsere neue Themen-Seite zum Thema KI: https://www.codecentric.de/leistungen/kuenstliche-intelligenz

Vor vielen Millionen Jahren, kam es in der Evolution zur kambrischen Explosion. Dabei ist in einem „relativ kurzen“ Zeitraum die Artenvielfalt auf der Erde „explodiert“. Einige Forscher sind der Meinung, dass eine Ursache dafür die Entwicklung des Sehens war, und dass wir heute im Bereich Computer Vision auf einem ähnlichen Weg sind [1]. Allerdings entwickeln sich die visuellen Fähigkeiten von Computern sehr, sehr viel schneller, als es in der Evolution der Fall war.

Autos, Roboter und Drohnen beginnen zu verstehen, was in Bildern und Videos zu sehen ist. Die Schnittstelle „Computer Vision“ zwischen Mensch und Maschine wird in den nächsten Jahren wahrscheinlich stark an Bedeutung gewinnen.

Dieser Artikel ist der erste in einer Serie und soll Interessierten einen schnellen Einstieg in das Thema Computer Vision ermöglichen. Am Beispiel einer interaktiven Drohne versuche ich zu erklären, wie man (mit einfachen Mitteln) Objekte und Personen in einem Video erkennen kann

… hier die Demo aus unserem Projekt http://cvdrone.de:

OpenCV, Python und verfügbare Frameworks – Getting Started

Es existieren diverse Frameworks für Computer Vision. Das wohl populärste ist OpenCV (http://www.opencv.org ) und ebenfalls empfehlenswert ist dlib (http://dlib.net ).

“ … OpenCV is released under a BSD license and hence it’s free for both academic and commercial use. It has C++, C, Python and Java interfaces and supports Windows, Linux, Mac OS, iOS and Android. OpenCV was designed for computational efficiency and with a strong focus on real-time applications. Written in optimized C/C++, the library can take advantage of multi-core processing. Enabled with OpenCL, it can take advantage of the hardware acceleration of the underlying heterogeneous compute platform. …“ – http://www.opencv.org

Je nach Vorliebe/Vorwissen kann man damit auf unterschiedlichsten Plattformen entwickeln. Für einen leichten Einstieg empfehle ich, eine Entwicklungs-Umgebung auf Ubuntu 16.04 mit Python 3.x und OpenCV 3.x aufzubauen. Auf meinem Macbook verwende ich eine virtuelle Maschine auf Basis von vmware Workstation (hier funktioniert die Integration von externer Hardware im Vergleich zu anderen Virtualisierungs-Lösungen oft stabiler). Die Komponenten lassen sich auch auf anderen Betriebssystemen zum Laufen bringen – hier ist evtl. aber fortgeschrittenes „Versions-Konflikt-und-Dependency-Gefummel“ notwendig.

dlib ist zwar bei weitem nicht so umfangreich wie OpenCV, aber manche Funktionen sind einfach sehr gut – beispielsweise die „Facial Landmark Detection“ oder der Correlation Tracker … Siehe hier

Weiterhin gibt es einen OpenVX-Standard. Dieser macht sich zur Aufgabe, Grafik-Hardware zu abstrahieren und diese damit besser nutzbar zu machen. Eine Implementierung davon ist NVIDIA’s VisionWorks (TM). Hier wurde viel Aufwand betrieben, um die wichtigsten CV-Algorithmen speziell für die Ausführung auf GPUs zu optimieren. Wer viel Performance bei geringem Stromverbrauch sucht, sollte sich VisionWorks genauer anschauen.

GPU oder CPU – ist das hier die Frage?

Einige Algorithmen basieren auf CUDA zur Nutzung der GPU. Dafür benötigt man eine Grafikkarte von NVIDIA. Hat man diese nicht, kann man auf AWS eine GPU-Instanz mieten oder man besorgt sich ein Entwickler-Board (z.B. NVIDIA Jetson TK1). Für einen ersten Einstieg ist das nicht unbedingt notwendig – aufwändigere Algorithmen (neuronale Netze, Deep Learning etc.) laufen mit Hardware-Beschleunigung aber oft um Größenordnungen schneller. In diesem Bereich fährt man übrigens nicht unbedingt gut, wenn man auf latest-greatest Versionen setzt. Evtl. ist ein älteres Ubuntu und ein nicht ganz aktueller Linux Kernel nötig, um alle Treiber und Abhängigkeiten kompilieren zu können. Im AWS Marketplace findet man GPU-Instanzen, bei denen bereits OpenCV, Python, CUDA etc. lauffähig vorinstalliert sind (basierend auf Ubuntu 14.04 – Stand Mai 2017).

Installation von OpenCV mit Python Wrappern

Es gibt im Internet viele Anleitungen, wie man OpenCV installieren kann – ich werde daher nicht das Rad neu erfinden, sondern verweise auf den lesenswerten Blog von Adrian Rosebrock [3]. Also zunächst eine Ubuntu VM aufsetzen und dann folgenden Artikel Schritt für Schritt nachvollziehen: http://www.pyimagesearch.com/2016/10/24/ubuntu-16-04-how-to-install-opencv/

OpenCV ist zwar in C geschrieben, mir ist aber der Einstieg mit den Python Wrappern leichter gefallen. Je nach Vorwissen kommt man damit deutlich schneller zu funktionierenden Prototypen. Der Performance-Unterschied ist dabei in vielen Fällen vernachlässigbar gering.

Computer Vision Basics

Der Fortschritt im Bereich Computer Vision passiert zwar vor allem mit Hilfe von neuronalen Netzen und Deep Learning, für einen Einstieg in das Thema sollte man sich vielleicht aber zunächst mit den Basics beschäftigen.

Hier ein Video mit einer kurzen Darstellung der Basics, sowie Code-Beispielen, wie wir den simplen Objekt-Detektor im Drohnen-Video realisiert haben:

Bilder sind multidimensionale Arrays

Ein Bild wird im Computer als multidimensionaler Array repräsentiert. In Python ist der Datentyp „numpy“ in C ist es „Mat“. Die Koordinate (0, 0) ist in der linken oberen Ecke. Bei einem farbigen Bild stehen an jeder Koordinate 3 Farbwerte. Je nach Auflösung und Farbraum können die Arrays unterschiedlich groß sein. Die Farbwerte reichen jeweils von 0 bis 255. In OpenCV gibt man als erstes die Y und dann die X Koordinate an (das ist teilweise verwirrend).

Folgender Code liest ein Bild ein und führt einige Basic-Operationen auf Pixel-Ebene aus:

1import cv2
2 
3# lese Bild von Festplatte
4image = cv2.imread("test.png")
5 
6# lese Farbwerte an Position y, x
7y = 100
8x = 50
9(b, g, r) = image[y, x]
10 
11# gib Farbwerte auf Bildschirm aus
12print(b,g,r)
13 
14# setze Farbwerte auf Rot (im BGR-Farbraum)
15image[y, x] = (0, 0, 255)
16 
17# waehle ein Region auf Interest an Punkt: (y, x) mit Dimension 50x50 Pixel
18region_of_interest = image[y:y+50, x:x+50]
19 
20# zeige Bild in Fenster an
21cv2.imshow("Bild", image)
22 
23# zeige Region of Interest an
24cv2.imshow("ROI", region_of_interest)
25 
26# setze ROI auf Gruen
27region_of_interest[:, :] = (0, 255, 0)
28 
29# die ROI ist ein "Zeiger" auf das urspruenglich geladene Image. Es enthaelt nun eine gruene Box!
30cv2.imshow("Bild modifiziert", image)
31 
32# warte auf Tastendruck (wichtig, sonst sieht man das Fenster nicht)
33cv2.waitKey(0)

Farbräume

Der default-Farbraum in OpenCV ist BGR – also Blue Green Red. Normalerweise kennt man es eher als RGB – also auch hier wieder leichte Verwirrung am Anfang. Aber dafür gibt es einen guten Grund: „War so, ist so und wird daher so bleiben!“ Je nachdem in welchem Farbraum man arbeitet, hat dies Vor- und Nachteile für die jeweilige Applikation. Beispielsweise ist ein Farbraum wie HSV leichter zu handhaben, wenn man nach bestimmten Farben filtert. Möchte ich im BGR-Farbraum alles filtern, was irgendwie „orange“ ist, ist das nicht so leicht zu implementieren – in HSV ist das deutlich einfacher. Auch ist dieser Farbraum z.B. nicht so anfällig für Änderungen der Helligkeit (durch Wolken/Sonne). Konvertiert man ein Bild in Graustufen, hat es nur noch einen Farb-Kanal. Dies macht zum Beispiel Sinn, um Datenmengen und Rechenzeit zu reduzieren.

Hier wieder ein kleines Beispiel:

1import cv2
2 
3# initialisiere WebCam
4cam = cv2.VideoCapture(0)
5 
6# lese ein Bild von der WebCam
7ret, image = cam.read()
8 
9# konvertiere das Bild in Graustufen
10image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
11 
12# zeige das Bild an
13cv2.imshow("Bild modifiziert", image)
14 
15# warte auf Tastendruck (wichtig, sonst sieht man das Fenster nicht)
16cv2.waitKey(0)

Gängige Algorithmen / Methoden

In der Computer Vision muss man teilweise etwas um die Ecke denken, um komplexere Funktionen zu implementieren. Der Computer versteht ja erstmal nicht wirklich, was in einem Bild zu sehen ist, sondern er sieht nur Zahlen, die Farbwerte repräsentieren. Ich möchte hier einige Methoden hervorheben, die zum Grundwerkzeug des Computer Visionärs gehören …

Thresholding

Thresholding wird häufig verwendet, um Bereiche eines Bildes, die bestimmte (Farb-)Eigenschaften haben, zu filtern. Es gibt verschiedene Thresholding-Methoden – eine davon ist „Binary Thresholding“. Dabei definiert man einen Schwellwert, und man erhält als Output ein Schwarz/Weiß-Bild. Pixel, die den Schwellwert überschreiten, sind weiß – alle anderen Pixel sind schwarz. Damit kann man dann zum Beispiel alle Pixel im Bild „suchen“, die orange sind (so wie der Marker in unserem Demo Video).

Diese Thresholding-Masken sind dann oft Grundlage für weitere Analysen.

Das Video dazu und der Code zu dem Video:

1## ermittle Farbwerte eines Tennisballs
2 
3import cv2
4 
5# initialisiere Webcam
6cam = cv2.VideoCapture(0)
7 
8# definiere Region of Interest
9x, y, w, h = 400, 400, 100, 100
10 
11# zeige Stream von WebCam an
12while cam.isOpened():
13    # lese frame von WebCam
14    ret, frame = cam.read()
15 
16    # konvertiere Frame in HSV-Farbraum, um besser nach Farb-Ranges filtern zu können
17    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
18 
19    # zeichne Rechteck in Bild
20    cv2.rectangle(frame, (x, y), (x+w, y+h), (255, 255, 255), thickness=1)
21 
22    # gebe Hue-Wert an der linken oberen Ecke der ROI aus, um Farbwerte des Tennis balls zu ermitteln:
23    cv2.putText(frame, "HSV: {0}".format(frame[y+1, x+1]), (x, 600),
24                cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), thickness=2)
25 
26    # zeige Frame an
27    cv2.imshow("frame", frame)
28 
29    # warte auf Tastendruck (sonst sieht man das Fenster nicht)
30    key = cv2.waitKey(1) & 0xff
31 
32    # wenn ESC gedrückt, beende Programm
33    if key == 27:
34        break

Mit den Farbwerten filtern wir nach Range:

1import cv2
2 
3# initialisiere Webcam
4cam = cv2.VideoCapture(0)
5 
6# definiere Farb-Ranges
7lower_yellow = (18, 100, 210)
8upper_yellow = (40, 160, 245)
9 
10# zeige Stream von WebCam an
11while cam.isOpened():
12    # lese Frame von WebCam
13    ret, frame = cam.read()
14 
15    # konvertiere Frame in HSV-Farbraum, um besser nach Farb-Ranges filtern zu können
16    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
17 
18    # filtere Bild nach Farbgrenzen
19    mask = cv2.inRange(frame, lower_yellow, upper_yellow)
20 
21    # zeige Frame an
22    cv2.imshow("threshold", mask)
23 
24    # warte auf Tastendruck (sonst sieht man das Fenster nicht)
25    key = cv2.waitKey(1) & 0xff
26 
27    # wenn ESC gedrückt, beende Programm
28    if key == 27:
29        break

Konturen finden

Für Schwarz/Weiß-Bilder existieren effiziente Algorithmen, um darin Konturen zu finden. Diese erkennen zusammenhängende Pixel und gruppieren diese zu Blobs. Zusätzlich kann man diverse Eigenschaften dieser Konturen für weitere Analysen verwenden – zum Beispiel die Fläche oder die Kantenlänge der Kontur, und man kann sich eine Bounding Box zurückgeben lassen. In unserem Demo-Video verwenden wir dies, um die Position des orangenen Markers zu finden – dabei suchen wir nur Konturen heraus, die eine gewisse Mindestfläche haben (so können wir einzelne „noisy“ Pixel herausfiltern, die im Orange-Bereich liegen).

Hier versuchen wir jetzt den Tennisball im Bild zu finden und filtern die noisy Pixel heraus.

1import cv2
2 
3# initialisiere Webcam
4cam = cv2.VideoCapture(0)
5 
6# definiere Farb-Ranges
7lower_yellow = (18, 100, 210)
8upper_yellow = (40, 160, 245)
9 
10# zeige Stream von WebCam an
11while cam.isOpened():
12    # lese frame von WebCam
13    ret, frame = cam.read()
14 
15    # konvertiere Frame in HSV-Farbraum, um besser nach Farb-Ranges filtern zu können
16    frame = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
17 
18    # filtere Bild nach Farbgrenzen
19    mask = cv2.inRange(frame, lower_yellow, upper_yellow)
20 
21    # finde Konturen in der Maske, die nur noch zeigt, wo gelbe Pixel sind:
22    _, contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL,
23                                      cv2.CHAIN_APPROX_SIMPLE)
24 
25    # suche die größte Kontur heraus (diese ist höchst wahrscheinlich der Tennisball)
26    # dazu nehmen wir die Fläche der Kontur:
27    if len(contours) > 0:
28        tennis_ball = max(contours, key=cv2.contourArea)
29 
30        # zeichne die Bounding box des Tennisballs in das Video-Bild ein:
31        x, y, w, h = cv2.boundingRect(tennis_ball)
32        cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), thickness=3)
33 
34    # zeige Frame an
35    cv2.imshow("frame", frame)
36 
37    # warte auf Tastendruck (sonst sieht man das Fenster nicht)
38    key = cv2.waitKey(1) & 0xff
39 
40    # wenn ESC gedrückt, beende Programm
41    if key == 27:
42        break

Background Subtraction

Wenn man eine statische Kamera hat, gibt es diverse (relativ einfache) Methoden, um Bewegung in einem Bild zu erkennen. Man geht dann davon aus, dass das was sich nicht bewegt der Hintergrund ist. Einfach gesagt subtrahiert man die Pixel-Farb-Werte vom aktuellen Frame mit denen vom vorhergehenden Frame. Dort, wo sich nichts verändert hat, ergibt dies 0 – also keine Bewegung. Dieses Modell ist aber für die Praxis meist zu simpel, denn durch leichte Veränderungen der Lichtverhältnisse oder Umwelteinflüsse, wie z.B. Wind erhält man zu viel „Noise“. Über die letzten Jahrzehnte wurde eine Vielzahl von Algorithmen entwickelt, die alle ihre Vor- und Nachteile haben. Einen „One-Fits-All“-Algorithmus, der in allen Situationen 100% funktioniert, gibt es nicht. Ein gute Übersicht über bekannte Verfahren gibt es hier: https://github.com/andrewssobral/bgslibrary/wiki/List-of-available-algorithms

Ein häufig genutzter Algorithmus setzt auf ein Gaussian Mixture Model (GMM) oder MoG2, wie es in OpenCV genannt wird. Neuere Algorithmen sind zum Beispiel SubSENSE [2]

Hier ein kurzes Beispiel Video.

Detektoren

Bei OpenCV oder dlib sind bereits diverse „Standard“-Detektoren integriert. Ein Programm, das in einem Webcam Stream Gesichter finden soll, ist in ein paar Zeilen Python schnell zusammengehackt. Taugen solche Programme auch für praktische Einsatzzwecke? – Wohl eher nicht. Die Standard-Detektoren haben hohe Fehlerraten (viele False Positives und False Negatives). „Klassisch“ benutzt man vor allem folgende Methoden, um Gesichter in einem Bild zu finden…

Haar Cascade Classifier:

Sie gehen zurück auf ein Paper von Viola und Jones aus dem Jahr 2000. Der Algorithmus ist relativ schnell – man kann ihn in abgespeckter Auflösung und Framerate auf einem Raspberry Pi laufen lassen. OpenCV bringt bereits einige vortrainierte Haar Cascade Classifier mit – unter anderem um Gesichter von Menschen oder Katzen zu erkennen. Allerdings erkennt dieser Classifier auch regelmäßig die Rückenlehne meines Stuhls als Gesicht.

HOG Detektoren:

HOG steht für Histogram of oriented Gradients. Dabei wird ein Bildausschnitt in ein Grid unterteilt. Für jede Box des Grids werden die dominanten Kanten ermittelt und in Zahlenwerte für die Ausrichtung der dieser Kanten umgewandelt. Auf diesen Werten wird dann ein Modell trainiert. Die benötigte Rechenleistung ist dabei deutlich höher als bei Haar Cascade Classifiern – man kann damit aber unter Umständen bessere Detektions-Ergebnisse erzielen.

Eine vereinfachte Visualisierung eines HOG Feature Vektors kann man sich so vorstellen. Die dominanten Gradienten in jeder Box des Grids sind insgesamt eindeutig als Gesicht zu erkennen:

   ______
  / _  _ \
 |   /    |
 |   __   | 
  \ ____ /

In unserem Drohnen-Demo-Video verwenden wir einen Haar Cascade Classifier, der nur nach Gesichtern in der Nähe des detektierten orangenen Marker sucht. Damit können wir die Zahl der False Negatives so weit reduzieren, dass wir insgesamt ein gutes Ergebnis erzielen.

Hier der Video-Ausschnitt, zum Facedetektor in der Nähe des Markers:

Ausblick Deep Learning

Zum Schluss möchte ich noch einen kleinen Ausblick auf das Thema Deep Learning geben. Viele Forscher beschäftigen sich mit dem Gebiet, und man findet regelmäßig neue beeindruckende Demos und Algorithmen auf youtube. Einer davon ist YOLO [4]. Damit ist nicht das Jugendwort aus 2012 gemeint, sondern es steht für „You Only Look Once“. Dahinter steckt ein Convolutional Neural Network, das in Echtzeit (auf entsprechender Hardware) verschiedenste Klassen von Objekten erkennen kann.

Wir haben den Algorithmus einmal ausprobiert. Dazu haben wir unsere Drohne durch unser Büro fliegen lassen. Auf AWS haben wir eine GPU-Instanz gemietet und dort YOLO installiert. Wir haben dazu ein vorkonfiguriertes „TensorFlow Image“ aus dem Amazon Marketplace gestartet und sind der Anleitung auf https://pjreddie.com/darknet/yolo/ gefolgt. Man kann natürlich auch selbst eine Instanz aufsetzen – aber alle Abhängigkeiten zum Laufen zu bringen, ist nicht trivial. Wer es probieren möchte, hier eine Starthilfe: http://cvdrone.de/install-opencv-on-aws-with-cuda.html . An dieser Stelle haben wir auch ganz deutlich gemerkt, wieviel Unterschied eine GPU bringt: Während der Algorithmus auf CPU etwa 15-20 Sekunden pro Frame rechnete, brauchte er mit GPU-Unterstützung gerade noch 6ms für die gleiche Arbeit.

Das Ergebnis unseres Drohnen-Fluges kann man hier sehen.

Weitere interessante Beispiele sind

„Convolutional Pose Machines „
„Style Transfer „
(… und noch viele mehr …)

Wer sich tiefer in das Thema einarbeiten möchte, dem empfehle ich das Buch „Deep Learning“ von Ian Goodfellow et al. Laut dem Buch verdoppeln sich Artificial Neural Networks alle 2,4 Jahre, und 2015 lag die Anzahl der Neuronen der größten Netzwerke wie GoogLeNet zwischen dem Gehirn einer Biene und dem eines Froschs. Dennoch waren einige spezialisierte ANNs dem Menschen in ganz bestimmten Aufgaben bereits überlegen. Geht die Entwicklung so weiter, erwartet man, dass die größten neuronalen Netzwerke um 2056 in der Größenordnung des menschlichen Gehirns liegen werden.

Ich hoffe, dass ich mit diesem Artikel etwas Interesse für Computer Vision wecken konnte. Ich freue mich über Shares und Feedback (gerne über: https://twitter.com/moseroli ). Wenn du mit mir über Computer Vision sprechen möchtest, findest du mich bei Ask-the-Expert .

References

[1] – Fei-Fei Li – Professor at Stanford University. https://youtu.be/qLCKtc9moks
[2] – SuBSENSE – https://www.ncbi.nlm.nih.gov/pubmed/25494507
[3] – http://pyimagesearch.com
[4] – YOLO – https://pjreddie.com/darknet/yolo/

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Oliver Moser

Service Lead GenAI

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Tech Trends 2026 in Deutschland: KI operationalisieren statt hypen

Die wirtschaftliche Lage in Deutschland wird sich dieses Jahr nicht schlagartig verbessern – sie bleibt angespannt, der Kostendruck hoch. Zusätzlich belasten Fachkräftemangel, demografischer Wandel und Fragen der digitalen Souveränität den Markt.Was ...

Künstliche Intelligenz
Generative KI
IT-Security
Softwareentwicklung
Digitalisierung

28.1.2026 | 2 Minuten Lesezeit

Rainer Vehns

5 Minuten reden, ein Proof of Concept - unser KI-Experiment mit AI-Assisted...

TL;DR: Wie viel lässt sich aus einem fünfminütigen Gespräch herausholen? Wir haben es ausprobiert: Mit einem kurzen Interview, einem Transkript und AI-unterstützten Coding nach der BMAD-Methode entstand in kürzester Zeit ein nutzbarer Proof of Concept...

Generative KI
Künstliche Intelligenz
Softwareentwicklung
Digitalisierung
Prozessautomatisierung
Prozessmanagement
Agilität
Agile Methoden
Cloud
Handel
Versicherung
Euro-Cloud
Projektmanagement
Softwarearchitektur
LLM
NLP
Software-Modernisierung
Collaboration
Digitale Produktentwicklung
Mobile
Dokumentation
Framework
Produktmanagement
UX/UI
Dokumentenmanagement
Input-Management
Agile
Fullstack

28.1.2026 | 5 Minuten Lesezeit

Teoman Kinaci

Sven Heinz

5 Gründe, warum wir Entwickler Agentic Software Engineering falsch einsch...

Das ganze Jahr 2025 über tobte eine Art Grabenkrieg zwischen Softwareentwicklern des Pro- und des Anti-KI-Lagers. Wir sind per Definition die Experten für Softwareerstellung. Ironischerweise macht uns genau das aber auch höchst voreingenommen – und ist...

Generative KI
Künstliche Intelligenz

8.1.2026 | 5 Minuten Lesezeit

John Fletcher

Das Developer's-Dilemma: Den Übergang zum AI Engineering meistern

Liebe Softwareentwicklerin, lieber Softwareentwickler, bitte entscheide dich für eine der folgenden Optionen für das Jahr 2026 und darüber hinaus:a) Du stellst fest, dass deine Fähigkeiten veraltet sind, und wirst schließlich arbeitslos. b) Deine Gehaltserhöhungen...

Künstliche Intelligenz
Generative KI

1.1.2026 | 11 Minuten Lesezeit

John Fletcher

Effizientes Prompting: Wie Caching die Inputkosten um bis zu 90 % senkt

Das Zauberwort für eine dramatische Kostenreduktion bei LLM Inference lautet: Caching. Ähnlich wie beim Caching anderer Daten in Computersystemen geht es auch hier um das temporäre Zwischenspeichern von oft gebrauchten Informationen. Bei LLMs geht es...

LLM
Künstliche Intelligenz
Generative KI

11.12.2025 | 4 Minuten Lesezeit

Daniel Töws

Reifegradanalyse & Roadmap: Der Kompass für deine wirksame Daten- und ...

Dies ist Teil 2 unserer Blog-Serie: 7 Schritte zur wertstiftenden Daten- und KI-Strategie. Den ersten Teil der Blog-Serie könnt ihr hier lesen. Wie können wir die Möglichkeiten von Daten und KI bei uns voll ausschöpfen? Diese Frage hören wir in fast ...

Data
Data Science
Künstliche Intelligenz
Generative KI

10.12.2025 | 5 Minuten Lesezeit

Shirin Elsinghorst

Elena Rüdenauer

7 Schritte zur wertstiftenden Daten- und KI-Strategie: RRW-DECKO-Ansatz

Die erwarteten Wertbeiträge von Daten und KI sind groß – McKinsey (2023) schätzt das globale Potenzial auf bis zu 25,6 Billionen US-Dollar. Gleichzeitig berichten viele Unternehmen, mit denen wir sprechen, von ähnlichen Herausforderungen. Und dies best...

Data
Data Science
Datenschutz
Big Data
Generative KI
Künstliche Intelligenz

2.12.2025 | 6 Minuten Lesezeit

Shirin Elsinghorst

Elena Rüdenauer

DuckDB vs. DataFrame Bibliotheken

Hinweis: Der folgende Artikel wurde auf Englisch erstellt und nachträglich maschinell auf Deutsch übersetzt. Update 10.12.25 – Nach hilfreichen Hinweisen von Polars-Entwickler Thijs Nieuwdorp nach der ersten Veröffentlichung dieses Artikels konnten ...

MotherDuck
Data
Data Science
Python
Datenbank

1.12.2025 | 10 Minuten Lesezeit

Niklas Niggemann

AI Everywhere – Watt now?

„ChatGPT, was ist die Frage auf Antwort 42“ - „Perplexity, wie kocht man Leaky, Leaky Soup“ -„Dall-E, generiere ein Bild im Stil von Monet, das eine Küstenlandschaft zeigt, in der Katzen auf Einhörnern die Dünen entlang reiten.“ Jeder hat wahrscheinlich...

Generative KI
Künstliche Intelligenz
Nachhaltigkeit

12.11.2025 | 10 Minuten Lesezeit

Kai Mohrhenn

Vom Datenschatz zum Erkenntnissystem: Ein Multi‑Agenten‑Ansatz mit LLMs

Dieser Artikel ist der zweite Teil meiner Erfahrungen mit Projekten bei denen wir LLMs in Umgebungen mit großen, chaotischen Daten eingesetzt haben. Den ersten Teil findet ihr hier. Viele Unternehmen sitzen auf einem enormen Datenschatz – und können ...

LLM
Data
Data Science
Künstliche Intelligenz
NLP
Generative KI

29.10.2025 | 4 Minuten Lesezeit

Daniel Töws

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

Wer mit Daten arbeitet, kennt den Frust: Dateien, die sich nicht an ihr eigenes Schema halten. CSVs, deren Spalten plötzlich mehrere Werte mit zusätzlichen Trennzeichen enthalten. Datenlager, in denen Tausende Tabellen existieren – mit unvollständiger...

LLM
Data
Künstliche Intelligenz
NLP
Generative KI

27.10.2025 | 6 Minuten Lesezeit

Daniel Töws

Vom Entwickler zum KI-Agenten: Der neue API-Consumer als Persona

Einführung - Wieso Personas?Ein Blick auf den State of the API Report 2024 (Postman Inc, 2024) zeigt einen überwiegenden Anteil von "Engineer or Developer" als Hauptkonsumenten von APIs. Um jedoch zu verstehen, wer diese Entwickler*innen sind und welche...

API
Künstliche Intelligenz
UX/UI

4.9.2025 | 7 Minuten Lesezeit

Benny Burkert

Wie finde ich die richtigen Generative KI Use Cases? 5 Learnings aus der...

Generative KI, insbesondere die Verwendung von Large-Language-Models (LLMs), zieht derzeit mit enormer Geschwindigkeit in Unternehmen aller Branchen und Größen ein. Ob Retail, Insurance oder Public Sector, vom Start-up über den Mittelständler bis hin...

Generative KI
Künstliche Intelligenz
Produktmanagement
Digitale Produktentwicklung

3.9.2025 | 8 Minuten Lesezeit

Marc Pudelski

How-to: Dein lokaler Observability-Stack für Python mit OpenTelemetry,...

Fehlermeldungen ohne Kontext? Plötzliche Performance-Einbrüche? Wenn du eine Python-Anwendung betreibst, kennst du diese Probleme. Oft fehlt die nötige Transparenz, um schnell zu verstehen, was im Inneren deiner App wirklich vor sich geht. Dieser Artikel...

Python
Observability
DevOps
Container

11.8.2025 | 7 Minuten Lesezeit

Patrick Soschinski

Deployment von n8n und ngrok in Minikube

Deployment von n8n in minikube und ngrok Seit einigen Monaten sorgt das Low-Code-Integrationstool n8n für Gesprächsstoff in der Tech-Welt. Angetrieben vom aktuellen Hype um KI-Agenten hat sich das Tool zum Liebling vieler Automatisierungsfans entwickelt...

DevOps
Kubernetes
Künstliche Intelligenz
Integration
Framework

11.8.2025 | 6 Minuten Lesezeit

Benjamin Lüdicke

Vibe coding – Was nun?

Kann man mit KI wirklich Anwendungen erzeugen, ohne selbst coden zu können, mit einem Bruchteil des Aufwands und der Zeit? "Gib dich dem Vibe hin! Erstelle Software nur mit natürlicher Sprache! GenAI ist der Builder. Hör auf, dich zu beschweren und fang...

Künstliche Intelligenz
Generative KI

12.4.2025 | 9 Minuten Lesezeit

Goetz Markgraf

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Am 27. Januar 2025 erlebte die Technologiebörse einen unerwarteten Einbruch: Der NVIDIA-Aktienkurs fiel um über 17%, wodurch der Konzern zeitweilig fast 600 Milliarden US-Dollar an Börsenwert verlor und damit einen neuen historischen Rekord am Aktienmarkt...

Künstliche Intelligenz
Generative KI
LLM

29.1.2025 | 8 Minuten Lesezeit

Daniel Ladischenski

Wie wir eine KI mit wenigen Worten hacken können

Wie wir eine KI mit wenigen Worten hacken können Künstliche Intelligenz (KI) hat in den letzten Jahren einen erstaunlichen Wandel durchgemacht und ist mittlerweile in vielen Lebensbereichen präsent. Ob in Form von Chatbots, die uns bei alltäglichen Fragen...

IT-Security
Künstliche Intelligenz

27.1.2025 | 4 Minuten Lesezeit

Mehmet Avci

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

In einem gemeinsamen Projekt haben Tom Scholz und ich Machine Learning (ML) Services gebaut, um einem Kunden bei der Analyse von Dokumenten zu helfen. Eine Proof-Of-Concept Lösung war schnell gebaut, die es nun zu operationalisieren gilt. Hierbei war...

Machine Learning
Python
Data
Data Science

12.9.2024 | 27 Minuten Lesezeit

Patrick Soschinski

Tom Scholz

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

Künstliche Intelligenz ist heutzutage in aller Munde. Die Einsatzgebiete sind vielfältig, der "WOW-Faktor" immer gegeben und das Potenzial noch lange nicht ausgeschöpft. Wo wir heute in vielen Bereichen schon unsere früheren Erwartungen übertroffen ...

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

Einführung in Computer Vision mit OpenCV und Python

OpenCV, Python und verfügbare Frameworks – Getting Started

GPU oder CPU – ist das hier die Frage?

Installation von OpenCV mit Python Wrappern

Computer Vision Basics

Bilder sind multidimensionale Arrays

Farbräume

Gängige Algorithmen / Methoden

Thresholding

Konturen finden

Background Subtraction

Detektoren

Haar Cascade Classifier:

HOG Detektoren:

Ausblick Deep Learning

References

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Artikel in diesem Themenbereich

Tech Trends 2026 in Deutschland: KI operationalisieren statt hypen

5 Minuten reden, ein Proof of Concept - unser KI-Experiment mit AI-Assisted...

5 Gründe, warum wir Entwickler Agentic Software Engineering falsch einsch...

Das Developer's-Dilemma: Den Übergang zum AI Engineering meistern

Effizientes Prompting: Wie Caching die Inputkosten um bis zu 90 % senkt

Reifegradanalyse & Roadmap: Der Kompass für deine wirksame Daten- und ...

7 Schritte zur wertstiftenden Daten- und KI-Strategie: RRW-DECKO-Ansatz

DuckDB vs. DataFrame Bibliotheken

AI Everywhere – Watt now?

Vom Datenschatz zum Erkenntnissystem: Ein Multi‑Agenten‑Ansatz mit LLMs

LLMs im Data Engineering: Wie wir chaotische Daten in verlässliche Ergebnisse...

Vom Entwickler zum KI-Agenten: Der neue API-Consumer als Persona

Wie finde ich die richtigen Generative KI Use Cases? 5 Learnings aus der...

How-to: Dein lokaler Observability-Stack für Python mit OpenTelemetry,...

Deployment von n8n und ngrok in Minikube

Vibe coding – Was nun?

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Wie wir eine KI mit wenigen Worten hacken können

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

Jetzt für unseren Newsletter anmelden