GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil 1)

14.6.2024 | 7 Minuten Lesezeit

Als Full Stack EntwicklerIn gibt es heutzutage wohl genug Themenkomplexe zur Einarbeitung. Ob das nächste Frontend-Framework des Jahres, die neue Backend-Technologie, ein weiterer Security-Scanner oder doch nur eine weitere Cloud-Integration: Die Auswahl ist schwer, am Ball zu bleiben fast unmöglich. Doch während wir versuchen, irgendwie eine Balance zwischen Wissenstiefe und Vielseitigkeit zu finden, tauchen immer wieder neue Trends auf, die uns unsere Kompetenz in Frage stellen lassen. Generative künstliche Intelligenz, oder GenAI, war für mich ein solches Thema. Seit Jahren geistert es irgendwo im Internet herum, mal in den Schlagzeilen, mal nur auf der vergilbten Overheadfolie eines Tübinger Uni-Professors. Doch spätestens seit ChatGPT 2022 veröffentlicht wurde, ist der Hype-Train völlig aus dem Ruder gelaufen. An jeder Ecke sprießen neue, bessere Chatbots hervor, und kaum ein Tool von Rang und Namen kann es sich mittlerweile noch leisten, nicht wenigstens irgendetwas mit KI zu machen. Bislang hatte ich es gekonnt geschafft, mein KI-Wissen auf die Nutzung von ChatGPT und Github Copilot zu beschränken. Doch irgendwie schien dieser Ansatz an allen Ecken und Enden zu bröckeln. Immer mehr Kunden suchen nach KI-EntwicklerInnen und möchten intelligentere Services bauen.

Da habe ich mich als Full Stack Entwickler gefragt: Wie lange können wir diesem Trend noch entgehen? Was wäre denn eine entsprechende Ergänzung meines Portfolios, um auch noch in zwei Jahren wenigstens mitreden zu können? Wo liegt die Grenze zwischen ausreichender Wissenstiefe und dem KI-Experten, der denkt, Vue sei das französische Wort für Augenlicht? In dieser Blogartikelserie möchte ich diesen Fragen nachgehen. Ich möchte herausfinden, was ich als Full Stack Entwickler tun kann, um der „neuen“ KI-Welt angemessen begegnen zu können. Was sind die ersten Themen, die ich mir aneignen sollte? Wie kann ich von GenAI profitieren und lohnt sich das überhaupt? Werde ich in ein paar Wochen das Schreiben an den Nagel hängen können und mein selbsttrainiertes KI-Modell macht die ganze Arbeit? Und mal ganz unter uns: Wie schwer kann es denn eigentlich sein, nachdem wir es mittlerweile geschafft haben, <div>-Elemente ordentlich zu zentrieren!

Working on my machine

Als ich vor ein paar Tagen blauäugig an dieses Thema herangetreten bin, war meine Vorstellung von GenAI die Folgende: „Große Firmen haben riesige Teams an Wissenschaftlern über Jahre hinweg in einen Keller gesperrt, ein paar hundert Mainframes gesponsert und am Ende ward Licht (irgendwo im Rechenzentrum). Und die Menschheit sah, dass es gut war."

In meiner Wahrnehmung waren LLMs (Large Language Models) das Ergebnis riesiger Rechenleistungen. Sie benötigten unzählige Grafikkarten, Terabytes an Festplattenspeicher und die Ressourcen einer Cloud, um brauchbare Ergebnisse zu liefern. Sicher, gerade die Giganten der Branche wie OpenAI, Meta und Google machen das auch so, doch für mich als kleinen Full Stacker war diese große, hochskalierte Welt zunächst vor allem Eines: einschüchternd. Als ich dann von einigen unserer KI-Experten lernen durfte, dass die Magie auch schon im Kleinen passiert, war ich sofort Feuer und Flamme. Denn wann immer ich in der Lage wäre, etwas auf meiner eigenen Maschine laufen zu lassen, wäre der Entwicklungsprozess deutlich entspannter.

Ich hätte, zumindest gefühlt, die volle Kontrolle über das, was da passiert und müsste mich zudem auch nicht um Lizenzen, Abrechnung und ähnliche Themen kümmern. In den nächsten Absätzen möchte ich euch also vorstellen, mit welchen Tools ein erster, entspannter Einstieg in das Thema GenAI möglich ist, komplett ohne eine Internetanbindung.

ollama - Ein kleiner Schritt für meine Festplatte, ein großer Schritt für’s Selbstbewusstsein

4.7 Gigabyte. Mit dieser heutzutage lächerlich kleinen Anzahl an Bytes verspricht llama3, eines der bekanntesten LLMs der Szene, das beste frei verfügbare KI-Modell zu sein. Fair enough, llama3 hat auch noch viel größere Modelle, doch dank Komprimierung (Quantization) und kleineren Datensätzen haben die KollegInnen von Meta es geschafft, ihre Chat-KI auf diese wunderbar handliche Größe zu schrumpfen. Fragt man llama3, wäre Ollama zwar ein mesoamerikanisches Ballspiel; für uns ist es vor allem eine Website und ein CLI-Tool, um ebensolche Open-Source-KI-Modelle verfügbar zu machen.

Nachdem man sich das CLI-Tool heruntergeladen und installiert hat, ist der erste lokale Chatbot nicht mehr fern. Ein einfaches ollama run llama3 lädt das Modell auf den Laptop und startet direkt einen Chat. Auch wenn llama3 noch keine Kenntnisse von Ollama hat, ist die Webseite an sich eine Goldgrube. Dort gibt es allerlei KI-Modelle jedweder Couleur, gut nutzbare Anleitungen, und allein das süße Llama des Logos ist einen Besuch wert!

Auf die Frage nach ollama scheint llama3 keine sinnvolle Antwort zu kennen

Ein kleiner Schmankerl obendrauf ist, dass alle mit ollama ausgeführten Modelle auch über eine REST-Api angesprochen werden können.

curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "Why is the sky blue?",
  "stream": false
}'

So wäre es schon in diesem Minimal Setup möglich, einen ersten kleinen Chatbot verfügbar zu machen und das ganz ohne aufwändige Cloud-KI Integration.

Die Antworten des Bots übertreffen meine Erwartungen zwar um Längen, können sich aber natürlich nicht vollständig mit ChatGPT und Co messen. Da es bei ollama auch viel spezialisiertere Modelle gibt lassen sich aber schnell bessere Ergebnisse produzieren, je nach Use Case.

Open WebUI - Let it shine!

So schön ein Terminal auch sein mag, richtig nutzbar ist unser lokaler Chatbot so wohl noch kaum. Das Open WebUI Projekt kann uns hier schnell Abhilfe leisten. Mit einem stark an ChatGPT erinnernden Interface lassen sich damit schnell alle ollama-Modelle zu auch von Laien nutzbaren KI-Partnern umfunktionieren. Am einfachsten geht das mit Docker.

docker run -p 3000:8080 -e WEBUI_AUTH=False  -v open-webui:/app/backend/data ghcr.io/open-webui/open-webui:main

Hier gibt es noch ein paar Details zu beachten:

Je nach Setup brauchst du noch eine Verbindung zum Host-System. Bei meinem MacOS-Setup mit Rancher Desktop reicht der obige Befehl, bei Docker Desktop brauchst du noch: --add-host=host.docker.internal:host-gateway damit das WebUI deine lokale ollama Instanz findet. Mehr Infos dazu findest du in diesem Ticket.
Zur Vereinfachung habe ich die Authentifizierung ausgeschaltet, da ich das System erst einmal nur lokal hoste. Für komplexere Setups ist das natürlich nicht geeignet.
Das Interface wird auf Port 3000 erreichbar sein

Ist das Setup abgeschlossen, finden wir unter http://localhost:3000 unser eigenes kleines “ChatGPT”.

Das Open WebUI interface erinnert doch schon stark an OpenAI's ChatGPT

Continue - Code Completion

Das dritte Tool für die ersten Schritte in die Welt der generativen KI schließt die Brücke zum Full Stack wieder. Daher habe ich mir angeschaut, welche Code-Completion es in diesem lokalen Setup gibt. Zuerst benötigen wir für die lokale Codinghilfe ein KI-Modell, das zumindest etwas spezialisierter ist als das llama3. Nach einem kurzen Blick auf ollama habe ich mich für das 1,7 GB große StarCoder2 entschieden. Neben anderen, deutlich größeren und potenteren Alternativen, wie zum Beispiel Mistral's neuem codestral, ist der Overhead an Rechenpower bei StarCoder2 einfach geringer.

Nach der gewohnten Installation mit ollama fehlt dann nur noch eine Integration für die IDE. Hier kommt das Continue-Projekt ins Spiel, das zum Beispiel bei IntelliJ über den Plugin-Mechanismus installiert werden kann. Dann muss noch kurz das richtige Modell in Continue eingestellt werden und fertig ist die KI-basierte Coding-Unterstützung. Meiner Erfahrung nach sind viele KI-generierte Codeblöcke eher hinderlich als hilfreich, aber mit ein bisschen Übung lernt man, die Diamanten herauszufiltern.

Besonders cool an Continue ist auch das Erklär-Feature, das mit einer einfachen Tastenkombination alle markierten Codeabschnitte analysiert und verständlich macht. Das einzige Risiko dabei bleibt, dass die Verlockung zu einer Grundsatzdiskussion über Kommas am Ende der Zeile mit dem Chatbot einfach kein Ende findet.

Eine solch brauchbare Antwort hätte ich eigentlich nicht erwartet, Continue ist eine tolle IDE-Integration

Was kommt als nächstes?

Mit diesem Setup ist der erste Schritt in die spannende Welt der generativen KI getan. Es lassen sich auch spezialisierte KI’s lokal ausprobieren und letztlich sogar schon im Entwicklungsalltag nutzen. Man bekommt ein initiales Gefühl für die Technik und Terminologien im GenAI Umfeld ohne sich selbst die Hände schmutzig zu machen.

Im nächsten Artikel werde ich über einen ersten konkreten Usecase schreiben. Denn so nett die Chatbots auch sind, von ollama und meinen eigenen Dokumenten scheinen sie nicht viel zu verstehen. Um das zu ändern schauen wir uns sogenannte RAG-Systeme (Retrieval-Augmented Generation) an. Eine Technik, die euch als Full Stack EntwicklerInnen höchstwahrscheinlich in den nächsten Jahren über den Weg laufen wird.

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Robin Schlenker

Full Stack Consultant

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Robin Schlenker

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

Künstliche Intelligenz ist heutzutage in aller Munde. Die Einsatzgebiete sind vielfältig, der "WOW-Faktor" immer gegeben und das Potenzial noch lange nicht ausgeschöpft. Wo wir heute in vielen Bereichen schon unsere früheren Erwartungen übertroffen ...

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

Ein gutes User Interface zu designen und umzusetzen, ist schwierig. Wir als Full Stack EntwicklerInnen wissen nur zu gut, dass der Teufel im Detail steckt. Einmal ist die Animation schlecht getimed, ein Input schiebt sich über den nächsten, ein Bild...

Künstliche Intelligenz
Generative KI
LLM

18.7.2024 | 12 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

Disclaimer: Dieser Artikel ist Teil einer Serie. Lies am besten zuerst Teil 1 und Teil 2, um auf dem neuesten Stand zu sein. In der traditionellen Softwareentwicklung sind Tests ein essenzieller Bestandteil. Wir nutzen E2E-Tests, Unit- und Integrationstests...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 14 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

Disclaimer: Dieser Artikel ist Teil einer Serie, wenn du den ersten Teil noch nicht gelesen hast dann findest du ihn hier. Nachdem wir beim letzten Mal einen ersten Kontakt mit Open Source LLMs hatten, geht es heute endlich ans Codieren! Die Chatbots...

Künstliche Intelligenz
LLM
Generative KI

24.6.2024 | 10 Minuten Lesezeit

Robin Schlenker

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Vibe coding – Was nun?

Kann man mit KI wirklich Anwendungen erzeugen, ohne selbst coden zu können, mit einem Bruchteil des Aufwands und der Zeit? "Gib dich dem Vibe hin! Erstelle Software nur mit natürlicher Sprache! GenAI ist der Builder. Hör auf, dich zu beschweren und fang...

Künstliche Intelligenz
Generative KI

12.4.2025 | 9 Minuten Lesezeit

Goetz Markgraf

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Am 27. Januar 2025 erlebte die Technologiebörse einen unerwarteten Einbruch: Der NVIDIA-Aktienkurs fiel um über 17%, wodurch der Konzern zeitweilig fast 600 Milliarden US-Dollar an Börsenwert verlor und damit einen neuen historischen Rekord am Aktienmarkt...

Künstliche Intelligenz
Generative KI
LLM

29.1.2025 | 8 Minuten Lesezeit

Daniel Ladischenski

Wie wir eine KI mit wenigen Worten hacken können

Wie wir eine KI mit wenigen Worten hacken können Künstliche Intelligenz (KI) hat in den letzten Jahren einen erstaunlichen Wandel durchgemacht und ist mittlerweile in vielen Lebensbereichen präsent. Ob in Form von Chatbots, die uns bei alltäglichen Fragen...

IT-Security
Künstliche Intelligenz

27.1.2025 | 4 Minuten Lesezeit

Mehmet Avci

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

Künstliche Intelligenz
Generative KI
LLM

18.7.2024 | 12 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 15 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

Künstliche Intelligenz
LLM
Generative KI

24.6.2024 | 11 Minuten Lesezeit

Robin Schlenker

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

GitHub Copilot – Pair Programming mit der KI

Vor drei Monaten konnte ich zum ersten Mal mit GitHub Copilot von Microsoft auf die Startbahn gehen. Ob der Flug erfolgreich war oder ob ich es gar nicht in die Luft geschafft habe, möchte ich euch einmal berichten. Was ist GitHub Copilot? Der Copilot...

Künstliche Intelligenz
GitHub
Microsoft

6.10.2022 | 8 Minuten Lesezeit

Danny Keller

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Die Corona-Krise ist weiterhin in aller Munde und wird uns mit hoher Wahrscheinlichkeit noch etwas länger begleiten. Wie man aus unterschiedlichen Statistiken erfährt, schwanken die Fallzahlen weiter und sorgen für zusätzliche Restriktionen. Diese werden...

Computer Vision
Künstliche Intelligenz
IoT
Machine Learning

13.12.2021 | 7 Minuten Lesezeit

Michel Ehmen

Wie man Java-Klassen in Python benutzt

Generell sollte man zwar für jedes Problem das passende Werkzeug nutzen. Aber oftmals wird man gezwungen, den Hammer Java zu nutzen, weil der Rest des Hauses mit diesem Hammer gebaut wurde. Eine moderne Lösung dieses Problems ist natürlich die Microservice...

Künstliche Intelligenz
Java
Python

15.11.2021 | 8 Minuten Lesezeit

Hendrik Schawe

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

Technologien lösen keine Probleme ― es sind die Menschen dahinter

Software zu entwickeln bedeutet, Mehrwert für den Kunden zu schaffen. Zu oft wird hierbei der menschliche Faktor im System missachtet. Stefanie Hasler, Senior Fullstack Developerin bei codecentric, gibt einen kleinen Einblick auf ihre Sicht der Dinge...

Künstliche Intelligenz
Softwareentwicklung
Remote Work
HR
Collaboration
Kultur

22.3.2021 | 6 Minuten Lesezeit

Kathrin Schaugg

Stefanie Hasler

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Machine Learning
Python

29.7.2020 | 11 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und ausreichend Spezialwissen möglich. Hauptsächlich große Internet-Konzerne wie Google, Apple und Facebook hatten das Geld, die Daten und die Expertise, um ...

Data
Machine Learning
Künstliche Intelligenz

6.7.2020 | 7 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Machine Learning und künstliche Intelligenz sind aktuell in aller Munde und versprechen vielfältige Einsatzmöglichkeiten im Unternehmen. Trotzdem tun sich viele Unternehmen aktuell noch schwer, das Potential der Technologie zu nutzen. „Der Fokus liegt...

Künstliche Intelligenz
Data
Community
Machine Learning

27.5.2020 | 1 Minuten Lesezeit

Matthias Niehoff

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil 1)

Working on my machine

ollama - Ein kleiner Schritt für meine Festplatte, ein großer Schritt für’s Selbstbewusstsein

Open WebUI - Let it shine!

Continue - Code Completion

Was kommt als nächstes?

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Beiträge

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Weitere Artikel in diesem Themenbereich

Vibe coding – Was nun?

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Wie wir eine KI mit wenigen Worten hacken können

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2...

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

ChatGPT im Alltag eines Python-Entwicklers

GitHub Copilot – Pair Programming mit der KI

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Wie man Java-Klassen in Python benutzt

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Technologien lösen keine Probleme ― es sind die Menschen dahinter

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Jetzt für unseren Newsletter anmelden