GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2)

24.6.2024 | 10 Minuten Lesezeit

Disclaimer: Dieser Artikel ist Teil einer Serie, wenn du den ersten Teil noch nicht gelesen hast dann findest du ihn hier.

Nachdem wir beim letzten Mal einen ersten Kontakt mit Open Source LLMs hatten, geht es heute endlich ans Codieren! Die Chatbots, die wir lokal verfügbar gemacht haben, sind zwar ein spannender Einstieg, doch abgesehen von der Code Completion mit Continue, waren sie nicht wirklich praktisch. So viel Spaß es auch machen kann, mit diesen Modellen zu chatten, haben wir noch kaum einen Mehrwert generiert. Wenn ihr euch erinnert, war Llama3 noch nicht einmal in der Lage, korrekt zu beschreiben, was Ollama ist. Derzeit kennen unsere Modelle noch keine interessanten Informationen über ihren Kontext. In einer zunehmenden Anzahl von Projekten im Bereich der LLMs geht es genau darum, diese Modelle zu kontextualisieren. Das bedeutet, ihnen auf verschiedene Weise Informationen zu übermitteln, damit sie gezielt und mit internem Fachwissen Fragen beantworten können.

Eine Methode, um dies zu bewerkstelligen, die sogenannte Retrieval-Augmented Generation (RAG), werde ich im Folgenden vorstellen. Da dies eher ein Integrations- als ein Expertenproblem ist, eignet es sich perfekt für den Werkzeugkasten eines Full Stack Entwicklers. Als solcher versuche ich außerdem, möglichst im selben Technologie-Stack zu bleiben. Deshalb werden wir das Ganze rein in Typescript schreiben, vom rudimentären Frontend-Chat bis zur Integration an unsere fleißigen, lokalen LLMs. Am Ende können wir in einem echten UI ganz normale Fragen an die KI stellen und sogar darauf hoffen, dass sie dieses Mal das Ollama Projekt kennt. Also nichts wie rein in den Code, viel Spaß!

Was ist eigentlich ein RAG?

Die Idee eines RAGs ist simpel: Anstatt ein KI-Modell nur mit einer Frage zu füttern, wird es gleichzeitig noch mit Texten ausgestattet, mithilfe derer es dann in der Lage sein sollte, die Frage genauer zu beantworten. Dazu wird „einfach“ eine Suche, ein sogenanntes Retrieval, über eine Wissensdatenbank gemacht, um die bestmöglichen Texte herauszufinden. Denn wenn wir zum Beispiel 200 PDFs im System haben, können wir die meisten Modelle nicht konstant mit so viel Input versorgen, mal ganz abgesehen von den schrecklichen Performance-Implikationen.

Übersicht der Struktur eines RAGs. Im Folgenden detaillierter beschrieben.

Um herauszufinden, welche Dokumente den besten Kontext liefern könnten, werden Embeddings genutzt. Das sind Mechanismen, mithilfe derer unstrukturierte Daten wie Texte quantifizierbar gemacht werden. Die Technologie dahinter ist super interessant, einen tollen Artikel über deren Entwicklung findet ihr hier, aber das würde wohl zu weit führen.

Interessant für uns ist, dass Embeddings letztlich immer Vektoren produzieren, die dann eine gewisse Aussagekraft über den eingebetteten Inhalt haben. Generiert man ausreichend Vektoren und versucht dann, sie mit dem Embedding der Chatbot-Frage zu vergleichen, lassen sich durch die mathematische (z.B. euklidische) Distanz verwandte Texte finden. Keine Sorge, wir fangen jetzt nicht gleich an, irgendwelche Vektoren miteinander zu vergleichen; dazu gibt es natürlich Bibliotheken und spezifische Vektordatenbanken, aber interessant ist es natürlich trotzdem. 🙂

Setup

Vorneweg muss ich noch anmerken, dass der komplette Code, den ich heute bespreche, unter diesem Repo mitverfolgt werden kann. Ich weiß, wie nervtötend es sein kann, schon das einfachste TypeScript-Setup zu erstellen. Daher werde ich einfach davon ausgehen, dass ihr ein solches schon vor euch habt und komme gleich ans Eingemachte.

Für unser kleines Projekt benötigen wir, neben unseren lokalen Modellen mit Ollama, noch folgende Bibliotheken:

LangChain ist eine Integrations-Bibliothek, um die Kommunikation mit LLMs zu vereinfachen. Sie stellt Tools für die Erstellung von RAGs bereit und hat, im Gegensatz zum ebenfalls bekannten LlamaIndex, eine weit umfangreichere TypeScript-Version. Zusätzlich werden wir auch die Bibliothek langchain/community installieren, um Zugriff auf eine ganze Reihe an kleinen Helferlein zu bekommen.
Mit Hnswlib können wir unsere Vektoren In-Memory speichern und gleichzeitig ihre nächsten Verwandten finden. Bei größeren Projekten wäre dies wohl die erste Komponente, die wir ersetzen müssten, um Arbeitsspeicher und Persistenz zu gewährleisten, doch für unseren Proof of Concept (PoC) reicht es erstmal aus.
Durch die Peer-Dependency pdf-parse ermöglichen wir LangChain zudem, PDFs zu verarbeiten.
Backroad ist ein JavaScript-Tool, um schnell Frontend-Prototypen zu erstellen. Es ermöglicht uns, nicht lange über VueJS vs React philosophieren zu müssen. Wir fokussieren uns stattdessen mehr auf den interessanten RAG-Teil des Projekts.

All diese Bibliotheken installieren wir zum Beispiel mit yarn:

1yarn add @backroad/backroad @langchain/community @langchain/core hnswlib-node pdf-parse

Nicht zuletzt gilt es noch eine sinnvolle Run Configuration im package.json zu hinterlegen:

1"scripts": {
2  "dev": "npx ts-node index.ts"
3},

Für den „intelligenten“ Teil unseres RAGs benötigen wir zwei Modelle. Unser altbekanntes llama3, um ihm beizubringen, was Ollama eigentlich wirklich ist (ollama pull llama3), und für das Erstellen der Embedding-Vektoren nutzen wir nomic-embed-text, ein eigens für diesen Zweck trainiertes Modell: ollama pull nomic-embed-text.

Außerdem brauchen wir natürlich eine Wissensdatenbank. Da wir ja beim letzten Mal schon geklärt hatten, was Ollama wirklich ist, liegt es nahe, einfach einen Teil des Codecentric Blogs herunterzuladen. Der Einfachheit halber habe ich das mit dem „Print to PDF“-Tool meines Browsers gemacht und so ein paar wenige Blogartikel erstellt, die wir später als Wissensdatenbank wieder einlesen können.

Konfigurieren und weiter Konfigurieren

Da LangChain uns schon so einiges abnimmt, können wir uns voll auf die Konfiguration konzentrieren. Ein erster Schritt ist, unseren Kontext bereitzustellen. Dazu habe ich alle PDFs in den Ordner data verfrachtet und lade sie nun mit LangChain in den Arbeitsspeicher. Ohne Voreinstellung lädt der PDFLoader jede PDF-Seite als eigenes Dokument hoch.

1async function loadFiles(path: string): Promise<Document[]> {
2  const loader = new DirectoryLoader(path, {
3    ".pdf": (path) => new PDFLoader(path),
4  })
5  return loader.load()
6}

Im Anschluss können wir die Daten einbetten und in unsere kleine In-Memory-Datenbank überführen. Da unser Embedder auch mit Ollama gehostet wird, nutzen wir die von der Community bereitgestellte OllamaEmbeddings Komponente. Jeder LangChain-VectorStore implementiert die fromDocuments-Methode, mit der wir letztlich eine DB-Instanz von den bereitgestellten Dokumenten erstellen.

1async function initializeVectorDatabase(documents: Document[]) {
2  const embeddings = new OllamaEmbeddings({ model: "nomic-embed-text" })
3  return HNSWLib._fromDocuments_(documents, embeddings)
4}

Diese Teile dann zu einer funktionalen RAG-Pipeline zu kombinieren sieht wie folgt aus.

1async function initializeRagChain(filePath: string): Promise<RunnableSequence> {
2  const docs = await loadFiles(filePath)
3  const vectorStore = await initializeVectorDatabase(docs)
4  const retriever = vectorStore.asRetriever()
5
6  const prompt =
7    PromptTemplate._fromTemplate_(`Answer the question based only on the following context:
8    {context}
9    Question: {question}`)
10  
11  const chatModel = new ChatOllama({
12    model: "llama3",
13  })  
14
15  return RunnableSequence._from_([
16    {
17      context: retriever.pipe(_formatDocumentsAsString_),
18      question: new RunnablePassthrough(),
19    },
20    prompt,
21    chatModel,
22    new StringOutputParser(),
23  ])
24}

Vom initialisierten VectorStore können wir uns einen Retriever generieren, durch den wir jene Dokumente bekommen, welche der Anfrage am nächsten sind.

Im Prompt definieren wir nun, wie genau die gefundenen Dokumente als Kontext an das Chat-Modell übergeben werden sollen. Die in geschweiften Klammern gesetzten Platzhalter werden später von unserer LangChain-Pipeline ersetzt. In diesem Fall weisen wir die KI darauf hin, dass sie ausschließlich Informationen auf Basis des vorgegebenen Kontextes liefern darf.

Zuletzt erstellen wir die Pipeline. LangChain hat eigens dafür eine eigene kleine DSL (Domain-Specific Language) entwickelt: LCEL. Eine RunnableSequence wird durch eine Reihe von Aktionen initialisiert, die sequentiell auf die Eingabeparameter ausgeführt werden. Unsere Schritte sind wie folgt:

Ausführen des Retrievers: Da per Default die drei Dokumente mit der größten Verwandtschaft zur Anfrage zurückgegeben werden, braucht es noch den formatDocumentsAsString-Helfer. Dieser reiht die gefundenen Dokumente einfach untereinander in einen String. Für die question, den zweiten Parameter unseres Prompts, wird einfach das initiale Argument weiter durchgereicht. Nach diesem Schritt ist der Parameter für die nächste Funktion ein Objekt mit den Feldern context und question.
Füllen des Prompts: Hier wird das PromptTemplate mit dem Ergebnis des Retrievers gefüllt.
Anfrage an das LLM: Der Prompt mitsamt Kontext aus der Wissensdatenbank wird an das lokale LLM übergeben. Hic sunt dracones.
Output parsen: Für unseren Chatbot brauchen wir einen einfachen String.

Lass mich mal sehen!

Wie versprochen, benötigen wir ein kleines UI, um dem Full-Stack-Anspruch und unserer CSS-Manie gerecht zu werden. Ohne die Frontend-Spezialisten zu sehr vor den Kopf stoßen zu wollen, beschränken wir uns aber auf das minimalste Setup. Perfekt dafür geeignet ist Backroad. Hiermit lassen sich einfache Prototypen ausnahmsweise mal wirklich in Minuten realisieren. Mit der run-Funktion können wir eine Sequenz starten, die bei jeder Datenänderung erneut ausgeführt wird und so einen dynamischen Inhalt rendern kann. Wir hinterlegen eine Variable messages, um auf Änderungen reagieren zu können und fangen mit einer einfachen Chatnachricht an.

Alle Messages werden dann über die schon vorgegebene ChatMessage-Funktion gerendert, und am Ende des Chats brauchen wir noch ein Input, das auf neue Eingaben wartet. Ist eine Frage eingegeben worden, wird die zuvor übergebene Funktion askRAG mit dem Text der Frage aufgerufen und das Ergebnis in die messages-Variable geschrieben. Durch diese Datenänderung wird dank Backroad einfach erneut alles gerendert, doch dieses Mal mit einer frischen Antwort des Modells.

1function startChatUI(askRAG: Function) {
2  _run_(async (br) => {
3    const messages = br.getOrDefault("messages", [
4      { by: "ai", content: "Wie kann ich dir helfen?" },
5    ])
6    br.write({ body: `# Chatte mit deinen Dokumenten \n---` }) 
7
8    messages.forEach((message) => {
9      br.chatMessage({ by: message.by }).write({ body: message.content })
10    }) 
11
12    const input = br.chatInput({ id: "input" })
13    if (input) {
14      const response = await askRAG(input)
15      br.setValue("messages", [
16        ...messages,
17        { by: "human", content: input },
18        { by: "ai", content: response },
19      ])
20    }
21  })
22}

Was ist denn nun Ollama?

Um das herauszufinden fehlt nur noch das Zusammenstöpseln von Front- und Backend.

1const main = async () => {
2  const chain = await initializeRagChain("./data")
3  startChatUI((input: string) => chain.invoke(input))
4}
5main()

Wir initialisieren die LangChain-Pipeline auf Basis unserer PDF-Sammlung und übergeben dann an Backroad eine Funktion. Diese nimmt einen Texteingabewert und startet die Pipeline mit invoke. Mit yarn dev starten wir dann im Terminal unser Projekt. Das Ergebnis können wir uns jetzt im Browser unter http://localhost:3333 ansehen. Wenn wir nun fragen, wer oder was wirklich Ollama ist, antwortet das Modell wie folgt:

Auf die Frage wer oder was Ollama ist antwortet das RAG das sei ein Chatbot oder ein AI System. Die Antwort ist auf Englisch.

Damit kommen der Wahrheit schon ein ganzes Stück näher. Ollama ist nun kein „mesoamerikanisches Ballspiel” mehr sondern wenigstens ein AI System oder Chatbot.

Jetzt kann ich RAGs, was kommt als nächstes?

Leider ist die ganze Wahrheit nicht so leicht wie dieser erste PoC. RAGs sind vom grundlegenden Konzept zwar recht simpel, doch wie so oft liegt der Teufel im Detail. Es gibt einige Stellschrauben, an denen wir nun noch drehen könnten, um das RAG genauer, hilfreicher und schneller zu machen. Ein paar mögliche Ansätze wären zum Beispiel:

Data Loading

Derzeit laden wir all unsere Dokumente mit dem bereitgestellten PDFLoader. Besonders bei PDFs ist die Bandbreite an Textarten jedoch enorm. Die Nutzung von spezialisierteren Lademechanismen oder einer entsprechenden API wie zum Beispiel LlamaParse kann helfen, mehr sinnvolle und für das LLM lesbare Informationen bereitzustellen.

Text Splitting

Der genutzte PDFLoader teilt Texte auf Basis von PDF-Seiten ein. Diese Größe ist vielleicht für unseren ersten Prototypen ausreichend, sorgt aber dafür, dass viel Text als Kontext mitgegeben wird, der nicht hilfreich ist. Außerdem können LLMs nur eine bestimmte Menge an Text gleichzeitig verarbeiten, weshalb es helfen könnte, kleinere Textabschnitte zu indexieren statt ganzer A4-Seiten. Die Menge an Kontext, die das Modell bekommt, ist ebenso relevant für das Ergebnis.

Embeddings & LLMs

Natürlich lassen sich auch unterschiedlichste Modelle und vor allem Embeddings nutzen. So gibt es zum Beispiel Embeddings, die besser mit deutschen Texten umgehen können oder potentere Chatmodelle wie ChatGPT.

Prompt Engineering

Auch durch das strukturierte Anpassen des Prompts lässt sich die Qualität verbessern. Wenn ihr dazu mehr wissen wollt lest euch doch mal unseren aktuellen Artikel durch.

Quellen

Im Gegensatz zu traditionellen LLMs nutzt unsere Pipeline nur ganz bestimmte Quellen. Um die Nachvollziehbarkeit des Systems zu erhöhen, könnte der Kontext mit in die Antwort gegeben werden.

Datenbank

Eine dedizierte Vektordatenbank würde unter anderem Persistenz mit sich bringen. So könnten leicht deutlich größere Wissensdatenbanken indexiert werden.

Falls du selbst einmal Hand anlegen möchtest um herauszufinden ob der ein oder andere Ansatz schon Verbesserungen mitbringt kannst du mal in das begleitende Github-Repo schauen. Unter enhancements habe ich ein paar der Vorschläge animplementiert. Dieses spannende Video zur Optimierung von RAGs könnte dir zudem weitere Ansätze liefern die richtigen Stellschrauben zu finden.

Wie genau wir herausfinden können, welche dieser und weiterer Anpassungen nun den besten Mehrwert für das System haben, schauen wir uns aber genauer im nächsten Teil der Serie an. Welche Metriken lassen sich auf solche RAGs anlegen, und wie können Qualität bewertet und optimiert werden? Ich möchte versuchen, messbar zu machen, worauf es wirklich ankommt. Doch bis dahin: Happy Coding!

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Robin Schlenker

Full Stack Consultant

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Robin Schlenker

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

Künstliche Intelligenz ist heutzutage in aller Munde. Die Einsatzgebiete sind vielfältig, der "WOW-Faktor" immer gegeben und das Potenzial noch lange nicht ausgeschöpft. Wo wir heute in vielen Bereichen schon unsere früheren Erwartungen übertroffen ...

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

Ein gutes User Interface zu designen und umzusetzen, ist schwierig. Wir als Full Stack EntwicklerInnen wissen nur zu gut, dass der Teufel im Detail steckt. Einmal ist die Animation schlecht getimed, ein Input schiebt sich über den nächsten, ein Bild...

Künstliche Intelligenz
Generative KI
LLM

18.7.2024 | 12 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

Disclaimer: Dieser Artikel ist Teil einer Serie. Lies am besten zuerst Teil 1 und Teil 2, um auf dem neuesten Stand zu sein. In der traditionellen Softwareentwicklung sind Tests ein essenzieller Bestandteil. Wir nutzen E2E-Tests, Unit- und Integrationstests...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 14 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

Als Full Stack EntwicklerIn gibt es heutzutage wohl genug Themenkomplexe zur Einarbeitung. Ob das nächste Frontend-Framework des Jahres, die neue Backend-Technologie, ein weiterer Security-Scanner oder doch nur eine weitere Cloud-Integration: Die Auswahl...

LLM
Künstliche Intelligenz
Generative KI

14.6.2024 | 7 Minuten Lesezeit

Robin Schlenker

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Vibe coding – Was nun?

Kann man mit KI wirklich Anwendungen erzeugen, ohne selbst coden zu können, mit einem Bruchteil des Aufwands und der Zeit? "Gib dich dem Vibe hin! Erstelle Software nur mit natürlicher Sprache! GenAI ist der Builder. Hör auf, dich zu beschweren und fang...

Künstliche Intelligenz
Generative KI

12.4.2025 | 9 Minuten Lesezeit

Goetz Markgraf

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Am 27. Januar 2025 erlebte die Technologiebörse einen unerwarteten Einbruch: Der NVIDIA-Aktienkurs fiel um über 17%, wodurch der Konzern zeitweilig fast 600 Milliarden US-Dollar an Börsenwert verlor und damit einen neuen historischen Rekord am Aktienmarkt...

Künstliche Intelligenz
Generative KI
LLM

29.1.2025 | 8 Minuten Lesezeit

Daniel Ladischenski

Wie wir eine KI mit wenigen Worten hacken können

Wie wir eine KI mit wenigen Worten hacken können Künstliche Intelligenz (KI) hat in den letzten Jahren einen erstaunlichen Wandel durchgemacht und ist mittlerweile in vielen Lebensbereichen präsent. Ob in Form von Chatbots, die uns bei alltäglichen Fragen...

IT-Security
Künstliche Intelligenz

27.1.2025 | 4 Minuten Lesezeit

Mehmet Avci

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

LLM
Generative KI
Künstliche Intelligenz

20.8.2024 | 13 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

Künstliche Intelligenz
Generative KI
LLM

18.7.2024 | 12 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

LLM
Künstliche Intelligenz
Generative KI

3.7.2024 | 15 Minuten Lesezeit

Robin Schlenker

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

LLM
Künstliche Intelligenz
Generative KI

14.6.2024 | 7 Minuten Lesezeit

Robin Schlenker

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Die Bedeutung von künstlicher Intelligenz wächst in der heutigen Welt. Doch wie funktioniert KI? Es hat zumindest nichts mit Magie zu tun – auch wenn KI gerne damit assoziiert wird. Normalerweise beantworte ich diese Frage ausführlich bei uns im IT ...

Künstliche Intelligenz

30.1.2024 | 3 Minuten Lesezeit

Meike Wocken

Ersetzt KI die Softwareentwickler?

In meinem letzten Blogartikel habe ich geschrieben, was KI-Tools wie ChatGPT heute schon leisten können, wenn es darum geht, fachliche Anwendungen in ausführbaren Programmcode zu übersetzen. Ich habe erfahren, dass die Ergebnisse zwar noch nicht zu 1...

Künstliche Intelligenz

10.9.2023 | 6 Minuten Lesezeit

Goetz Markgraf

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

Einleitung KI-Tools, die die Arbeit des Softwareentwicklers unterstützen – oder eventuell sogar ganz ersetzen – sorgen im Moment für Schlagzeilen. In diesem Artikel möchte ich einen ganz persönlichen Erfahrungsbericht schreiben, wie es mir erging, als...

Künstliche Intelligenz

4.9.2023 | 8 Minuten Lesezeit

Goetz Markgraf

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

GitHub Copilot – Pair Programming mit der KI

Vor drei Monaten konnte ich zum ersten Mal mit GitHub Copilot von Microsoft auf die Startbahn gehen. Ob der Flug erfolgreich war oder ob ich es gar nicht in die Luft geschafft habe, möchte ich euch einmal berichten. Was ist GitHub Copilot? Der Copilot...

Künstliche Intelligenz
GitHub
Microsoft

6.10.2022 | 8 Minuten Lesezeit

Danny Keller

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Die Corona-Krise ist weiterhin in aller Munde und wird uns mit hoher Wahrscheinlichkeit noch etwas länger begleiten. Wie man aus unterschiedlichen Statistiken erfährt, schwanken die Fallzahlen weiter und sorgen für zusätzliche Restriktionen. Diese werden...

Computer Vision
Künstliche Intelligenz
IoT
Machine Learning

13.12.2021 | 7 Minuten Lesezeit

Michel Ehmen

Wie man Java-Klassen in Python benutzt

Generell sollte man zwar für jedes Problem das passende Werkzeug nutzen. Aber oftmals wird man gezwungen, den Hammer Java zu nutzen, weil der Rest des Hauses mit diesem Hammer gebaut wurde. Eine moderne Lösung dieses Problems ist natürlich die Microservice...

Künstliche Intelligenz
Java
Python

15.11.2021 | 8 Minuten Lesezeit

Hendrik Schawe

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

Technologien lösen keine Probleme ― es sind die Menschen dahinter

Software zu entwickeln bedeutet, Mehrwert für den Kunden zu schaffen. Zu oft wird hierbei der menschliche Faktor im System missachtet. Stefanie Hasler, Senior Fullstack Developerin bei codecentric, gibt einen kleinen Einblick auf ihre Sicht der Dinge...

Künstliche Intelligenz
Softwareentwicklung
Remote Work
HR
Collaboration
Kultur

22.3.2021 | 6 Minuten Lesezeit

Kathrin Schaugg

Stefanie Hasler

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Machine Learning
Python

29.7.2020 | 11 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und ausreichend Spezialwissen möglich. Hauptsächlich große Internet-Konzerne wie Google, Apple und Facebook hatten das Geld, die Daten und die Expertise, um ...

Data
Machine Learning
Künstliche Intelligenz

6.7.2020 | 7 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Machine Learning und künstliche Intelligenz sind aktuell in aller Munde und versprechen vielfältige Einsatzmöglichkeiten im Unternehmen. Trotzdem tun sich viele Unternehmen aktuell noch schwer, das Potential der Technologie zu nutzen. „Der Fokus liegt...

Künstliche Intelligenz
Data
Community
Machine Learning

27.5.2020 | 1 Minuten Lesezeit

Matthias Niehoff

GenAI für Full Stack EntwicklerInnen: Der erste echte Use Case (Teil 2)

Was ist eigentlich ein RAG?

Setup

Konfigurieren und weiter Konfigurieren

Lass mich mal sehen!

Was ist denn nun Ollama?

Jetzt kann ich RAGs, was kommt als nächstes?

Data Loading

Text Splitting

Embeddings & LLMs

Prompt Engineering

Quellen

Datenbank

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Beiträge

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Weitere Artikel in diesem Themenbereich

Vibe coding – Was nun?

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Wie wir eine KI mit wenigen Worten hacken können

GenAI für Full Stack EntwicklerInnen - Agent Chi PiTie (Teil 5)

GenAI für Full Stack EntwicklerInnen: Sprachverständnis als User Interface...

GenAI für Full Stack EntwicklerInnen: RAG Evaluation mit TypeScript (Teil...

GenAI für Full Stack EntwicklerInnen: Aller Anfang ist... lokal? (Teil...

Eine Einführung in das Thema künstliche Intelligenz für Schülerinnen und...

Ersetzt KI die Softwareentwickler?

KI-Tools zum Lernen neuer Programmiersprachen: Ein Erfahrungsbericht

ChatGPT im Alltag eines Python-Entwicklers

GitHub Copilot – Pair Programming mit der KI

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Wie man Java-Klassen in Python benutzt

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Technologien lösen keine Probleme ― es sind die Menschen dahinter

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

KI für KMU: (Teil-)Automatisierung der Qualitätskontrolle von Bauteilen

Machine Learning in der Praxis. Eine Mate mit … Matthias Niehoff #EineMateMit

Jetzt für unseren Newsletter anmelden