Kürzere Time-to-Market für ML-Modelle durch Googles BigQuery ML

26.7.2021 | 5 Minuten Lesezeit

Machine Learning (ML) erzeugt erst dann realen Mehrwert, wenn es in Produktion benutzt wird. Allerdings kann die Zeitspanne zwischen der Entwicklung eines belastbaren Modells und dessen Einsatz frustrierend lange sein. Insbesondere in schnelllebigen Branchen ist ein solcher Zeitversatz ein Wettbewerbsnachteil. Die Ursachen hierfür sind häufig darin zu suchen, dass das eigentliche ML-Modell nur einen kleinen Teil der gesamten Pipeline ausmacht :

Unserer Erfahrung nach wird häufig unverhältnismäßig viel Aufwand in die „ML-Code“-Logik investiert. Stattdesssen sollten Ansätze, die eine höhere Entwicklungsgeschwindigkeit und damit einen höheren Business Value liefern können, mit Priorität verfolgt werden. In diesem Blogpost widmen wir uns einem der möglichen Werkzeuge dafür, nämlich demBigQuery ML (BQML) Dienst auf der Google Cloud Platform (GCP).

Wir sehen uns ein typisches Beispiel aus der Praxis an: Recommendation Engines. Ihr Einsatz auf dem Markt ist umfassend, bildet einen wichtigen Bestandteil für E-Commerce-Geschäftsmodelle und ist auch für viele andere Branchen relevant. Um einen direkten Mehrwert für digitale Produkte erzeugen, ist die Fähigkeit, eine solche Engine schnell und in hoher Qualität zu implementieren, zentral. Details zu der von uns verwendeten Implementierung lassen sich in unserem technischen Post zur gleichen Thematik nachlesen.

Zusätzlicher Lesestoff zur generellen Thematik von ML in Produktion sind die Beiträge unserer Kollegen Marcel Mikl („Wie man Data-Science-Projekte nicht in die PoC-Sackgasse manövriert“ , „KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben und umsetzen“ ), Roman Seyffarth („Machine learning: Moving from experiments to production“ ) und Nils Bauroth, Sven Rediske & Lennart Küll („Schnelles KI-Prototyping mit Google Cloud AutoML Vision „).

Die Business-Perspektive auf Recommendation Engines

Das sichtbarste Ergebnis von Recommendation Engines sind die „Kunden, die diesen Artikel gekauft haben, haben auch X gekauft“-Bereiche in E-Commerce-Shops. Im Hintergrund werden berechnete Empfehlungen entweder direkt für den User berechnet oder in Datenbanken bereitgehalten. Um den Erfolg von Engines zu messen, kann beispielsweise Cross-/Up-Selling oder die Verweildauern bei Content-Providern herangezogen werden.

Angewendet werden diese Engines auf zwei Arten von Daten. Implizites Feedback entsteht durch beobachtetes Verhalten von Kunden, also z. B. welche Produkte gekauft werden. Explizites Feedback liegt vor, wenn beispielsweise Sternebewertungen zur Verfügung stehen. Auch wenn explizites Feedback reichere Daten erzeugt, sind beide Szenarien valide Einsatzgebiete für Recommendation Engines.

Uns ist keine umfassende Quantifizierung des Geschäftswerts von Recommender-Systemen bekannt. Die vorliegenden Fallstudien sprechen jedoch eine eindeutige Sprache. So berichtete Alibaba beispielsweise von 20 % höheren Konversionsraten bei personalisierten Seiten im Vergleich zu nicht personalisierten Inhalten.

Im Allgemeinen erzeugen Recommendation-Systeme drei weitreichende Vorteile für Unternehmen:

Das Benutzererlebnis verbessert sich signifikant. Qualitativ hochwertige Empfehungen reduzieren die Suchzeit und machen den Besuch zu einem reibungslosen Erlebnis.
Empfehlungen unterstützen Cross- und Up-Selling. Kunden sehen direkt alternative und ergänzende Angebote zu den von ihnen in Betracht gezogenen Produkten.
Die Reaktionen der Kunden auf die Empfehlungen liefern wertvolles Feedback für die Produktentwicklung.

Diese Vorteile müssen jedoch im richtigen Verhältnis zu den Entwicklungs- und Implementierungskosten stehen. Genau hier verspricht BQML eine starke Kostensenkung und damit einer Stärkung des Business Cases. Aber kann es dieses Versprechen auch einhalten? Wir bewerten in diesem Blogpost dafür zwei Aspekte: Time-to-Market und Kosten.

Time-to-Market

Unter Time-to-Market verstehen wir die Gesamtzeit von Beginn der Arbeit an einer Recommendation Engine bis zu dem Zeitpunkt, an dem ihre Ergebnisse in z. B. einem Onlineshop integriert sind:

Eine wichtige Zäsur sind dabei vorläufige Ergebnisse. Diese Ergebnisse müssen (und sollen) nicht perfekt sein, ermöglichen aber eine frühzeitige Entscheidung über Fortführung oder Einstellung der Komponente. Sollte bei einer Fortführung das Modell eine ausreichende Qualität erreichen, um einen substanziellen Mehrwert zu erzielen, kann es als MVP in das digitale Gesamtprodukt integriert werden.

Aus einer Geschäftsperspekte sollten zwei Aspekte besonders bedacht werden. Je kürzer die Zeit bis zu ersten Ergebnissen, desto geringer das anfängliche Investitionsrisiko. Je schneller vielversprechende erste Ergebnisse in ein MVP überführt werden können, desto höher der Wert über die gesamte Laufzeit. Zusätzliche Verbesserungen geschehen dann vor dem Hintergrund bereits realisierten Mehrwerts.

Kosten

Natürlich lässt sich keine allgemeine Kostenschätzung seriös abgeben. Stattdessen fokussieren wir uns auf die zwei größten Kosten-Komponenten einer in BQML umgesetzen Lösung:

Die Preisstruktur der Komponenten, die auf GCP benötigt werden.
Die Arbeitskosten für die Implementierung, Warung und Aktualisierung des Systems. Dieser Aspekt ergibt sich aus der vorhandenen Qualifikation und notwendigen Arbeitszeit der eingesetzen Mitarbeiterinnen.

Evaluation von BigQuery ML

Time-To-Market

In unserem Test-Setup war das erste Modell bereits nach einer Stunde Arbeit für zwei Personen umgesetzt. Diese Stunde beinhaltete Diskussionen über technische Parameter und das Einrichten eine Cloud-Budgets für unsere Experimente. Wichtig zu erwähnen ist dabei jedoch, dass wir auf vorhandene Daten zugreifen konnten. Es waren keine zusätzlichen Anbindungen etc. notwendig.

Mit insgesamt einem Tag Arbeit wäre zudem Finetuning sowie eine Aufbereitung und Evaluation der vorläufigen Ergebnisse machbar gewesen. Anders formuliert: Ein einziger Tag hätte in unserem Fall von einem Kick-off bis hin zu belastbaren ersten Ergebnissen ausgereicht. Unter Berücksichtigung des üblichen Tagesgeschäfts wäre ein solches Experiment in einer einzigen Arbeitswoche machbar.

Würde die Entscheidung für den nächsten Schritt, also die Erstellung eines MVP, fallen, wären bereits zwei Produktvarianten zur Verprobung verfügbar. Zum einen könnte beispielsweise eine BI-Abteilung Analysen auf den berechneten Empfehlungen durchführen. Einzige Voraussetzung wären dabei durchschnittliche SQL-Kenntnisse. Zum anderen kann sehr leicht ein allgemein verfügbarer Endpoint erstellt werden. Dieser würde das Konsumieren der Ergebnisse z. B. durch eine Webseite ermöglichen.

Obwohl unsere Erwartungen im Vorfeld bereits hoch waren, wurden sie in Hinblick auf Time-to-Market sogar übertroffen. Selbstverstädndlich darf die Komplexität der konkreten Einbindung nicht unterschätzt werden. Trotzdem halten wir dies in wenigen Wochen für absolut realistisch.

Kosten

Wie bei allen Cloud-Diensten muss jeder Anwendungsfall gesondert berechnet werden, um unangenehme Überraschungen zu vermeiden. Die Kosten der Hauptkomponenten ergeben das folgende Bild:

Das Modelltraining stellt also den größten Kostentreiber dar. Hier lassen sich, wie bei allen Cloud-Services, zwar Kosten optimieren, dem steht jedoch ein Overhead für gewissenhaftes Monitoring gegenüber. Eine solche Entscheidung muss im Einzelfall getroffen werden.

Im Vergleich zu anderen Implementierungsansätzen sind die Arbeitskosten vernachlässigbar. Es muss keine zusätzliche Infrastruktur für das Modelltraining und die Evaluation verwaltet werden. Durch die Integration in SQL können auch Anwender ohne Programmiererfahrung schnell Ergebnisse erzielen. Das Feintuning der Modelle kann ebensfalls schnell und ohne besondere technische Kenntnisse durchgeführt werden.

Fazit zu BigQueryML aus der Business-Perspektive

Aus unserer Sicht sind Dienste wie BigQuery ML ein großer Schritt zur Kommoditisierung und Kommerzialsierung von Machine Learning. Darüber hinaus ermöglichen sie eine hohe Entwicklungs- und Integrationsgeschwindigkeit. Uns hat der Service deshalb klar überzeugt.

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*innen

Timo Böhm

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Niklas Haas

Service Lead GenAI

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Timo Böhm & Niklas Haas

Höhere Business Agility durch den aktiven Umgang mit Push- und Pull-Systemen...

Im Rahmen agiler Transformationen entstehen häufig starke Reibungsflächen in der Ablauforganisation. Ein verbreitetes Beispiel ist das Aufeinandertreffen klassischer Projekt- bzw. Budgetplanungen auf der einen und einer agilen Arbeitsweise in den operativen...

Agilität
Agile Transformation
Change Management
Process Management

9.12.2022 | 10 Minuten Lesezeit

Timo Böhm

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Machine Learning (ML) kann nur durch Modelle in der Produktion Business Value erzeugen. Allerdings kann die Zeitspanne zwischen der Entwicklung der nächsten Iteration eines Modells und dessen Einsatz in einer Produktionsumgebung massiv sein. Dies gilt...

Accelerate
Cloud
Data
Google Cloud
Machine Learning

26.7.2021 | 11 Minuten Lesezeit

Niklas Haas

Timo Böhm

Interview: Accelerate IT bei der METRO.digital

Interview: Accelerate IT bei der METRO.digital Dr. Anna Hannemann ist Data Science Engineering Manager und Domain Owner bei METRO.digital , der Software-Unit der METRO AG, die den digitalen Wandel vorantreibt. Niklas Haas, Machine Learning Engineer...

Accelerate

11.10.2021 | 2 Minuten Lesezeit

Niklas Haas

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Accelerate
Cloud
Data
Google Cloud
Machine Learning

26.7.2021 | 11 Minuten Lesezeit

Niklas Haas

Timo Böhm

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Serverless aus Europa: Meine Erfarhrung mit Scaleway als Alternative zu...

Neben den dominierenden US-Anbietern wie AWS, Azure und GCP bietet das französische Unternehmen Scaleway jetzt auch ein umfangreiches Serverless-Computing-Angebot. Dieses umfasst unter anderem Services für Function as a Service, einen leichtgewichtigen...

Compliance
Infrastructure
Datenschutz
Cloud Native
Cloud
Infrastructure as Code

28.5.2025 | 5 Minuten Lesezeit

Florian Lüdiger

Team ’25 Rückblick – Was Atlassian in Anaheim bewegt hat

Vom 8. bis 10. April 2025 traf sich die Atlassian-Community in Anaheim zur Team ’25 – der jährlichen Leitkonferenz rund um moderne Zusammenarbeit, ITSM, Agile, DevOps und skalierbare Teamstrukturen.Ein paar Tage sind seitdem vergangen – genug Zeit, um...

Cloud
Wissensmanagement
Atlassian
Community
Projektmanagement
Collaboration

11.5.2025 | 5 Minuten Lesezeit

Benedikt Hoffschröer

Kubernetes-Konfiguration mit Jsonnet

YAML ist die gängige Konfigurationssprache im Container- und Kubernetes-Umfeld. Das hat zum einen Vorteile, denn YAML besitzt wenige Konstrukte und spezielles Markup, das man sich merken muss. Andererseits wirft die Arbeit mit YAML auch einige Probleme...

Infrastructure as Code
Kubernetes
Cloud Native
Cloud

8.4.2025 | 5 Minuten Lesezeit

Oliver Frommel

Das ultimative Tool für Ingenieure und Entwickler: Compass Premium

Es kommt nicht jeden Tag vor, dass ein Tool auf den Markt kommt und die Arbeitsweise von Ingenieur- und Entwicklungsteams neu definiert, aber Compass ist das Tool mit einer bahnbrechenden Lösung. Als sofort einsatzbereite interne Entwicklerplattform ...

Atlassian
Cloud

3.12.2024 | 4 Minuten Lesezeit

Özge Kavas

Die schaurigen Gestalten der Agilität – und warum sie oft zum Scheitern...

Die schaurigen Gestalten der Agilität – und warum sie oft zum Scheitern führenIn der agilen Welt wird es immer lauter: Agilität wird zunehmend als ineffektiv abgetan und sogar für tot erklärt (agile is dead). Doch was steckt wirklich hinter dieser wachsenden...

Agile Methoden
Softwareentwicklung
Agilität
Agile Transformation
Projektmanagement
Change Management

30.10.2024 | 11 Minuten Lesezeit

Nina Nitzsche

AWS European Sovereign Cloud: Die wichtigsten Informationen

Im Oktober 2023 hat Amazon Web Services seine Pläne vorgestellt, die AWS European Sovereign Cloud als “unabhängige” europäische Cloud-Lösung auf den Markt zu bringen. Erklärtes Ziel des Vorhabens ist es, Kunden im öffentlichen Sektor und streng regulierten...

Cloud
AWS
Compliance

29.10.2024 | 9 Minuten Lesezeit

Björn Bohn

Wir haben unsere SaaS-Anwendung auf fly.io deployed (und dabei richtig...

Wie wir unsere Anwendung in einem Bruchteil der Zeit bereitgestellt und dabei 100 % der Kosten eingespart haben. Unser Team, bestehend aus einer Gruppe erfahrener Software-Entwickler ohne Cloud Vorkenntnisse, wollte unseren OCPP-konformen EV-Ladesäulen...

AWS
Cloud

23.10.2024 | 4 Minuten Lesezeit

Jannis Mainczyk

Cloud-Lösungen in der Architekturrichtlinie des Bundes

Um die Rahmenbedingungen für IT- und Digitalisierungsvorhaben für die Bundesverwaltung festzulegen, existiert bereits seit einigen Jahren die Architekturrichtlinie für die IT des Bundes. Im Folgenden haben wir die Vorgaben hinsichtlich des Themas Cloud...

Cloud
Compliance

10.10.2024 | 7 Minuten Lesezeit

Björn Bohn

Marc Bialowons

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

In einem gemeinsamen Projekt haben Tom Scholz und ich Machine Learning (ML) Services gebaut, um einem Kunden bei der Analyse von Dokumenten zu helfen. Eine Proof-Of-Concept Lösung war schnell gebaut, die es nun zu operationalisieren gilt. Hierbei war...

Machine Learning
Python
Data
Data Science

12.9.2024 | 27 Minuten Lesezeit

Patrick Soschinski

Tom Scholz

Dangling DNS in Cloud Infrastrukturen

Dangling DNS Einträge sind nichts neues. Vergessene, veraltete oder fehlerhafte DNS-Einträge können dazu führen, dass Subdomänen übernommen werden können und beispielsweise bei Phishing-Kampagnen genutzt werden um Geheimnisse von MitarbeiterInnen zu ...

IT-Security
Validierung
Cloud
AWS
Infrastructure

5.9.2024 | 3 Minuten Lesezeit

Markus Höfer

Estuarine Mapping – Wie komplexe Organisationen von natürlichen Ökosystemen...

In unserer immer komplexer werdenden Welt wird es unwahrscheinlich, dass wir uns ein spezifisches Ziel setzen und dieses dann auch genau wie geplant erreichen. Auf dem Weg zum Ziel passiert Unvorhersehbares, das uns im einfachsten Fall auf einen Umweg...

Agile Methoden
Agile Transformation
Collaboration
Agilität
Change Management
Pattern
Process Management
Produktmanagement
Projektmanagement

15.7.2024 | 11 Minuten Lesezeit

Marco Böttcher

Sprintziele: Fokus schärfen und Teamerfolg steigern

⁠In der Welt der agilen Softwareentwicklung hat sich Scrum als fester Bestandteil vieler Entwicklungsprozesse etabliert. Doch während Scrum-Teams stolz ihre Agilität proklamieren, wird ein zentrales Konzept oft übersehen: das Sprintziel. Stellen Dir ...

Agile Methoden
Softwareentwicklung
Agilität
Agile Transformation

2.7.2024 | 12 Minuten Lesezeit

Nina Nitzsche

Rust in der Cloud: Performance-Vergleich mit TypeScript und Java in AWS...

In diesem Artikel setzen wir Rust ein, um AWS-Lambda-Funktionen zu implementieren und vergleichen die Performance mit TypeScript (Node.js) und Java (JVM). Rust ist momentan in aller Munde und wird für seine Performance, Effizienz und Speichersicherheit...

Rust
Cloud
AWS
Serverless
Node.js
Java
JavaScript
Green IT

20.6.2024 | 6 Minuten Lesezeit

Nicolas Großmann

Willkommen in der nächsten Ära von Jira!

Während der jährlichen Konferenz in Las Vegas hat Atlassian die sogenannte „nächste Ära von Jira“ angekündigt, die ab dem 1. Mai beginnt.Bis jetzt haben wir alle „verschiedene“ Jiras genutzt. Das eine war „Jira-Software“ und das andere „Jira Work Management...

Cloud
Atlassian

15.5.2024 | 4 Minuten Lesezeit

Aurimas Brazaitis

Adrian Voigt

Von Skepsis zu Innovation: Wie Confidential Computing den Weg in die Cloud...

“Unser Datenschutzbeauftragter sagt, wir können nicht in die Cloud.” - "Es ist zu riskant", sagt er, während er besorgt auf den Berg von Papierakten auf seinem Schreibtisch blickt. “Unsere sensiblen Daten überall anders als in unseren sicheren, physischen...

Digitalisierung
Cloud
Compliance

14.5.2024 | 7 Minuten Lesezeit

Stefanie Schwilski

Philip Herzog

Public Cloud im regulierten Sektor: Das ist zu beachten

Es war längere Zeit ein weit verbreitetes und in strategischen Debatten häufig zitiertes Missverständnis, dass die Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) dem Einsatz von Public-Cloud-Anbietern wie AWS, Azure und Co. einen Riegel vorschiebt...

Cloud
Compliance

10.4.2024 | 6 Minuten Lesezeit

Marc Bialowons

Björn Bohn

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

AZ-900-Zertifizierung: Mein How-to!

Was ist AZ-900? Azure bietet eine Reihe verschiedener Zertifizierungen an. Zu finden sind sie hier. Darunter befindet sich auch die Zertifizierung AZ-900. Bei diesem Zertifikat handelt es sich um Microsoft Certified: Azure Fundamentals. Diese prüft unter...

Azure
Cloud

2.1.2024 | 5 Minuten Lesezeit

Ege Inanc

Mit FinOps die größten Kostenfallen bei AWS S3 verhindern

In der Welt der Cloud-Technologie und insbesondere bei AWS (Amazon Web Services) ist die effiziente Verwaltung von Ressourcen von entscheidender Bedeutung, um unnötige Kosten zu vermeiden. Dieser Blogbeitrag konzentriert sich auf AWS S3 und die teuren...

AWS
Cloud

27.11.2023 | 4 Minuten Lesezeit

Lukas Miliunas

Maximilian Mayer

Cloud FinOps

Cloud FinOps bietet einen etablierten Prozess, um Kosten für den Cloudbetrieb zu reduzieren (s. auch diesen Artikel). Zu diesem Zweck bietet es ein etabliertes Cloud-unabhängiges Vorgehen, das eine Organisation schrittweise aufgreifen kann. Das Tooling...

Cloud
Cloud Native
Green IT

26.10.2023 | 5 Minuten Lesezeit

Lukas Miliunas

Marco Paga

Kürzere Time-to-Market für ML-Modelle durch Googles BigQuery ML

Die Business-Perspektive auf Recommendation Engines

Time-to-Market

Kosten

Evaluation von BigQuery ML

Time-To-Market

Kosten

Fazit zu BigQueryML aus der Business-Perspektive

War dieser Beitrag hilfreich?

Blog-Autor*innen

Weitere Beiträge

Höhere Business Agility durch den aktiven Umgang mit Push- und Pull-Systemen...

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Interview: Accelerate IT bei der METRO.digital

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Weitere Artikel in diesem Themenbereich

Serverless aus Europa: Meine Erfarhrung mit Scaleway als Alternative zu...

Team ’25 Rückblick – Was Atlassian in Anaheim bewegt hat

Kubernetes-Konfiguration mit Jsonnet

Das ultimative Tool für Ingenieure und Entwickler: Compass Premium

Die schaurigen Gestalten der Agilität – und warum sie oft zum Scheitern...

AWS European Sovereign Cloud: Die wichtigsten Informationen

Wir haben unsere SaaS-Anwendung auf fly.io deployed (und dabei richtig...

Cloud-Lösungen in der Architekturrichtlinie des Bundes

Lessons learned: Was wir in einem Jahr ML Orchestrierung mit Dagster gelernt...

Dangling DNS in Cloud Infrastrukturen

Estuarine Mapping – Wie komplexe Organisationen von natürlichen Ökosystemen...

Sprintziele: Fokus schärfen und Teamerfolg steigern

Rust in der Cloud: Performance-Vergleich mit TypeScript und Java in AWS...

Willkommen in der nächsten Ära von Jira!

Von Skepsis zu Innovation: Wie Confidential Computing den Weg in die Cloud...

Public Cloud im regulierten Sektor: Das ist zu beachten

Green Cloud: Daten und Emissionen sparen

AZ-900-Zertifizierung: Mein How-to!

Mit FinOps die größten Kostenfallen bei AWS S3 verhindern

Cloud FinOps

Jetzt für unseren Newsletter anmelden