SPRACHE

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

25.8.2023 | 7 Minuten Lesezeit

Mithilfe von Daten können Unternehmen fundiertere Entscheidungen treffen, ihre Arbeitsabläufe optimieren und mit der Kraft des maschinellen Lernens (ML) einen Vorteil in der wettbewerbsintensiven Geschäftswelt erlangen. Allerdings ist der Umgang mit Daten im Laufe der Jahre zunehmend schwierig geworden. Heute stehen Unternehmen vor der Herausforderung, sich an ständig wechselnde regulatorische und Cybersicherheitsanforderungen anzupassen und gleichzeitig die Privatsphäre der Dateneigentümer zu gewährleisten. Aufgrund dieser Herausforderungen haben viele Branchen noch immer begrenzten Zugang zu den Spitzentechnologien des 21. Jahrhunderts im Bereich Daten.

Was können wir also dagegen tun? Nun, wenn wir die Daten nicht zum Machine-Learning-(ML) Modell bringen können, wie wäre es dann, wenn wir die ML-Modelle zu den Daten bringen? Genau das versucht Federated Learning zu erreichen. Das wollen wir uns einmal genauer im industriellen Kontext ansehen.

Federated Learning setzt sich daraus zusammen, die maschinellen Lernoperationen von der Cloud auf Edge-Geräte zu verlagern und lokal mit den Daten zu interagieren. Die beiden grundlegenden Komponenten des Federated Learning sind Server und Client. Unten siehst du die grundlegenden Schritte eines Federated Learning:

Wie in der Grafik (Arbeit des Autors) dargestellt, beginnen wir mit der Initialisierung eines globalen Modells. Wir senden dieses Modell dann an die einzelnen Clients, die es mit ihren lokalen Daten trainieren. Später senden diese Clients ihre Updates an den Server zurück, wo sie aggregiert werden. An diesem Punkt ist eine Iteration abgeschlossen und wir gehen zurück zum ersten Schritt – der Server sendet das aktualisierte globale Modell zurück an die Clients und der gesamte Prozess beginnt von vorn.

Das ist das grundlegende Prinzip von Federated Learning! Wie du dir denken kannst, steckt hinter jedem Punkt in dem Diagramm oben aber noch viel mehr. Die großen Konzepte beinhalten: Strategie, Techniken zur Verbesserung der Privatsphäre (engl. PETs) und sichere Mehrparteienberechnung (engl. SMPC). Das Ziel dieser Artikelserie, die aus 2 Blogbeiträgen besteht, ist es, einen grundlegenden Überblick über diese Themen zu geben und wie jedes von ihnen sich auf Federated Learning bezieht.

Strategie für federated learning

Was ist dann eine „Strategie“ im Kontext von Federated Learning? Eine Strategie ist der Versuch, den effektivsten Weg zu finden, das Modell zu trainieren und die Gewichte zu aggregieren. Gewichte sind die „Erkenntnisse“ des Modells aus dem Training. Denken wir einmal über die Client-Auswahl nach und nehmen an, dass wir 1000 Clients haben. Sollten wir alle Clients auswählen, wenn wir das Training starten? Mehr Clients bedeuten zwar in der Regel mehr Daten, aber sind mehr Daten immer besser für unser ML Modell? Forschungen haben gezeigt, dass das Nutzen aller Clients häufig zu einer langsameren Konvergenz führen kann, was bedeutet, dass das ML Modell langsamer angelernt wird, als wenn wir weniger Clients mit hochwertigen Datensätzen verwendet hätten (Németh et al. 4).

Eines sollte dabei immer im Hinterkopf behalten werden: Das ist, was die empirische Forschung vorschlägt und keine Regel, also ist es nicht in Stein gemeißelt und alle hier erwähnten Ideen sollten hinterfragt werden, da die beste Strategie stark kontextabhängig ist. Wie wählen wir also die Clients aus, die wir in unserem Aktualisierungsschritt einbeziehen möchten? Nicht alle Clients sind gleich in ihrer Kommunikations- oder Rechenkapazität sowie ihrem Zugang zu den Datenpunkten. Es wurden viele Strategien von der Forschung vorgeschlagen. Einige von ihnen schließen die Priorisierung der Clients mit einzigartigen Datenpunkten ein (Németh et al. 6), während einige vorschlagen, die Clients auf die energieeffizienteste Weise zu wählen (Németh et al. 5).

Jetzt werfen wir einen Blick darauf von der Server-(Aggregator-) Seite. Die Menge der Datenpunkte, die jedem Client zur Verfügung stehen, variiert. Daher haben auch die trainierten Gewichte unterschiedliche „Erfahrungsniveaus“. Ein Modell, das auf 1000 Datenpunkten trainiert wurde, befindet sich in einer anderen Phase als eines, das lediglich 100 Datenpunkte gesehen hat. Wenn wir aggregieren würden, wäre das Modell mit 1000 Datenpunkten stärker auf das globale Modell einflussreich. Um eine gerechtere Verteilung an die Clients zu geben, kann beispielsweise der FedAvg-Algorithmus verwendet werden, um die Modellupdates, die von den Clients kommen, zu mitteln.

Im obigen Diagramm (Németh et al. 5) kannst du die breite Palette von Ideen sehen, die im Laufe der Jahre von den Forschern vorgeschlagen wurden.

Proof of Concept: Predictive Maintenance

Bevor wir weitermachen, möchte ich einen Proof of Concept vorstellen, an dem ich gearbeitet habe, der sich auf Predictive Maintenance bezieht und warum es ein wichtiges Thema ist, das Federated Learning lösen kann.

Bedeutung von KI-gestützter Predictive Maintenance

Maschinen sind das Herzstück der Industrie und ihre Ausfallzeiten sind mit erheblichen Kosten verbunden. Predictive Maintenance bezieht sich auf das Konzept, den Ausfall von Maschinen vorherzusagen und Wartungsarbeiten durchzuführen, bevor sie ausfallen. Laut einer Studie von McKinsey & Company kann mit Hilfe von künstlicher Intelligenz „die Verfügbarkeit in einigen Fällen um mehr als 20% steigen. Die Inspektionskosten können um bis zu 25% reduziert werden und eine generelle Reduzierung der jährlichen Wartungskosten um bis zu 10% ist möglich.“ (McKinsey & Company, Inc. 8).

Das eigentliche Problem jedoch ist die begrenzte Datenverfügbarkeit für einzelne Fabrikbesitzer. Wie oft fallen moderne Maschinen tatsächlich aus? Vielleicht einmal oder zweimal im Monat? Und wie oft haben diese Ausfälle die gleiche Ursache? Mit nur einer geringen Anzahl von Maschinen, die jeder Organisation zur Verfügung steht, wird es schwierig sein, genügend qualitativ hochwertige Ausfalldaten zu sammeln.

In einer traditionellen ML-Umgebung könnten wir nach Anerkennung des Mangels an ausreichenden Daten nach ähnlichen Daten außerhalb unserer Organisation suchen. Verständlicherweise zögern Fabrikbesitzer jedoch, ihre Daten mit externen Organisationen zu teilen - ein schwieriges Szenario für konventionelles ML, jedoch nicht so sehr für das föderierte Lernen, da es einer großen Anzahl von Maschinen ermöglicht, zu einem größeren zentralen ML-Modell beizutragen, während gleichzeitig die Privatsphäre gewahrt bleibt.

Implementierung

Wir haben das Framework Flower gewählt, da es sehr anfängerfreundlich ist und eine ziemlich aktive Community hat, die bereit ist, bei Diskussionen und Fragen zu helfen. Wir haben den „Machine Predictive Maintenance Classification"-Datensatz von Kaggle verwendet. Es handelt sich um einen synthetischen Datensatz und daher ist nicht viel Vorverarbeitung erforderlich. Der Datensatz wurde in kleinere Teile unterteilt, sodass jeder Kunde einen einzigartigen Teilbereich zur Verfügung hatte, um das Modell lokal zu trainieren. Werfen wir einen genaueren Blick auf den Server und die Client-Seite.

Server-Seite

Auf der Server-Seite definierst und kompilierst du zuerst das Modell, wie du es normalerweise tun würdest. Als Strategie haben wir FedAvg gewählt, das jedem Client einen gleichen Einfluss auf das globale Modell gibt, wenn die Modelle aggregiert werden. Es gibt bessere Strategien, aber seine Einfachheit macht es für unseren Proof of Concept ziemlich gut. Als Anfangsparameter übergeben wir zufällige Werte, aber in einem realen Anwendungsfall kannst du einen Client bitten, dir die Anfangsgewichte zu geben, damit du realistischere Startgewichte hast, was wiederum eine schnellere Konvergenz bedeutet.

Anhand des Bildes (Arbeit des Autors) kannst du erkennen, was der Server ausgibt und welche Prozesse er durchläuft. Wie du sehen kannst, befolgt der Server nach der Initialisierung die Schritte, die wir zuvor erwähnt haben. In jeder Runde wählt er eine Gruppe von Clients für das Training (fit_rounds) aus, fasst die Daten zusammen und liefert dann eine Bewertung für diese Runde.

Client-Seite

Auf der Client-Seite verwenden wir dieselbe Modell-Architektur, da es unmöglich wäre, die Gewichtungen zu aggregieren, ohne zu wissen, zu welcher Modell-Architektur sie gehören. Die Gewichtungen können als Materialien zum Bau eines Gebäudes betrachtet werden. Ohne den Bauplan (die Modell-Architektur) des Gebäudes wäre es unmöglich, die Materialien an den richtigen Positionen zu platzieren.

Aus dem Bild (Arbeit des Autors) kann man erkennen, dass der Client zuerst eine Verbindung zum Server herstellt. Danach trainiert er das Modell mit lokalen Daten und zeigt auch an, wie das Modell mit diesen Daten abschneidet.

Fazit

Federated Learning ist ein faszinierendes Konzept, das nicht nur aus technischer Sicht interessant ist, sondern auch aus geschäftlicher Sicht. Die Idee, Modelle direkt auf den verteilten Datenquellen der Nutzer zu trainieren, ermöglicht es, datenintensive ML-Anwendungen in Bereiche zu erweitern, die zuvor aufgrund von Datenschutzbedenken oder begrenztem Datenzugang ausgeschlossen waren. Im nächsten Blogbeitrag werden wir uns mit den fortgeschrittenen Techniken und bekannten Problemen von Federated Learning befassen.

References:

Németh, Gergely Dániel, et al. "A Snapshot of the Frontiers of Client Selection in Federated Learning." Transactions on Machine Learning Research, 2022, https://openreview.net/forum?id=vwOKBldzFu
McKinsey & Company, Inc. Smartening up with Artificial Intelligence (AI) - What’s in it for Germany and its Industrial Sector? Digital McKinsey, 2017, www.mckinsey.com/~/media/mckinsey/industries/semiconductors/our%20insights/smartening%20up%20with%20artificial%20intelligence/smartening-up-with-artificial-intelligence.ashx . Accessed 24 July 2023.

War dieser Beitrag hilfreich?

SPRACHE

Beitrag teilen

Gefällt mir

Blog-Autor*in

Ihsan Kisi

Werkstudent

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Ihsan Kisi

An introduction to federated learning in an industrial context: Advanced

In the Machine Learning space, it was long believed that sharing learnings or weights was safe in the sense that the input data couldn't be extracted. However, this belief has been challenged by researchers coming out over the years. Nowadays, numerous...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 9 Minuten Lesezeit

Ihsan Kisi

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Green Cloud: Daten und Emissionen sparen

Das Internet produziert jährlich 900 Millionen Tonnen CO₂ – das ist deutlich mehr als Deutschland insgesamt emittiert. Hauptverantwortlich ist der immer weiter steigende Stromverbrauch beim Transport und der Speicherung von Daten. Wenn ihr kurz darüber...

Cloud
Green IT
Softwarearchitektur
Data

11.3.2024 | 5 Minuten Lesezeit

Dennis

Charge your APIs Volume 23: REST vs. gRPC

APIs dienen als Verbindungsstück zwischen Daten und Verarbeitung und erlauben uns damit, Daten im richtigen Kontext als Informationen zu interpretieren. Passende fachliche Themen sind dabei präsenter denn je und erreichen bald auch den Endverbraucher...

Java
Softwareentwicklung
Spring
Softwarearchitektur
API
Data

11.2.2024 | 7 Minuten Lesezeit

Sebastian Tiemann

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Im Bereich des maschinellen Lernens wurde eine lange Zeit angenommen, dass die Eingabedaten von Modellen und Gewichten sicher sei und nicht extrahiert werden könnten. In den letzten Jahren veröffentlichte Forschung hat diese Annahme in Frage gestellt...

Machine Learning
Big Data
Data Science
Data

18.9.2023 | 8 Minuten Lesezeit

Ihsan Kisi

Große Sprachmodelle: Was ist ein LLM?

Große Sprachmodelle (Large Language Models oder LLM) haben in den letzten Jahren enorme Fortschritte gemacht und spielen eine entscheidende Rolle in verschiedenen Anwendungen. Aber was ist ein LLM? Es ist sinnvoll zu erklären, was ein „einfaches“ Sprachmodell...

Machine Learning

20.6.2023 | 4 Minuten Lesezeit

Elvira Siegel

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Wenn wir Erkenntnisse aus großen Datenmengen gewinnen wollen, bieten uns Cloud Service Provider inzwischen Lösungen an, dank derer wir uns kein Data Warehouse oder Hadoop-Cluster mehr in den Keller stellen müssen. AWS hat mit Athena, RedShift und EMR...

Cloud
Big Data
AWS
Serverless
GitLab

21.3.2023 | 16 Minuten Lesezeit

Maik Fleuter

Bessere SQL-Datenpipelines mit dbt

SQL ist weiterhin aus der Datenanalyse nicht wegzudenken – es ist vergleichsweise einfach zu lernen und Anwender können es ohne zusätzliche Werkzeuge auf einer Datenbank ausführen. Entsprechend ist es bei vielen Datenanalysten und Engineers beliebt. ...

Data

22.2.2023 | 2 Minuten Lesezeit

Matthias Niehoff

Data Governance: Wie können wir Daten demokratisieren?

“Data is the new oil” ist inzwischen ein alter Hut. Jedes Unternehmen versucht, Daten besser zu nutzen, sei es, um die eigenen Prozesse zu optimieren, die Kunden besser zu verstehen oder neue Produkte anzubieten. Dabei stellen fast alle fest: Wir haben...

Data Science

23.11.2022 | 2 Minuten Lesezeit

Matthias Niehoff

Streaming Wikipedia mit Apache Kafka

Apache Kafka ist in aller Munde und entwickelt sich im Kontext von verteilten Systemen zum De-facto-Standard als Plattform für Event Streaming. Im Rahmen unserer OffProject Time (Weiterbildungszeit) haben wir uns die Plattform auch näher angeschaut und...

Kotlin
Data
Java
Messaging
Spring

15.8.2022 | 10 Minuten Lesezeit

Christoph Metzger

Felix Rieß

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

In diesem Artikel möchte ich euch mit einem Python Jupyter Notebook zeigen, wie ihr Anwendungsfälle der Tourenoptimierung inklusive Nebenbedingungen lösen und visualisieren könnt. Außerdem zeige ich euch, wie ihr mit OpenStreetMaps die Route zwischen...

Data

21.6.2022 | 7 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

In diesem Artikel möchte ich euch zeigen, wie ihr Probleme der Tourenoptimierung in einem Python Jupyter Notebook lösen und visualisieren könnt. Am Beispiel eines Fahrradkurierdienst zeige ich außerdem, wie das Grundproblem um gängige Nebenbedingungen...

Data

16.6.2022 | 9 Minuten Lesezeit

Lukas Heidemann

Einführung in die Welt der Tourenoptimierung (1/3)

In vielen Unternehmen fallen täglich verschiedene Transportprozesse an. Klassische Beispiele sind die Optimierung von Warenein- und ausgängen, die Einsatzplanung von Servicetechnikern oder die optimale Reihenfolge der Auslieferung bei Lieferdiensten....

Data

12.6.2022 | 8 Minuten Lesezeit

Lukas Heidemann

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Die Corona-Krise ist weiterhin in aller Munde und wird uns mit hoher Wahrscheinlichkeit noch etwas länger begleiten. Wie man aus unterschiedlichen Statistiken erfährt, schwanken die Fallzahlen weiter und sorgen für zusätzliche Restriktionen. Diese werden...

Computer Vision
Künstliche Intelligenz
IoT
Machine Learning

13.12.2021 | 7 Minuten Lesezeit

Michel Ehmen

Machine-Learning-Modelle bewerten – Quality Gates etablieren

Die Qualität bzw. Nützlichkeit von Machine-Learning-Modellen lässt sich mit Hilfe von Testdaten und Metriken bewerten. Allerdings in welchem Umfang? Manuell, automatisiert, einmalig, regelmäßig? Manuell lassen sich die ersten Modelle als Ergebnis eines...

Data
Machine Learning
Softwareentwicklung
CI/CD

7.12.2021 | 7 Minuten Lesezeit

Berthold Schulte

Kürzere Time-to-Market für ML-Modelle durch Googles BigQuery ML

Machine Learning (ML) erzeugt erst dann realen Mehrwert, wenn es in Produktion benutzt wird. Allerdings kann die Zeitspanne zwischen der Entwicklung eines belastbaren Modells und dessen Einsatz frustrierend lange sein. Insbesondere in schnelllebigen ...

Agile Methoden
Cloud
Machine Learning

26.7.2021 | 5 Minuten Lesezeit

Timo Böhm

Niklas Haas

Schnelles Training eines Recommendation-Modells durch BigQuery ML

Machine Learning (ML) kann nur durch Modelle in der Produktion Business Value erzeugen. Allerdings kann die Zeitspanne zwischen der Entwicklung der nächsten Iteration eines Modells und dessen Einsatz in einer Produktionsumgebung massiv sein. Dies gilt...

Accelerate
Cloud
Data
Google Cloud
Machine Learning

26.7.2021 | 11 Minuten Lesezeit

Niklas Haas

Timo Böhm

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Heutzutage steht fast alles, was mit den Labels „künstliche Intelligenz (KI)“ oder „Machine Learning (ML)“ versehen ist, für Fortschritt. Seltsamerweise schließt diese Assoziation jedoch häufig die Themen Daten und Dateninfrastruktur nicht ausreichend...

Kultur
Data
Machine Learning

21.6.2021 | 12 Minuten Lesezeit

Marcel Mikl

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

Bei klassischen Machine-Learning-(ML-)Projekten beschäftigen sich Data Scientists häufig längere Zeit (mehrere Monate) mit der Entwicklung eines ML-Modells. Dabei werden hohe Kosten verursacht und die Zeit, bis ein erstes Modell zur Verfügung steht, ...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Google Cloud
Machine Learning

17.5.2021 | 5 Minuten Lesezeit

Nils Bauroth

Sven Rediske

The Good, the Bad and the Ugly: Daten effektiv visualisieren und kommunizieren

Dieser Artikel begleitet meinen Vortrag The Good, the Bad and the Ugly: Daten effektiv visualisieren und kommunizieren, den ich am 20.10.2020 auf der data2day gehalten habe.Datenvisualisierung ist ausschlaggebend für Verständnis und KommunikationDatenvisualisierung...

Data
Data Science

19.10.2020 | 11 Minuten Lesezeit

Shirin Elsinghorst

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

Noch vor kurzer Zeit mussten für den Einsatz von künstlicher Intelligenz (KI) unter großem Aufwand eigene KI-Modelle erstellt werden. Heute ist für viele Anwendungsfälle die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken...

Cloud
Computer Vision
Data
Künstliche Intelligenz
Machine Learning
Python

29.7.2020 | 11 Minuten Lesezeit

Marcel Mikl

Nico Axtmann

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Noch vor kurzer Zeit war der Einsatz von künstlicher Intelligenz (KI) nur mit großem Aufwand und Konstruktion eigener neuronaler Netze möglich. Heute ist die Einstiegshürde in die Welt der KI durch Cloud-Computing-Dienste stark gesunken. So kann man ...

Cloud
Computer Vision
Data
Python
Machine Learning
Google Cloud
Künstliche Intelligenz

8.7.2020 | 11 Minuten Lesezeit

Nico Axtmann

Marcel Mikl

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Du stehst vor einer großen IT-Herausforderung? Wir sorgen für eine maßgeschneiderte Unterstützung. Informiere dich jetzt.

Hilf uns, noch besser zu werden.

Wir sind immer auf der Suche nach neuen Talenten. Auch für dich ist die passende Stelle dabei.

Kontakt

Absenden

Eine Einführung in Federated Learning im industriellen Kontext: Grundlagen

Strategie für federated learning

Proof of Concept: Predictive Maintenance

Bedeutung von KI-gestützter Predictive Maintenance

Implementierung

Server-Seite

Client-Seite

Fazit

War dieser Beitrag hilfreich?

Ja

Blog-Autor*in

Kontakt aufnehmen

Kontakt aufnehmen

Weitere Beiträge

An introduction to federated learning in an industrial context: Advanced

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Zur Stellenanzeige

Weitere Artikel in diesem Themenbereich

Green Cloud: Daten und Emissionen sparen

Charge your APIs Volume 23: REST vs. gRPC

Eine Einführung in Federated Learning im industriellen Kontext: Fortgeschritten

Große Sprachmodelle: Was ist ein LLM?

Datenanalyse auf die schnelle Art – mit Amazon Athena und GitLab

Bessere SQL-Datenpipelines mit dbt

Data Governance: Wie können wir Daten demokratisieren?

Streaming Wikipedia mit Apache Kafka

Einführung in die Welt der Tourenoptimierung – Echte Routen und realistischere...

Einführung in die Welt der Tourenoptimierung – Visualisierung und Lösungsverfahren...

Einführung in die Welt der Tourenoptimierung (1/3)

Smart DistancR – Perspektivisch korrekte Distanzmessung zwischen Personen

Machine-Learning-Modelle bewerten – Quality Gates etablieren

Kürzere Time-to-Market für ML-Modelle durch Googles BigQuery ML

Schnelles Training eines Recommendation-Modells durch BigQuery ML

KI, Daten und Infrastruktur – ML-Systeme schnell Ende-zu-Ende verproben...

Schnelles KI-Prototyping mit Google Cloud AutoML Vision

The Good, the Bad and the Ugly: Daten effektiv visualisieren und kommunizieren

KI in der Praxis: Fehlerhafte Bauteile mit Rekognition auf AWS identifizieren

KI in der Praxis: Fehlerhafte Bauteile mit AutoML in der Google Cloud ...

Gemeinsam bessere Projekte umsetzen.

Wir helfen deinem Unternehmen.

Unsere Leistungen

Hilf uns, noch besser zu werden.

Zu den Jobangeboten