• Publikation
  • Machine Learning in Produktion: Die zwei Seiten eines Daten-Projekts
  • Machine Learning in Produktion: Die zwei Seiten eines Daten-Projekts

Java aktuell

03/21

Machine Learning in Produktion: Die zwei Seiten eines Daten-Projekts

Geschrieben von:
Mark Keinhörster

Vom Feature-Engineering über das Training bis hin zur Visualisierung; Tools und Frameworks für Data Scientists gibt es zuhauf. Aber was kommt nach einem Proof-of-Concept? Da Data-Science-Experimente eher experimenteller Natur sind, stellen sie klassische IT-Projekte vor Herausforderungen. Neben der Anwendung selbst müssen nun auch die trainierten Modelle sowie deren Code für Training und Evaluation den Ansprüchen der modernen Softwareentwicklung gerecht werden. Dem geht Mark in seinem Java-aktuell-Artikel auf den Grund.

Data Science (DS) und Machine Learning (ML) sind in der Wirtschaft mittlerweile angekommen und immer mehr Unternehmen nutzen neuronale Netze, Entscheidungsbäume und Konsorten zur Implementierung neuer Features oder ganzer Geschäftsideen. Das verwundert wenig, denn moderne Frameworks wie TensorFlow, Keras oder Pytorch gestalten den Einstieg verhältnismäßig leicht, ohne tief in die Mathematik der Algorithmen einsteigen zu müssen. Rund um die Thematik entwickelt sich ein großes Ökosystem aus Tools und Frameworks, die die Nutzer vom Feature-Engeering über das Training der Modelle bis hin zur Visualisierung der Ergebnisse unterstützen. Leider ist die Entwicklung von ML-Modellen, das ML-Engineering, immer noch vom experimentierfreudigen Data-Science-Ansatz beeinflusst. Hyperparameter werden ad hoc justiert und Datensätze unterschiedlich vorverarbeitet, bis die Modellqualität ausreichend ist. Das mag in kleineren Projekten funktionieren, skaliert bei längeren Laufzeiten und größeren Teams jedoch nur noch unzureichend. Das Ergebnis sind häufig schwer zu reproduzierende Resultate und frustrierte Entwickler.

Vollständiger Artikel

Hinweis: In Ihrem Browser ist JavaScript deaktiviert. Für eine bessere und fehlerfreie Nutzung dieser Webseite, aktivieren Sie bitte JavaScript in Ihrem Browser.