Informatik Aktuell

11/19

Data Science in der Praxis

Autor:
Mark Keinhörster, Tim Sabsch

Wie Softwareentwicklung und Data Science zusammenspielen

Wir erklären, wie Data Scientisten und Engineers Werkzeuge wie DVC nutzen können, um sämtliche Elemente eines Projekts zu versionieren: Angefangen beim Datensatz, über den Code bis zum Modell selbst. Das ist aber noch nicht alles!

In diesem Artikel erklären wir den gesamten Entwicklungsprozess, einschließlich Experimente und Reproduzierbarkeit, sowie Release und Deployment des Modells in die freie Wildbahn.

Durch die steigende Datenflut gewinnen maschinelle Lernverfahren nicht nur in der Forschung immer mehr an Beliebtheit, sondern werden auch zunehmend in der Wirtschaft und der Industrie eingesetzt. Kein Wunder, gestalten moderne Frameworks wie TensorFlow oder PyTorch den Einstieg in die Entwicklung von Machine-Learning-Modellen so einfach wie nie. Schnell lassen sich damit effiziente Algorithmen entwickeln, die im besten Fall ganze Regelwerke ablösen und selbstständig Entscheidungen treffen können. Die Entwicklung von ML-Modellen ist jedoch häufig noch vom experimentierfreudigen Data-Science-Ansatz geprägt: Hyperparameter werden sorglos manuell angepasst und getestet oder Features in den Daten werden unterschiedlich vorverarbeitet, bis das Modell eine vernünftige Qualität liefert. Diese Entwicklungsstrategie mag für kurzlebige Projekte funktionieren, verliert bei längeren Zeiträumen und in größeren Teams aber schnell an Übersicht. Auf der anderen Seite beachten etablierte Softwareentwicklungs-Strategien oftmals nicht den experimentellen Anteil in der Arbeit mit diesen Technologien. Das Ergebnis sind schwer nachvollziehbare Projektresultate und frustrierte Entwickler. Viele Projekte passen ihre Entwicklungsstrategien und -muster jedoch nicht auf die Besonderheiten dieser Technologien an.

Vollständiger Artikel

Cookies erleichtern die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden. Weitere Informationen

Hinweis: In Ihrem Browser ist JavaScript deaktiviert. Für eine bessere und fehlerfreie Nutzung dieser Webseite, aktivieren Sie bitte JavaScript in Ihrem Browser.