Vorträge

Treffen Sie uns auf einer Konferenz!

Verschaffen Sie sich einen Überblick, auf welchen Events unsere codecentric-Kollegen als Referenten vertreten sind. Wir würden uns freuen, Sie auf einer Konferenz persönlich begrüßen zu dürfen.

Skalierbare OCR Pipelines mit Python, Tensorflow und Tesseract

24.04.2018

devday.18

BÖRSE DRESDEN, Messering, Dresden, Deutschland

Mark ist im April zu Gast beim devday.18 in Dresden und spricht über skalierbare OCR Pipelines. Sein Abstract lautet:

In diesem Vortrag machen wir einen Ausflug in die Welt der Texterkennung mit freier Software und gehen Stück für Stück durch die einzelnen Teilbereiche einer flexiblen und skalierbaren OCR-Applikation. In einer Live-Demo wird gezeigt wie Tesseract zur Texterkennung verwendet und die Qualität mit freien Frameworks wie openCV verbessert wird. Im Anschluss werden die Dokumente indiziert abgelegt. Das alles mit nur wenigen Zeilen Code und ganze im Sinne des Interactive Programming mit Jupyter.

== Agenda inklusive Live-Coding ==
– Quirks und Pitfalls beim Erkennen von Dokumenten
– Möglichkeiten und Vorverarbeitung mit openCV
– Tesseract skalierbar Nutzen
– Ergebnisse quantifizieren, vergleichen und Aufwerten
– Texterkennung mit Tensorflow die über das MNIST Beispiel hinausgeht

Mark KeinhörsterMark Keinhörster