Dokumentenklassifikation, Datenextraktion und der ganze Rest…

20.8.2019 | 7 Minuten Lesezeit

Im Laufe der Zeit gab es im codecentric-Blog viele Beiträge, die Dokumentenklassifikation und Datenextraktion zum Thema hatten. In diesem Beitrag möchte ich diese Artikel nochmal in einen Zusammenhang stellen und auf Neuerungen bei den älteren Beiträgen hinweisen.

Da wir bei der codecentric im Bereich Digital Integration sehr viel mit den Produkten Kofax Capture / Kofax Transformation Modules und Kofax Total Agility arbeiten, nimmt ein großer Teil der aufgeführten Beiträge Bezug auf diese Produkte.

Die aufgeführten Beiträge entstanden unabhängig voneinander im Laufe der letzten Jahre. Der Übersichtlichkeit halber, habe ich versucht die Artikel in zusammenhängende Bereiche zusammenzufassen:

Allgemeine Vorgehensweisen
Berichte aus der Praxis / Success Story
Tipps und Tricks
Neueste Trends
Die Basis von allem
Was es sonst noch gab

Allgemeine Vorgehensweisen

Unabhängig von bestimmten Projekten beleuchten diese Artikel allgemeine Vorgehensweisen bei Kundenprojekten zur Dokumentenklassifikation/Datenextraktion.

Christian Böhnel hat bereits im Jahre 2010 eine Klassiker verfasst, der die Themen Messbarkeit der Erkennungsleistung und Dunkelverarbeitung von Dokumenten beinhaltet. Die dort angesprochene Vorgehensweise ist auch heute noch genauso aktuell wie damals:

Wieviel Erkennung braucht Dunkelverarbeitung?

Basis einer Verarbeitung von Eingangsdokumenten ist fast immer die Klassifikation der Dokumente in Dokumentenklassen. Die zu extrahierenden Daten sind ja meist je Dokumentenklasse verschieden. Der folgende Artikel erläutert die in Kofax Transformation Modules vorhandenen Klassifikationswerkzeuge:

Dokumentenklassifizierung mit Kofax Transformation Modules (KTM)

Künstliche Intelligenz, neuronale Netze und maschinelles Lernen sind aktuelle Techniken in dem hier besprochenen Umfeld. Kofax Transformation Modules setzt diese schon seit Jahren ein und liefert mit jedem Release aktualisierte und neue Werkzeuge:

Kofax Transformation Modules (KTM), KI und maschinelles Lernen

Berichte aus der Praxis

Die folgenden Blog-Beiträge entstanden aus Projektsituationen bei Kunden. Sie handeln von Details beim Bearbeiten von SEPA-Mandaten bis hin zu einer Success Story der Provinzial Nordwest über den Einsatz der KTM-KI-Komponenten zur Automatisierung von Versicherungsprozessen.

Bei einem unserer Kunden erfolgt die Verarbeitung eingehender SEPA-Mandate automatisch oder manuell, je nachdem ob in einer bestimmten Region des Formulars handschriftliche Ergänzungen vorgenommen wurden. Hier wird erklärt mit welchen Werkzeugen KTM dies handschriftlichen Ergänzungen erkennn kann:

Kofax Transformation Modules: SEPA-Mandate und handschriftliche Ergänzungen – oder: wer hat etwas auf mein Formular gekritzelt?

Ein bei jedem Projekt zu diskutierenden Punkt ist das Thema „Dunkelverarbeitung“. Zu Projektbeginn versteht meist jeder etwas anderes darunter, und man muss zunächst zu einem gemeinsamen Verständnis kommen. Die unterschiedlichen Sichtweisen werden im folgenden Artikel erläutert:

KTM im Versicherungseinsatz: Heller, grauer und dunkler Posteingang

Ziel eines Erkennungsprozesses ist die möglichst automatische Verarbeitung der Belege. Hier bieten sich häufig eingehende Kündigungsschreiben an, da dort fast immer das Kündigungsdatum in irgendeiner Form erwähnt wird. Welche Probleme dabei in der Praxis auftreten und wie diese mit KTM-Mitteln gelöst werden können, wird hier beschrieben:

Unterstützung eines automatisierten Kündigungsprozesses mit Kofax KTM

Das folgende war ursprünglich als Blog-Artikel geplant, ist dann aber in Zusammenarbeit mit unserem Kunden zu einer Sucess Story geworden. Die Provinzial Nordwest setzt schon seit einigen Jahren für die Posteingangsverarbeitung Kofax Capture und Kofax Transformation Modules ein. Im Rahmen der Prozessautomatisierung wurden dann die KI-Komponenten von Kofax Transformation Modules zur Automatisierung verschiedener Versicherungsprozesse genutzt:

Automatisierung von Versicherungsprozessen mit Künstlicher Intelligenz (KI) (Success Story Provinzial Nordwest)

Tipps und Tricks

In fast jedem Kundenprojekt gibt es die „kleinen“ Probleme, die sich mit den Standardwerkzeugen nicht so ohne weiteres lösen lassen. Dann ist Ideenreichtum gefragt, um möglichst ohne andere externe Produkte eine Lösung zu finden. Hier folgt eine Sammlung von Tipps und Tricks, die so entstanden sind.

Scan- und Erkennungssoftware versucht häufig die erfassten Seiten „richtig“ auszurichten, so dass sie ohne weitere manuelles Drehen lesbar sind. Manchmal scheitert diese Automatik, da insbesondere bei Faxen manchmal Texte 90° oder 180° gedreht zum Haupttext erscheinen. Wie man diese Dokumente trotzdem automatisiert „richtig“ ausrichten kann, beschreibt der folgende Artikel:

Orientierungsprobleme bei der Dokumentenerkennung (Kofax Transformation Modules)

KTM bietet die Möglichkeit, mit sogenannten Wörterbüchern zu arbeiten. Sucht man mit regulären Ausdrücken beispielsweise nach einem Datum, kann dieses in verschiedenen Formaten auf den Dokumenten erscheinen: 01.09.2019 oder 01. September 2019 usw. In einem Wörterbuch (eine einfache Textdatei) kann man nun z. B. alle Monatsnamen und deren Abkürzungen eintragen und dieses Wörterbuch im regulären Ausdruck referenzieren. Dies spart einerseits Tipparbeit bei der Definition des regulären Ausdrucks und andererseits kann man Wörterbücher unabhängig vom KTM-Projekt verändern. Manchmal ergibt sich der Wunsch, dass man im Projekt per Skripting etwas im Wörtbuch suchen möchte. Dies kann folgendermaßen realisiert werden:

Kofax Transformation Modules (KTM) – Suche per Skript in Wörterbüchern

Der folgende Tipp ist inzwischen hinfällig und nur noch für KTM Version 5 oder niedriger sinnvoll. In Maschinenschrift gedruckte Daten können leicht mittels Freiformerkennung ausgelesen werden. Das war bei handschriftlichen Daten nicht immer möglich, da die Ganzseiten-OCR-Engines auf Maschinenschrift optimiert waren. Der Artikel erläutert, wie man damals trotzdem mit der Freiformerkennung Handschriftliches erkennen konnte. Mit KTM 5.5 kam dann die „gemischte Schrift“-OCR-Ganzseitenerkennung, die sowohl Maschinen- als auch Handschrift auf einer Seite erkennt.

Kofax Transformation Modules (KTM): „Freiformerkennung“ für handschriftliche Nummern

Die Allzweckwaffe der Auslesewerkzeuge von KTM sind die sogenannten Formatlokatoren. Die beiden unten aufgeführten Artikel bieten eine Einführung in die Nutzung dieser Freiformerkennungswerkzeuge:

Kofax Transformation Modules – Formatlokatoren und dynamische reguläre Ausdrücke
Kofax Transformation Modules – Formatlokatoren und dynamische reguläre Ausdrücke – Teil 2

KTM ist sehr gut darin Informationen aus strukturierten und unstrukturierten Dokumenten auszulesen. Manchmal steht man aber vor dem Problem nicht nur Daten sondern auch Objekte auf Bildern erkennen zu müssen. Der folgende Artikel von Niko Blättermann zeigt, wie man KTM um diese Fähigkeiten erweitern kann:

Computer-Vision-Techniken in Kofax Transformation Modules (KTM/KTD)

Neueste Trends

Kofax Capture und Kofax Transformation Modules sind seit Jahren Basis vieler Erfassungslösungen und Kofax ist der Marktführer auf diesem Gebiet. Um auch für zukünftige erweiterte Anforderungen vorbereitet zu sein, gibt es seit einiger Zeit das Produkt Kofax Total Agility. Vereinfacht ausgedrückt beinhaltet dieses Produkt Kofax Capture, Kofax Transformation Modules und Kofax Import Connector eingebettet in eine vielseitige Workflow-Engine. Daniel Brodka erläutert die weitreichenden Fähigkeiten von KTA in diesem Artikel:

Einführung und erste Schritte in Kofax Total Agility

Eine aktuelle Technik, die immer größere Verbreitung findet, ist die sogenannte Robot Process Automation (RPA). Kofax stellt mit dem Produkt Kapow eine Plattform für die Verarbeitung von Daten von strukturierten oder unstrukturierten Datenbanken, Dateien, E-Mail-Systemen, Webseiten, Portalen und sogar älteren Mainframe-Systemen oder Terminal-Emulationen bereit, die sich perfekt in die vorhandene Lösungen einfügt. Kofax Kapow hat zwischenzeitlich den Namen geändert und heißt nun Kofax RPA. Stefan Blank hat die Möglichkeiten von Kofax RPA/Kapow anhand eines Beispiel-Robots sehr schön zusammengefasst:

Robotic Process Automation mit Kofax Kapow™

Die Basis von allem

Die erfolgreiche Erfassungslösung von Kofax ist Kofax Capture, und mit ihr kann man auch ganz ohne KTM eine Menge erreichen. Wie das geht und was man alles mit eigenen Erweiterungen erreichen kann, zeigt Stefan Blank in diesem sehr schönen Grundlagenartikel über die Erweiterungsmöglichkeiten von Kofax Capture:

Kofax Capture – Erweiterungsmöglichkeiten jenseits des Standards

In einem weiteren Artikel über Erweiterungen zu Kofax Capture erklärt Stefan Blank, wie man das Scan-Modul an projektspezifische Bedürfnisse anpassen kann:

Kofax Capture erweiterte Scan Api: Eine erste Annäherung

Kofax Capture bietet u. a. eine Möglichkeit, die erkannten Daten zu validieren und auch weitere Daten einzugeben. Dies wird im Validierungsmodul durchgeführt. Dort steht den Entwicklern eine Skriptsprache zur Verfügung, um das Validiermodul den Projektgegebenheiten individuell anzupassen. Diese Skriptsprache war viele Jahre das SB-Basic, welches in etwa dem Visual Basic der 90er Jahre entspricht. Doch seit einigen Jahren ist es auch möglich dort wahlweise mit .NET (VB, C#) zu entwickeln. Der folgende Artikel beschreibt, was man beachten muss, wenn man von SBL zu .NET wechseln möchte:

Kofax Capture Validierungsskripte – Von SBL zu VB.NET für Dummies

Ein weit verbreiteter Trennungsmechanismus für Dokumente sind Barcodes, die entweder als Aufkleber auf der ersten Dokumentenseite aufgebracht oder als Trennblatt vor der ersten Dokumentenseite eingelegt werden. Die Trennung mit Barcodes funktioniert generell sehr gut. Allerdings hat sich als Problem herausgestellt, dass manchmal „Fremd-Barcodes“, die bereits auf den Dokumentseiten aufgedruckt waren, dann auch als Trennbarcodes erkannt wurden. Damit ist dann natürlich die Dokumentenstruktur zerstört. Aber auch dafür gibt es Abhilfe:

Kofax Capture – Dokumententrennung mit Barcodes

Was es sonst noch gab

Neben den oben aufgelisteten Artikel über Erfassung, Klassifikation und Extraktion, erschienen im codecentric-Blog auch einige Artikel die andere Aspekte in diesem Umfeld beleuchteten.

CenterDevice ist ein Cloud-basiertes professionelles Dokumentenmanagement- und Online-Collaboration-System. CenterDevice wird von unseren Kunden häufig als Zielsystem für die Weiterverarbeitung/Ablage der erfassten Dokumente eingesetzt. Die beiden unten aufgeführten Artikel zeigen, wie sich Kofax Capture und CenterDevice ohne großen Aufwand integrieren lassen:

CenterDevice und Kofax Capture – Integration out of the box
CenterDevice und CenterScan – Scannen, Erkennen und sichere Ablage

Ich hoffe, die Aufbereitung und Einsortierung der diversen Blog-Artikel hat das gesamte Thema Erfassung, Klassifikation und Datenextraktion etwas übersichtlicher für den Leser gemacht. Für Fragen oder Anregungen steht unten die Kommentarfunktion zur Verfügung. Wir freuen uns über jede Anmerkung!

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Jürgen Voss

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Jürgen Voss

Spaß mit Flaggen: KTM – ein lockerer Rückblick auf 16 Jahre Kofax Transformation...

Anfang 2006 war ich bei DICOM beschäftigt, die einige Jahre zuvor Kofax gekauft hatten (ja, ich bin schon etwas älter). Da ich mit dem KTM-Vorgängerprodukt Ascent Advanced Forms schon einige Projekte erfolgreich durchgeführt hatte, durfte ich mich dann...

Digitalisierung

12.12.2022 | 2 Minuten Lesezeit

Jürgen Voss

Auslesen von deutschen Empfängeradressen mit Kofax Transformation Modules...

Das Auslesen von Adress-/Anschriftbereichen in Briefen war schon immer eine recht schwierige Problematik. Die Freude war umso größer, als Kofax vor einigen KTM-Versionen (Kofax Transformation Modules ) ein Werkzeug (Adress-Lokator) für das automatisierte...

NLP
Archivierung

7.3.2022 | 6 Minuten Lesezeit

Jürgen Voss

Natural Language Processing: Erweiterungen mit KTM 6.4

Im Frühjahr 2020 erhielt das Produkt Kofax Transformation Modules (KTM) mit dem Service Pack 6.3.1 ein neues Modul: Natural Language Processing (NLP). Natural Language Processing versucht, den Text des Dokuments zu analysieren, Wörter und deren Beziehungen...

Content Management
Archivierung
NLP

15.4.2021 | 2 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules: Natural Language Processing, Stimmungen ...

Kofax Transformation Modules (KTM) bietet diverse Werkzeuge, um Dokumente zu klassifizieren und Daten zu extrahieren. Diese Werkzeuge wurden bereits in früheren Blog-Artikeln erläutert: – Dokumentenklassifizierung – Datenextraktion mit Format-Lokatoren...

Content Management
NLP
Archivierung

16.3.2020 | 7 Minuten Lesezeit

Jürgen Voss

Orientierungsprobleme bei der Dokumentenerkennung (Kofax Transformation...

Bei der intelligenten Dokumentenklassifizierung und Datenextraktion von Eingangspost in Unternehmen müssen die Eingangskanäle Papier, Email und Fax berücksichtigt werden. Normalerweise ist die Orientierung der digitalisierten Dokumente (0°, 90°, 180°...

Content Management
NLP
Archivierung

7.7.2019 | 3 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules (KTM) – Suche per Skript in Wörterbüchern

Neben Fuzzy-Datenbanken bieten Kofax Transformation Modules (KTM) auch sogenannte Wörterbücher zur Optimierung der Erkennung an. Diese Wörterbücher können in den regulären Ausdrücken eines Formatlokators genutzt werden, um zum Beispiel neben einem Datum...

6.7.2017 | 2 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules (KTM), KI und maschinelles Lernen

Die Themen „KI“, maschinelles Lernen und Deep Learning sind in aller Munde, und in den Medien erscheinen regelmäßig Artikel darüber. Was viele nicht wissen ist, dass Kofax Transformation Modules (KTM) „unter der Haube“ auch Mechanismen des maschinellen...

16.5.2017 | 5 Minuten Lesezeit

Jürgen Voss

CenterDevice und CenterScan – Scannen, Erkennen und sichere Ablage

CenterDevice ist ein Cloud-basiertes, professionelles Dokumentenmanagement- und Online-Collaboration-System. Im codecentric-Blog-Artikel CenterDevice und Kofax Capture – Integration out of the box wurde die einfache Integration von CenterDevice und...

8.2.2017 | 2 Minuten Lesezeit

Jürgen Voss

CenterDevice und Kofax Capture – Integration out of the box

Eine Standardaufgabe in vielen Unternehmen ist die Digitalisierung von eingehenden Papier-, Fax- und EMail-Dokumenten, deren Klassifizierung, Datenextraktion, sowie die sichere Ablage in einem Dokumentenmanagementsystem. In diesem Artikel soll kurz skizziert...

7.12.2016 | 3 Minuten Lesezeit

Jürgen Voss

Unterstützung eines automatisierten Kündigungsprozesses mit Kofax KTM

Die Eingangsdokumente (Brief, Fax oder Email) bei einem unserer Versicherungskunden werden mit Kofax Capture erfasst und durch Kofax Transformation Modules (KTM) klassifiziert und die gewünschten Geschäftsdaten werden dann ebenfalls mit KTM extrahiert...

26.10.2016 | 4 Minuten Lesezeit

Jürgen Voss

Kofax Capture Validierungsskripte – Von SBL zu VB.NET für Dummies

Kofax Capture bietet standardmäßig die Möglichkeit, Indexwerte zu einem Dokument in einer Validierungsmaske einzugeben bzw. automatisch erkannte Werte dort zu bestätigen oder zu ändern. Dazu werden alle zu einer Dokumentart definierten Felder angezeigt...

8.6.2016 | 4 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules: SEPA-Mandate und handschriftliche Ergänzungen...

Im Rahmen der europaweiten SEPA-Einführung mussten viele Unternehmen in den letzten Jahren sogenannte SEPA Lastschriftmandate von ihren Kunden unterschreiben lassen. Die meisten Unternehmen sendeten ein mit den Kundendaten ausgefülltes Formular (das ...

19.2.2016 | 4 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules (KTM): ‚Freiformerkennung‘ für handschriftliche...

Freiformerkennung versucht im Gegensatz zur formularbasierten Erkennung, bestimmte Werte wie etwa eine Versicherungsnummer, irgendwo auf einem Dokument zu finden. Hilfreich dabei ist immer eine bestimmte Struktur des gesuchten Wertes, der dann meist ...

NLP
Archivierung

19.7.2015 | 3 Minuten Lesezeit

Jürgen Voss

Kofax Capture – Dokumententrennung mit Barcodes

Ein seit langem verbreiteter Trennungsmechanismus für Dokumente beim Scannen mit Kofax Capture ist das Aufkleben von Barcodeetiketten auf die erste Seite eines Dokuments. Alternativ kann der Barcode auch auf einem Einzeltrennblatt aufgebracht sein. Beim...

6.1.2015 | 4 Minuten Lesezeit

Jürgen Voss

IBM Content Collector for SAP (formerly known as IBM CommonStore for SAP...

IBM Content Collector for SAP (kurz ICC/SAP) ist die Verbindung zwischen SAP ERP-Systemen und den von IBM angebotenen Archivierungslösungen IBM Content Manager, On Demand und TSM. SAP stellt eine Standardschnittstelle zur Anbindung von externen Archivsystemen...

Content Management
NLP
Archivierung

22.7.2014 | 5 Minuten Lesezeit

Jürgen Voss

KTM im Versicherungseinsatz: Heller, grauer und dunkler Posteingang

Viele unserer Kunden setzten Systeme zur automatischen Dokumentenklassifikation und Datenextraktion ein. Diese Dokumenten-Erkennungssysteme ermitteln die Metadaten aus elektronischen Bildern (die gescannten Seiten der zu verarbeitenden Dokumente, Faxe...

29.11.2013 | 5 Minuten Lesezeit

Jürgen Voss

Dokumentenklassifizierung mit Kofax Transformation Modules (KTM)

Viele unserer Kunden setzen Systeme zur automatischen Dokumentenklassifikation und Datenextraktion ein. Eines dieser Systeme ist das Kofax Produkt ‚Kofax Transformation Modules‘ (KTM). Diese Dokumenten-Erkennungssysteme ermitteln die Metadaten aus elektronischen...

22.3.2013 | 6 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules – Formatlokatoren und dynamische reguläre...

Teil 2: Dynamische reguläre Ausdrücke in KTM Nachdem im ersten Teil dieses Blog-Artikels die Nutzung der Formatlokatoren mit regulären Ausdrücken beschrieben wurde, soll im Folgenden gezeigt werden, wie flexibel man durch die KTM-eigene Skripting-Sprache...

1.2.2013 | 3 Minuten Lesezeit

Jürgen Voss

Kofax Transformation Modules – Formatlokatoren und dynamische reguläre...

Teil 1: Einführung in Formatlokatoren und reguläre Ausdrücke Viele unserer Kunden setzten Systeme zur automatischen Dokumentenklassifikation und Datenextraktion ein. Diese Dokumenten-Erkennungssysteme ermitteln die Metadaten aus elektronischen Bildern...

9.1.2013 | 4 Minuten Lesezeit

Jürgen Voss

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Die codecentric TR-RESISCAN Lösung auf Basis von Kofax Capture

In einer Welt, in der Papierdokumente zunehmend digitalisiert werden, ist die effiziente Verarbeitung und Archivierung von Informationen von entscheidender Bedeutung. Für Unternehmen, die auf der Suche nach einer umfassenden Lösung für das Scannen, Prüfen...

Archivierung
Digitalisierung
Input-Management
DMS
Dokumentenmanagement
Kofax

23.4.2024 | 5 Minuten Lesezeit

Fred Wehmeyer

ChatGPT im Alltag eines Python-Entwicklers

Seit einigen Tagen spiele ich mit ChatGPT herum. Beruflich und privat konnte ich damit einige Fragen bearbeiten, bspw. welche Alternativen es zu bestimmten Tools gibt, was Vorteile von Teilzeit für den Arbeitgeber sind oder wer ich bin. Leider weiß ChatGPT...

NLP
Python
Künstliche Intelligenz

27.1.2023 | 7 Minuten Lesezeit

Robert Meißner

Mit wenigen Zeilen Code Titel und Vorschaubild generieren

Ich bin ein fauler Mensch. Und ich schreibe viel, u. a. beruflich und privat in Blogs, auf Twitter und auf Wissenschaftsseiten. Das Schreiben per se ist schön. Aber wenn ich mir Titel überlegen muss oder gar Schlagwörter, dann ist der Spaß vorbei. Noch...

11.10.2022 | 7 Minuten Lesezeit

Robert Meißner

Auslesen von deutschen Empfängeradressen mit Kofax Transformation Modules...

NLP
Archivierung

7.3.2022 | 6 Minuten Lesezeit

Jürgen Voss

Natural Language Processing: Erweiterungen mit KTM 6.4

Content Management
Archivierung
NLP

15.4.2021 | 2 Minuten Lesezeit

Jürgen Voss

Handschriftenerkennung bei der Dokumentenklassifikation und -extraktion

Im Rahmen eines Kundenprojektes bei einem Telekommunikationsunternehmen war die Aufgabenstellung folgende: Die Eingangsbriefpost musste digitalisiert werden. Nach dem Scannen der Dokumente galt es diese zu klassifizieren (z. B. Kündigungen, Beschwerden...

Content Management
NLP

29.3.2020 | 3 Minuten Lesezeit

Thomas Bergmann

Kofax Transformation Modules: Natural Language Processing, Stimmungen ...

Kofax Transformation Modules (KTM) bietet diverse Werkzeuge, um Dokumente zu klassifizieren und Daten zu extrahieren. Diese Werkzeuge wurden bereits in früheren Blog-Artikeln erläutert:– Dokumentenklassifizierung – Datenextraktion mit Format-Lokatoren...

Content Management
NLP
Archivierung

16.3.2020 | 7 Minuten Lesezeit

Jürgen Voss

Orientierungsprobleme bei der Dokumentenerkennung (Kofax Transformation...

Content Management
NLP
Archivierung

7.7.2019 | 3 Minuten Lesezeit

Jürgen Voss

codecentric.AI Bootcamp ist online!

Im letzten Jahr haben wir bei codecentric eine AI-Initiative gestartet. Wir haben uns zum Ziel gesetzt, einen Online-Kurs zum Thema Machine Learning und künstliche Intelligenz in deutscher Sprache zu entwickeln. Natürlich gibt es bereits mehrere sehr...

Computer Vision
Künstliche Intelligenz
NLP

26.5.2019 | 4 Minuten Lesezeit

Oliver Moser

Natural Language Processing - Einsteigen und loslegen!

1 Worum geht es?Ob Suchmaschinen, Spamfilter, Chatbots oder Sprachassistenten wie Siri und Alexa — Computer verarbeiten immer mehr Sprache mit immer besserer Genauigkeit und dringen damit immer weiter in unseren Alltag vor. Dahinter stecken anspruchsvolle...

Künstliche Intelligenz
Machine Learning
Python
NLP
Data

7.3.2019 | 11 Minuten Lesezeit

Thomas Timmermann

Ausrollen von Paketen mit Jenkins und der Cloud-Lösung CenterDevice

Manchmal gibt es Projekte, in denen man nicht die Hoheit über das Produktivsystem des Kunden hat, man also nicht selbständig neue Versionen vollautomatisiert vom Build bis ins Produktivsystem bringen kann. Man muss also einen Weg finden, dem Kunden die...

Archivierung
Cloud
CI/CD

25.9.2017 | 5 Minuten Lesezeit

Oliver

Introduction of and first steps in Kofax Total Agility

Kofax Total Agility (KTA) is one and probably the leading product in the First Mile™ strategy of Kofax. This strategy implies a simplification and improvement of the first steps of a business case. You can see KTA as a versatile workflow platform which...

Content Management
Archivierung

8.7.2017 | 10 Minuten Lesezeit

Daniel Brodka

Robotic Process Automation mit Kofax Kapow™

Kapow Software wurde 2013 von Kofax übernommen und passt perfekt in dessen First Mile™ Strategie. Kofax Kapow stellt eine Plattform für die Verabeitung von Daten von strukturierten oder unstrukturierten Datenbanken, Dateien, E-Mail-Systemen, Webseiten...

Archivierung
BPM

24.4.2017 | 11 Minuten Lesezeit

Stefan Blank

Computer-Vision-Techniken in Kofax Transformation Modules (KTM/KTD)

„Computer Vision“ ist eines der wichtigsten, aktuellen Themen in der IT. Überall in modernen Systemen kommt diese Technologie zum Einsatz – sei es in den genialen Autos von Tesla („Object Detection“ für Hindernisse, andere Verkehrsteilnehmer, Straßenschilder...

Data
NLP
Softwareentwicklung
Computer Vision
Archivierung
Künstliche Intelligenz

11.4.2017 | 3 Minuten Lesezeit

Niko Blättermann

Topic Modeling der codecentric Blog-Artikel

Der größte Teil von Big Data sind unstrukturierte Daten. Wenn eine Organisation ihre oder externe Daten von sozialen Medien mit dem Ziel besserer Geschäftsentscheidungen nutzbar machen möchte, so besteht eine Herausforderung darin aus unstrukturierten...

NLP
Python
Machine Learning

3.1.2017 | 15 Minuten Lesezeit

Matthias Radtke

Kofax Transformation Modules (KTM): ‚Freiformerkennung‘ für handschriftliche...

NLP
Archivierung

19.7.2015 | 3 Minuten Lesezeit

Jürgen Voss

IBM Content Collector for SAP (formerly known as IBM CommonStore for SAP...

Content Management
NLP
Archivierung

22.7.2014 | 5 Minuten Lesezeit

Jürgen Voss

Automatisierter Modulimport für OpenCms

In einem unserer Projekte verwenden wir seit langer Zeit OpenCms als Redaktionssystem, ergänzt um ein Backend zur Realisierung von Fachlogik. Da wir agil arbeiten, haben wir natürlich auch den Anspruch, agil zu testen. Erste Maßnahme in Sprint 1 des ...

CI/CD
Content Management

15.4.2010 | 5 Minuten Lesezeit

Robert Spielmann

Jetzt für unseren Newsletter anmelden

Alles Wissenswerte auf einen Klick:
Unser Newsletter bietet dir die Möglichkeit, dich ohne großen Aufwand über die aktuellen Themen bei codecentric zu informieren.

Dokumentenklassifikation, Datenextraktion und der ganze Rest…

Allgemeine Vorgehensweisen

Berichte aus der Praxis

Tipps und Tricks

Neueste Trends

Die Basis von allem

Was es sonst noch gab

War dieser Beitrag hilfreich?

Blog-Autor*in

Weitere Beiträge

Spaß mit Flaggen: KTM – ein lockerer Rückblick auf 16 Jahre Kofax Transformation...

Auslesen von deutschen Empfängeradressen mit Kofax Transformation Modules...

Natural Language Processing: Erweiterungen mit KTM 6.4

Kofax Transformation Modules: Natural Language Processing, Stimmungen ...

Orientierungsprobleme bei der Dokumentenerkennung (Kofax Transformation...

Kofax Transformation Modules (KTM) – Suche per Skript in Wörterbüchern

Kofax Transformation Modules (KTM), KI und maschinelles Lernen

CenterDevice und CenterScan – Scannen, Erkennen und sichere Ablage

CenterDevice und Kofax Capture – Integration out of the box

Unterstützung eines automatisierten Kündigungsprozesses mit Kofax KTM

Kofax Capture Validierungsskripte – Von SBL zu VB.NET für Dummies

Kofax Transformation Modules: SEPA-Mandate und handschriftliche Ergänzungen...

Kofax Transformation Modules (KTM): ‚Freiformerkennung‘ für handschriftliche...

Kofax Capture – Dokumententrennung mit Barcodes

IBM Content Collector for SAP (formerly known as IBM CommonStore for SAP...

KTM im Versicherungseinsatz: Heller, grauer und dunkler Posteingang

Dokumentenklassifizierung mit Kofax Transformation Modules (KTM)

Kofax Transformation Modules – Formatlokatoren und dynamische reguläre...

Kofax Transformation Modules – Formatlokatoren und dynamische reguläre...

Dein Job bei codecentric?

Agile Developer und Consultant (w/d/m)

Weitere Artikel in diesem Themenbereich

Die codecentric TR-RESISCAN Lösung auf Basis von Kofax Capture

ChatGPT im Alltag eines Python-Entwicklers

Mit wenigen Zeilen Code Titel und Vorschaubild generieren

Auslesen von deutschen Empfängeradressen mit Kofax Transformation Modules...

Natural Language Processing: Erweiterungen mit KTM 6.4

Handschriftenerkennung bei der Dokumentenklassifikation und -extraktion

Kofax Transformation Modules: Natural Language Processing, Stimmungen ...

Orientierungsprobleme bei der Dokumentenerkennung (Kofax Transformation...

codecentric.AI Bootcamp ist online!

Natural Language Processing - Einsteigen und loslegen!

Ausrollen von Paketen mit Jenkins und der Cloud-Lösung CenterDevice

Introduction of and first steps in Kofax Total Agility

Robotic Process Automation mit Kofax Kapow™

Computer-Vision-Techniken in Kofax Transformation Modules (KTM/KTD)

Topic Modeling der codecentric Blog-Artikel

Kofax Transformation Modules (KTM): ‚Freiformerkennung‘ für handschriftliche...

IBM Content Collector for SAP (formerly known as IBM CommonStore for SAP...

Automatisierter Modulimport für OpenCms

Jetzt für unseren Newsletter anmelden