Direkt zum Inhalt
KI im Scanner Header

KI im Scanner: Wie Künstliche Intelligenz bei der Dokumentenklassifizierung unterstützt

Effizienzsteigerung, Kosteneinsparungen, Automatisierung: Wohl kaum einer Technologie wird aktuell ein größeres Potenzial zugeschrieben als der Künstlichen Intelligenz (KI). Schrittweise halten entsprechende Technologien Einzug in den Büroalltag. Auch im Bereich des Dokumentenmanagements machen sich immer mehr Unternehmen die KI zunutze – zum Beispiel bei der Klassifikation im Inputmanagement.


Als wesentliches Leistungsmerkmal von Techniken der Künstlichen Intelligenz (KI), die in Unternehmensprozesse integriert werden, gilt die Geschwindigkeit. KI hilft dabei, Zeit zu sparen und meist auch eine höhere Verarbeitungsqualität zu erreichen – insbesondere da, wo Massendaten verarbeitet werden müssen.


Beispiele im Umfeld klassischer Informationsmanagementprozesse wären etwa die automatische Erkennung und Zuweisung von Dokumenten oder E-Mails zu Ordnern, Akten oder Unternehmensprozessen. Ein zunehmend verbreitetes Anwendungsszenario ist die Dokumentenklassifikation im Rahmen des Inputmanagements. Die notwendigen Verfahren zur Einteilung bestimmter Objekte in Klassen, basierend auf einem Algorithmus, existieren bereits seit geraumer Zeit.


Hierbei werden regelbasierte Erkennungsmuster festgelegt: Wenn Fall A eintritt, muss Handlung B ausgeführt werden. Der Arbeitsalltag in vielen Unternehmen ist voll von derartigen Wenn-Dann-Regeln.


Anhand des Beispiels eines Versicherungsunternehmens lässt sich illustrieren, wie dies in der Praxis funktioniert. Ziel der Assekuranz war es, manuelle Prozessschritte zu automatisieren, um vor allem zeitliche Ressourcen beim Scanvorgang im Bereich der Eingangspost einzusparen. Schließlich ist die manuelle Annahme, Verarbeitung und Ablage von Dokumenten langwierig und kostenintensiv.


Vom analogen Dokument zur E-Akte – fehlerfrei und ohne Reibungsverluste


Der modernisierte Workflow am Beispiel der genannten Versicherung sieht heute wie folgt aus: Zugesendete Dokumente werden eingescannt und digital aufbereitet. Eine Software, die mit dem Scanner verknüpft ist, unterstützt bei der automatisierten Dokumentenerkennung. Um welche Art von Dokument handelt es sich? Eine Schadenmeldung, ein medizinischer Befund? Der Scanner ist mit einer Künstlichen Intelligenz für die optische Zeichenerkennung, auch Optical Character Recongnition (OCR) genannt, verknüpft. Mittels einer App kann diese Erkennungssoftware angesprochen und mit der Einordnung des Dokumentes beauftragt werden.


Ist dieser Vorgang abgeschlossen, wird das digitale Dokument kategorisiert an einer vorbestimmten Stelle innerhalb einer E-Akte abgelegt. Diese liefert dem Inputmanagement eine Kennzeichnung zurück, die mit dem Kernsystem für die Bestandsführung verknüpft wird. Der zuständige Sachbearbeiter erhält daraufhin in seinem elektronischen Postkorb einen neuen Auftrag – mit dem Verweis auf das betreffende Schriftgut.


OCR wird immer besser


Nicht immer war die optische Zeichenerkennung derart zuverlässig, dass sie einen automatisierten Workflow unterstützen konnte. Dies zu ändern, hatte sich kürzlich das Fraunhofer Institut in Zusammenarbeit mit verschiedenen Softwareherstellern auf die Fahnen geschrieben. Die Herausforderung: Die meisten Programme zur OCR arbeiteten schlichtweg nicht genau genug. Genauigkeit ist aber für rechtlich und finanziell relevante Dokumente zwingend nötig. Denn schon eine Fehlerquote von 0,1 Prozent je Zeichen genügt, damit pro Dokumentenseite ein Fehler entsteht – der Teufel steckt demnach im Detail.


Ziel war es also, eine "OCR-Engine" zu entwickeln, die auch bei der Auswertung von umfangreichen Inhalten so wenige Fehler wie möglich bzw. gar keine Fehler produziert. Dazu trainierten die Forscher die OCR-Engine über einen Zeitraum von 27 Monaten. Dabei wurden pro existierendem Zeichen mindestens 5000 verschiedenen Variationen zum Training der Netze verwendet. Weil oftmals die schwankende Qualität des Ausgangsdokumentes eine Fehlerquelle ist, wurden der Software auch historische Texte oder verschiedene Graustufen vorgelegt. Die Folge: Die Software ist nicht nur in der Lage, gut lesbare Texte zu erkennen, sondern auch mangelhaft belichtete Fotos, alte Schriften und sogar Verkehrsschilder oder Plakattexte zu lesen.


Ausblick: KI zur Dokumenten-Klassifikation verbreitet sich


Das Beispiel der Klassifikation im Inputmanagement zeigt auf, wie und an welchen Stellen im Büroalltag Künstliche Intelligenz schon heute gewinnbringend zum Einsatz gebracht werden kann. Doch ohne eine zuverlässige Zeichenerkennung besteht das Risiko einer fehlerhaften Verarbeitung von Dokumenten. Das führt zu ineffizienten Prozessen, wenn es nicht gar zu einem finanziellen Schaden – etwa in Form von Strafzahlungen – kommt.  Die hohe Ergebnisqualität, die die Fraunhofer-Forscher mit ihrer OCR-Engine erzielen konnten, lässt es zu, dass auch sensible Dokumente automatisiert verarbeitet werden können. Und dies wiederum ist eine wichtige Voraussetzung dafür, dass sich KI-Technologie im Inputmanagement zukünftig noch weiterverbreiten wird.   

 

KI im Scanner: Wie Künstliche Intelligenz bei der Dokumentenklassifizierung unterstützt