WiWiEn

Plattform zur Entwicklung KI-basierter Geschäftsmodelle

Dokumentanalyse

Glossar
SchlüsselwörterDokumentenanalyse, Dokumenten-Analyse, Dokumentenanalysen, Dokumenten-Analysen
TypKI-UseCase

Mit Hilfe von KI-Systemen können verschiedene Arten von Dokumenten (Belege, Rechnungen, Lieferscheine, Materialzeugnisse, Verträge, dialogbasierte Manuskripte, etc.) automatisiert gesichtet, erfasst, verarbeitet und analysiert werden, sodass ein Mensch hierbei in der sachbearbeitenden Tätigkeit unterstützt werden kann.

Es können aber auch verschiedene Dokumente (z.B. verbale oder schriftliche Manuskripte) zusammengeführt und übergreifend analysiert werden. Das KI-System wird dabei vorab mit einer Datenbank von bereits bearbeiteten Dokumenten trainiert. Ein unbekanntes, zu bearbeitendes Dokument wird dann auf Grundlage dieser Lerneffekte vom KI-System ver-, bzw. bearbeitet.

Problemstellung & Zielsetzung

Intelligente Dokumentenanalyse wird vor allem zur Komplexitätsreduktion und Effizienzsteigerung eingesetzt. Zum einen geht es darum den Zeitaufwand für die manuelle Verarbeitung zu reduzieren und zum anderen die Zugänglichkeit und Verständlichkeit von Informationen zu verbessern. Aufgrund des exponentiellen Wachstums der digitalen Daten ist es oft schwierig, relevante Informationen aus der Masse an verfügbaren Dokumenten zu extrahieren. Je nachdem für welchen Anforderungsbereich die Dokumentenanalyse eingesetzt wird, kann sie auch die Entscheidungsfindung unterstützen, indem in großen Datenmengen Muster und Trends identifiziert werden.

Mögliche KI-Methodiken

(Vergleiche auch Optical Character Recognition)

Die Dokumentenanalyse kann über verschiedenen Methodiken und Techniken realisiert werden. Je nach Einsatzszenario fällt der Anforderungsbereich an solche Systeme unterschiedlich aus. Im Allgemeinen kann man aber sagen, dass vor allem das Natural Language Processing (NLP) in diesem Kontext als Schlüsseltechnologie anzusehen ist. Diese Methodik ermöglicht es dem System grammatische Strukturen zu analysieren und Entitäten und deren Beziehungen zueinander zu erkennen. Mit anderen Worten ermöglicht es der KI, den Inhalt und Kontext von Dokumenten zu verstehen. Aufbauend auf dieser Grundlage, können weitere KI-Methodiken kombiniert werden:

  1. Regelbasiert - Bei standardisierten Dokumententypen wie z.B. Rechnungen oder Lieferscheinen
  2. Machine Learning - ML-Algorithmen können Dokumente klassifizieren oder Muster erkennen.
      1. Ermöglicht z.B. die Klassifizierung von Dokumenttypen.
      1. Ermöglicht z.B. die Erkennung von Mustern und das Extrahieren relevanter Informationen.
  3. Deep Learning - als Untergruppe des ML haben hohe Leistungsfähigkeit in der Verarbeitung von NLP-Aufgaben.
      1. Ermöglichen eine bessere sequentielle Erfassung von Muster in Daten als das klassische Machine Learning.

Risiken & Chancen

  • Durch die Automatisierung von Routineaufgaben bzw. der Bearbeitung von Dokumenten kann eine erhebliche Effizienzsteigerung und Kosteneinsparung erzielt werden.
  • Die Erweiterung von Analysen und Mustererkennung bei großen Datenmengen (z.B. eine Vielzahl an Dokumenten).
  • Physische Dokumente müssen erst digitalisiert werden.
  • KI-Modelle können nur spezifische Dokumente verarbeiten, für die sie trainiert wurden. Unbekannte Dokumentarten oder unbekannte Sachverhalte müssen vom Menschen nachbearbeitet werden.
  • Je nach Anwendungsbereich ist die automatisierte Dokumentenanalyse/-bearbeitung nur bis zu einem gewissen Grad möglich.
  • Je nach Anwendungs- und Anforderungsbereich können Fehlinterpretationen entstehen, die aufgrund des Black-Box-Problems nicht mehr nachvollziehbar sind.

Best Practices

Weiterführende Informationen