vereinfacht

Mit Power zur digitalen Transformation?
Dann sind Sie bei PEAX goldrichtig.

Blog
Jeremias  Märki 27.02.2018
samuel zeller 367977 unsplash2

Digitalisierung und der Dokumentenversand

Traditionell werden Geschäftsdokumente in Briefform verschickt. Im Zuge der Digitalisierung ergeben sich viele neue Anforderungen. Dazu gehört beispielsweise die elektronische Archivierung und die möglichst automatische Verarbeitung von eingehenden Geschäftsfällen. Dieser Artikel etabliert den Kontext in dem sich unter anderem der elektronische Briefkasten von PEAX bewegt.

Anhand der folgenden Grafik picken wir in verschiedenen Blog-Einträgen bestimmte Themen heraus und betrachten diese genauer. Zunächst aber die grobe Übersicht über das Output und Input Management.

Grafik JEM

Oben befindet sich das Output Management und betrifft den Dokumentenversender. Dieser verwaltet im Normalfall Daten z.B. in einem ERP System. Stellt er eine Rechnung, müssen die (Roh-)Daten des Geschäftsfalls in ein für den Menschen lesbares Dokument umgewandelt werden. Das geschieht über die Schritte Komposition und Formatierung, die teils separat und teils kombiniert laufen, je nach eingesetzter Technologie.

Das Resultat ist ein formatiertes, elektronisches Dokument, häufig im PDF Format. Eine solche Rechnung kann elektronisch an den Empfänger übermittelt werden. Ist ein elektronischer Versand nicht möglich oder nicht gewünscht, müssen wir uns in der Grafik weiter bewegen. Jede Seite des Dokuments muss gerastert werden. Übermitteln wir auf dieser Stufe, bewegen wir uns z.B. beim guten alten Fax-Versand. Muss das Dokument per Post verschickt werden, drucken wir die Rasterbilder der Seite auf Papier. Das Dokument wird in ein Couvert verpackt und der Post übergeben.

Erhalte ich als Empfänger (z.B. eine Unternehmung) eine Rechnung per Post, muss ich das Couvert öffnen, den Inhalt lesen, verstehen und entsprechend darauf reagieren. Wahrscheinlich muss ich die Rechnungsdaten zu einem bestimmten Detailierungsgrad von Hand in der eigenen Buchhaltungslösung erfassen. Ich muss also mühsam Informationen von einem analogen Medium wieder in ein digitales überführen, so dass ich mit den gewonnenen Daten (z.B. Zahlungsinformationen) etwas Nützliches tun kann. Hier bewegen wir uns im Bereich des Input Managements. In unserem Kontext geht es darum, diese Verarbeitung weitgehend zu automatisieren. Jeder Schritt (die Grafik hoch bis ganz oben) dreht sich um die Wiederherstellung der vom sogenannten Medienbruch für die Maschine «verlorenen» Informationen. Jeder dieser Schritte ist für den Menschen einfach, aber mühsam, repetitiv und zeitaufwendig. Und damit teuer.

Wir können das Problem von zwei Seiten angehen. Zunächst versuchen wir den analogen Brief erst zurück in ein Rasterbild zu überführen. Danach versucht der OCR Prozess (Optical Character Recognition oder auf Deutsch Texterkennung) den rohen Text des Dokuments möglichst fehlerlos abzuleiten. Wie man sich denken kann, können hier bereits Fehler geschehen. Der Prozess ist also verlustbehaftet. Bei der Deformatierung geht es darum, beispielsweise zwischen Seiten getrennte Textblöcke logisch zusammenzuführen (im schlimmsten Fall beim Zeilenumbruch am Ende der Seite mitten im Wort). Die Dekomposition schliesslich versucht aus dem Textdokument Informationen zu ermitteln, also z.B. einen Totalbetrag einer Rechnung. Es geht darum Daten mit ihrer Semantik zu ermitteln. Am Schluss haben wir hoffentlich ein strukuturiertes Datenpaket (z.B. eine XML Datei) mit den für den Geschäftsfall relevanten Informationen, die anschliessend von einem Programm automatisch verarbeitet werden können. Auch diese letzten beiden Schritte, die wir bei PEAX unter dem Begriff «Capturing» zusammenfassen, sind wieder potenziell verlustanfällig.

In Anbetracht dessen wünscht man sich nun natürlich auf Input Management Seite gar nicht den ganzen Weg machen zu müssen. Im Idealfall läuft der Austausch eines Geschäftsfalls ganz oben von links nach rechts. Das ist z.B. bei automatisierten Bestellverfahren mittels elektronischem Datenaustausch (engl. electronic data interchange, EDI) der Fall. Dort werden gar keine für den Menschen aufbereitete Dokumente versendet, sondern computerlesbare Datenpakete, die verlustfrei interpretiert werden können. Tauschen wir ein PDF aus, müssen wir immerhin schon mal kein Scanning und kein OCR durchführen. Das reduziert schon gewisse Verlustquellen gegenüber dem physischen Brief. Der Mensch kann immer noch ohne technisches Wissen das Dokument interpretieren.

Gibt es eine Möglichkeit, beiden Anspruchsgruppen (Mensch und Maschine) gleichzeitig gerecht zu werden? Ja. Das ist die Domäne der sogenannten Hybridrechnung. Im Deutschen ZUGFeRD Rechnungsstandard wird beispielsweise das Datenpaket als XML Datei als Anhang in eine PDF Datei eingebettet. Der Mensch betrachtet die Darstellung der PDF Datei, während der Computer sich das Datenpaket aus der PDF Datei zieht und verlustfrei den Geschäftsfall verarbeitet. Die Hybridrechnung behandeln wir noch detailliert in einem späteren Blog-Beitrag.

PEAX bewegt sich genau in diesem Spannungsfeld zwischen Input und Output Management. Wir bieten Ihnen in verschiedenen Bereichen auf der Übersichtsgrafik Dienste und Unterstützung an, immer mit dem Ziel die Digitalisierung vorwärts zu treiben.