Schlagwort: PDF Dokumente automatisieren

PDFmdx – Job Prozessor – Kurzübersicht der Funktionen

Der PDFmdx Job Prozessor dient der zentralen, serverbasierenden, automatisierten und unbeaufsichtigten Verarbeitung von Dokumenten über Folder-Monitoring.

Mehrere Jobs können angelegt und mehrere Eingangsordner damit überwacht werden. Pro Job / Eingangsordner erfolgt eine Vor-Auswahl der zu erkennenden Templates und Layouts.

Der Prozessor prüft jedes zu verarbeitende Dokument gegen die vorausgewählten Templates / Layouts. Passen die Erkennungs-Bedingungen so erfolgt die über das Template / Layout festgelegte Verarbeitung. Der Job-Prozessor führt das aus was über den PDFmdx Template Editor an Logik und Verarbeitungs-Schritten festgelegt wurde.

01 PDFmdx - Service Prozessing über Windows Dienst - Userinterface zur Job Konfiguration

Windows Dienst
Für die serverbasierende und unbeaufsichtigte Verarbeitung wird ein Windows Dienst installiert. Alternativ dazu kann auch eine startbare Anwendung verwendet werden. Der zu verwendende Service Account ist konfigurierbar.

07 PDFmdx - Jobverarbeitung über startbare Anwendung - alternativ zum Service Prozessing

Parallele Verarbeitung
Bei genug Ressourcen und hohem Dokumentenaufkommen lassen sich mehrere parallele Verarbeitungsprozessor konfigurieren.

Email Server Konfiguration
Der Versand der Emails erfolgt über eine SMTP Server, mit oder ohne Verschlüsselung und Authentifizierung. Auftretende Fehler lassen sich per Email melden.

04 PDFmdx - EMail Server Konfiguration für die Job Verarbeitung

Druck-Server Konfiguration
Der PDF2Printer Druckserver-Dienst wird unterstützt. Auswahl des Standard-Druckers sowie welches Feld die Drucker steuert. Alias Zuordnung ermöglich es ausgelesene Werte einen physischen Drucker zuzuordnen.

05 PDFmdx - Integration mit dem PDF2Printer Druckserver

Nur Daten ausgeben
Diese Option erlaubt es nur Metadaten aus Dokumenten auszulesen, die Dokumente selbst aber nicht zu verändern. Es erfolgt kein Teilen, Umbenennen, Verschieben usw.

Kopiere nach
Eingangsdokumente können damit auch automatisch in die andere ausgewählten Jobs / Ordner kopiert. Damit lassen sich unterschiedliche Ergebnisse aus den Eingangsdokumenten erzeugen.

06 PDFmdx - Kopiere nach - Funktion um Eingangsdateien eines Jobs parallel dazu auch durch andere Jobs zu verarbeiten

Vorab Teilen
Umfangreiche Dokumente mit vielen Seiten können vorab geteilt werden um die Verarbeitung zu beschleunigen. Optionen: Vorab-Teilen über eine Vorlage nach Bedingungen, nach Feldinhaltsänderung, nach Seitenzahl oder nach Layout-Änderung.

Vorlagen / Layout-Auswahl
Pro Job / Ordner wird ausgewählt gegen welche Templates / Layouts getestet werden soll. Nein im Eingangs-Ordner hinzukommende Dokumente werden gegen diese Auswahl getestet, bei positivem Ergebnis erfolgt die Verarbeitung auf dieser Basis.

02 PDFmdx - Job Verarbeitung - Konfiguration welche Layouts für eine bestimmte Job-Definiton aktiv sein sollen sowie Konfiguration Vorab-Teilen

Zeitgesteuerte Verarbeitung
Standardmäßig werden neu hinzukommende Dateien sofort erkannt und verarbeitet. Es gibt jedoch auch die zeitgesteuerte Verarbeitung – im Minuten-Intervall, Täglich zu einer bestimmten Zeit oder mit festgelegten Datum / Uhrzeit.

Error Folder / Logging
Fehler werden protokolliert. Das betreffende Dokument wird in den Error Folder verschoben. Falls konfiguriert wird auch ein Error Email verschickt. Erfolgreiche Verarbeitungen werden über die Metadaten-Datei protokolliert.

www.pdfmdx.at

PDFmdx – Template Editor – Kurzübersicht der Funktionen

Mit dem PDFmdx Template Editor werden die Kriterien und Verarbeitungsschritte konfiguriert. Templates und die damit verbundenen Layouts sind die Voraussetzung um die Dokumente zu kategorisieren, zu splitten und die gewünschte Information daraus auszulesen. Templates bestimmen die Namensgebung, Folder-Struktur, Metadaten und legen die weitere Verarbeitung mit Briefpapier, Signatur und E-Mail Versand fest.

Templates – Legen fest wie Dokumente über Bedingungen klassifiziert, einem Layout zugeordnet bzw. auch in Einzeldokumente aufgeteilt werden. Templates definieren für alle Layouts die gemeinsamen Verarbeitungsparameter: Felder, Dateiname, Ordnerstruktur, Bedingung für: Teilen, Erkennen, Seiten löschen, sowie Briefpapier, Signatur und EMail

Layouts – Einem Template können auch mehrere Layouts zugeordnet werden. Diese legen fest wo und wie die Felder gefunden bzw. was ausgelesen werden soll.

02 PDFmdx - Tempate Editor -  Vorlagen, Layouts sowie deren Logik werden damit konfiguriert

Felder –  Mit einem Layout sind die Felder / Variablen verbunden. Es können beliebige Felder definiert und im Layout zum Auslesen von Informationen aus Dokumenten verwendet werden. Die Variablen werden mit dem ausgelesenen Text belegt und können für die Weiterverarbeitung als Metadaten verwendet werden.

04 PDFmdx - Template Editor - Feld Definition und Aufbereitung

Bedingungen – Werden über Felder aufgebaut und über logische Verknüpfungen sowie über Text und Teilstring aufgebaut. Damit werden Teilung, Layout Erkennung und das Löschen von Seiten gesteuert

06 PDFmdx - Template Editor - eine Vorlage mit mehreren Layouts - Identifikation über Bedingungen

Layout erkennen – Die Layout-Erkennung erfolgt durch logische Bedingungen über die im Layout positionierten Felder.

Dokumente teilen – Dokumente können nach – fixen Seiten, Änderungen von Feldinhalten, Logischen Kriterien bzw. nach Erkennen der Layout-Änderung geteilt werden

05 PDFmdx - Template Editor - Bedingungen für Teilen, Layout erkennen und Seiten löschen

Seiten löschen – Über logische Kriterien können Seiten erkannt werden die gelöscht und nicht ins Zieldokument übernommen werden sollen.

Neu Zusammenfügen – Dokumente lassen sich teilen und danach über Felder mit andere Sortierung und Struktur neu zusammenfügen.

14 PDFmdx - Template Editor - Seiten löschen, Dokument neu zusammenfügen

PDF Voransicht – Auf dem Beispieldokument für das Layout werden die Felder per Drag&Drop positioniert. Ausgelesene Feldinhalte werden sofort angezeigt.

01 PDFmdx - Template Editor - Definition von Vorlagen und Layouts für die automatisierte Dokumentenverarbeitung

Such- / Ankerfelder – Felder können absolut oder aber über eine Suchfunktion relativ zu Ankerfeldern positioniert und ausgelesen werden.

11 PDFmdx - Template Editor - Ankerfelder mit Suchfunktion ermöglichen variable Feldpositionen auf die andere Felder bezogen werden können

Testfunktion – Direkter Test des Templates / Layouts – Erkennen, Auslesen, Teilen, Seiten löschen wird simuliert und angezeigt, andere Testdateien können ausgewählt werden.

12 PDFmdx - Template Editor - Test Funktion - Auslesen von Bereichen

Briefpapier – Überlagern/Hinterlegen von Briefpapier, Unterschiedliche Briefpapiere können durch Bedingungen über den Dokumenteninhalt gesteuert werden.

07 PDFmdx - Template Editor - Briefpapier hinterlegen oder überlagern - Steuerung über Dokumenteninhalte

Email Vorlage – Erkennen und Auslesen von Email Adressen aus dem Dokument. Betreff und Inhalt sind vorkonfigurier- und über Feldinhalte anreicherbar. Fixe Anhänge sind zuordenbar.

10 PDFmdx - Template Editor - Vorlagendefinition für den EMail Versand

Signatur – Über Software Zertifikate kann die PDF Datei digital – sichtbar oder unsichtbar signiert werden.

08 PDFmdx - Template Editor - sichtbare oder unsichtbare Signatur

PDF-Infofelder – Lassen sich mit fixem Text oder über aus dem Dokument ausgelesenen Infos befüllt werden.

09 PDFmdx - Template Editor - Ausfüllen der PDF Infofelder über Dokumenteninhalte

www.pdfmdx.at

PDFmdx – PDF Dokumentenverarbeitung automatisieren – Anwendung in der Praxis

PDFmdx ist eine vielseitig einsetzbare Software um die PDF Dokumentenverarbeitung zu automatisieren
An Hand des Inhalts und über Bedingungen können Dokumente erkannt, geteilt und Metadaten daraus ausgelesen werden. Die Dokumente können auch nach Kriterien neu zusammensetzt, inhaltsgesteuert kann Briefpapier hinterlegt, gedruckt und per Email versandt werden.

Übersicht über Einsatzmöglichkeiten von PDFmdx

EMail Versand von Rechnungen, Auftragsbestätigungen, Mahnungen, Terminerinnerungen

PDF Dokumente werden einzeln oder als Gesamtdatei verarbeitet. Bei der Gesamtdatei erfolgt zuerst eine Teilung in Einzeldokumente. Als Teilungskriterium wird z.b. die Rechnungsnummer verwendet. Aus den Belegen wird die EMail Adresse, das Belegdatum und die Belegnummer ausgelesen. Die Belegnummer wird als Variable für die Namensgebung der Einzeldateien verwendet. Anschließend wird ein PDF Briefpapier hinterlegt und eine elektronische Signatur aufgebracht. Die Belege werden dann einzeln automatisiert per Email an die Empfänger verschickt. Das PDF Dokument wird als Anhang eingefügt. Der Betreff und die Nachricht wird über einen vordefinierten Baustein mit der Möglichkeit die aus den Dokumenten ausgelesenen Informationen als Variablen im Text wieder zu verwenden. PDFmdx bietet damit die Möglichkeit aus jeder beliebigen ERP Software die weitere Verarbeitung automatisiert ablaufen zu lassen. Dabei reicht es die Reports über einen einfachen Druckvorgang per PDF Druckertreiber in einen festgelegten Ordner zu drucken.

Automatisierte Archivierung von Reports und Belegen

Buchhaltungs-, Lohnverrechnungs- oder ERP Belege und Reports werden über den PDF Druckertreiber in einen festgelegten Ordner gedruckt. PDFmdx erkennt an Hand der Inhalte und Kriterien um welchen Beleg oder Report es sich handelt. Es wird das passende Layout mit den Felddefinitionen geladen. Damit werden die für die Archivierung erforderlichen Metadaten ausgelesen und als XML, CSV oder XLS weggeschrieben. Die für die Archivierung notwendigen Informationen müssen also nicht manuell erfasst werden sondern können automatisiert aus den Belegen gewonnen werden.

Hinterlegen von Briefpapier

Es gibt Unternehmen mit einer zentrale Informationsverarbeitung für eine Vielzahl an Projekten oder Tochter- / Sub-Unternehmen. Das verwalten, hinterlegen und die einfache Steuerung von perfekt gestaltetem PDF Briefpapier für die erzeugten Belege ist meistens aus einer Standardanwendung heraus nicht möglich bzw. sind die Anpassungen mühsam und aufwändig. PDFmdx ist in der Lage dieses Problem zu lösen – die Briefpapiere und PDF Formulare brauchen nicht mehr aus der Anwendung heraus berücksichtigt werden. Über Inhalte und Kriterien die aus dem PDF Dokument heraus gewonnen werden lässt sich steuern welches Briefpapier verwendet werden soll. Anpassungen und Änderungen reduzieren sich damit auf den einfachen Tausch eines PDF Dokuments.

Erzeugen von Tickets, Gutscheinen und Rechnungen durch Hinterlegen von Grafiken und Ausgabe über einen Druck-Server

Aus einem Web-Shop eines Veranstaltungszentrums heraus wir auf Grund einer Bestellung ein Dokumentenset aus Tickets, Gutscheinen und Rechnungen als PDF erzeugt. Das Gesamt-Dokument wird in die Einzeldokumente geteilt. Je nach Dokumententyp und je nach Veranstaltung für das der Gutschein oder das Ticket erzeugt wurde werden aktuelle und passende Grafiken hinterlegt und auf unterschiedlichen Druckern ausgegeben. PDFmdx teilt das Gesamtdokument in Einzeldokumente, liest die Information aus welche PDF Grafiken hinterlegt und auf welchem Drucker ausgegeben werden soll. Der Druck erfolgt dann über den PDF2Printer Druckserver.

Dokumente teilen, benennen, in Ordnern strukturieren und über OwnCloud für Mobil Clients zugänglich machen

Bestellungen und Auftragsbestätigungen sollen den Außendienstmitarbeitern über mobile Clients zugänglich gemacht werden. In regelmäßigen Abständen werden die neu hinzugekommenen Bestellungen und AB´s aus dem ERP als PDF gedruckt. PDFmdx teilt das Gesamt-PDF in Einzeldokumente und liest alle für die Namensgebung und den Aufbau der Ordnerstruktur erforderlichen Informationen aus den Dokumenten aus. Die Einzeldokumente werden benannt und in die über Variablen festgelegt Ordnerstruktur verschoben. Die damit erzeugte Dokumentenstruktur wird per OwnCloud repliziert. So stehen den Außendienstmitarbeitern laufend die aktuellen Bestellungen und AB´s über eine einfache und übersichtliche Ordnerstruktur auf deren mobilen Geräten zur Verfügung.

Gesamt-Reports teilen und nach anderen Kriterien neu zusammensetzen

Monatliche Reports werden als Gesamt PDF erzeugt und haben eine vorgegebene Sortierung und Strukturierung. Dieser Gesamt Report soll in Einzelreports aufgeteilt, nach anderen Kriterien neu sortiert und über PDF Lesezeichen neu strukturiert werden. Deckblätter des Gesamtreports sollen erkannt und gelöscht werden. PDFmdx kann zu löschende Seiten erkennen und PDF-Gesamtdokumente über Inhalte und Bedingungen in Einzel-Dokumente aufteilen und benennen. Diese Einzeldokumente können über die aus den einzelnen Seiten ausgelesene Informationen neu sortiert und strukturiert werden.

Gescannte Eingangsrechnungen, automatisch erkennen und Metadaten für die Weiterverarbeitung auslesen

Eingangsrechnungen werden gescannt und über den AutoOCR Server in durchsuchbare PDF´s gewandelt. Im PDFmdx ist für jeden Lieferanten das Layout und die Erkennungslogik für seine Eingangsrechnungen hinterlegt. Die auszulesenden Felder sind für die Rechnungen aller Lieferanten gleich und einheitlich definiert. Je nach Lieferant befindet sich die gewünschte Information an unterschiedlichen Stellen. Eine Suchfunktion für „Ankerfelder“ dient dazu sowohl die durch das Scannen „wandernden“ Positionen als auch die unterschiedlichen Layouts verarbeiten zu können. Ebenso können damit Gesamt-Summenwerte die sich sowohl auf verschiedenen vertikalen Positionen als auch auf unterschiedlichen Seiten befinden gesucht und ausgelesen werden.

Sammelrechnungen & Gutschriften – Erkennen, Auslesen und in Einzelbelege aufteilen

Bei diesem Anwendungsfall muss ein Dokumentenstapel der Rechnungen und Gutschriften mit unterschiedlichen Layouts enthält in Einzeldokumente aufgeteilt und die Einzeldokumente nach der Belegnummer benannt werden. Dabei sind nicht nur die Layouts der Belegtypen unterschiedlich, auch innerhalb des gleichen Belegtyps kann die Position der Belegnummer je nach Anzahl der Adresszeilen vertikal verschieden sein.