PDFmdx – Version 2.8.1 verfügbar

Neuerungen PDFmdx Version 2.8.1:

Vorlagen-Synchronisation:

Der PDFmdx Template Editor kann jetzt die lokal erstellten Vorlagen und Layouts per Web-Service Verbindung mit einem oder mehreren PDFmdx Server abgleichen. Damit können Templates lokal entwickelt und getestet werden um diese dann auf die Verarbeitungs-Server zu replizieren. Die Kommunikation erfolgt über SOAP per http/https. Damit wird der Abgleich und die Verteilung von neuen und aktualisierten Templates wesentlich vereinfacht und beschleunigt.

8_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#1  9_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#2

Text-Stempel mit Drehwinkel: 

Um einen Text nicht nur horizontal sondern in jedem beliebigen Winkel aufzubringen gibt es jetzt den zusätzlichen „Drehwinkel“ Parameter.

6_Text-Stempel mit Drehwinkel Option  7_Text-Stempel mit Drehwinkel Option - Ergebnis

Ankerfeld-Suche – Neue Funktionen:

Bisher wurde der String für die Positionierung des Ankerfelds auf der ganze Seite gesucht (von oben weg) und die erste Fundstelle wurde als Position für das Ankerfeld angenommen. Es kann jedoch speziell bei der Teilstringsuche vorkommen dass der Begriff auf der Seite nicht die erste sondern eine weitere Fundstelle die gesuchte Position ist und es keine andere eindeutige Möglichkeit gibt das Feld über einen Suchstring zu positionieren. Deswegen wurde die Funktion erweitert.

Standardmäßig erfolgt die Ankerfeld-Suche nun von der Feldposition der Vorlage aus. Der nächstgelegene passende String wird als Position für das Ankerfelder genommen. Neu hinzugekommen ist die Option „Treffer“. Ist sie aktiviert und eine Nummer angegeben so wird die Seite von oben nach unten und von links nach rechts nach dem Anker-Text durchsucht. Die Zahl gibt an, der wievielte Treffer als Position für das Ankerfeld genommen wird. Damit kann also auch z.b. der 2. Treffer auf einer Seite als Ankerfeld-Position gefunden werden.

4_Anker-Felder mit Teilstring Suche - Such-Treffer Nummer kann angegeben werden

AutoScale-Funktion:

Speziell bei gescannten Dokumenten kann es vorkommen dass die Inhalte der Dokumente auf der Seite nicht nur in ihrer Positionierung horizontal bzw. vertikal variieren sondern Dokumente können auch unterschiedliche Skalierungen und Größen aufweisen. Z.B. falls ein gescannter Ausdruck mit unterschiedlichen  Skalierungen erstellt wurde. Die relative Position und Größe der auszulesenden Felder zueinander ist prozentuell zwischen den Dokumenten zwar gleich, die absoluten Werte sind aber unterschiedlich. Das Layout für das Auslesen der Felder wird an Hand eine typischen Dokuments erstellt und berücksichtigte bisher nur die absoluten Abstände und Größen der Felder zueinander. Ein Dokument das also z.b. um ca. 10% kleiner auf der A4 Seite erscheint konnte so nicht verarbeitet werden da die Felder im Vergleich zum erstellten Layout sowohl von der Position also auch von der Größe nicht passen. Dafür haben wir jetzt eine AutoScale Funktion implementiert welche in der Lage ist solche unterschiedlichen Skalierungen in einem bestimmten Umfang automatisch auszugleichen.

5_AutoScale für Ankerfelder - gleicht Skalierungen der Dokumente aus

Was ist zu beachten:

  • Das Layout sollte von der „größten“ Ausprägung aus erstellt werden
  • Es muss ein Ankerfeld verwendet werden das ohne Teilstringsuche gefunden werden kann. Z.B. über den String „Rechnung“ nicht jedoch über „*Rechnung*“
  • Die Option „AutoScale“ muss aktiviert werden.

Leere Seiten erkennen und entfernen:

Beim Scan von Dokumenten kann es bei doppelseitigen Scans vorkommen dass leere Seiten (der teilweise unbedruckten Rückseiten) im Dokument enthalten sind. Nicht immer verfügen Scanner über eine Funktion um diese automatisch beim Scanvorgang zu entfernen. Für die Weiterverarbeitung und Archivierung sind Leerseiten  störend und sollten entfernt werden können. Mit der aktuellen PDFmdx Version 2.8.1 gibt es  jetzt eine Funktion um leere Seiten automatisch zu erkennen und zu entfernen. Als Kriterium für die Erkennung einer leeren Seite dient ein Schwellwert der standardmäßig auf 95% gestellt ist. Wir empfehlen einen Wert zwischen 95 und 98%. Der Wert gibt den %-tuellen Anteil der „weißen Pixel“ auf einer Seite an. Eine Seite wird als „Leer“ identifiziert sobald der Anteil der weißen Pixel größer/gleich dem eingestellten Wert z.B. 95% ist. Leere Seiten werden vor Beginn aller anderen PDFmdx Verarbeitungen entfernt.

1_Entferne alle leere Seiten aus den Dokument - vor dem Start der Verarbeitung mit Schwellwert-Parameter

Seiten / Leere Seiten nach der Trennseite entfernen:

Wird ein Dokument geteilt werden so kann die gefundene Trennseite auch gelöscht werden. Neu hinzugekommen ist jetzt auch eine Funktion um Folgeseiten der Trennseite zu löschen. Dabei kann entweder eine bestimmte Anzahl an zu entfernenden Folgeseiten festgelegt oder es wird die Funktion zur automatischen Leerseiten-Erkennung/Entfernung mit Schwellwertangabe verwendet.

2_Entferne leere Seiten nach der Trennseite mit Schwellwert Parameter  3_Entferne eine eingestellte Zahl an Seiten nach der Trennseite

Regular Expression Parameter um gezielt Zahlen aus einem Feld zu extrahieren:

Über den RegEx Ausdruck „\d+“ können Zahlen eines Feldes zurückgeliefert werden. Wird kein Parameter angegeben so wir automatisch die „erste der längsten der gefundenen Zahlen“ zurückgeliefert. z.B. der ausgelesene Feldinhalt ist „Seite 15 / 110“  so wird „110“ zurückgeliefert. Zusammen mit dem Parameter “Treffer” kann gezielt eine Zahl einer bestimmten Position aus dem String extrahiert werden. Mit dem Parameter = 1 wird die erste in dem String gefundene Zahl „15“ mit 2 die zweite „110“ usw. zurückgeliefert.

RegEx auch in Kombination mit den zusätzlichen String-Aufbereitungen verwendbar:

Bisher konnte entweder nur die RegEx Verarbeitung oder alternativ die anderen String Aufbereitungs-Funktionen verwendet werden. Jetzt ist es auch möglich diese beiden Funktionen zu kombinieren – RegEx kann also zusammen mit den Funktionen – Teilstring, Entferne – Links / Rechts / Leerzeichen / Führende Nullen sowie der Funktion Zeichen ersetzen und Typ-Auswahl verwendet werden. Dabei wird immer unabhängig vom Typ des Feldes zuerst die RegEx Verarbeitung  ausgeführt  und anschließend die weiteren Aufbereitungen.

%TIME% Variable – jetzt im 24 Stunden Format

Update auf SQL Compact Version 4.x – Die Version ist jetzt bereits im Setup enthalten und muss nicht mehr wie bisher mit Version 3.5 extra nachgeladen und zusätzlich installiert werden.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 2.5.0 verfügbar

Neuerungen PDFmdx Version 2.5.0:

  • pmdx – Vorlagen Export / Import – Die PDF Prototyp Dateien aller Layouts sind jetzt in der pmdx Datei enthalten. Wurde bisher eine Vorlage aus dem PDFmdx Editor exportiert und auf einem anderen Rechner wieder importiert, so musste die PDF Prototypen Datei separat kopiert und auf dem Zielrechner vor dem Aufruf im richtigen Pfad vorhanden sein. War sie nicht vorhanden so ging die Position  verloren und die Felder mussten neu eingefügt werden. Die PDF Prototypen sind jetzt in der pmdx Datei enthalten und werden nicht mehr extern abgelegt. Das vereinfacht den Austausch sowie den PDFmdx Editor und den PDFmdx Prozessor auf unterschiedlichen Rechnern auszuführen.

6_PDFmdx - Export & Import von Vorlagen - die PDF Prototypen Dateien aller Layouts werden mit der pmdx Datei exportiert und wieder importiert

  • Seiten / Trennblätter (vorab-)löschen – Über Bedingungen können Seiten / Trennblätter erkannt sowie vor bzw. während der Verarbeitung gelöscht werden. Falls die gelöschte Seite nicht auch für die Erkennung des Layouts bzw. zum Trennen verwendet wird gibt es eine eigene Funktion um die erkannte Seite „Vor der Verarbeitung“ zu löschen. In diesem Fall werden zuerst alle zu löschenden Seiten gesucht und erst in einem zweiten Durchgang die weiteren Erkennungen und Teilungen für das „Restdokument“ durchgeführt. Das Kriterium kann über ein ausgewähltes Feld oder über „die ganze Seite“ festgelegt werden. Ebenso kann die Suche auf einer bestimmten Seite, eine Folge von Seiten oder über alle Seiten erfolgen. Es kann mit einem exakten String oder mit Hilfe von Platzhaltern wie #,? und * gearbeitet werden.

1_PDFmdx - dieses Trennblatt soll gelöscht werden  2_PDFmdx - Seiten nur löschen, Das Layout soll hier nicht erkannt werden, Trennung wird auch nicht durchgeführt  3_PDFmdx - Sollen Dokumente an der Trennseite auch geteilt werden so ist dies auch möglich

  • Vorab-Teilen von Dokumentenstapel an Hand von Layouts bzw. Vorlage – Sind unterschiedliche Layouts bzw.  Vorlagen in einem Dokumentenstapel enthalten und sollen die unterschiedlichen Dokumente an Hand von Kriterien erkannt und in Einzeldokumente aufgeteilt werden so muss dies im PDFmdx Prozessor über die Funktion „Vorab-Teilen falls sich das Layout oder die Vorlage ändern“ erfolgen. Eine in einem Layout definierte „S = Split“ Bedingung wirkt im Dokumentenstapel nur bei gleichen Layouts, nicht jedoch bei verschiedenen Layouts und Vorlagen. Liegen die zu verarbeitenden Dokumente bereits als getrennte Einzeldokumente vor so ist diese Option nicht erforderlich.

4_PDFmdx - Unterschiedliche Belege = Layouts werden erkannt und geteilt falls sich gleiche Belege hintereinander befinden  5_PDFmdx - Für die Verarbeitung von Dokumentenstapel müssen die Dokumente vor der Erkennung noch geteilt werden - dies erfolgt auf Basis der Layouts und Vorlagen

  • Barcode – Erkennung – Bei den Feldtypen gibt es jetzt auch die Möglichkeit „Barcode“ auszuwählen. Damit lassen sich 1D-Barcodes innerhalb des markierten Feldbereiches erkennen. Der Barcodewert wird als als Feldinhalt zurückgeliefert. Über die Barcode-Einstellungen kann festgelegt werden welche Barcode Typen erkannt werden sollen. Die Barcode-Erkennung wird auch direkt auch bei der Feldpositionierung und bei der Test-Funktion  ausgeführt. Damit ist gleich ersichtlich ob der Barcode erkannt wird bzw. welchen Wert der Barcode aufweist.

7_PDFmdx - Der Feldtyp Barcode ermöglicht das Auslesen von Barcodes innerhalb des festgelegten Feldbereiches  07_PDFmdx - Feldtyp Barcode  8_PDFmdx - Mit den Barcode Einstellungen kann festgelegt werden welche Barcode Typen erkannt werden sollen

  • Datums- und Zeit-Format der Ausgabe-Variablen konfigurierbar – Das Format für die Ausgabe Variablen %DATE% und %TIME% kann jetzt über die Variablen „dd“ „mm“ „yyyy“ sowie „hh“ „mm“ „ss“ individuell festgelegt werden.

9_PDFmdx - Datums und Zeitformatierung für die Ausgabevariablen DATE und TIME individuell konfigurierbar

  • Test Funktion zeigt die extrahierten sowie die aufbereiteten Feldinhalte – Bei der Testfunktion werden nicht nur die aus dem PDF extrahierten sondern auch die durch die Felddefinition aufbereiteten Feldinhalte die von PDFmdx für die Weiterverarbeitung verwendet werden angezeigt.

10_PDFmdx - Extrahierte Feldinhalte können aufbereitet werden  11_PDFmdx - Testfunktion zeigt sowohl den extrahierten als auch den aufbereiteten Feldinhalt an

  • Text bzw. 1D/2D Barcode Stempel aufbringen – PDFmdx ist nicht nur in der Lage Texte aus PDF Dokumenten auszulesen sondern es können auch Text bzw. Barcode-Stempel auf Seiten aufgebracht werden. Dabei kann fixer Text, Standard-Variablen wie Datum, Zeit, Rechner-, Benutzer-, Vorlagen-Name, Layout Seitennummer, Seitenzahl-Gesamt aber auch ausgelesene Feldwerte über konfigurierte Variablen verwendet werden. Für Text-Stempel stehen Schriftstil, Schriftgröße, Farbe sowie die Formatierungen – Fett, Kursiv, Kontur, Unterstrichen, Durchgestrichen als Parameter zur Verfügung. Die Text Ausrichtung kann innerhalb der positionierten Box – Links / Mitte / Rechts, Oben / Mitte / Unten ausgewählt werden. Ein Wert kann aber auch als 1D / 2D Barcode-Stempel aufgebracht werden. Es stehen 36 Barcode-Typen zur Auswahl. Ein weiterer Parameter legt fest ob der Stempel auf bestimmten Seiten, in einem Seitenbereich, auf allen Seiten bzw. nur auf der letzten Seite aufgebracht werden soll.

12_PDFmdx - Ein über den Barcode ausgelesene Wert wird als QR-Code auf dem Dokument aufgebracht  13_PDFmdx - Die ausgelesene Rechnugnsnummer soll als CODE128 Barcode auf allen Seiten aufgebracht werden  14_PDFmdx - Text und Barcode Stempel können aufgebracht und ausgelesene Werte als Inhalt verwendet werden  15_PDFmdx - Barcode als QR-Code und Rechnugsnummer als Barcode aufgestempelt

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 2.4.3 – Barcode Erkennung & verbesserte Anker / Suchfeldfunktion

Neuerungen Version 2.4.3:

Feld-Typ – Barcode: Mit dem neuen Feldtyp Barcode ist es jetzt auch möglich Felder (Bereiche) als Typ „Barcode“ zu definieren. Aus dem festgelegten Bereich wird nicht der Text ausgelesen sondern eine 1D-Barcode Erkennung nach dem ausgewählten Barcode Typ durchgeführt und der erkannte Wert zurückgeliefert.

1_Felder können als Typ Barcode angelegt werden  2_Barcode Typ auswählen  3_Barcodes werden in dem Feldbereich erkannt und als Text ausgegeben

Verbesserte Anker / Suchfeldfunktion:  Felder können  in Relation zu einem „Anker / Suchfeld“ Feld gesetzt werden. Das Ankerfeld kann über einen Text bzw. Teilstring Suchtext auf einer Seiten gesucht werden. Wird der Begriff gefunden so werden die anderen Felder in Relation zu diesem Feld ausgelesen. Damit kann z.b. „Gesamtbetrag“ und die dazu in Relation stehenden Felder – Netto, Mwst, Brutto – gefunden und ausgelesen werden. Diese Funktion ist auch für die Verarbeitung eingescannter Dokumente wichtig da hier durch den Scanvorgang nicht gewährleistet ist dass sich die auszulesenden Felder immer an der gleichen Position befinden. Auch Barcode Felder können relativ zu Ankerfeldern festgelegt und gelesen werden.

Download – PDFmdx Template Editor & Processor >>>

SMTP Massen EMail Versand – was ist zu beachten ?

Es wird immer üblicher und ist mittlerweile auch von vielen Unternehmen akzeptiert Belege wie z.b. Rechnungen, Auftragsbestätigungen, Mahnungen oder Kundeninformationen per Email zu versenden.

Über unsere Produkte iPaper Server sowie PDFmdx ist es möglich in kurzer Zeit eine großen Anzahl an EMails per SMTP automatisiert zu versenden.

Es müssen jedoch einige Dinge beachtet werden um nicht die eigene, tägliche, normale Email Kommunikation zu behindern bzw. komplett zu blockieren in dem der eigene EMail Server als potentielle Spam Quelle identifiziert und auf einer „Black-List“ landet und damit für die EMail Kommunikation temporär gesperrt wird.

Was ist beim Massen Email Versand zu beachten:

  • Verwenden sie zum Massenversand einen eigenen, getrennten SMTP EMail Server und nicht den Email Server der auch für die normale tägliche Kommunikation benutzt wird. Damit verhindern sie verzögerte Zustellungen bzw. Black List Probleme.
  • Die Berechtigung dass dieser Email Server für ihre Domain senden darf muss gesetzt sein – SPF Record in den DNS Einstellungen
  • Die IP des Email Servers muss im PTR Record gesetzt sein – dies erfolgt nicht über den DNS sondern muss beim Provider des Servers gesetzt werden.
  • Der MX Record für den Server muss über die DNS Einstellungen der Domaingesetzt sein – Achtung: Es muss hier sichergestellt werden (z.b. über eine Firewall ) dass dieser Server keine Emails entgegennimmt.
  • Die EMail sollten in Batches von z.b. 100 Emails im Abstand von z.b. 5 oder 10min. verschickt werde – dies muss durch die versendende Anwendung sichergestellt und konfiguriert werden.
  • Um sicher zu gehen dass der EMail Server nicht doch als Spam Quelle erkannt und gesperrt wird sollte ein regelmäßiger und automatisierte Check gegen die wichtigsten Black-Listen erfolgen. Das kann z.b. über eine NAGIOS Überwachung erfolgen.
  • Die Absender Email Adresse ist entsprechend festzulegen damit – durch den Empfänger geblockte bzw. ungültige Email Adressen erkannt und weiterverarbeitet werden können bzw. Antworten nicht verloren gehen.

Gerne können unsere Spezialisten sie auch bei der Einrichtung und Konfiguration eines solchen Email Servers für den Massenversand unterstützen bzw. bieten wir auch für diesen Zweck gehostete, fertig konfigurierte Server an.

Anfragen >>>

PDFmdx – Job Prozessor – Kurzübersicht der Funktionen

Der PDFmdx Job Prozessor dient der zentralen, serverbasierenden, automatisierten und unbeaufsichtigten Verarbeitung von Dokumenten über Folder-Monitoring.

Mehrere Jobs können angelegt und mehrere Eingangsordner damit überwacht werden. Pro Job / Eingangsordner erfolgt eine Vor-Auswahl der zu erkennenden Templates und Layouts.

Der Prozessor prüft jedes zu verarbeitende Dokument gegen die vorausgewählten Templates / Layouts. Passen die Erkennungs-Bedingungen so erfolgt die über das Template / Layout festgelegte Verarbeitung. Der Job-Prozessor führt das aus was über den PDFmdx Template Editor an Logik und Verarbeitungs-Schritten festgelegt wurde.

01 PDFmdx - Service Prozessing über Windows Dienst - Userinterface zur Job Konfiguration

Windows Dienst
Für die serverbasierende und unbeaufsichtigte Verarbeitung wird ein Windows Dienst installiert. Alternativ dazu kann auch eine startbare Anwendung verwendet werden. Der zu verwendende Service Account ist konfigurierbar.

07 PDFmdx - Jobverarbeitung über startbare Anwendung - alternativ zum Service Prozessing

Parallele Verarbeitung
Bei genug Ressourcen und hohem Dokumentenaufkommen lassen sich mehrere parallele Verarbeitungsprozessor konfigurieren.

Email Server Konfiguration
Der Versand der Emails erfolgt über eine SMTP Server, mit oder ohne Verschlüsselung und Authentifizierung. Auftretende Fehler lassen sich per Email melden.

04 PDFmdx - EMail Server Konfiguration für die Job Verarbeitung

Druck-Server Konfiguration
Der PDF2Printer Druckserver-Dienst wird unterstützt. Auswahl des Standard-Druckers sowie welches Feld die Drucker steuert. Alias Zuordnung ermöglich es ausgelesene Werte einen physischen Drucker zuzuordnen.

05 PDFmdx - Integration mit dem PDF2Printer Druckserver

Nur Daten ausgeben
Diese Option erlaubt es nur Metadaten aus Dokumenten auszulesen, die Dokumente selbst aber nicht zu verändern. Es erfolgt kein Teilen, Umbenennen, Verschieben usw.

Kopiere nach
Eingangsdokumente können damit auch automatisch in die andere ausgewählten Jobs / Ordner kopiert. Damit lassen sich unterschiedliche Ergebnisse aus den Eingangsdokumenten erzeugen.

06 PDFmdx - Kopiere nach - Funktion um Eingangsdateien eines Jobs parallel dazu auch durch andere Jobs zu verarbeiten

Vorab Teilen
Umfangreiche Dokumente mit vielen Seiten können vorab geteilt werden um die Verarbeitung zu beschleunigen. Optionen: Vorab-Teilen über eine Vorlage nach Bedingungen, nach Feldinhaltsänderung, nach Seitenzahl oder nach Layout-Änderung.

Vorlagen / Layout-Auswahl
Pro Job / Ordner wird ausgewählt gegen welche Templates / Layouts getestet werden soll. Nein im Eingangs-Ordner hinzukommende Dokumente werden gegen diese Auswahl getestet, bei positivem Ergebnis erfolgt die Verarbeitung auf dieser Basis.

02 PDFmdx - Job Verarbeitung - Konfiguration welche Layouts für eine bestimmte Job-Definiton aktiv sein sollen sowie Konfiguration Vorab-Teilen

Zeitgesteuerte Verarbeitung
Standardmäßig werden neu hinzukommende Dateien sofort erkannt und verarbeitet. Es gibt jedoch auch die zeitgesteuerte Verarbeitung – im Minuten-Intervall, Täglich zu einer bestimmten Zeit oder mit festgelegten Datum / Uhrzeit.

Error Folder / Logging
Fehler werden protokolliert. Das betreffende Dokument wird in den Error Folder verschoben. Falls konfiguriert wird auch ein Error Email verschickt. Erfolgreiche Verarbeitungen werden über die Metadaten-Datei protokolliert.

www.pdfmdx.at

PDFmdx – Template Editor – Kurzübersicht der Funktionen

Mit dem PDFmdx Template Editor werden die Kriterien und Verarbeitungsschritte konfiguriert. Templates und die damit verbundenen Layouts sind die Voraussetzung um die Dokumente zu kategorisieren, zu splitten und die gewünschte Information daraus auszulesen. Templates bestimmen die Namensgebung, Folder-Struktur, Metadaten und legen die weitere Verarbeitung mit Briefpapier, Signatur und E-Mail Versand fest.

Templates – Legen fest wie Dokumente über Bedingungen klassifiziert, einem Layout zugeordnet bzw. auch in Einzeldokumente aufgeteilt werden. Templates definieren für alle Layouts die gemeinsamen Verarbeitungsparameter: Felder, Dateiname, Ordnerstruktur, Bedingung für: Teilen, Erkennen, Seiten löschen, sowie Briefpapier, Signatur und EMail

Layouts – Einem Template können auch mehrere Layouts zugeordnet werden. Diese legen fest wo und wie die Felder gefunden bzw. was ausgelesen werden soll.

02 PDFmdx - Tempate Editor -  Vorlagen, Layouts sowie deren Logik werden damit konfiguriert

Felder –  Mit einem Layout sind die Felder / Variablen verbunden. Es können beliebige Felder definiert und im Layout zum Auslesen von Informationen aus Dokumenten verwendet werden. Die Variablen werden mit dem ausgelesenen Text belegt und können für die Weiterverarbeitung als Metadaten verwendet werden.

04 PDFmdx - Template Editor - Feld Definition und Aufbereitung

Bedingungen – Werden über Felder aufgebaut und über logische Verknüpfungen sowie über Text und Teilstring aufgebaut. Damit werden Teilung, Layout Erkennung und das Löschen von Seiten gesteuert

06 PDFmdx - Template Editor - eine Vorlage mit mehreren Layouts - Identifikation über Bedingungen

Layout erkennen – Die Layout-Erkennung erfolgt durch logische Bedingungen über die im Layout positionierten Felder.

Dokumente teilen – Dokumente können nach – fixen Seiten, Änderungen von Feldinhalten, Logischen Kriterien bzw. nach Erkennen der Layout-Änderung geteilt werden

05 PDFmdx - Template Editor - Bedingungen für Teilen, Layout erkennen und Seiten löschen

Seiten löschen – Über logische Kriterien können Seiten erkannt werden die gelöscht und nicht ins Zieldokument übernommen werden sollen.

Neu Zusammenfügen – Dokumente lassen sich teilen und danach über Felder mit andere Sortierung und Struktur neu zusammenfügen.

14 PDFmdx - Template Editor - Seiten löschen, Dokument neu zusammenfügen

PDF Voransicht – Auf dem Beispieldokument für das Layout werden die Felder per Drag&Drop positioniert. Ausgelesene Feldinhalte werden sofort angezeigt.

01 PDFmdx - Template Editor - Definition von Vorlagen und Layouts für die automatisierte Dokumentenverarbeitung

Such- / Ankerfelder – Felder können absolut oder aber über eine Suchfunktion relativ zu Ankerfeldern positioniert und ausgelesen werden.

11 PDFmdx - Template Editor - Ankerfelder mit Suchfunktion ermöglichen variable Feldpositionen auf die andere Felder bezogen werden können

Testfunktion – Direkter Test des Templates / Layouts – Erkennen, Auslesen, Teilen, Seiten löschen wird simuliert und angezeigt, andere Testdateien können ausgewählt werden.

12 PDFmdx - Template Editor - Test Funktion - Auslesen von Bereichen

Briefpapier – Überlagern/Hinterlegen von Briefpapier, Unterschiedliche Briefpapiere können durch Bedingungen über den Dokumenteninhalt gesteuert werden.

07 PDFmdx - Template Editor - Briefpapier hinterlegen oder überlagern - Steuerung über Dokumenteninhalte

Email Vorlage – Erkennen und Auslesen von Email Adressen aus dem Dokument. Betreff und Inhalt sind vorkonfigurier- und über Feldinhalte anreicherbar. Fixe Anhänge sind zuordenbar.

10 PDFmdx - Template Editor - Vorlagendefinition für den EMail Versand

Signatur – Über Software Zertifikate kann die PDF Datei digital – sichtbar oder unsichtbar signiert werden.

08 PDFmdx - Template Editor - sichtbare oder unsichtbare Signatur

PDF-Infofelder – Lassen sich mit fixem Text oder über aus dem Dokument ausgelesenen Infos befüllt werden.

09 PDFmdx - Template Editor - Ausfüllen der PDF Infofelder über Dokumenteninhalte

www.pdfmdx.at

PDFmdx – PDF Dokumentenverarbeitung automatisieren – Anwendung in der Praxis

PDFmdx ist eine vielseitig einsetzbare Software um die PDF Dokumentenverarbeitung zu automatisieren
An Hand des Inhalts und über Bedingungen können Dokumente erkannt, geteilt und Metadaten daraus ausgelesen werden. Die Dokumente können auch nach Kriterien neu zusammensetzt, inhaltsgesteuert kann Briefpapier hinterlegt, gedruckt und per Email versandt werden.

Übersicht über Einsatzmöglichkeiten von PDFmdx

EMail Versand von Rechnungen, Auftragsbestätigungen, Mahnungen, Terminerinnerungen

PDF Dokumente werden einzeln oder als Gesamtdatei verarbeitet. Bei der Gesamtdatei erfolgt zuerst eine Teilung in Einzeldokumente. Als Teilungskriterium wird z.b. die Rechnungsnummer verwendet. Aus den Belegen wird die EMail Adresse, das Belegdatum und die Belegnummer ausgelesen. Die Belegnummer wird als Variable für die Namensgebung der Einzeldateien verwendet. Anschließend wird ein PDF Briefpapier hinterlegt und eine elektronische Signatur aufgebracht. Die Belege werden dann einzeln automatisiert per Email an die Empfänger verschickt. Das PDF Dokument wird als Anhang eingefügt. Der Betreff und die Nachricht wird über einen vordefinierten Baustein mit der Möglichkeit die aus den Dokumenten ausgelesenen Informationen als Variablen im Text wieder zu verwenden. PDFmdx bietet damit die Möglichkeit aus jeder beliebigen ERP Software die weitere Verarbeitung automatisiert ablaufen zu lassen. Dabei reicht es die Reports über einen einfachen Druckvorgang per PDF Druckertreiber in einen festgelegten Ordner zu drucken.

Automatisierte Archivierung von Reports und Belegen

Buchhaltungs-, Lohnverrechnungs- oder ERP Belege und Reports werden über den PDF Druckertreiber in einen festgelegten Ordner gedruckt. PDFmdx erkennt an Hand der Inhalte und Kriterien um welchen Beleg oder Report es sich handelt. Es wird das passende Layout mit den Felddefinitionen geladen. Damit werden die für die Archivierung erforderlichen Metadaten ausgelesen und als XML, CSV oder XLS weggeschrieben. Die für die Archivierung notwendigen Informationen müssen also nicht manuell erfasst werden sondern können automatisiert aus den Belegen gewonnen werden.

Hinterlegen von Briefpapier

Es gibt Unternehmen mit einer zentrale Informationsverarbeitung für eine Vielzahl an Projekten oder Tochter- / Sub-Unternehmen. Das verwalten, hinterlegen und die einfache Steuerung von perfekt gestaltetem PDF Briefpapier für die erzeugten Belege ist meistens aus einer Standardanwendung heraus nicht möglich bzw. sind die Anpassungen mühsam und aufwändig. PDFmdx ist in der Lage dieses Problem zu lösen – die Briefpapiere und PDF Formulare brauchen nicht mehr aus der Anwendung heraus berücksichtigt werden. Über Inhalte und Kriterien die aus dem PDF Dokument heraus gewonnen werden lässt sich steuern welches Briefpapier verwendet werden soll. Anpassungen und Änderungen reduzieren sich damit auf den einfachen Tausch eines PDF Dokuments.

Erzeugen von Tickets, Gutscheinen und Rechnungen durch Hinterlegen von Grafiken und Ausgabe über einen Druck-Server

Aus einem Web-Shop eines Veranstaltungszentrums heraus wir auf Grund einer Bestellung ein Dokumentenset aus Tickets, Gutscheinen und Rechnungen als PDF erzeugt. Das Gesamt-Dokument wird in die Einzeldokumente geteilt. Je nach Dokumententyp und je nach Veranstaltung für das der Gutschein oder das Ticket erzeugt wurde werden aktuelle und passende Grafiken hinterlegt und auf unterschiedlichen Druckern ausgegeben. PDFmdx teilt das Gesamtdokument in Einzeldokumente, liest die Information aus welche PDF Grafiken hinterlegt und auf welchem Drucker ausgegeben werden soll. Der Druck erfolgt dann über den PDF2Printer Druckserver.

Dokumente teilen, benennen, in Ordnern strukturieren und über OwnCloud für Mobil Clients zugänglich machen

Bestellungen und Auftragsbestätigungen sollen den Außendienstmitarbeitern über mobile Clients zugänglich gemacht werden. In regelmäßigen Abständen werden die neu hinzugekommenen Bestellungen und AB´s aus dem ERP als PDF gedruckt. PDFmdx teilt das Gesamt-PDF in Einzeldokumente und liest alle für die Namensgebung und den Aufbau der Ordnerstruktur erforderlichen Informationen aus den Dokumenten aus. Die Einzeldokumente werden benannt und in die über Variablen festgelegt Ordnerstruktur verschoben. Die damit erzeugte Dokumentenstruktur wird per OwnCloud repliziert. So stehen den Außendienstmitarbeitern laufend die aktuellen Bestellungen und AB´s über eine einfache und übersichtliche Ordnerstruktur auf deren mobilen Geräten zur Verfügung.

Gesamt-Reports teilen und nach anderen Kriterien neu zusammensetzen

Monatliche Reports werden als Gesamt PDF erzeugt und haben eine vorgegebene Sortierung und Strukturierung. Dieser Gesamt Report soll in Einzelreports aufgeteilt, nach anderen Kriterien neu sortiert und über PDF Lesezeichen neu strukturiert werden. Deckblätter des Gesamtreports sollen erkannt und gelöscht werden. PDFmdx kann zu löschende Seiten erkennen und PDF-Gesamtdokumente über Inhalte und Bedingungen in Einzel-Dokumente aufteilen und benennen. Diese Einzeldokumente können über die aus den einzelnen Seiten ausgelesene Informationen neu sortiert und strukturiert werden.

Gescannte Eingangsrechnungen, automatisch erkennen und Metadaten für die Weiterverarbeitung auslesen

Eingangsrechnungen werden gescannt und über den AutoOCR Server in durchsuchbare PDF´s gewandelt. Im PDFmdx ist für jeden Lieferanten das Layout und die Erkennungslogik für seine Eingangsrechnungen hinterlegt. Die auszulesenden Felder sind für die Rechnungen aller Lieferanten gleich und einheitlich definiert. Je nach Lieferant befindet sich die gewünschte Information an unterschiedlichen Stellen. Eine Suchfunktion für „Ankerfelder“ dient dazu sowohl die durch das Scannen „wandernden“ Positionen als auch die unterschiedlichen Layouts verarbeiten zu können. Ebenso können damit Gesamt-Summenwerte die sich sowohl auf verschiedenen vertikalen Positionen als auch auf unterschiedlichen Seiten befinden gesucht und ausgelesen werden.

Sammelrechnungen & Gutschriften – Erkennen, Auslesen und in Einzelbelege aufteilen

Bei diesem Anwendungsfall muss ein Dokumentenstapel der Rechnungen und Gutschriften mit unterschiedlichen Layouts enthält in Einzeldokumente aufgeteilt und die Einzeldokumente nach der Belegnummer benannt werden. Dabei sind nicht nur die Layouts der Belegtypen unterschiedlich, auch innerhalb des gleichen Belegtyps kann die Position der Belegnummer je nach Anzahl der Adresszeilen vertikal verschieden sein.

PDFmdx – Version 2.2.1 – mit vielen Erweiterungen und Neuerungen

Mit der Version 2.x sowie jetzt mit der Version 2.2.1 wurden für PDFmdx eine Vielzahl an Erweiterungen und Neuerungen implementiert.

Neuerungen PDFmdx Template Editor Version 2.x:

Komplett neu gestalteter Template Editor – einem Template können jetzt mehrere Layouts zugeordnet werden. Bisher musste pro Layout ein eigenes Template angelegt werden. Ein Template fasst jetzt alle Layouts zusammen welche die gleichen Felder enthalten und gleich verarbeitet werden sollen. Um z.b. Eingangs-Rechnungen zu verarbeiten gibt es ein einziges Rechnungs – Template mit den Feldern – Firma, Nummer, Datum, Betrag. Pro Lieferant gibt es dann ein Layout um die unterschiedlichen Rechnungsformulare abzubilden. Layouts werden über Bedingungen erkannt und legen die Felder auf dem Formular fest.

Briefpapier über Informationen aus dem Dokument steuern: PDFmdx kann auf die erzeugten Dokumente auch ein PDF-Briefpapier als Überlagerung oder Hinterlegung anwenden. Feldinhalte und Kriterien steuern über den Dokumenteninhalt unterschiedliche Briefpapiere. Ebenso können die Felder auch zur Generierung für Namen und Pfad des PDF Briefpapiers verwendet werden.

Mehrere Briefpapiere über Dokumenteninhalte steuern

Anker Felder – Teilstringsuche und Seitenbereiche: Anker Felder werden benötigt um Referenzstellen in einem Dokument zu finden um andere Felder absolut darauf zu beziehen. Es gibt Informationen die sich weder immer wieder an der gleichen Stelle noch auf der gleichen Seite befinden. Ein typisches Beispiel ist z.b. der Endbetrag einer Rechnung – dieser kann sich auf der ersten, der letzten oder aber auch auf einer x beliebigen Seite befinden. Zusätzlich kann  je nach Anzahl der Rechnungs-Positionen der Endbetrag vertikal variieren. Eine fixe Definition würde hier nicht helfen. Eine weitere Herausforderung stellen gescannte Belege dar. Hier kann von Dokument zu Dokument jedes Feld horizontal und vertikal – „wandern“ – je nach dem wie das Dokument in den Scanner eingelegt und gescannt wurde – können sich Verschiebungen und Verzerrungen ergeben. Eine fixe Positionsdefinition würde eine hohe Fehlerrate verursachen.

Um in diesen Fällen die Felder zuverlässig auslesen und verarbeiten zu können haben wir die „Anker-Felder“ implementiert – diese Felder sind Fixpunkte auf welche sich andere Felder dann absolut beziehen können – z.B. Briefpapierköpfe mit Firmennamen oder Texte wie z.b. „Gesamtsumme“ oder „Rechnungsendbetrag“ usw.

Pro Layout können ein oder mehrere Ankerfelder definiert werden auf welche sich andere Felder beziehen können. Die Suche nach den Ankerfeldern kann über Teilstrings oder fixe Texte erfolgen und es kann festgelegt werden ob alle oder nur bestimmte Seiten durchsucht werden sollen.

Template Editor - Anker Feld - Teilstringsuche & Seitendefinition

Seiten löschen – Manchmal ist es erforderlich bestimmte Seiten zu löschen und diese nicht in das Zieldokument zu übernehmen. Z.b. bei Deck- oder Trenn-Blättern. Die Seiten werden wie die Layouts über Bedingungen aus dem Inhalt erkannt.

Neue Funktion - Seite entfernen  Zu löschende Seiten können über Bedingungen erkannt und gelöscht werden

Teilen & Neu zusammenfügen: PDFmdx ist in der Lage Dokumentenstapel nach Kriterien in Einzeldokumente aufzuteilen – z.b. Über Seitenzahl, über Änderung eines bestimmten Feldes (z.b. Rechnungsnummer) oder über frei festlegbare UND / ODER Kriterien. Neu hinzugekommen ist jetzt auch eine Funktion um die so geteilten Dokumente wieder nach anderen Kriterien zu neuen Dokumenten zusammenzusetzen. Innerhalb des Dokuments kann nach aus dem Dokument ausgelesenen Informationen neu sortiert und über Lesezeichen strukturiert werden. Damit lassen sich z.b. Gesamt-Reports in Einzel-Reports aufteilen und nach anderen Kriterien wieder neu zusammensetzen und strukturieren.

Feld-Definitionen - Seiten löschen, teilen und neu zusammensetzen  Informationen aus dem Dokument ermöglichen die Teilung und Neustrukturierung  Seite 2 - Musterdokument  Definition der Kriterien zum Teilen und Neu Zusammenfügen  Der Test zeigt welche Seiten gelöscht und welche Informationen ausgelesen werden  Der Test zeigt auch welche Seiten auch wieder zu einem neuen Dokument zusammengesetzt werden  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #1  Zusammenfürgen - Kriterien #2  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #2  Zusammenfürgen - Kriterien #3  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #3

Test – Funktion – wesentlich erweitert: Der Template Editor bietet für die Layouts eine „Test“ Funktion. Diese dient dazu um schon vorab an Hand einer Muster- oder Vorlagendatei – einen Test der Feld-Suche, -Extraktion, -Aufbereitung, der Layout-Erkennung, der Seiten Löschfunktion und der Dokumententeilung – durchführen zu können. Für den Test kann auch eine andere als die für das Layout verwendete PDF Datei ausgewählt werden.

Template Editor - Test Funktion - Feld Extraktion  Template Editor Test Funktion - Teilen und Zusammenfügen

Felder – mit Werten belegen: Im Normalfall können Informationen aus dem Dokument ausgelesen und Feldern / Variablen zugeordnet werden. Es gibt aber Fälle in denen es nicht möglich ist bestimmte Informationen die weggeschrieben werden sollen auszulesen. Z.B. kann  es vorkommen dass bei einer Rechnung die per PDF vorliegt der Lieferant für die Gestaltung des Formulars nur Bilder verwendet hat und es daher keinen Bereich gibt über den man den Firmennamen auslesen kann – das Layout aber über andere Kriterien erkannt und eindeutig zugeordnet werden kann. Für den Fall wird das Feld „Firma“ nicht auf dem Layout positioniert, kann aber mit dem Namen der Firma belegt werden um die Information in weiterer Folge als Variable bzw. in den Metadaten verwenden zu können.

Template Editor - Belegen von nicht positinierten Feldern mit Werten

Neuerungen PDFmdx Prozessor Version 2.x:

Kopieren nach..: Um z.b. eine einzige Eingabedatei auf mehrere unterschiedliche Arten zu verarbeiten dient die Funktion „Kopiere nach..“ – Dabei muss nur mehr der Name des / der Ziel Jobs aus der Liste ausgewählt werden. Die Übergabe kann auch parallel an mehrere Jobs erfolgen. Alle Eingabedateien des einen Jobs werden dann automatisch auch in die Eingabe-Ordner der anderen Jobs kopiert. Damit können z.b. automatisch mehrere Varianten einer Verarbeitung mit unterschiedlichen Parametern auf einmal ausgeführt werden – siehe auch die Funktion „Teilen & Neu zusammenfügen“

Verketten von PDFmdx Jobs über die Kopieren nach Funktion

Vorab-Teilen bei Änderung des Layouts / Template: Diese Funktion ermöglicht es Dokumentenstapel vor der weiteren Verarbeitung an Hand der erkannten Layouts bzw.- Vorlagen in Einzeldokumente aufzuteilen und dann weiter zu verarbeiten. Eine Teilung in ein neues Dokument erfolgt sobald sich ein erkanntes Layout ändert. Layouts und Vorlagen werden über die konfigurierten Kriterien erkannt. Es wird nur an Seiten geteilt wo ein Layout erkannt wird.

Vorab-Teilen bei Änmderung der Vorlage oder des Layouts

PDFmdx Service Prozessor – Zeitgesteuerte Verarbeitung: Standardmäßig beginnt die Verarbeitung sobald eine neue Datei in einem der Eingangs-Ordner erkannt wird. Darüber hinaus hat es bisher beim startbaren PDFmdx Prozessor auch die Möglichkeit gegeben die Verarbeitung zeitgesteuert – mit einem eingestellten Intervall von x Minuten, bzw. auch zu einem bestimmten Datum & Uhrzeit oder aber auch täglich zu einer bestimmten Uhrzeit – durchzuführen. Diese Möglichkeit gibt es jetzt auch für den PDFmdx Service Prozessor.

Zeitgesteuerte Jobverarbeitung jetzt auch beim Service Processing

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 1.2.6 – automatische Ausdrucke über PDF2Printer – Integration

PDFmdx Version 1.2.6 verfügt jetzt über eine Integration mit dem PDF Druckerdienst – PDF2Printer. Damit können die erzeugten Dokumente automatisiert auf Druckern ausgegeben werden.

Die Druckausgabe erfolgt für alle im Rahmen der PreSplit Funktion erzeugten Einzeldokumente. Die Information auf welchen Drucker ausgegeben werden soll kann aus den Einzeldokumenten über ein Datenfeld des PreSplit Templates ausgelesen und für die Ansteuerung von PDF2Printer verwendet werden.

Mittels Alias Zuordnung kann über ein aus dem Dokument ausgelesenes Feld ein physischer Drucker ermittelt und zugeordnet werden. Kann  kein passender Alias gefunden werden oder fehlt die Information im Dokument so wird der eingestellte „Default Printer“ genommen. Die Druckfunktion kann generell, sowie pro Verarbeitungsdefinition individuell aktiviert und deaktiviert werden.

PDFmdx - Processor - Print Funktion aktiviert  PDFmdx - Service Client - Print Funktion aktiviert  PDFmdx - Processor - PDF2Print Integration - Konfiguration

PDFmdx erzeugt pro Verarbeitungsjob (Eingangsdokument) das verarbeitet wird – einen eindeutigen Unterordner im gemeinsamen Druck-Eingangs-Folder. Dahin werden die über den Splitvorgang erzeugten PDF-Einzeldateien kopiert.

Zum Start der Weiterverarbeitung = Druckvorgang wird automatisch eine „PDFmdx.pcf“  (Print Contol File) ASCII Datei – erzeugt und zum Schluss in den Unterordner kopiert. Das PCF enthält die Namen der zu druckenden PDF´s, legt die Druckreihenfolge sowie den Drucker fest auf den ausgegeben werden soll. Der PDF2Printer Dienst erkennt die vorhandene „PDFmdx.pcf“ Datei und startet den Druckvorgang. Nach erfolgreichem Druck wird der Unterordner gelöscht.

Die PCF – Datei triggert und steuert die Druck-Ausgabe:

Subfolder processing with pcf - print control file

Download – PDFmdx Template Editor & Processor >>>