Kategorie: PDFmdx

PDFmdx – Version 2.4.3 – Barcode Erkennung & verbesserte Anker / Suchfeldfunktion

Neuerungen Version 2.4.3:

Feld-Typ – Barcode: Mit dem neuen Feldtyp Barcode ist es jetzt auch möglich Felder (Bereiche) als Typ „Barcode“ zu definieren. Aus dem festgelegten Bereich wird nicht der Text ausgelesen sondern eine 1D-Barcode Erkennung nach dem ausgewählten Barcode Typ durchgeführt und der erkannte Wert zurückgeliefert.

1_Felder können als Typ Barcode angelegt werden  2_Barcode Typ auswählen  3_Barcodes werden in dem Feldbereich erkannt und als Text ausgegeben

Verbesserte Anker / Suchfeldfunktion:  Felder können  in Relation zu einem „Anker / Suchfeld“ Feld gesetzt werden. Das Ankerfeld kann über einen Text bzw. Teilstring Suchtext auf einer Seiten gesucht werden. Wird der Begriff gefunden so werden die anderen Felder in Relation zu diesem Feld ausgelesen. Damit kann z.b. „Gesamtbetrag“ und die dazu in Relation stehenden Felder – Netto, Mwst, Brutto – gefunden und ausgelesen werden. Diese Funktion ist auch für die Verarbeitung eingescannter Dokumente wichtig da hier durch den Scanvorgang nicht gewährleistet ist dass sich die auszulesenden Felder immer an der gleichen Position befinden. Auch Barcode Felder können relativ zu Ankerfeldern festgelegt und gelesen werden.

Download – PDFmdx Template Editor & Processor >>>

SMTP Massen EMail Versand – was ist zu beachten ?

Es wird immer üblicher und ist mittlerweile auch von vielen Unternehmen akzeptiert Belege wie z.b. Rechnungen, Auftragsbestätigungen, Mahnungen oder Kundeninformationen per Email zu versenden.

Über unsere Produkte iPaper Server sowie PDFmdx ist es möglich in kurzer Zeit eine großen Anzahl an EMails per SMTP automatisiert zu versenden.

Es müssen jedoch einige Dinge beachtet werden um nicht die eigene, tägliche, normale Email Kommunikation zu behindern bzw. komplett zu blockieren in dem der eigene EMail Server als potentielle Spam Quelle identifiziert und auf einer „Black-List“ landet und damit für die EMail Kommunikation temporär gesperrt wird.

Was ist beim Massen Email Versand zu beachten:

  • Verwenden sie zum Massenversand einen eigenen, getrennten SMTP EMail Server und nicht den Email Server der auch für die normale tägliche Kommunikation benutzt wird. Damit verhindern sie verzögerte Zustellungen bzw. Black List Probleme.
  • Die Berechtigung dass dieser Email Server für ihre Domain senden darf muss gesetzt sein – SPF Record in den DNS Einstellungen
  • Die IP des Email Servers muss im PTR Record gesetzt sein – dies erfolgt nicht über den DNS sondern muss beim Provider des Servers gesetzt werden.
  • Der MX Record für den Server muss über die DNS Einstellungen der Domaingesetzt sein – Achtung: Es muss hier sichergestellt werden (z.b. über eine Firewall ) dass dieser Server keine Emails entgegennimmt.
  • Die EMail sollten in Batches von z.b. 100 Emails im Abstand von z.b. 5 oder 10min. verschickt werde – dies muss durch die versendende Anwendung sichergestellt und konfiguriert werden.
  • Um sicher zu gehen dass der EMail Server nicht doch als Spam Quelle erkannt und gesperrt wird sollte ein regelmäßiger und automatisierte Check gegen die wichtigsten Black-Listen erfolgen. Das kann z.b. über eine NAGIOS Überwachung erfolgen.
  • Die Absender Email Adresse ist entsprechend festzulegen damit – durch den Empfänger geblockte bzw. ungültige Email Adressen erkannt und weiterverarbeitet werden können bzw. Antworten nicht verloren gehen.

Gerne können unsere Spezialisten sie auch bei der Einrichtung und Konfiguration eines solchen Email Servers für den Massenversand unterstützen bzw. bieten wir auch für diesen Zweck gehostete, fertig konfigurierte Server an.

Anfragen >>>

PDFmdx – Job Prozessor – Kurzübersicht der Funktionen

Der PDFmdx Job Prozessor dient der zentralen, serverbasierenden, automatisierten und unbeaufsichtigten Verarbeitung von Dokumenten über Folder-Monitoring.

Mehrere Jobs können angelegt und mehrere Eingangsordner damit überwacht werden. Pro Job / Eingangsordner erfolgt eine Vor-Auswahl der zu erkennenden Templates und Layouts.

Der Prozessor prüft jedes zu verarbeitende Dokument gegen die vorausgewählten Templates / Layouts. Passen die Erkennungs-Bedingungen so erfolgt die über das Template / Layout festgelegte Verarbeitung. Der Job-Prozessor führt das aus was über den PDFmdx Template Editor an Logik und Verarbeitungs-Schritten festgelegt wurde.

01 PDFmdx - Service Prozessing über Windows Dienst - Userinterface zur Job Konfiguration

Windows Dienst
Für die serverbasierende und unbeaufsichtigte Verarbeitung wird ein Windows Dienst installiert. Alternativ dazu kann auch eine startbare Anwendung verwendet werden. Der zu verwendende Service Account ist konfigurierbar.

07 PDFmdx - Jobverarbeitung über startbare Anwendung - alternativ zum Service Prozessing

Parallele Verarbeitung
Bei genug Ressourcen und hohem Dokumentenaufkommen lassen sich mehrere parallele Verarbeitungsprozessor konfigurieren.

Email Server Konfiguration
Der Versand der Emails erfolgt über eine SMTP Server, mit oder ohne Verschlüsselung und Authentifizierung. Auftretende Fehler lassen sich per Email melden.

04 PDFmdx - EMail Server Konfiguration für die Job Verarbeitung

Druck-Server Konfiguration
Der PDF2Printer Druckserver-Dienst wird unterstützt. Auswahl des Standard-Druckers sowie welches Feld die Drucker steuert. Alias Zuordnung ermöglich es ausgelesene Werte einen physischen Drucker zuzuordnen.

05 PDFmdx - Integration mit dem PDF2Printer Druckserver

Nur Daten ausgeben
Diese Option erlaubt es nur Metadaten aus Dokumenten auszulesen, die Dokumente selbst aber nicht zu verändern. Es erfolgt kein Teilen, Umbenennen, Verschieben usw.

Kopiere nach
Eingangsdokumente können damit auch automatisch in die andere ausgewählten Jobs / Ordner kopiert. Damit lassen sich unterschiedliche Ergebnisse aus den Eingangsdokumenten erzeugen.

06 PDFmdx - Kopiere nach - Funktion um Eingangsdateien eines Jobs parallel dazu auch durch andere Jobs zu verarbeiten

Vorab Teilen
Umfangreiche Dokumente mit vielen Seiten können vorab geteilt werden um die Verarbeitung zu beschleunigen. Optionen: Vorab-Teilen über eine Vorlage nach Bedingungen, nach Feldinhaltsänderung, nach Seitenzahl oder nach Layout-Änderung.

Vorlagen / Layout-Auswahl
Pro Job / Ordner wird ausgewählt gegen welche Templates / Layouts getestet werden soll. Nein im Eingangs-Ordner hinzukommende Dokumente werden gegen diese Auswahl getestet, bei positivem Ergebnis erfolgt die Verarbeitung auf dieser Basis.

02 PDFmdx - Job Verarbeitung - Konfiguration welche Layouts für eine bestimmte Job-Definiton aktiv sein sollen sowie Konfiguration Vorab-Teilen

Zeitgesteuerte Verarbeitung
Standardmäßig werden neu hinzukommende Dateien sofort erkannt und verarbeitet. Es gibt jedoch auch die zeitgesteuerte Verarbeitung – im Minuten-Intervall, Täglich zu einer bestimmten Zeit oder mit festgelegten Datum / Uhrzeit.

Error Folder / Logging
Fehler werden protokolliert. Das betreffende Dokument wird in den Error Folder verschoben. Falls konfiguriert wird auch ein Error Email verschickt. Erfolgreiche Verarbeitungen werden über die Metadaten-Datei protokolliert.

www.pdfmdx.at

PDFmdx – Template Editor – Kurzübersicht der Funktionen

Mit dem PDFmdx Template Editor werden die Kriterien und Verarbeitungsschritte konfiguriert. Templates und die damit verbundenen Layouts sind die Voraussetzung um die Dokumente zu kategorisieren, zu splitten und die gewünschte Information daraus auszulesen. Templates bestimmen die Namensgebung, Folder-Struktur, Metadaten und legen die weitere Verarbeitung mit Briefpapier, Signatur und E-Mail Versand fest.

Templates – Legen fest wie Dokumente über Bedingungen klassifiziert, einem Layout zugeordnet bzw. auch in Einzeldokumente aufgeteilt werden. Templates definieren für alle Layouts die gemeinsamen Verarbeitungsparameter: Felder, Dateiname, Ordnerstruktur, Bedingung für: Teilen, Erkennen, Seiten löschen, sowie Briefpapier, Signatur und EMail

Layouts – Einem Template können auch mehrere Layouts zugeordnet werden. Diese legen fest wo und wie die Felder gefunden bzw. was ausgelesen werden soll.

02 PDFmdx - Tempate Editor -  Vorlagen, Layouts sowie deren Logik werden damit konfiguriert

Felder –  Mit einem Layout sind die Felder / Variablen verbunden. Es können beliebige Felder definiert und im Layout zum Auslesen von Informationen aus Dokumenten verwendet werden. Die Variablen werden mit dem ausgelesenen Text belegt und können für die Weiterverarbeitung als Metadaten verwendet werden.

04 PDFmdx - Template Editor - Feld Definition und Aufbereitung

Bedingungen – Werden über Felder aufgebaut und über logische Verknüpfungen sowie über Text und Teilstring aufgebaut. Damit werden Teilung, Layout Erkennung und das Löschen von Seiten gesteuert

06 PDFmdx - Template Editor - eine Vorlage mit mehreren Layouts - Identifikation über Bedingungen

Layout erkennen – Die Layout-Erkennung erfolgt durch logische Bedingungen über die im Layout positionierten Felder.

Dokumente teilen – Dokumente können nach – fixen Seiten, Änderungen von Feldinhalten, Logischen Kriterien bzw. nach Erkennen der Layout-Änderung geteilt werden

05 PDFmdx - Template Editor - Bedingungen für Teilen, Layout erkennen und Seiten löschen

Seiten löschen – Über logische Kriterien können Seiten erkannt werden die gelöscht und nicht ins Zieldokument übernommen werden sollen.

Neu Zusammenfügen – Dokumente lassen sich teilen und danach über Felder mit andere Sortierung und Struktur neu zusammenfügen.

14 PDFmdx - Template Editor - Seiten löschen, Dokument neu zusammenfügen

PDF Voransicht – Auf dem Beispieldokument für das Layout werden die Felder per Drag&Drop positioniert. Ausgelesene Feldinhalte werden sofort angezeigt.

01 PDFmdx - Template Editor - Definition von Vorlagen und Layouts für die automatisierte Dokumentenverarbeitung

Such- / Ankerfelder – Felder können absolut oder aber über eine Suchfunktion relativ zu Ankerfeldern positioniert und ausgelesen werden.

11 PDFmdx - Template Editor - Ankerfelder mit Suchfunktion ermöglichen variable Feldpositionen auf die andere Felder bezogen werden können

Testfunktion – Direkter Test des Templates / Layouts – Erkennen, Auslesen, Teilen, Seiten löschen wird simuliert und angezeigt, andere Testdateien können ausgewählt werden.

12 PDFmdx - Template Editor - Test Funktion - Auslesen von Bereichen

Briefpapier – Überlagern/Hinterlegen von Briefpapier, Unterschiedliche Briefpapiere können durch Bedingungen über den Dokumenteninhalt gesteuert werden.

07 PDFmdx - Template Editor - Briefpapier hinterlegen oder überlagern - Steuerung über Dokumenteninhalte

Email Vorlage – Erkennen und Auslesen von Email Adressen aus dem Dokument. Betreff und Inhalt sind vorkonfigurier- und über Feldinhalte anreicherbar. Fixe Anhänge sind zuordenbar.

10 PDFmdx - Template Editor - Vorlagendefinition für den EMail Versand

Signatur – Über Software Zertifikate kann die PDF Datei digital – sichtbar oder unsichtbar signiert werden.

08 PDFmdx - Template Editor - sichtbare oder unsichtbare Signatur

PDF-Infofelder – Lassen sich mit fixem Text oder über aus dem Dokument ausgelesenen Infos befüllt werden.

09 PDFmdx - Template Editor - Ausfüllen der PDF Infofelder über Dokumenteninhalte

www.pdfmdx.at

PDFmdx – PDF Dokumentenverarbeitung automatisieren – Anwendung in der Praxis

PDFmdx ist eine vielseitig einsetzbare Software um die PDF Dokumentenverarbeitung zu automatisieren
An Hand des Inhalts und über Bedingungen können Dokumente erkannt, geteilt und Metadaten daraus ausgelesen werden. Die Dokumente können auch nach Kriterien neu zusammensetzt, inhaltsgesteuert kann Briefpapier hinterlegt, gedruckt und per Email versandt werden.

Übersicht über Einsatzmöglichkeiten von PDFmdx

EMail Versand von Rechnungen, Auftragsbestätigungen, Mahnungen, Terminerinnerungen

PDF Dokumente werden einzeln oder als Gesamtdatei verarbeitet. Bei der Gesamtdatei erfolgt zuerst eine Teilung in Einzeldokumente. Als Teilungskriterium wird z.b. die Rechnungsnummer verwendet. Aus den Belegen wird die EMail Adresse, das Belegdatum und die Belegnummer ausgelesen. Die Belegnummer wird als Variable für die Namensgebung der Einzeldateien verwendet. Anschließend wird ein PDF Briefpapier hinterlegt und eine elektronische Signatur aufgebracht. Die Belege werden dann einzeln automatisiert per Email an die Empfänger verschickt. Das PDF Dokument wird als Anhang eingefügt. Der Betreff und die Nachricht wird über einen vordefinierten Baustein mit der Möglichkeit die aus den Dokumenten ausgelesenen Informationen als Variablen im Text wieder zu verwenden. PDFmdx bietet damit die Möglichkeit aus jeder beliebigen ERP Software die weitere Verarbeitung automatisiert ablaufen zu lassen. Dabei reicht es die Reports über einen einfachen Druckvorgang per PDF Druckertreiber in einen festgelegten Ordner zu drucken.

Automatisierte Archivierung von Reports und Belegen

Buchhaltungs-, Lohnverrechnungs- oder ERP Belege und Reports werden über den PDF Druckertreiber in einen festgelegten Ordner gedruckt. PDFmdx erkennt an Hand der Inhalte und Kriterien um welchen Beleg oder Report es sich handelt. Es wird das passende Layout mit den Felddefinitionen geladen. Damit werden die für die Archivierung erforderlichen Metadaten ausgelesen und als XML, CSV oder XLS weggeschrieben. Die für die Archivierung notwendigen Informationen müssen also nicht manuell erfasst werden sondern können automatisiert aus den Belegen gewonnen werden.

Hinterlegen von Briefpapier

Es gibt Unternehmen mit einer zentrale Informationsverarbeitung für eine Vielzahl an Projekten oder Tochter- / Sub-Unternehmen. Das verwalten, hinterlegen und die einfache Steuerung von perfekt gestaltetem PDF Briefpapier für die erzeugten Belege ist meistens aus einer Standardanwendung heraus nicht möglich bzw. sind die Anpassungen mühsam und aufwändig. PDFmdx ist in der Lage dieses Problem zu lösen – die Briefpapiere und PDF Formulare brauchen nicht mehr aus der Anwendung heraus berücksichtigt werden. Über Inhalte und Kriterien die aus dem PDF Dokument heraus gewonnen werden lässt sich steuern welches Briefpapier verwendet werden soll. Anpassungen und Änderungen reduzieren sich damit auf den einfachen Tausch eines PDF Dokuments.

Erzeugen von Tickets, Gutscheinen und Rechnungen durch Hinterlegen von Grafiken und Ausgabe über einen Druck-Server

Aus einem Web-Shop eines Veranstaltungszentrums heraus wir auf Grund einer Bestellung ein Dokumentenset aus Tickets, Gutscheinen und Rechnungen als PDF erzeugt. Das Gesamt-Dokument wird in die Einzeldokumente geteilt. Je nach Dokumententyp und je nach Veranstaltung für das der Gutschein oder das Ticket erzeugt wurde werden aktuelle und passende Grafiken hinterlegt und auf unterschiedlichen Druckern ausgegeben. PDFmdx teilt das Gesamtdokument in Einzeldokumente, liest die Information aus welche PDF Grafiken hinterlegt und auf welchem Drucker ausgegeben werden soll. Der Druck erfolgt dann über den PDF2Printer Druckserver.

Dokumente teilen, benennen, in Ordnern strukturieren und über OwnCloud für Mobil Clients zugänglich machen

Bestellungen und Auftragsbestätigungen sollen den Außendienstmitarbeitern über mobile Clients zugänglich gemacht werden. In regelmäßigen Abständen werden die neu hinzugekommenen Bestellungen und AB´s aus dem ERP als PDF gedruckt. PDFmdx teilt das Gesamt-PDF in Einzeldokumente und liest alle für die Namensgebung und den Aufbau der Ordnerstruktur erforderlichen Informationen aus den Dokumenten aus. Die Einzeldokumente werden benannt und in die über Variablen festgelegt Ordnerstruktur verschoben. Die damit erzeugte Dokumentenstruktur wird per OwnCloud repliziert. So stehen den Außendienstmitarbeitern laufend die aktuellen Bestellungen und AB´s über eine einfache und übersichtliche Ordnerstruktur auf deren mobilen Geräten zur Verfügung.

Gesamt-Reports teilen und nach anderen Kriterien neu zusammensetzen

Monatliche Reports werden als Gesamt PDF erzeugt und haben eine vorgegebene Sortierung und Strukturierung. Dieser Gesamt Report soll in Einzelreports aufgeteilt, nach anderen Kriterien neu sortiert und über PDF Lesezeichen neu strukturiert werden. Deckblätter des Gesamtreports sollen erkannt und gelöscht werden. PDFmdx kann zu löschende Seiten erkennen und PDF-Gesamtdokumente über Inhalte und Bedingungen in Einzel-Dokumente aufteilen und benennen. Diese Einzeldokumente können über die aus den einzelnen Seiten ausgelesene Informationen neu sortiert und strukturiert werden.

Gescannte Eingangsrechnungen, automatisch erkennen und Metadaten für die Weiterverarbeitung auslesen

Eingangsrechnungen werden gescannt und über den AutoOCR Server in durchsuchbare PDF´s gewandelt. Im PDFmdx ist für jeden Lieferanten das Layout und die Erkennungslogik für seine Eingangsrechnungen hinterlegt. Die auszulesenden Felder sind für die Rechnungen aller Lieferanten gleich und einheitlich definiert. Je nach Lieferant befindet sich die gewünschte Information an unterschiedlichen Stellen. Eine Suchfunktion für „Ankerfelder“ dient dazu sowohl die durch das Scannen „wandernden“ Positionen als auch die unterschiedlichen Layouts verarbeiten zu können. Ebenso können damit Gesamt-Summenwerte die sich sowohl auf verschiedenen vertikalen Positionen als auch auf unterschiedlichen Seiten befinden gesucht und ausgelesen werden.

Sammelrechnungen & Gutschriften – Erkennen, Auslesen und in Einzelbelege aufteilen

Bei diesem Anwendungsfall muss ein Dokumentenstapel der Rechnungen und Gutschriften mit unterschiedlichen Layouts enthält in Einzeldokumente aufgeteilt und die Einzeldokumente nach der Belegnummer benannt werden. Dabei sind nicht nur die Layouts der Belegtypen unterschiedlich, auch innerhalb des gleichen Belegtyps kann die Position der Belegnummer je nach Anzahl der Adresszeilen vertikal verschieden sein.

PDFmdx – Version 2.2.1 – mit vielen Erweiterungen und Neuerungen

Mit der Version 2.x sowie jetzt mit der Version 2.2.1 wurden für PDFmdx eine Vielzahl an Erweiterungen und Neuerungen implementiert.

Neuerungen PDFmdx Template Editor Version 2.x:

Komplett neu gestalteter Template Editor – einem Template können jetzt mehrere Layouts zugeordnet werden. Bisher musste pro Layout ein eigenes Template angelegt werden. Ein Template fasst jetzt alle Layouts zusammen welche die gleichen Felder enthalten und gleich verarbeitet werden sollen. Um z.b. Eingangs-Rechnungen zu verarbeiten gibt es ein einziges Rechnungs – Template mit den Feldern – Firma, Nummer, Datum, Betrag. Pro Lieferant gibt es dann ein Layout um die unterschiedlichen Rechnungsformulare abzubilden. Layouts werden über Bedingungen erkannt und legen die Felder auf dem Formular fest.

Briefpapier über Informationen aus dem Dokument steuern: PDFmdx kann auf die erzeugten Dokumente auch ein PDF-Briefpapier als Überlagerung oder Hinterlegung anwenden. Feldinhalte und Kriterien steuern über den Dokumenteninhalt unterschiedliche Briefpapiere. Ebenso können die Felder auch zur Generierung für Namen und Pfad des PDF Briefpapiers verwendet werden.

Mehrere Briefpapiere über Dokumenteninhalte steuern

Anker Felder – Teilstringsuche und Seitenbereiche: Anker Felder werden benötigt um Referenzstellen in einem Dokument zu finden um andere Felder absolut darauf zu beziehen. Es gibt Informationen die sich weder immer wieder an der gleichen Stelle noch auf der gleichen Seite befinden. Ein typisches Beispiel ist z.b. der Endbetrag einer Rechnung – dieser kann sich auf der ersten, der letzten oder aber auch auf einer x beliebigen Seite befinden. Zusätzlich kann  je nach Anzahl der Rechnungs-Positionen der Endbetrag vertikal variieren. Eine fixe Definition würde hier nicht helfen. Eine weitere Herausforderung stellen gescannte Belege dar. Hier kann von Dokument zu Dokument jedes Feld horizontal und vertikal – „wandern“ – je nach dem wie das Dokument in den Scanner eingelegt und gescannt wurde – können sich Verschiebungen und Verzerrungen ergeben. Eine fixe Positionsdefinition würde eine hohe Fehlerrate verursachen.

Um in diesen Fällen die Felder zuverlässig auslesen und verarbeiten zu können haben wir die „Anker-Felder“ implementiert – diese Felder sind Fixpunkte auf welche sich andere Felder dann absolut beziehen können – z.B. Briefpapierköpfe mit Firmennamen oder Texte wie z.b. „Gesamtsumme“ oder „Rechnungsendbetrag“ usw.

Pro Layout können ein oder mehrere Ankerfelder definiert werden auf welche sich andere Felder beziehen können. Die Suche nach den Ankerfeldern kann über Teilstrings oder fixe Texte erfolgen und es kann festgelegt werden ob alle oder nur bestimmte Seiten durchsucht werden sollen.

Template Editor - Anker Feld - Teilstringsuche & Seitendefinition

Seiten löschen – Manchmal ist es erforderlich bestimmte Seiten zu löschen und diese nicht in das Zieldokument zu übernehmen. Z.b. bei Deck- oder Trenn-Blättern. Die Seiten werden wie die Layouts über Bedingungen aus dem Inhalt erkannt.

Neue Funktion - Seite entfernen  Zu löschende Seiten können über Bedingungen erkannt und gelöscht werden

Teilen & Neu zusammenfügen: PDFmdx ist in der Lage Dokumentenstapel nach Kriterien in Einzeldokumente aufzuteilen – z.b. Über Seitenzahl, über Änderung eines bestimmten Feldes (z.b. Rechnungsnummer) oder über frei festlegbare UND / ODER Kriterien. Neu hinzugekommen ist jetzt auch eine Funktion um die so geteilten Dokumente wieder nach anderen Kriterien zu neuen Dokumenten zusammenzusetzen. Innerhalb des Dokuments kann nach aus dem Dokument ausgelesenen Informationen neu sortiert und über Lesezeichen strukturiert werden. Damit lassen sich z.b. Gesamt-Reports in Einzel-Reports aufteilen und nach anderen Kriterien wieder neu zusammensetzen und strukturieren.

Feld-Definitionen - Seiten löschen, teilen und neu zusammensetzen  Informationen aus dem Dokument ermöglichen die Teilung und Neustrukturierung  Seite 2 - Musterdokument  Definition der Kriterien zum Teilen und Neu Zusammenfügen  Der Test zeigt welche Seiten gelöscht und welche Informationen ausgelesen werden  Der Test zeigt auch welche Seiten auch wieder zu einem neuen Dokument zusammengesetzt werden  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #1  Zusammenfürgen - Kriterien #2  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #2  Zusammenfürgen - Kriterien #3  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #3

Test – Funktion – wesentlich erweitert: Der Template Editor bietet für die Layouts eine „Test“ Funktion. Diese dient dazu um schon vorab an Hand einer Muster- oder Vorlagendatei – einen Test der Feld-Suche, -Extraktion, -Aufbereitung, der Layout-Erkennung, der Seiten Löschfunktion und der Dokumententeilung – durchführen zu können. Für den Test kann auch eine andere als die für das Layout verwendete PDF Datei ausgewählt werden.

Template Editor - Test Funktion - Feld Extraktion  Template Editor Test Funktion - Teilen und Zusammenfügen

Felder – mit Werten belegen: Im Normalfall können Informationen aus dem Dokument ausgelesen und Feldern / Variablen zugeordnet werden. Es gibt aber Fälle in denen es nicht möglich ist bestimmte Informationen die weggeschrieben werden sollen auszulesen. Z.B. kann  es vorkommen dass bei einer Rechnung die per PDF vorliegt der Lieferant für die Gestaltung des Formulars nur Bilder verwendet hat und es daher keinen Bereich gibt über den man den Firmennamen auslesen kann – das Layout aber über andere Kriterien erkannt und eindeutig zugeordnet werden kann. Für den Fall wird das Feld „Firma“ nicht auf dem Layout positioniert, kann aber mit dem Namen der Firma belegt werden um die Information in weiterer Folge als Variable bzw. in den Metadaten verwenden zu können.

Template Editor - Belegen von nicht positinierten Feldern mit Werten

Neuerungen PDFmdx Prozessor Version 2.x:

Kopieren nach..: Um z.b. eine einzige Eingabedatei auf mehrere unterschiedliche Arten zu verarbeiten dient die Funktion „Kopiere nach..“ – Dabei muss nur mehr der Name des / der Ziel Jobs aus der Liste ausgewählt werden. Die Übergabe kann auch parallel an mehrere Jobs erfolgen. Alle Eingabedateien des einen Jobs werden dann automatisch auch in die Eingabe-Ordner der anderen Jobs kopiert. Damit können z.b. automatisch mehrere Varianten einer Verarbeitung mit unterschiedlichen Parametern auf einmal ausgeführt werden – siehe auch die Funktion „Teilen & Neu zusammenfügen“

Verketten von PDFmdx Jobs über die Kopieren nach Funktion

Vorab-Teilen bei Änderung des Layouts / Template: Diese Funktion ermöglicht es Dokumentenstapel vor der weiteren Verarbeitung an Hand der erkannten Layouts bzw.- Vorlagen in Einzeldokumente aufzuteilen und dann weiter zu verarbeiten. Eine Teilung in ein neues Dokument erfolgt sobald sich ein erkanntes Layout ändert. Layouts und Vorlagen werden über die konfigurierten Kriterien erkannt. Es wird nur an Seiten geteilt wo ein Layout erkannt wird.

Vorab-Teilen bei Änmderung der Vorlage oder des Layouts

PDFmdx Service Prozessor – Zeitgesteuerte Verarbeitung: Standardmäßig beginnt die Verarbeitung sobald eine neue Datei in einem der Eingangs-Ordner erkannt wird. Darüber hinaus hat es bisher beim startbaren PDFmdx Prozessor auch die Möglichkeit gegeben die Verarbeitung zeitgesteuert – mit einem eingestellten Intervall von x Minuten, bzw. auch zu einem bestimmten Datum & Uhrzeit oder aber auch täglich zu einer bestimmten Uhrzeit – durchzuführen. Diese Möglichkeit gibt es jetzt auch für den PDFmdx Service Prozessor.

Zeitgesteuerte Jobverarbeitung jetzt auch beim Service Processing

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 1.2.6 – automatische Ausdrucke über PDF2Printer – Integration

PDFmdx Version 1.2.6 verfügt jetzt über eine Integration mit dem PDF Druckerdienst – PDF2Printer. Damit können die erzeugten Dokumente automatisiert auf Druckern ausgegeben werden.

Die Druckausgabe erfolgt für alle im Rahmen der PreSplit Funktion erzeugten Einzeldokumente. Die Information auf welchen Drucker ausgegeben werden soll kann aus den Einzeldokumenten über ein Datenfeld des PreSplit Templates ausgelesen und für die Ansteuerung von PDF2Printer verwendet werden.

Mittels Alias Zuordnung kann über ein aus dem Dokument ausgelesenes Feld ein physischer Drucker ermittelt und zugeordnet werden. Kann  kein passender Alias gefunden werden oder fehlt die Information im Dokument so wird der eingestellte „Default Printer“ genommen. Die Druckfunktion kann generell, sowie pro Verarbeitungsdefinition individuell aktiviert und deaktiviert werden.

PDFmdx - Processor - Print Funktion aktiviert  PDFmdx - Service Client - Print Funktion aktiviert  PDFmdx - Processor - PDF2Print Integration - Konfiguration

PDFmdx erzeugt pro Verarbeitungsjob (Eingangsdokument) das verarbeitet wird – einen eindeutigen Unterordner im gemeinsamen Druck-Eingangs-Folder. Dahin werden die über den Splitvorgang erzeugten PDF-Einzeldateien kopiert.

Zum Start der Weiterverarbeitung = Druckvorgang wird automatisch eine „PDFmdx.pcf“  (Print Contol File) ASCII Datei – erzeugt und zum Schluss in den Unterordner kopiert. Das PCF enthält die Namen der zu druckenden PDF´s, legt die Druckreihenfolge sowie den Drucker fest auf den ausgegeben werden soll. Der PDF2Printer Dienst erkennt die vorhandene „PDFmdx.pcf“ Datei und startet den Druckvorgang. Nach erfolgreichem Druck wird der Unterordner gelöscht.

Die PCF – Datei triggert und steuert die Druck-Ausgabe:

Subfolder processing with pcf - print control file

Download – PDFmdx Template Editor & Processor >>>

PDF2Printer – MS-Windows Dienst um PDF automatisiert zu drucken

PDF2Printer ist eine als MS-Windows Dienst installierte Anwendung um PDF´s aus einem überwachten Ordner automatisiert auf verschiedene Drucker auszugeben.

Funktionen:

  • PDF-Druckdienst  für 32 und 64bit Windows Beitriebsysteme
  • Folder-Überwachung druckt automatisiert alle im Ordner vorhandenen und neu hinzukommenden PDF´s
  • Konfiguration für Eingangs / Archiv und Error Folder
  • Nach dem Druckvorgang – Verschieben der PDF´s in den Archiv / Error-Folder bzw. Löschen der Datei.
  • Auswahl – Standard Drucker aus der Liste der verfügbaren Drucker falls keine PCF Drucker-Steuerdatei mitgegeben wird.
  • Service – Start / Stop
  • Anzeige Log Datei
  • Konfiguration – Windows Service Account – als System oder User Account.

PDF2Printer - Config User interface  PDF2Printer - icon tray functions

  • Bei Start / Stop des Services wird eine ASCII Datei (printers.pnames) mit den Namen der verfügbaren Drucker erzeugt und in den überwachten Eingangs-Folder geschrieben. Damit können integrierte Anwendungen (z.b. PDFmdx) die Namen der zur Verfügung stehenden Drucker auslesen, anzeigen und verwenden.

Start-stop of service writes an ascii file with the name of the available printers to the in-folder

  • Sub-Folder Überwachung mit PCF Triggerdatei Datei (Print Control File) ermöglicht den getriggerten Druckstart der im Unterordner enthaltenen PDF´s. Der Druckvorgang startet mit auftreten der *.pcf Datei. Die in der pcf-Datei gelisteten PDF´s werden in der angegebenen Reihenfolge auf dem ebenso angegebenen Druckern ausgedruckt.

Subfolder processing with pcf - print control file

Download – PDF2Printer –  Dienst um PDF´s automatisiert zu drucken >>>

PDFmdx – Version 1.6.1 – OCR, Regular Expression, XLS Lookup für E-Mail Adressen, Start der Verarbeitung über Datum & Uhrzeit

Neuerungen PDFmdx Version 1.6.1:

1.) Bereichs OCR: Markierte Bereiche / Feldinhalte  können jetzt auch per OCR aus dem Dokument ausgelesen werden. Für jedes Feld kann über den Modus festgelegt werden wie der Text aus dem PDF ausgelesen werden soll – Native – Dabei wir wie bisher der darunterliegende Text direkt aus dem PDF ausgelesen. OCR / SmartOCR – Nicht bei jedem PDF kann immer jedes Wort das unter dem markierten Bereich liegt ausgelesen werden. Manchmal ist nur ein Image vorhanden oder es kann nur der ganzer Satz/Absatz nicht aber ein Begriff an einer bestimmten Position ausgelesen werden – In dem Fall kann der OCR / SmartOCR Modus verwendet werden. Dabei wird aus dem PDF in ein Image erzeugt welches anschließend per OCR verarbeitet wird. Der markierte Bereich kann ausgelesen werden, unabhängig davon wie das PDF aufgebaut ist bzw. wie es erzeugt wurde. Über die OCR Einstellungen wird die OCR-Sprache sowie die Auflösung für die Konvertierung des PDF´s in das Image konfiguriert. Der Standardwert für die Auflösung liegt bei 300dpi und kann bei schwierigen Schriften und Dokumenten bis auf 600dpi erhöht werden. Bei SmartOCR erfolgt eine automatische Umschaltung zwischen Native auf OCR.

2.) Regular Expression: RegEx Regeln können für jedes Feld definiert werden und ermöglichen eine Aufbereitung und Filterung der extrahierten Feldinhalte  – z.B.:

  • [ab]+“ entspricht „a“, „b“, „aa“, „bbaab“ etc.
  • [0-9]{2,5}“ entspricht zwei, drei, vier oder fünf Ziffern in Folge, z. B. „42“ oder „54072“, jedoch nicht den Zeichenfolgen „0“, „1.1“ oder „a1a1“

3.) XLS Lookup für E-Mail Adressen: Dabei kann eine XLS(X) Datei mit 2 Spalten dazu verwendet werden um für einen aus dem Dokument ausgelesenen Schlüsselwert z.b. die Kundennummer die im Dokument nicht enthaltene E-Mail Adresse über die zweite Spalte zu finden und als Variable für den E-Mail Versand für das „to“-Feld zu verwenden.

4.) Start der Verarbeitung zu einem vorgegebenen Datum & Uhrzeit: Bisher konnte die Verarbeitung entweder manuell, oder immer wiederkehrend mit einem festgelegten Intervall angestoßen werden. Es war aber bisher nicht möglich die Verarbeitung zu einem bestimmten Datum und Uhrzeit zu starten. Das kann z.b. sinnvoll sein um eine größere Anzahl an E-Mails zeitversetzt in der Nacht zu verschicken um nicht den normalen Arbeitsablauf zu stören. Die Dateien können vorbereitet und die Verarbeitung wird zum festgelegten Zeitpunkt gestartet.

1_Felddefinition mit Regular Expression und OCR Support  2_OCR Settings - Spachauswahl  3_OCR Settings - Auswahl der Auflösung für PDF Rendering  4_E-Mail Adress Extraktion auch über OCR möglich  5_E-Mail Lookup über XLS Tabelle möglich  6_Start der verarbeitung zu einem vordefinierten Zeitpunkt um z.b. die Verarbeitung in der Nachausführen zu lassen

 

Download – PDFmdx Template Editor & Processor >>>

Webshop