Kategorie: PDFmdx

PDFmdx – Version 2.2.1 – mit vielen Erweiterungen und Neuerungen

Mit der Version 2.x sowie jetzt mit der Version 2.2.1 wurden für PDFmdx eine Vielzahl an Erweiterungen und Neuerungen implementiert.

Neuerungen PDFmdx Template Editor Version 2.x:

Komplett neu gestalteter Template Editor – einem Template können jetzt mehrere Layouts zugeordnet werden. Bisher musste pro Layout ein eigenes Template angelegt werden. Ein Template fasst jetzt alle Layouts zusammen welche die gleichen Felder enthalten und gleich verarbeitet werden sollen. Um z.b. Eingangs-Rechnungen zu verarbeiten gibt es ein einziges Rechnungs – Template mit den Feldern – Firma, Nummer, Datum, Betrag. Pro Lieferant gibt es dann ein Layout um die unterschiedlichen Rechnungsformulare abzubilden. Layouts werden über Bedingungen erkannt und legen die Felder auf dem Formular fest.

Briefpapier über Informationen aus dem Dokument steuern: PDFmdx kann auf die erzeugten Dokumente auch ein PDF-Briefpapier als Überlagerung oder Hinterlegung anwenden. Feldinhalte und Kriterien steuern über den Dokumenteninhalt unterschiedliche Briefpapiere. Ebenso können die Felder auch zur Generierung für Namen und Pfad des PDF Briefpapiers verwendet werden.

Mehrere Briefpapiere über Dokumenteninhalte steuern

Anker Felder – Teilstringsuche und Seitenbereiche: Anker Felder werden benötigt um Referenzstellen in einem Dokument zu finden um andere Felder absolut darauf zu beziehen. Es gibt Informationen die sich weder immer wieder an der gleichen Stelle noch auf der gleichen Seite befinden. Ein typisches Beispiel ist z.b. der Endbetrag einer Rechnung – dieser kann sich auf der ersten, der letzten oder aber auch auf einer x beliebigen Seite befinden. Zusätzlich kann  je nach Anzahl der Rechnungs-Positionen der Endbetrag vertikal variieren. Eine fixe Definition würde hier nicht helfen. Eine weitere Herausforderung stellen gescannte Belege dar. Hier kann von Dokument zu Dokument jedes Feld horizontal und vertikal – “wandern” – je nach dem wie das Dokument in den Scanner eingelegt und gescannt wurde – können sich Verschiebungen und Verzerrungen ergeben. Eine fixe Positionsdefinition würde eine hohe Fehlerrate verursachen.

Um in diesen Fällen die Felder zuverlässig auslesen und verarbeiten zu können haben wir die “Anker-Felder” implementiert – diese Felder sind Fixpunkte auf welche sich andere Felder dann absolut beziehen können – z.B. Briefpapierköpfe mit Firmennamen oder Texte wie z.b. “Gesamtsumme” oder “Rechnungsendbetrag” usw.

Pro Layout können ein oder mehrere Ankerfelder definiert werden auf welche sich andere Felder beziehen können. Die Suche nach den Ankerfeldern kann über Teilstrings oder fixe Texte erfolgen und es kann festgelegt werden ob alle oder nur bestimmte Seiten durchsucht werden sollen.

Template Editor - Anker Feld - Teilstringsuche & Seitendefinition

Seiten löschen – Manchmal ist es erforderlich bestimmte Seiten zu löschen und diese nicht in das Zieldokument zu übernehmen. Z.b. bei Deck- oder Trenn-Blättern. Die Seiten werden wie die Layouts über Bedingungen aus dem Inhalt erkannt.

Neue Funktion - Seite entfernen  Zu löschende Seiten können über Bedingungen erkannt und gelöscht werden

Teilen & Neu zusammenfügen: PDFmdx ist in der Lage Dokumentenstapel nach Kriterien in Einzeldokumente aufzuteilen – z.b. Über Seitenzahl, über Änderung eines bestimmten Feldes (z.b. Rechnungsnummer) oder über frei festlegbare UND / ODER Kriterien. Neu hinzugekommen ist jetzt auch eine Funktion um die so geteilten Dokumente wieder nach anderen Kriterien zu neuen Dokumenten zusammenzusetzen. Innerhalb des Dokuments kann nach aus dem Dokument ausgelesenen Informationen neu sortiert und über Lesezeichen strukturiert werden. Damit lassen sich z.b. Gesamt-Reports in Einzel-Reports aufteilen und nach anderen Kriterien wieder neu zusammensetzen und strukturieren.

Feld-Definitionen - Seiten löschen, teilen und neu zusammensetzen  Informationen aus dem Dokument ermöglichen die Teilung und Neustrukturierung  Seite 2 - Musterdokument  Definition der Kriterien zum Teilen und Neu Zusammenfügen  Der Test zeigt welche Seiten gelöscht und welche Informationen ausgelesen werden  Der Test zeigt auch welche Seiten auch wieder zu einem neuen Dokument zusammengesetzt werden  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #1  Zusammenfürgen - Kriterien #2  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #2  Zusammenfürgen - Kriterien #3  Ergebnis - Teilen und Neu zusammenfügen nach festgelegten Kriterien #3

Test – Funktion – wesentlich erweitert: Der Template Editor bietet für die Layouts eine “Test” Funktion. Diese dient dazu um schon vorab an Hand einer Muster- oder Vorlagendatei – einen Test der Feld-Suche, -Extraktion, -Aufbereitung, der Layout-Erkennung, der Seiten Löschfunktion und der Dokumententeilung – durchführen zu können. Für den Test kann auch eine andere als die für das Layout verwendete PDF Datei ausgewählt werden.

Template Editor - Test Funktion - Feld Extraktion  Template Editor Test Funktion - Teilen und Zusammenfügen

Felder – mit Werten belegen: Im Normalfall können Informationen aus dem Dokument ausgelesen und Feldern / Variablen zugeordnet werden. Es gibt aber Fälle in denen es nicht möglich ist bestimmte Informationen die weggeschrieben werden sollen auszulesen. Z.B. kann  es vorkommen dass bei einer Rechnung die per PDF vorliegt der Lieferant für die Gestaltung des Formulars nur Bilder verwendet hat und es daher keinen Bereich gibt über den man den Firmennamen auslesen kann – das Layout aber über andere Kriterien erkannt und eindeutig zugeordnet werden kann. Für den Fall wird das Feld “Firma” nicht auf dem Layout positioniert, kann aber mit dem Namen der Firma belegt werden um die Information in weiterer Folge als Variable bzw. in den Metadaten verwenden zu können.

Template Editor - Belegen von nicht positinierten Feldern mit Werten

Neuerungen PDFmdx Prozessor Version 2.x:

Kopieren nach..: Um z.b. eine einzige Eingabedatei auf mehrere unterschiedliche Arten zu verarbeiten dient die Funktion “Kopiere nach..” – Dabei muss nur mehr der Name des / der Ziel Jobs aus der Liste ausgewählt werden. Die Übergabe kann auch parallel an mehrere Jobs erfolgen. Alle Eingabedateien des einen Jobs werden dann automatisch auch in die Eingabe-Ordner der anderen Jobs kopiert. Damit können z.b. automatisch mehrere Varianten einer Verarbeitung mit unterschiedlichen Parametern auf einmal ausgeführt werden – siehe auch die Funktion “Teilen & Neu zusammenfügen”

Verketten von PDFmdx Jobs über die Kopieren nach Funktion

Vorab-Teilen bei Änderung des Layouts / Template: Diese Funktion ermöglicht es Dokumentenstapel vor der weiteren Verarbeitung an Hand der erkannten Layouts bzw.- Vorlagen in Einzeldokumente aufzuteilen und dann weiter zu verarbeiten. Eine Teilung in ein neues Dokument erfolgt sobald sich ein erkanntes Layout ändert. Layouts und Vorlagen werden über die konfigurierten Kriterien erkannt. Es wird nur an Seiten geteilt wo ein Layout erkannt wird.

Vorab-Teilen bei Änmderung der Vorlage oder des Layouts

PDFmdx Service Prozessor – Zeitgesteuerte Verarbeitung: Standardmäßig beginnt die Verarbeitung sobald eine neue Datei in einem der Eingangs-Ordner erkannt wird. Darüber hinaus hat es bisher beim startbaren PDFmdx Prozessor auch die Möglichkeit gegeben die Verarbeitung zeitgesteuert – mit einem eingestellten Intervall von x Minuten, bzw. auch zu einem bestimmten Datum & Uhrzeit oder aber auch täglich zu einer bestimmten Uhrzeit – durchzuführen. Diese Möglichkeit gibt es jetzt auch für den PDFmdx Service Prozessor.

Zeitgesteuerte Jobverarbeitung jetzt auch beim Service Processing

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 1.2.6 – automatische Ausdrucke über PDF2Printer – Integration

PDFmdx Version 1.2.6 verfügt jetzt über eine Integration mit dem PDF Druckerdienst – PDF2Printer. Damit können die erzeugten Dokumente automatisiert auf Druckern ausgegeben werden.

Die Druckausgabe erfolgt für alle im Rahmen der PreSplit Funktion erzeugten Einzeldokumente. Die Information auf welchen Drucker ausgegeben werden soll kann aus den Einzeldokumenten über ein Datenfeld des PreSplit Templates ausgelesen und für die Ansteuerung von PDF2Printer verwendet werden.

Mittels Alias Zuordnung kann über ein aus dem Dokument ausgelesenes Feld ein physischer Drucker ermittelt und zugeordnet werden. Kann  kein passender Alias gefunden werden oder fehlt die Information im Dokument so wird der eingestellte “Default Printer” genommen. Die Druckfunktion kann generell, sowie pro Verarbeitungsdefinition individuell aktiviert und deaktiviert werden.

PDFmdx - Processor - Print Funktion aktiviert  PDFmdx - Service Client - Print Funktion aktiviert  PDFmdx - Processor - PDF2Print Integration - Konfiguration

PDFmdx erzeugt pro Verarbeitungsjob (Eingangsdokument) das verarbeitet wird – einen eindeutigen Unterordner im gemeinsamen Druck-Eingangs-Folder. Dahin werden die über den Splitvorgang erzeugten PDF-Einzeldateien kopiert.

Zum Start der Weiterverarbeitung = Druckvorgang wird automatisch eine “PDFmdx.pcf”  (Print Contol File) ASCII Datei – erzeugt und zum Schluss in den Unterordner kopiert. Das PCF enthält die Namen der zu druckenden PDF´s, legt die Druckreihenfolge sowie den Drucker fest auf den ausgegeben werden soll. Der PDF2Printer Dienst erkennt die vorhandene “PDFmdx.pcf” Datei und startet den Druckvorgang. Nach erfolgreichem Druck wird der Unterordner gelöscht.

Die PCF – Datei triggert und steuert die Druck-Ausgabe:

Subfolder processing with pcf - print control file

Download – PDFmdx Template Editor & Processor >>>

PDF2Printer – MS-Windows Dienst um PDF automatisiert zu drucken

PDF2Printer ist eine als MS-Windows Dienst installierte Anwendung um PDF´s aus einem überwachten Ordner automatisiert auf verschiedene Drucker auszugeben.

Funktionen:

  • PDF-Druckdienst  für 32 und 64bit Windows Beitriebsysteme
  • Folder-Überwachung druckt automatisiert alle im Ordner vorhandenen und neu hinzukommenden PDF´s
  • Konfiguration für Eingangs / Archiv und Error Folder
  • Nach dem Druckvorgang – Verschieben der PDF´s in den Archiv / Error-Folder bzw. Löschen der Datei.
  • Auswahl – Standard Drucker aus der Liste der verfügbaren Drucker falls keine PCF Drucker-Steuerdatei mitgegeben wird.
  • Service – Start / Stop
  • Anzeige Log Datei
  • Konfiguration – Windows Service Account – als System oder User Account.

PDF2Printer - Config User interface  PDF2Printer - icon tray functions

  • Bei Start / Stop des Services wird eine ASCII Datei (printers.pnames) mit den Namen der verfügbaren Drucker erzeugt und in den überwachten Eingangs-Folder geschrieben. Damit können integrierte Anwendungen (z.b. PDFmdx) die Namen der zur Verfügung stehenden Drucker auslesen, anzeigen und verwenden.

Start-stop of service writes an ascii file with the name of the available printers to the in-folder

  • Sub-Folder Überwachung mit PCF Triggerdatei Datei (Print Control File) ermöglicht den getriggerten Druckstart der im Unterordner enthaltenen PDF´s. Der Druckvorgang startet mit auftreten der *.pcf Datei. Die in der pcf-Datei gelisteten PDF´s werden in der angegebenen Reihenfolge auf dem ebenso angegebenen Druckern ausgedruckt.

Subfolder processing with pcf - print control file

Download – PDF2Printer –  Dienst um PDF´s automatisiert zu drucken >>>

PDFmdx – Version 1.6.1 – OCR, Regular Expression, XLS Lookup für E-Mail Adressen, Start der Verarbeitung über Datum & Uhrzeit

Neuerungen PDFmdx Version 1.6.1:

1.) Bereichs OCR: Markierte Bereiche / Feldinhalte  können jetzt auch per OCR aus dem Dokument ausgelesen werden. Für jedes Feld kann über den Modus festgelegt werden wie der Text aus dem PDF ausgelesen werden soll – Native – Dabei wir wie bisher der darunterliegende Text direkt aus dem PDF ausgelesen. OCR / SmartOCR – Nicht bei jedem PDF kann immer jedes Wort das unter dem markierten Bereich liegt ausgelesen werden. Manchmal ist nur ein Image vorhanden oder es kann nur der ganzer Satz/Absatz nicht aber ein Begriff an einer bestimmten Position ausgelesen werden – In dem Fall kann der OCR / SmartOCR Modus verwendet werden. Dabei wird aus dem PDF in ein Image erzeugt welches anschließend per OCR verarbeitet wird. Der markierte Bereich kann ausgelesen werden, unabhängig davon wie das PDF aufgebaut ist bzw. wie es erzeugt wurde. Über die OCR Einstellungen wird die OCR-Sprache sowie die Auflösung für die Konvertierung des PDF´s in das Image konfiguriert. Der Standardwert für die Auflösung liegt bei 300dpi und kann bei schwierigen Schriften und Dokumenten bis auf 600dpi erhöht werden. Bei SmartOCR erfolgt eine automatische Umschaltung zwischen Native auf OCR.

2.) Regular Expression: RegEx Regeln können für jedes Feld definiert werden und ermöglichen eine Aufbereitung und Filterung der extrahierten Feldinhalte  – z.B.:

  • [ab]+“ entspricht „a“, „b“, „aa“, „bbaab“ etc.
  • [0-9]{2,5}“ entspricht zwei, drei, vier oder fünf Ziffern in Folge, z. B. „42“ oder „54072“, jedoch nicht den Zeichenfolgen „0“, „1.1“ oder „a1a1“

3.) XLS Lookup für E-Mail Adressen: Dabei kann eine XLS(X) Datei mit 2 Spalten dazu verwendet werden um für einen aus dem Dokument ausgelesenen Schlüsselwert z.b. die Kundennummer die im Dokument nicht enthaltene E-Mail Adresse über die zweite Spalte zu finden und als Variable für den E-Mail Versand für das “to”-Feld zu verwenden.

4.) Start der Verarbeitung zu einem vorgegebenen Datum & Uhrzeit: Bisher konnte die Verarbeitung entweder manuell, oder immer wiederkehrend mit einem festgelegten Intervall angestoßen werden. Es war aber bisher nicht möglich die Verarbeitung zu einem bestimmten Datum und Uhrzeit zu starten. Das kann z.b. sinnvoll sein um eine größere Anzahl an E-Mails zeitversetzt in der Nacht zu verschicken um nicht den normalen Arbeitsablauf zu stören. Die Dateien können vorbereitet und die Verarbeitung wird zum festgelegten Zeitpunkt gestartet.

1_Felddefinition mit Regular Expression und OCR Support  2_OCR Settings - Spachauswahl  3_OCR Settings - Auswahl der Auflösung für PDF Rendering  4_E-Mail Adress Extraktion auch über OCR möglich  5_E-Mail Lookup über XLS Tabelle möglich  6_Start der verarbeitung zu einem vordefinierten Zeitpunkt um z.b. die Verarbeitung in der Nachausführen zu lassen

 

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Neue Version 1.4.3 verfügbar

Neuerungen und Verbesserungen:

  • Anker-Feld Suchfunktion wurde verbessert – es können jetzt auch Begriffe die mit Leerzeichen getrennt sind gesucht und gefunden werden – wie z.B.: “R E C H N U N G”
  • Sonderzeichen in den Feldern für den CSV Export werden nicht mehr durch “_” ersetzt – z.b. “/”
  • Neben dem Export der extrahierten Felddaten als CSV oder TXT (IDX) steht jetzt auch der direkte Export der Daten als MS-Excel (XLS) zur Verfügung.
  • Neue Export-Variablen für die exportierte PDF Datei (Name, Ordner, Pfad) können verwendet und exportiert werden.
  • Fehler beim Speichern des Passworts für die e-Mail Sever Konfiguration wurde behoben.
  • Verbesserungen und Fehlerbehebungen bei der Konfiguration und E-Mail Adress-Suche wurden durchgeführt.

Download – PDFmdx Template Editor & Processor >>>

eDocPrintPro – E-Mail Plugin Version 5.1.3

Features – Version 5.1.3 – eDocPrintPro E-Mail plugin :

  • Profilfunktion – faßt alle Einstellungen und Optionen zusammen – Profile könne  erstellt, gelöscht, umbenannt und kopiert werden. Profile können vor der Verarbeitung zur Auswahl angeboten werden.
  • Suche und Extraktion von E-Mail Adressen und Betreff aus dem gedruckten Dokument über definierbare Delimiter.
  • Einfügen fix vorausgewählter Anhänge (z.b. Geschäftsbedingungen, Sonderaktionen …)
  • Optionaler Versand der Anhänge als ZIP
  • Neue SMTP Fehlerbenachrichtigung – interaktiv bzw. per E-Mail.
  • Setup prüft auf die passende OS Version – 32 bzw. 64bit.

1_email_plugin_empfänger 2_email_plugin_extrahieren _von_email_adressen 3_email_plugin_betreff 4_email_plugin_anhänge 5_email_plugin_email_system_einstellungen

Download – eDocPrintPro – E-Mail Plugin für 32bit OS >>>
Download – eDocPrintPro – E-Mail Plugin für 64bit OS >>>

PDFmdx – Dokumente erkennen, Splitten und Metadaten extrahieren

PDFmdx ist eine Anwendung um PDF Dokumente auf Grund von definierten Bedingungen und Inhalten zu erkennen, zu klassifizieren sowie Gesamtdokumentenpackages in Einzeldokumente aufzusplitten.

Aus den klassifizierten und gesplitteten Einzeldokumenten werden an Hand von vordefinierten Feldtemplates die gewünschten Inhalte (Metadaten) ausgelesen und für die Weiterverarbeitung in eine Indexdatei geschrieben.

Auf diese Art und Weise lassen sich sowohl PDF Dokumente die direkt aus einer beliebigen Anwendung heraus z.B.: per PDF-Druckertreiber erzeugt, aber auch eingescannte Dokumente die per OCR Vorgang in durchsuchbare PDF´s (Image im Vordergrund und Text im Hintergrund) konvertiert wurden verarbeiten.

Neben der Erkennung, Aufteilung und Extraktion von Bereichsinhalten verfügt PDFmdx auch über weiterverarbeitende Funktionen zur Automatisierung von Abläufen.

  • PDF Briefpapier kann hinterlegt / überlagert werden.
  • PDF Signatur kann sichtbar / unsichtbar aufgebracht werden.
  • E-Mail Versand kann durchgeführt werden, wobei die für das E-Mail erforderlichen Informationen aus dem Dokumenteninhalt gewonnen werden.

Die Anwendung besteht aus zwei Programmteilen – dem PDFmdx Template Editor und dem PDFmdx Prozessor. Mit dem Template Editor werden die Kriterien und Verarbeitungsschritte konfiguriert und der Prozessor verarbeitet die Dokumente auf Basis der Templates.

PDFmdx – Einsatzbereiche:

  • Automatische Archivierung von Reports aus ERP, Lohnverrechnung usw. – Erkennung der Reporttypen, Extraktion von Metadaten für die Archivierung.
  • Automatische Archivierung von Rechnungen, Lieferscheinen, Auftragsbestätigungen über PDF Druckvorgang.
  • Automatische Weiterverarbeitung von Belegen – Versand von Terminbestätigungen, Rechnungen, Mahnungen, Auftragsbestätigungen per Einzel bzw. Gesamtdruckvorgang überPDF Druckertreiber oder PDF-Export – Hinterlegen von Briefpapier, Elektronische Signatur, E-Mail Versand.
  • Eingangs-Belegerfassung über Scanvorgang mit PDF-OCR : Belegerkennung und Metadatenextraktion für die Weiterverarbeitung bzw. Archivierung.

PDFmdx Template Editor – zur Erstellung von Templates für den PDFmdx Prozessor

01_PDFmdx Template Editor

Templates sind die Voraussetzung um die Dokumente zu kategorisieren, zu splitten und die gewünschte Information daraus auszulesen. Templates legen auch die zusätzlichen Verarbeitungen fest: Under/Overlay, Signatur und E-Mail Versand.

Zuerst müssen Kategorien erstellt werden – diese legen die Felder, Typen, Ausgabefolder und den Aufbau der Indexdatei fest. Kategorien werden dann in den Templates verwendet  und müssen nicht jedes Mal neu definiert werden. Z.B.: Die Feld/Datenstruktur für Eingangsrechnungen unterschiedlicher Lieferanten ist immer gleich – das Aussehen der unterschiedlichen Rechnungen, die Position und Anordnung der Felder ist jedoch immer verschieden. Also muss eine Kategorie für Eingangsrechnungen angelegt werden und dann pro Lieferant ein Template.

Funktionen – PDFmdx Kategorien:

03_Definition der Profil Kategorien - Felddefinitionen

  • Kategorien werden über Namen verwaltet – Neu anlegen, Kopieren, Umbenennen.
  • Auswahl Zielfolder für Indexdaten – entweder eine zusammengefasste Indexdatei für alle Dokumente oder pro Dokument eine Indexdatei.
  • Definition des Indexdatei Aufbaus – Text, Variablen und Felder sind verwendbar.
  • Definition – Zielfolder sowie Dateiname für die PDF Dokumente – auch unter Verwendung von Variablen / Feld-Inhalten.
  • Felddefinition – Name, Typ (Text, Ziffern, Buchstaben, Buchstaben und Ziffern), Führende Nullen entfernen, Entfernen von Text oder Zeichen Links oder Rechts z.b. „(123)“, Groß und Kleinschreibung ignorieren.
  • Felder hinzufügen, löschen, verschieben hinauf / hinunter.
  • Definition – Dezimal- und Tausender Trennzeichen – Punkt, Beistrich, Kein.

Funktionen – PDFmdx Template Editor:

02_PDFmdx Template Editor

  • Templates werden über Namen verwaltet und ausgewählt – Template Laden, Speichern, Kopieren, Neu anlegen, Umbenennen, Löschen.
  • Template exportieren / importieren – Alle benötigten Dateien werden in einer ZIP Datei zusammengefasst  gespeichert / geladen. Templates können damit auf andere Rechner oder PDFmdx Verarbeitungsstationen übertragen werden.
  • PDF Prototyp auswählen und dem Template zuordnen – Eine PDF Musterdatei wird ausgewählt und angezeigt und dient als Grundlage für die visuelle Positionierung der Felder.
  • Profil Kategorie auswählen – Damit wird das Template um die Feld-Definition sowie die Festlegung der Ziel-Folder /Namen ergänzt.
  • Grundeinstellungen Template Editor:  Auswahl der Text Extraktions Komponente, Farb- & Transparenz-Zuordnung für die visuelle Felddarstellung.

Funktionen – Voransicht PDF-Musterdatei:

  • Seite blättern, Seite per Nummer auswählen, Erste/Letzte Seite, Zoom In/Out, Anpassen – Breite/Höhe/Optimal anpassen.
  • Auswahl der über die Kategorie zur Verfügung gestellten Felder, Positionierung und Größenanpassung der Feld-Bereiche im PDF Viewer, Anzeige der Feld-Bereichsinformation (Seite, Bereichskoordinaten, Extrahierter Text, Kategorie, Feldname, Ziel Ordner).
  • Statusanzeige – Position, Größe, Seitengröße, extrahierter Text.

Konfiguration – Verarbeitungsfunktionen:

PDF-Overlay / Underlay
– auswählen /aktivieren/ deaktivieren, Nur erste Seite/Erste Seite auf allen Seiten anwenden/Erste Seite auf der ersten Seite und 2.Seite auf den Folgeseiten anwenden.

08_Template Settings Stationery

PDF-Signatur – aktivieren/deaktivieren, Auswahl Zertifikat, Zusatzinformationen für Signatur: Kontakt, Standort, Grund. Auswahl der Seite für die Signatur: Erste, Letzte, bestimmte Seite. Sichtbare Signatur: Positon (X/Y), Ankerpunkt, Größe (X/Y), Skalierung, Bild für die Darstellung auswählen.

09_Template Settings Signatur

PDF-Metadaten – Titel, Autor, Betreff, Schlüsselworte, Anwendung – fixer Text bzw. Verwendung von Variablen und Feldinhalten, Auslesen und Einfügen der bestehenden PDF-Metadaten über Variable möglich.

10_Template Settings PDF Metadata

Allgemeine Template Einstellungen – Referenzpunkt für die Anwendung des Templates auf dem zu verarbeitenden Dokument, Horizontal / Vertikal – Links / Mitte / Rechts. Erlaubte Toleranz der Seitengröße – Template und Verarbeitung.

11_Template Settings Allgemeine Einstellungen

Template Erkennungs- / Split-Bedingungen:

  • Anlegen und Bearbeiten der Bedingungen zur Erkennung des Templates – Vergleichstext/Suchbegriff – fix oder unter Verwendung von „Wildcards“ (*?#), in einen  bestimmten Feld / Text der ganzen Seite, Festlegung der zu durchsuchenden Seiten (Einzelseiten, Intervall, $ – bis zur letzten Seite).
  • Hierarchisch logische Verknüpfung der Bedingungen über UND / ODER

05_PDFmdx Template Designer - Template Recognition

  • Definition der Bedingungen für den Dokumentensplit  – auf Basis des Templates – Teilen nach fix definierten Seiten, Teilen falls sich der Inhalt eines bestimmten Feldes verändert, Teilen auf Basis von hierarchisch logische Bedingungen über UND / ODER gleich wie bei der Template Erkennung.

06_PDFmdx Template Designer - Split conditions

E-Mail Versand – Die Dokumente können auch automatisiert per SMTP E-Mail verschickt werden – im Template Editor wird eine E-Mail Vorlage für den Versand hinterlegt.

  • Eine individuelle über das Template gesteuerte oder allgemeine Absender E-Mail Adresse verwenden.
  • „an:“, „cc:“, „bcc:“ – fix, über Feld-Variablen, bzw. über Dokumenten E-Mail Adress-Suche belegbar. Für die Suche – Definition der zu durchsuchenden Seiten, Ausschließen von E-Mail Adressen.
  • Betreff, HTML E-Mail Body  – fixer Text bzw. Verwendung von Variablen und Feldinhalten
  • Anhängen zusätzlicher statischen E-Mail Attachments.

12_Template E-Mail Einstellungen

Template Test-Funktion – Im Template Editor ist eine Testfunktion vorgesehen mit der das aktuelle Template entweder mit der geladenen oder mit einer frei wählbaren PDF Datei getestet werden kann. Dabei werden die Feldnamen und die extrahierten Textinhalte angezeigt. Der „Test“ Button ermöglicht zu überprüfen – ob das aktuelle Template erkannt und bei welchen Seiten die PDF Datei geteilt werden würde.

13_PDFmdx Text Extraction & Split Test Function

PDFmdx – Prozessor:
Der PDFmdx Prozessor kann einen oder mehrere Inputfolder überwachen. Die Verarbeitung kann pro Folder entweder zeitgesteuert in einem bestimmten Intervall erfolgen oder manuell angestoßen werden.

14_PDFmdx processor

Funktionen PDFmdx – Prozessor:

  • Verarbeitungs-Folder – Neu anlegen, Löschen, Umbenennen
  • Templates neu einlesen, Template importieren
  • SMTP – E-Mail Konfiguration: Server, Port, SSL, Absender E-Mail, Benutzername, Passwort, Test E-Mail, Eigene E-Mail Konfiguration für Fehler.
  • Auswahl Input-Folder, Error-Folder
  • Versand von E-Mail aktivieren / deaktivieren – falls im Template eine E-Mail Funktion definiert wurde  kann diese hier generell für den ganzen Folder und allen zugeordneten Templates deaktiviert werden.
  • Folder-Scan Intervall festlegen, Anzeige der verbleibenden Zeit bis zum nächsten Scan, Automatisierten Folder-Scan aktivieren / deaktivieren. „Scan-Now“ Button.
  • Template – Auswahl: dabei wird für den aktuellen Folder festgelegt welche der vorhandenen Templates für die Dokumentenerkennung verwendet werden sollen.  Die Templates werden der Reihen nach abgearbeitet, bei der ersten Übereinstimmung der Kriterien wird die Verarbeitung mit dem gefundenen Template gestartet.
  • PreSplit der Dokumente: Normalerweise erfolgt zuerst eine Template-Erkennung und auf Basis des ersten erkannten Templates. Danach wird, falls vorgesehen das Gesamtdokument einer Aufteilung  unterzogen. Das funktioniert jedoch nur dann wenn es sich um gleiche Dokumente handelt. Sind jedoch verschiedene Dokumententypen im Stapel vorhanden so muss dieser zuerst in Einzeldokumente aufgeteilt werden. Um diese danach gegen die vorhandenen Templates zu identifizieren.
  • Für die PreSplit Funktion ist ein eigenes Template erforderlich – dieses dient jedoch nur dazu um Felder und Positionen zu haben um Splitkriterien aufbauen zu können – die Split-Bedingungen sind hierbei dem Ordner zugeordnet.

Download – PDFmdx Template Editor & Processor >>>