PDFmdx – Positionsdaten über Gruppen- / Untergruppenfelder auslesen

PDFmdx kann neben Dokumentenfeldern auch Positionsdaten auslesen. Positionsdaten sind Listen oder Tabellen mit Zeilen und Spalten. Diese finden sich typischerweise auf Rechnungen um mehrere Positionen im Beleg anzuführen. Wir verwenden dafür den Begriff einer “gleitenden Gruppe/Untergruppe”. Dabei werden ein oder mehrere Spalten (=Felder) über eine oder mehrere Zeilen auf einer oder mehreren Seiten in einem vertikal festgelegten Bereich gesucht und ausgelesen.

Ab der PDFmdx Version 3.5.0 gibt es eine 2-stufige Struktur wo neben der Gruppen auch eine Untergruppen Ebene möglich ist. Es können also zu einem Gruppen-Datensatz ein oder mehrere Untergruppen-Datensätze erkannt und ausgelesen werden. Belege mit 2-stufige Positionsdaten gibt es z.B. bei Textilien oder bei Bekleidung wo es zu einem Artikel (Nummer, Beschreibung) auch eine “Unterebene” mit Größen bzw. Farbangaben geben kann. Der Artikel selbst wird nur einfach angeführt und in der Ebene darunter finden sich dann  die Mengen / Preise zu einzelnen Ausprägungen.

Zweistufiges Auslesen von Positionsdaten:

  • “Dokumenten/Gruppen/ Untergruppen” Felder definieren die Erkennungsebene.

  • Ein über 2 rote horizontale Begrenzungslinien festgelegter Bereich wird auf allen Seiten des Dokuments nach den Gruppen- (rote Felder) sowie Untergruppen-Datensätzen (grüne Felder) abgegescannt.

  • Über die festgelegten Bedingungen werden die Gruppen- (G) sowie die zugehörigen Untergruppen- (U) Datensätze identifiziert und ausgelesen.

  • Zusammen mit den Datensätzen der untersten Ebene stehen auch die Informationen der Gruppen- und der Dokumentenfelder zur Verfügung.

Für Tests und als Ausgangspunkt für eigene Versuche haben wir zwei Beispiel-Vorlagen mit PDF-Testdateien erstellt. Die *.pmdx Vorlagen müssen nur per Drag&Drop in den PDFmdx Editor importiert und der Ausgabepfad gegebenenfalls angepasst werde. Für die Verarbeitung ist es dann noch erforderlich im PDFmdx Prozessor ein Job mit Eingangs- und Error-Folder anzulegen und die beiden Test-Vorlagen für den Job auszuwählen.

Download – PDFmdx – Vorlagen und Beispiele für zweistufiges Auslesen von Positionsdaten >>>
Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.5.3 verfügbar

Neuerungen PDFmdx Version 3.5.3:

  • Feld / Bereichs OCR / Bereich invertieren / OCR immer ausführen:

Normalerweise werden für die PDFmdx Verarbeitung PDF Dateien als Input verwendet die bereits Text enthalten – entweder “normale” PDF oder gescannte PDF die über einen vorangegangenen OCR Prozess (z.b. über AutoOCR oder FileConverterPro) eine zusätzliche Textebenen erhalten haben.

PDFmdx verfügt auch über eine integrierte OCR Funktion um den Text in den Bereichen der positionierten Feldern aus der Bildinformation ermitteln zu können.

Bei den allgemeinen PDFmdx OCR Einstellungen gibt es die Möglichkeit festzulegen wie die Texte aus dem PDF gewonnen werden sollen – “Original”, “OCR” oder “SmartOCR”. Bei “Original” wird der Text immer aus dem PDF genommen, bei OCR – wird der Text immer über einen PDFmdx OCR Vorgang gewonnen, auch falls bereits ein Text im PDF vorhanden ist. Bei der “SmartOCR” Einstellung wird die PDFmdx OCR Funktion nur ausgeführt falls im PDF noch kein Text vorhanden ist, ansonsten wird der im PDF vorhandene Text genommen. Diese Einstellungen gelten generell für die ganze Vorlage und alle damit verbundenen Layouts.

In dem Zusammenhang gibt es jetzt 2 neue Funktionen die es ermöglichen weißen Text auf schwarzem Hintergrund zu erkennen.

Einzelne Bereiche mit Text in weißer Schrift auf schwarzen Hintergrund können über einen automatischen OCR Vorgang nicht erkannt werden, da vor dem OCR Vorgang der Bereich invertiert werden müsste um erkannt werden zu können. Das kann nur interaktiv erfolgen in dem der zu Bereiche manuell ausgewählt wird.

Im PDFmdx Editor gib es jetzt die Möglichkeit bei der Feldkonfiguration die Option “Bereich invertieren” zu aktivieren. Dabei wird für die OCR Verarbeitung der Feldbereich invertiert. Dadurch entsteht schwarze Schrift auf weißem Hintergrund welche durch die OCR erkannt werden kann.

In dem Zusammenhang gibt es eine weitere neue Feldfunktion “OCR immer ausführen” – Damit kann die generelle Einstellung „SmartOCR“ übersteuert werden. Die OCR Erkennung wird dann für dieses Feld immer ausgeführt, auch wenn bereits ein darunterliegender Text vorhanden ist.

  

  • PDFmdx Editor – Bedingung suchen, Layout aufrufen: Es gib jetzt eine Suchfunktion um in den Bedingungen nach einem (Teil)String zu Vorwärts und Rückwärts zu suchen. Damit kann eine Zeile in den Bedingungen direkt angesprungen werden. Aus der Bedingungszeile kann dann auch das verknüpfte Layout direkt aufgerufen werden. Diese Funktion erleichtert die Arbeit mit einer großen Zahl an Bedingungen.

  • Die Web-Service Funktionen wurden überarbeitet, im Web-Service Beispiel können die Metadaten jetzt auch als XML heruntergeladen werden.
  • Bei der Metadaten XML wurden die neu hinzugekommenen Variablen JobID, JobName, JobDescription und ProzessID ergänzt.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.5.0 verfügbar

Neuerungen PDFmdx Version 3.5.0:

  • Untergruppen – zusätzliche Hierarchie für gleitende Gruppen: Eine gleitende Gruppe dienen dazu um z.b. Rechnungspositionen die in einem Dokument bzw. auf einer Seite mehrfach vorkommen zu erkennen und um daraus mehrere Datensätze bilden zu können. Es gibt jedoch Belege bei denen diese Datensätze eine weitere Hierarchiestufe erfordern, z.b. falls unter einer Position mehrere Unterdatensätze vorkommen um z.B. verschiedene Ausprägungen eines Artikels nach Farbe oder Größe zu unterscheiden. Das kann entweder als Liste oder aber auch in Form einer Matrix erfolgen. Um solche zusätzlichen Ausprägungen auch erkennen und auslesen zu können gibt es jetzt die Möglichkeit “Untergruppen” zu einer gleitenden Gruppe zu bilden.

Es gibt damit jetzt 3 Feldebenen – die “Dokumentenfelder”, die “Gruppenfelder” und die “Untergruppenfelder”. Untergruppen-Datensätze werden wie die Gruppen-Datensätze über Bedingungen definiert. Bei der Ausgabe stehen für Untergruppen-Datensätze auch die Information des Dokuments und der Gruppe zur Verfügung.

Für die Ausgabe kann konfiguriert werden ob – alle Datensätze ausgegeben, oder ob die Gruppen bzw. der Dokumenten Datensätze unterdrückt werden sollen. Die Felder der darüber liegenden Ebenen stehen bei der Ausgabe auch im Gruppen / Untergruppen-Datensatz zur Verfügung.  Zur Identifikation der Datensatzebene kann die Variable  %RECORD_LEVEL% mit den Werten (D)ocument, (G)roup, (S)ubgroup verwendet werden.

Die Felder der unterschiedlichen Ebenen werden im PDFmdx Editor farblich unterschiedlich dargestellt – Dokumentenfelder “Blau”, Gruppenfelder “Rot” und Untergruppenfelder “Grün”.

Der Arbeits-/Suchbereich für die gleitende Gruppe / Untergruppe wird im PDFmdx Editor über 2 horizontale rote Linien dargestellt, welche Vertikal in der Voransicht positioniert werden können. Die Suche nach Datensätzen erfolgt nur innerhalb des festgelegten Bereichs.

  • MS-SQL Datenbank Support für Metadaten / Log & Error Log Funktion: Neben dem Export der Metadaten in eine XLSX / CSV / XML Datei gibt es jetzt auch die Möglichkeit die Datensätze in MS-SQL Datenbank-Tabellen zu schreiben. Die ausgelesenen Werte werden als Dokumenten / Gruppen / Subgruppen Datensätze mit konfigurierbaren Feldern und Inhalten geschrieben, die Log- Tabelle mit einem fix festgelegten Aufbau.

MS-SQL Export Funktionen:

    • Konfiguration – MS-SQL Server / Datenbank.
    • SQL Tabellen anlegen / löschen / Daten aus den Tabellen löschen.
    • SQL Spalten in der ausgewählten Tabelle anlegen / löschen.
    • Für jedes Template kann, der SQL Export aktiviert, sowie die SQL Tabelle ausgewählt werden. Jeder SQL Spalte können Felder (Variablen) oder fixer Text zugeordnet werden.
    • SQL – Logging / Error Log aktivieren. Der Name der Log-Tabelle ist konfigurierbar.
    • Das SQL-Log enthält folgende Informationen: PROCESS_ID, Rechnername (WsName), Benutzername (UserName), Vorlage (Template), Layout, Status (OK, ERROR), Fehler Code (ErrorCode), Fehlernachricht als Text (ErrorMessage), Info über die Ein / Ausgabedatei (InputPath, InputFileName, InputFolder, OutputPath, OutputFileName, OutputFolder), Beginn/Ende der Verarbeitung (StartTime, EndTime), Verarbeitungsdauer (ProcessingTime).

PDFmdx Fehler Codes im Log:

    • 0 = Erfolgreiche Verarbeitung.
    • 1 = Keine im PDF verbleibenden Seiten.
    • 2 = Konfiguriertes Briefpapier konnte nicht gefunden werden.
    • 3 = Fehlende Lizenz.
    • 4 = Fehler beim Laden des Text Plugins.
    • 5 = Fehler beim Schreiben der PDF Datei.
    • 6 = Keine für die angegebenen Kriterien passende Vorlage / Layout gefunden.
    • 7 = Fehler beim Schreiben der Drucker (PCF) Konfigurationsdatei.
    • 8 = Verarbeitungsfehler.
    • 9 = Fehler beim Anlegen des Ausgabe Ordners.
    • 10 = Fehler beim Erzeugen der Ausgabedatei.
    • 11 = Fehler beim Überlagern / Hinterlegen des Briefpapiers.
    • 12 = Fehler beim Signieren.
    • 13 = Fehler beim EMail Versand.
    • 14 = Fehler beim Schreiben der Metadaten.
    • 15 = Fehler beim Erzeugen der XML Datei.

  • PDFmdx Editor – Test Funktion: Die Test-Funktion im PDFmdx Editor und die PDFmdx Verarbeitung basieren jetzt auf der gleichen Komponente. Damit wird sicher gestellt dass das Ergebnis beim “Test” im PDFmdx Editor für die Erkennung, das Teilen und Auslesen das gleiche Ergebnis bringt wie bei der Verarbeitung durch den PDFmdx Prozessor.

In einer PDFmdx Vorlage kann konfiguriert werden ob und wie ein Layout über Bedingungen identifiziert werden soll. Bei der “Test” Funktion im PDFmdx Editor werden die Bedingungen geprüft, das erkannte Layout identifiziert und die über das Layout festgelegten Felder ausgelesen. Auf der Test-Maske gibt es jetzt eine Checkbox um die Layout-Erkennung / Kriterien zu ignorieren. Die Felder werden dann nur über das manuell ausgewählte Layout gelesen und angezeigt.

  • Feld-Teilstring vom Ende. Die Teilstring-Feldfunktion ist jetzt nicht nur vom Beginn eines Feldes, sondern auch vom Ende aus möglich (umschaltbar).

  • Neue OCR Version, mehrere Erkennungssprachen: Die Bereichs OCR Funktion für Felder wurde aktualisiert und basiert jetzt auf der Tesseract Version 4.0. Damit ist jetzt auch die Erkennung mehrere Sprachen möglich.

  • Vorgabewerte für Felder – Layout bezogen: Es gibt neben der Funktion einen generellen Vorgabewert zu vergeben, jetzt auch eine Funktion um für jedes Layout einen individuellen Vorgabewert für ein Feld zu vergeben. Eine Variable bekommt den Vorgabewert zugewiesen falls das Feld auf einem Layout nicht positioniert wurde bzw. wenn ein Feld positioniert wurde  aber nichts ausgelesen werden kann da der Bereich leer (=blank) ist. Damit kann über die Layouterkennung einer Variablen ein fixer Wert zugewiesen werden. z.b. eine Kundennummer die nicht direkt aus dem Dokument ausgelesen werden kann.
  • Neuer “Zusammengesetzt” Feldtyp: Der Typ “Zusammengesetzt” erlaubt es kombinierte Felder zu erzeugen, die aus mehreren anderen Feldern bzw. Text bestehen. Solche zusammengesetzten Felder stehen für die Ausgabe (Ordner, Dateiname, Metadaten), nicht jedoch für Bedingungen zur Auswahl. Diese Felder können aus Variablen der Dokumenten / Gruppen und Untergruppen zusammengesetzt werden.

  • Option – Keine verbleibenden Seiten – Dokument nicht in den Fehler Ordner verschieben: Beim Teilen, Löschen von Seiten (Deckblätter) sowie Löschen von leeren Seiten kann es vorkommen dass das Restdokument über keine weiteren für die Verarbeitung verbleibenden Seiten mehr verfügt. Diese Option legt fest ob das “Rumpfdokument” erhalten bleiben soll und in den Fehler Ordner verschoben wird oder ob ein solches Dokument nicht erhalten bleibt und der Vorgang nur im Error-Log protokolliert wird.

  • Export zusätzlicher Formate, auswählbar für – „Erfolgreich / Fehler / Beides“: Damit ist es jetzt auch möglich die in den Error Folder verschobenen PDF Dateien zusätzlich in andere Formate z.b. TXT zu konvertieren um weitere Auswertungen durchzuführen.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.3.0 verfügbar

Neuerungen PDFmdx Version 3.3.0:

  • Zusätzliche Formate exportieren – Über die Integration des PDF2DOCX Konverters können zusätzlich zum erzeugten PDF jetzt auch ein HTML, DOCX, XML, TXT und XLS erstellt werden. Diese zusätzlichen Dateien werden aus dem erstellten PDF erzeugt und im gleichen Ausgabepfad wie das PDF abgelegt. Es können gleichzeitig ein- oder mehrere zusätzliche Datei-Formate erzeugt werden.

  • PDFmdx Editor – Speichern und Laden der im Editor erstellten Bedingungen als XML Datei um verschiedene Zustände der Bedingungen einfach und schnell speichern und wieder laden zu können. Der Dateiname wird beim Speichern  automatisch auf Basis von – Vorlagenname, Datum und Uhrzeit vorgeschlagen.

  • PDFmdx Editor – Bedingungen nach oben / unten bzw. an den Anfang / Ende – verschieben. Damit können Bedingungen einfach neu sortiert und gruppiert werden um zusammengehörige Zeilen untereinander anzuordnen.

 

  • PDFmdx Editor – Bedingungen – Trennlinie einfügen / umbenennen. Bedingungen können mit zusätzlichen Trennzeilen versehen werden um die Lesbarkeit und Übersichtlichkeit umfangreicher Strukturen zu erhöhen. Eine eingefügte Trennzeile kann entfernt und der Text kann wieder bearbeitet werden.

  • Fehlerkorrektur – Eine Aktion welche mit einer Bedingung – Erkennen, Teilen, Löschen, Gleitende Gruppen – verknüpft ist kann auf bestimmte Seiten begrenzt werden. Z.B. Nur auf die erste oder auf die erste und zweite Seite. Damit lässt sich die Verarbeitung beschleunigen, da nicht alle Seiten eines Stapels durcharbeitet werden müssen Es wurde der Fehler behoben dass die Angabe der Seitenbeschränkung nicht angewendet und immer alle Seiten durchsucht wurden. Mit der Version 3.3.0 werden jetzt nur die angegebenen Seiten verarbeitet.

  • Feldinhalte aus gelöschten Seiten erhalten. Werden Seiten über Bedingungen gelöscht so war es bisher nicht möglich die Feldinformation von diesen Seiten für Bedingungen, für die Ausgabe der Metadaten sowie auch für die Bildung des Pfads und Dateinamens zu verwenden. Z.B. um einen Barcode Wert eines Deckblattes als Dokumenten-Kennung, für die Trennung eines Stapels, für die Auswahl des Layouts, für den Dateinamen zu verwenden und um schlussendlich diese Trennseite zu löschen. Um Feldinhalte trotz der Löschung von Seiten zu erhalten gibt es jetzt bei der Felddefinition die Option „Erhaltener Wert“. Damit ist es möglich in einem Schritt mit einer einzigen Bedingung eine Layout zu erkennen, den Stapel zu teilen, die Seiten zu löschen und den ausgelesenen Wert für den  Dateinamen zu verwenden.

  • PDFmdx Editor – Vorlagen / Layout-Struktur als XML speichern. Die Baumstruktur der im PDFmdx Editor erstellten Vorlagen und Layouts kann in eine XML Datei weggeschrieben und beim Beenden des PDFmdx Editors automatisch aktualisiert werden.

  • PDFmdx Editor – Neuer Feldtyp – „Dateiname“ – Damit kann der Dateiname der Eingangsdatei auch für die Bedingungen der Verarbeitung und Layout-Erkennung verwendet werden. Z.B. kann das zu verwendende Layout damit über den Dateinamen bzw. Teile des Namens gesteuert werden.

    

  • PDFmdx Editor – Bedingungen – Direkte Auswahl des zu verwendenden Layouts über Option <VALUE>. Will man ein Layout über einen Wert einer Variablen z.b. über den Dateinamen auswählen so muss entweder für jedes Layout eine eigene Bedingung erfasst und mit „OR“ verknüpft werden oder man verwendet bei den Bedingungen die Auswahl <VALUE>. Damit wird die angegebene Variable automatisch gegen jeden für die Vorlage angelegten Layout Namen geprüft und jene Layout-Vorlage ausgewählt bei dem der Layout-Name mit dem Inhalt des Feldes übereinstimmt.

 

  • %FILENAME% Variable – Die Groß / Klein Schreibung des Dateinamens bleibt erhalten – bisher wurde der Dateiname immer in Kleinbuchstaben umgewandelt.
  • Datei überschreiben / Zähler anhängen – Es gibt jetzt eine Option um bei der Verarbeitung Dateien mit gleichem Namen zu überschreiben. Ist diese Option nicht angehakt so wird wie bisher eine neue Datei angelegt und ein Zähler an den vorhandenen Dateinamen angehängt.

Download – PDFmdx Template Editor & Processor >>>

iPaper 3.x – MDX Option – Produktvideo verfügbar – Inhalte auslesen und als Variablen verwenden

Für iPaper Version 3.x gibt es das “MDX – MetaDataXtraction” Zusatzmodul. Dabei wurden wesentliche Funktionen der PDFmdx Anwendung in iPaper integriert. Dokumente können an Hand von Inhalten erkannt, das entsprechende Briefpapier ausgewählt, bzw. über Feld-, Template- und Layout Definitionen können Informationen aus dem Dokument ausgelesen werden. Dabei werden Felder / Variablen mit Werten befüllt die in weiterer Folgen bei den iPaper Aktionen verwendet werden können. Fixe oder aus dem Dokument ausgelesene Infos lassen sich auch als Text oder als 1D / 2D / QR – Barcode auf das PDF “aufstempeln”.

iPaper MDX Anwendungsbereiche:

  • Das zu verwendende Briefpapier über den Dokumenteninhalt automatisch auswählen.
  • Bei Serien-Briefen oder Dokumenten-Stapel kann erkannt werden bei welcher Seite ein neues Dokument beginnt um das Briefpapier neu auszuwählen bzw. wieder mit der ersten BP-Seite zu starten.
  • E-Mail Adressen aus dem Dokument auslesen um das Dokument damit sofort zu versenden.
  • Dokumente können an Hand von Kriterien erkannt, Felder über Layout-Masken aus dem Dokument ausgelesen, Variablen zugeordnet und für iPaper Aktionen wie z.b. dem EMail Versand, Speichern unter, Programmaufruf usw. verwendet werden.
  • QR-Code Barcodes z.B. für Schnellüberweisungen bzw. auch andere 1D/2D Barcodes oder Text-Stempel können auf Belege aufgebracht werden. Dabei können auch ausgelesenen Feld-Inhalte aus dem Dokument zugewiesen werden.

iPaper MDX Produktvideo – Inhalte auslesen und als Dateinamen verwenden:

PDFmdx Version 3.2.7 verfügbar

Neuerungen PDFmdx Version 3.2.7:

  • Multiline Edit Box für Barcode- und Text-Stempel – QR-Code für Zahlungsanweisungen erstellen – Bisher konnte für die Text und Barcode Stempelung nur ein einzeiliger String angegeben werden. CR/LF wurde nicht berücksichtigt.  Jetzt gibt es zum Erfassen der Texte ein mehrzeiliges Eingabefeld. Zeilenumbrüche (CR/LF) und Leerzeilen werden korrekt auf die Stempel und Barcodes übernommen. Damit lassen sich jetzt z.b. auch QR-Codes für die Erstellung von SEPA Zahlungsanweisungen generieren – Siehe QR-Code “Zahlen mit Code”.  Die Grundlage für diesen QR-Code bildet eine Norm des European Payments Council. Viele Banken bieten eBanking Apps für Smartphones an, mit deren Funktionalität solche QR-Code gelesen werden können. Die Information wird dabei automatisch in eine Überweisung transferiert.

    

  • Gleiche Empfänger zusammenfassen – Bisher konnte jedes erzeugte PDF-Dokument nur in einer eigenen EMail Nachricht verschickt werden. Jetzt ist es auch möglich bei der Verarbeitung eines Jobs alle Dokumente mit der gleichen Empfänger-Adresse zu sammeln und in nur einer Nachricht zu versenden. Der Empfänger erhält also statt bisher mehrere EMails mit nur je einem Anhang eine EMail in der alle Dokumente enthalten sind.

  • Zeichen entfernen – Bisher hat es nur die Funktion gegeben um an Beginn bzw. am Ende  eines ausgelesenen Feldes bestimmte Zeichen zu entfernen. Jetzt gibt es auch die Möglichkeit ein oder mehrere festgelegte Zeichen aus dem ganzen ausgelesenen String zu entfernen – egal an welcher Stelle diese stehen.

  • Mehrere Zeichen auf einmal ersetzen – Es gab bereits die Funktion um mehrere Zeichen zu definieren die ersetzt werden sollten. Jedoch wurde die Funktion nicht “auf einmal” sondern nacheinander ausgeführt. Damit war es z.b. nicht möglich 1,234.56 auf 1.234,56 zu konvertieren. Das wurde geändert und die Funktion wird mit allen definierten Ersatz-Zeichen auf einmal ausgeführt wodurch solche Konvertierungen jetzt möglich sind.

  • XLSX statt XLS – sowie Blattname konfigurierbar – Das MS-Excel XLS Format wurde durch das XLSX Format ersetzt. Ebenso kann jetzt der Blattname frei vergeben werden. Bisher was der Blatt-Name im XLS mit “PDFmdx” fix vorgegeben.

  • Job wöchentlich ausführen – Zeitgesteuertes ausführen eines Jobs – Neben der Option “Täglich” gibt es jetzt auch die Option “Wöchentlich”

 

  • EMail Adressen suchen – Dokument / Seite – Fehlerbehebung – Neben dem Auslesen von EMail Adressen über Felder gibt es auch die Möglichkeit alle EMail Adressen aus den Dokument bzw. auf bestimmten Seiten zu suchen und für den Versand zu verwenden.

  • HTML Body – Bilder einbetten –  Fehlerbehebung beim HTML EMail Versand – Bei manchen EMail Clients / Web-basierenden EMail Diensten (z.b. Web.de) wurde falls Bilder im Body eingebettet wurden die Nachricht als HTML Code / Text und damit nicht richtig dargestellt .

Download – PDFmdx Template Editor & Processor >>>

PDFmdx-CL Version 1.0.25 – Commandline Anwendung für PDFmdx verfügbar

PDFmdx-CL ist eine Kommandozeilen Anwendung die es ermöglicht PDF Dokumente bzw. ganze Ordnerstrukturen über die Web-Service Schnittstelle an einen PDFmdx Service zur Verarbeitung zu übergeben und die Ergebnisse der Verarbeitung in einem Zielordner abzulegen.

PDFmdx-CL ist ein kostenloses Add-On für den PDFmdx Server, kann auf beliebigen MS-Windows Arbeitsplätzen installiert werden und erfordert keine zusätzliche Lizenzierung.

PDFmdx-CL Anwendungsbereich:

  • PDF Dokumente über Felder und deren Inhalte mittels hinterlegter Kriterien zu erkennen
  • Dokumentenstapel an Hand von Kriterien in Einzeldokumente zu teilen
  • Feldinformationen aus den Dokumenten auszulesen und als Metadaten (ASCII-TXT) Datei zu schreiben
  • PDF Briefpapier über Feldinhalte gesteuert zu hinterlegen / überlagern
  • PDF Dokumente zu signieren
  • PDF/A-1b bzw. PDF/A-3b konforme Dokumente zu erzeugen
  • PDF Infofelder mit den ausgelesenen Metadaten zu befüllen
  • Textstempel / Wasserzeichen aufbringen – fix bzw. über Inhalte / Variablen aus dem Dokument
  • 1D / 2D Barcodes aufbringen – fix bzw. über Inhalte / Variablen aus dem Dokument

Der PDFmdx Server bietet auch die Möglichkeit die Dokumente neu zu benennen, am Server in einer Folderstruktur zu speichern, per EMail zu versenden oder über den PDF2Printer Druckserver auszudrucken. Diese Funktionen können momentan nur über die Verarbeitung direkt am PDFmdx Server jedoch noch nicht über die PDFmdx-CL Anwendung genutzt werden.

PDFmdx-CL Funktionen:

  • Kommandozeilen Anwendung für PDFmdx.

 

  • Web-Service Kommunikation (SOAP) – local(host) oder remote PDFmdx Verarbeitungs-Service.
  • Verarbeitung einzelner PDF Dateien sowie aller PDF´s eines Ordners / ZIP Datei bzw. von Ordner-Strukturen.
  • User-Interface für die Konfiguration sowie um Standardeinstellungen vorzugeben.

  • Job-Vorlagen erzeugen (Name / Beschreibung) und die Verarbeitungs-Vorlage(n) auswählen. Verarbeitungs-Vorlagen werden über den PDFmdx Editor erzeugt und sind am PDFmdx Server hinterlegt.

  • Neue Verarbeitungsjobs können über eine bereits angelegte Job-Vorlage erzeugt und mit Dokumenten (einzelnen oder ganze Ordner) befüllt und verarbeitet werden – Erforderliche Parameter werden entweder angegeben oder werden standardmäßig über die Voreinstellungen belegt.

  • Die Ergebnisdokumente (PDF´s+Metadaten) werden in den vorgegebenen Ziel-Ordner heruntergeladen
  • Job-Details können über die Job Liste angezeigt werden.

 

Download – PDFmdx-CL Commandline Add-on Client für PDFmdx >>>

pdfFM – PDF Folder Merge – Dokumente mit gleichem Namen zu einem Gesamt-PDF(/A) zusammenfügen

Mit PDFmdx können Dokumentenstapel sehr einfach nach den unterschiedlichsten Kriterien in Einzeldokumente geteilt und ausgelesene Bereichsinhalte benannt werden. Manchmal kann es aber auch erforderlich sein Dokumente die mit gleichem Namen aus unterschiedlichen Quellen entstanden sind in einer bestimmten Reihenfolge automatisch zu einem Gesamtdokument zusammenzuführen.

Im Rahmen eines Kundenprojekts haben wir pdfFM entwickelt – eine Anwendung bei der 3 Ordner angegeben werden. Bei der Verarbeitung werden die Ordner nach Dokumenten mit gleichem Namen durchsucht, die namens gleichen Dokumente zu einem neuen Gesamt-PDF in der Reihenfolge der angegebenen Ordner zusammengefügt und in einem Zielordner abgelegt. Fehlt eine Datei in einem der Ordner so werden diese Dokumente in den Fehlerordner verschoben. Eine Log Datei protokolliert die Verarbeitung. Die Verarbeitung kann entweder interaktiv oder auch über Kommandozeilenaufruf ausgeführt werden.

Zusätzlich zum Zusammenfügen zu einer Gesamt PDF kann die Ausgabedatei auch in eine ISO – PDF/A-1b,2b oder 3b Datei konvertiert werden.

pdfFM - Konfiguration  pdfFM - Commandline Parameter

PDFmdx – Video – Rechnungen automatisiert per EMail versenden

Mit diesem PDFmdx Anwendungs-Beispiel wird gezeigt wie aus einem PDF Dokument Bereiche ausgelesen und die Information in weiterer Folge für den automatisierten EMail Versand der fertigen Rechnung verwendet wird.

  • Es werden Felder und Bereiche definiert um – die Firma, die Rechnungsnummer, das Rechnungsdatum und die EMail Adresse aus dem Beleg auszulesen.
  • Die Eingangsdatei wird auf Basis der ausgelesenen Information benannt. Ein PDF Briefpapier wird hinterlegt. Weiters wird die ausgelesene Rechnungsnummer als 1D Barcode sowie ein 2D QR-Code mit einem Web-Link auf die Rechnung aufgebracht.
  • Als letzten Schritt wird dann über ein HTML EMail Template eine EMail Nachricht generiert. Dabei werden Variablen welche im Betreff und im Nachrichtentext eingefügt wurden mit der ausgelesenen Information ersetzt. Die PDF Rechnung sowie zusätzliche Dateien werden als Anhang eingefügt und danach automatisiert über einen SMTP EMail Server verschickt.

 

 

PDFmdx Version 3.2.5 verfügbar

Neuerungen PDFmdx Version 3.2.5:

  • Neue Option für den Versand von HTML EMails – Bisher war es nur möglich externe Links die auch für den Empfänger erreichbar waren für Bilder in der Nachricht zu verwenden. Nun werden die Bilder direkt in die HTML Nachricht eingebettet – entweder “alle Bilder” oder “nur die lokalen Bilder”. Damit müssen keine externen für alle Empfänger erreichbaren Ressourcen mehr verwendet werden.

HTML Body - Referenzierte Bilder werden im EMail eingebettet verschickt

  • Ist die Option zum Erhalt des Erstellungs-Datums / Uhrzeit aktiviert so wird jetzt auch bei Dateien oder Teil-Dateien die in den Fehler Ordner verschoben werden diese Information von der Ausgangsdatei übernommen.
  • Die %COUNTER% Variable unterstützt jetzt auch Werte >9999
  • Ist die Funktion “Leere Seiten löschen” aktiv und wird ein Dokument mit nur einer einzigen leeren Seite verarbeitet so landet diese jetzt korrekt im Fehler- und nicht im Ziel-Ordner.

Download – PDFmdx Template Editor & Processor >>>