PDFmdx Version 3.2.7 verfügbar

Neuerungen PDFmdx Version 3.2.7:

  • Multiline Edit Box für Barcode- und Text-Stempel – QR-Code für Zahlungsanweisungen erstellen – Bisher konnte für die Text und Barcode Stempelung nur ein einzeiliger String angegeben werden. CR/LF wurde nicht berücksichtigt.  Jetzt gibt es zum Erfassen der Texte ein mehrzeiliges Eingabefeld. Zeilenumbrüche (CR/LF) und Leerzeilen werden korrekt auf die Stempel und Barcodes übernommen. Damit lassen sich jetzt z.b. auch QR-Codes für die Erstellung von SEPA Zahlungsanweisungen generieren – Siehe QR-Code “Zahlen mit Code”.  Die Grundlage für diesen QR-Code bildet eine Norm des European Payments Council. Viele Banken bieten eBanking Apps für Smartphones an, mit deren Funktionalität solche QR-Code gelesen werden können. Die Information wird dabei automatisch in eine Überweisung transferiert.

    

  • Gleiche Empfänger zusammenfassen – Bisher konnte jedes erzeugte PDF-Dokument nur in einer eigenen EMail Nachricht verschickt werden. Jetzt ist es auch möglich bei der Verarbeitung eines Jobs alle Dokumente mit der gleichen Empfänger-Adresse zu sammeln und in nur einer Nachricht zu versenden. Der Empfänger erhält also statt bisher mehrere EMails mit nur je einem Anhang eine EMail in der alle Dokumente enthalten sind.

  • Zeichen entfernen – Bisher hat es nur die Funktion gegeben um an Beginn bzw. am Ende  eines ausgelesenen Feldes bestimmte Zeichen zu entfernen. Jetzt gibt es auch die Möglichkeit ein oder mehrere festgelegte Zeichen aus dem ganzen ausgelesenen String zu entfernen – egal an welcher Stelle diese stehen.

  • Mehrere Zeichen auf einmal ersetzen – Es gab bereits die Funktion um mehrere Zeichen zu definieren die ersetzt werden sollten. Jedoch wurde die Funktion nicht “auf einmal” sondern nacheinander ausgeführt. Damit war es z.b. nicht möglich 1,234.56 auf 1.234,56 zu konvertieren. Das wurde geändert und die Funktion wird mit allen definierten Ersatz-Zeichen auf einmal ausgeführt wodurch solche Konvertierungen jetzt möglich sind.

  • XLSX statt XLS – sowie Blattname konfigurierbar – Das MS-Excel XLS Format wurde durch das XLSX Format ersetzt. Ebenso kann jetzt der Blattname frei vergeben werden. Bisher was der Blatt-Name im XLS mit “PDFmdx” fix vorgegeben.

  • Job wöchentlich ausführen – Zeitgesteuertes ausführen eines Jobs – Neben der Option “Täglich” gibt es jetzt auch die Option “Wöchentlich”

 

  • EMail Adressen suchen – Dokument / Seite – Fehlerbehebung – Neben dem Auslesen von EMail Adressen über Felder gibt es auch die Möglichkeit alle EMail Adressen aus den Dokument bzw. auf bestimmten Seiten zu suchen und für den Versand zu verwenden.

  • HTML Body – Bilder einbetten –  Fehlerbehebung beim HTML EMail Versand – Bei manchen EMail Clients / Web-basierenden EMail Diensten (z.b. Web.de) wurde falls Bilder im Body eingebettet wurden die Nachricht als HTML Code / Text und damit nicht richtig dargestellt .

Download – PDFmdx Template Editor & Processor >>>

PDFmdx-CL Version 1.0.25 – Commandline Anwendung für PDFmdx verfügbar

PDFmdx-CL ist eine Kommandozeilen Anwendung die es ermöglicht PDF Dokumente bzw. ganze Ordnerstrukturen über die Web-Service Schnittstelle an einen PDFmdx Service zur Verarbeitung zu übergeben und die Ergebnisse der Verarbeitung in einem Zielordner abzulegen.

PDFmdx-CL ist ein kostenloses Add-On für den PDFmdx Server, kann auf beliebigen MS-Windows Arbeitsplätzen installiert werden und erfordert keine zusätzliche Lizenzierung.

PDFmdx-CL Anwendungsbereich:

  • PDF Dokumente über Felder und deren Inhalte mittels hinterlegter Kriterien zu erkennen
  • Dokumentenstapel an Hand von Kriterien in Einzeldokumente zu teilen
  • Feldinformationen aus den Dokumenten auszulesen und als Metadaten (ASCII-TXT) Datei zu schreiben
  • PDF Briefpapier über Feldinhalte gesteuert zu hinterlegen / überlagern
  • PDF Dokumente zu signieren
  • PDF/A-1b bzw. PDF/A-3b konforme Dokumente zu erzeugen
  • PDF Infofelder mit den ausgelesenen Metadaten zu befüllen
  • Textstempel / Wasserzeichen aufbringen – fix bzw. über Inhalte / Variablen aus dem Dokument
  • 1D / 2D Barcodes aufbringen – fix bzw. über Inhalte / Variablen aus dem Dokument

Der PDFmdx Server bietet auch die Möglichkeit die Dokumente neu zu benennen, am Server in einer Folderstruktur zu speichern, per EMail zu versenden oder über den PDF2Printer Druckserver auszudrucken. Diese Funktionen können momentan nur über die Verarbeitung direkt am PDFmdx Server jedoch noch nicht über die PDFmdx-CL Anwendung genutzt werden.

PDFmdx-CL Funktionen:

  • Kommandozeilen Anwendung für PDFmdx.

 

  • Web-Service Kommunikation (SOAP) – local(host) oder remote PDFmdx Verarbeitungs-Service.
  • Verarbeitung einzelner PDF Dateien sowie aller PDF´s eines Ordners / ZIP Datei bzw. von Ordner-Strukturen.
  • User-Interface für die Konfiguration sowie um Standardeinstellungen vorzugeben.

  • Job-Vorlagen erzeugen (Name / Beschreibung) und die Verarbeitungs-Vorlage(n) auswählen. Verarbeitungs-Vorlagen werden über den PDFmdx Editor erzeugt und sind am PDFmdx Server hinterlegt.

  • Neue Verarbeitungsjobs können über eine bereits angelegte Job-Vorlage erzeugt und mit Dokumenten (einzelnen oder ganze Ordner) befüllt und verarbeitet werden – Erforderliche Parameter werden entweder angegeben oder werden standardmäßig über die Voreinstellungen belegt.

  • Die Ergebnisdokumente (PDF´s+Metadaten) werden in den vorgegebenen Ziel-Ordner heruntergeladen
  • Job-Details können über die Job Liste angezeigt werden.

 

Download – PDFmdx-CL Commandline Add-on Client für PDFmdx >>>

pdfFM – PDF Folder Merge – Dokumente mit gleichem Namen zu einem Gesamt-PDF(/A) zusammenfügen

Mit PDFmdx können Dokumentenstapel sehr einfach nach den unterschiedlichsten Kriterien in Einzeldokumente geteilt und ausgelesene Bereichsinhalte benannt werden. Manchmal kann es aber auch erforderlich sein Dokumente die mit gleichem Namen aus unterschiedlichen Quellen entstanden sind in einer bestimmten Reihenfolge automatisch zu einem Gesamtdokument zusammenzuführen.

Im Rahmen eines Kundenprojekts haben wir pdfFM entwickelt – eine Anwendung bei der 3 Ordner angegeben werden. Bei der Verarbeitung werden die Ordner nach Dokumenten mit gleichem Namen durchsucht, die namens gleichen Dokumente zu einem neuen Gesamt-PDF in der Reihenfolge der angegebenen Ordner zusammengefügt und in einem Zielordner abgelegt. Fehlt eine Datei in einem der Ordner so werden diese Dokumente in den Fehlerordner verschoben. Eine Log Datei protokolliert die Verarbeitung. Die Verarbeitung kann entweder interaktiv oder auch über Kommandozeilenaufruf ausgeführt werden.

Zusätzlich zum Zusammenfügen zu einer Gesamt PDF kann die Ausgabedatei auch in eine ISO – PDF/A-1b,2b oder 3b Datei konvertiert werden.

pdfFM - Konfiguration  pdfFM - Commandline Parameter

PDFmdx – Video – Rechnungen automatisiert per EMail versenden

Mit diesem PDFmdx Anwendungs-Beispiel wird gezeigt wie aus einem PDF Dokument Bereiche ausgelesen und die Information in weiterer Folge für den automatisierten EMail Versand der fertigen Rechnung verwendet wird.

  • Es werden Felder und Bereiche definiert um – die Firma, die Rechnungsnummer, das Rechnungsdatum und die EMail Adresse aus dem Beleg auszulesen.
  • Die Eingangsdatei wird auf Basis der ausgelesenen Information benannt. Ein PDF Briefpapier wird hinterlegt. Weiters wird die ausgelesene Rechnungsnummer als 1D Barcode sowie ein 2D QR-Code mit einem Web-Link auf die Rechnung aufgebracht.
  • Als letzten Schritt wird dann über ein HTML EMail Template eine EMail Nachricht generiert. Dabei werden Variablen welche im Betreff und im Nachrichtentext eingefügt wurden mit der ausgelesenen Information ersetzt. Die PDF Rechnung sowie zusätzliche Dateien werden als Anhang eingefügt und danach automatisiert über einen SMTP EMail Server verschickt.

 


PDFmdx Version 3.2.5 verfügbar

Neuerungen PDFmdx Version 3.2.5:

  • Neue Option für den Versand von HTML EMails – Bisher war es nur möglich externe Links die auch für den Empfänger erreichbar waren für Bilder in der Nachricht zu verwenden. Nun werden die Bilder direkt in die HTML Nachricht eingebettet – entweder “alle Bilder” oder “nur die lokalen Bilder”. Damit müssen keine externen für alle Empfänger erreichbaren Ressourcen mehr verwendet werden.

HTML Body - Referenzierte Bilder werden im EMail eingebettet verschickt

  • Ist die Option zum Erhalt des Erstellungs-Datums / Uhrzeit aktiviert so wird jetzt auch bei Dateien oder Teil-Dateien die in den Fehler Ordner verschoben werden diese Information von der Ausgangsdatei übernommen.
  • Die %COUNTER% Variable unterstützt jetzt auch Werte >9999
  • Ist die Funktion “Leere Seiten löschen” aktiv und wird ein Dokument mit nur einer einzigen leeren Seite verarbeitet so landet diese jetzt korrekt im Fehler- und nicht im Ziel-Ordner.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.2.4 verfügbar

Neuerungen PDFmdx Version 3.2.4:

  • PDFmdx Editor – Neuer HTML Editor für den Nachrichtentext der EMail Funktion.

PDFmdx Editor - Neuer HTML Editor für den Body Text

  • EMail Versand – Die Option im PDFmdx Editor um den EMail Versand zu aktivieren war nicht sichtbar und konnte daher nicht aktiviert werden.
  • Der PDF/A Konverter wurde aktualisiert.
  • Fehlerkorrektur im PDFmdx Editor – Beim Erstellen von Vorlagen wurde ein Fehler bei der automatischen Speicherung behoben. Das Problem trat nur beim Erstellen der ersten Voralge auf.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 3.2.2 verfügbar

Neuerungen PDFmdx Version 3.2.2:

  • PDFmdx ist jetzt eine 64bit Version und kann somit nur mehr auf 64bit Windows Versionen installiert werden. Dadurch ist es erforderlich bei bestehenden Installationen die Lizenz zu “moven” d.h. an unseren Lizenz-Server zurückzugeben und danach wieder abzurufen. Die neue Version setzte auch das .NET Runtime Version 4 voraus.
  • Neue Basisroutinen für PDF-, Image-, Barcode und OCR Verarbeitung sowie für die Extraktion von Text aus dem PDF
  • Erweiterte Liste an unterstützten 1D und 2D Barcodes um Barcodes zu erkennen und auf dem Dokument aufzubringen.

Erweiterte Barcode Unterstützung für 1D und 2D Barcodes

  • PDF/A – 1b, 2b, 3b – Konvertierung und Dokumentenausgabe

PDFmdx kann Dokumente im Format PDFA 1 bis 3 ausgeben

  • Neue und verbesserte Funktion um leere Seiten in Schwarzweiß- und Farb-PDF-Dokumenten automatisch zu erkennen und zu entfernen. %Satz der Schwärzung dient als Parameter. Zusätzlich kann auch die Information über im Hintergrund vorhandenen Text als Kriterium herangezogen werden.  Die Test-Funktion zeigt jetzt auch die identifizierten Leerseiten des ausgewählten Musterdokuments sowie deren Schwärzungsgrad an. Die Leerseiten werden ganz zu Beginn der PDFmdx Verarbeitung entfernt.

Funktion um Leere Seiten über einen Schwellwert zu finden und zu löschen

  • Die Auswerteliste der Leerseiten Erkennung lässt sich nach den angezeigten Spalten auf bzw. absteigend sortieren.

Testfunktion zeigt an welche Seiten bei dem eingestellten Schwellwert löschbar sind

  • Beim Test aus dem PDFmdx Editor heraus wird jetzt auch der Name des über die D – Bedingung identifizierten Layouts angezeigt. Dadurch kann festgestellt werden ob sowie als welches Layout mit dem getesteten Dokument erkannt wird.
  • Vereinfachtes Erfassen und Ändern der Bedingungen im PDFmdx Editor z.b. kann eine UND / ODER Bedingung jetzt auch nachträglich am Startknoten eingefügt werden.

Bei den Bedigungen gibt es jetzt alle Möglichkeiten der nachträglichen Bearbeitung

  •  Bei den Bedingungen wird die Seiten-Bereichsdefinition jetzt korrekt verarbeitet.

Bei jeder Bedingung kann festgelegt werden auf welchen Seiten diese geprüft werden sollen

  • Fuzzy / Näherungssuche für Bedingungen und Anker Felder. Gibt an, für wie viele Zeichen eine Abweichung vom angegebenen String noch akzeptiert wird – steht bei der deaktivierten Teilstring-Suche zur Verfügung.

Unschärfte = Fuzzy Funktion für die Bedingungen  Unschärfte = Fuzzy Funktion für die Ankerfeld Suche

  • Textbereiche / Felder werden jetzt auch auslesen falls die Textbox im PDF über den sichtbaren Seitenrand hinausragt.
  • Text–Suche sowie Auswahl/Kopier-Funktion: In der Voransicht des PDFmdx Editors kann ein Text im ganzen Dokument vorwärts bzw. rückwärts gesucht werden. Die gefundene Textstelle wird herausgehoben markiert. Ebenso ist es jetzt auch möglich im Editor Text zu markieren und in die Zwischenablage zu kopieren.

Im PDFmdx Editor kann im Markiermodus Text in der Voransicht ausgewählt und kopiert werden  Im PDFmdx Editor kann nach Text-Strings vorwärts und rückwärts gesucht werden - die Fundstelle wird markiert

  • Funktion um das Erstellungs-Datum bzw. -Uhrzeit der Ausgangsdatei für die Zieldatei zu übernehmen und zu erhalten. Diese Information stehen auch über Variablen für den Pfad / Dateinamen sowie für die Metadaten-Ausgabe z.b. über XLS zur Verfügung.

Erstellungs-Datum & Uhrzeit der Ursprungsdatei kann für die Ausgabedatei erhalten werden sowie als Variablen verwendet werden

  • Bei Verwendung der Variable für den Dateinamen der Eingangsdatei bleibt die Groß / Kleinschreibung des Dateinamens erhalten – bisher wurde der Dateiname immer in Kleinbuchstaben umgewandelt.
  • Im PDFmdx Service-Prozessor kann  die max. Anzahl der parallel auszuführenden Prozesse von 1,2,3,4,5,10 usw. festgelegt werden. Bisher war der minimale Wert von 5 aufwärts.

Die max. Anzahl an parallelen Verarbeitungsprozessen kann konfiguriert werden

  • Die Web-Service Schnittstelle über REST / SOAP wird bei der Installation standardmäßig aktiviert.

Die Web-Service Schnittstelle ist jetzt standardmäßig aktiviert

Neue Web-Service Funktionen (REST / SOAP) für die Benutzer- und Job-Template Verwaltung.

Die neuen Funktionen sind im mitgelieferten .NET / C# Beispielprojekt berücksichtigt und können damit getestet werden. Diese Erweiterungen sind für die Umsetzung der in Zukunft verfügbaren PDFmdx Commandline Anwendung erforderlich.

  • Benutzerverwaltung – Neue Benutzer anlegen, Löschen, Passwort rücksetzen / Neu setzen,  Bisher hat es nur einen „admin“ Benutzer gegeben. Jetzt ist es auch möglich weitere Benutzer anzulegen. Die Jobs und die Job-Vorlagen werden auf Basis der Benutzer verwaltet. Über den „Admin“ können weitere Benutzer angelegt werden. Das “Admin” Passwort kann über den PDFmdx Service-Prozessor zurück gesetzt werden.

Web-Service Benutzerverwaltung

  • Job-Template Funktion – Um neue Jobs über die Web-Service Schnittstelle einfach ohne viel Konfigurationsaufwand anzulegen gibt es jetzt auch die Möglichkeit Job-Templates zu verwenden. Job-Templates dienen als Referenz für neue Jobs. Ein bestehender Job kann über eine Checkbox zu einem Job-Template gemacht werden. Jobs die über ein Template erzeugt wurden sind darauf referenziert.

1_Neuen Job über Web-Service anlegen  2_Ein vorhandender Job kann als Templete verwendet werden um daraus neue Jobs anzulegen  3_Ein neuer Job Nummer #2 wurde durch Auswahl aus einem Template angelegt

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 2.8.1 verfügbar

Neuerungen PDFmdx Version 2.8.1:

Vorlagen-Synchronisation:

Der PDFmdx Template Editor kann jetzt die lokal erstellten Vorlagen und Layouts per Web-Service Verbindung mit einem oder mehreren PDFmdx Server abgleichen. Damit können Templates lokal entwickelt und getestet werden um diese dann auf die Verarbeitungs-Server zu replizieren. Die Kommunikation erfolgt über SOAP per http/https. Damit wird der Abgleich und die Verteilung von neuen und aktualisierten Templates wesentlich vereinfacht und beschleunigt.

8_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#1  9_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#2

Text-Stempel mit Drehwinkel: 

Um einen Text nicht nur horizontal sondern in jedem beliebigen Winkel aufzubringen gibt es jetzt den zusätzlichen „Drehwinkel“ Parameter.

6_Text-Stempel mit Drehwinkel Option  7_Text-Stempel mit Drehwinkel Option - Ergebnis

Ankerfeld-Suche – Neue Funktionen:

Bisher wurde der String für die Positionierung des Ankerfelds auf der ganze Seite gesucht (von oben weg) und die erste Fundstelle wurde als Position für das Ankerfeld angenommen. Es kann jedoch speziell bei der Teilstringsuche vorkommen dass der Begriff auf der Seite nicht die erste sondern eine weitere Fundstelle die gesuchte Position ist und es keine andere eindeutige Möglichkeit gibt das Feld über einen Suchstring zu positionieren. Deswegen wurde die Funktion erweitert.

Standardmäßig erfolgt die Ankerfeld-Suche nun von der Feldposition der Vorlage aus. Der nächstgelegene passende String wird als Position für das Ankerfelder genommen. Neu hinzugekommen ist die Option „Treffer“. Ist sie aktiviert und eine Nummer angegeben so wird die Seite von oben nach unten und von links nach rechts nach dem Anker-Text durchsucht. Die Zahl gibt an, der wievielte Treffer als Position für das Ankerfeld genommen wird. Damit kann also auch z.b. der 2. Treffer auf einer Seite als Ankerfeld-Position gefunden werden.

4_Anker-Felder mit Teilstring Suche - Such-Treffer Nummer kann angegeben werden

AutoScale-Funktion:

Speziell bei gescannten Dokumenten kann es vorkommen dass die Inhalte der Dokumente auf der Seite nicht nur in ihrer Positionierung horizontal bzw. vertikal variieren sondern Dokumente können auch unterschiedliche Skalierungen und Größen aufweisen. Z.B. falls ein gescannter Ausdruck mit unterschiedlichen  Skalierungen erstellt wurde. Die relative Position und Größe der auszulesenden Felder zueinander ist prozentuell zwischen den Dokumenten zwar gleich, die absoluten Werte sind aber unterschiedlich. Das Layout für das Auslesen der Felder wird an Hand eine typischen Dokuments erstellt und berücksichtigte bisher nur die absoluten Abstände und Größen der Felder zueinander. Ein Dokument das also z.b. um ca. 10% kleiner auf der A4 Seite erscheint konnte so nicht verarbeitet werden da die Felder im Vergleich zum erstellten Layout sowohl von der Position also auch von der Größe nicht passen. Dafür haben wir jetzt eine AutoScale Funktion implementiert welche in der Lage ist solche unterschiedlichen Skalierungen in einem bestimmten Umfang automatisch auszugleichen.

5_AutoScale für Ankerfelder - gleicht Skalierungen der Dokumente aus

Was ist zu beachten:

  • Das Layout sollte von der „größten“ Ausprägung aus erstellt werden
  • Es muss ein Ankerfeld verwendet werden das ohne Teilstringsuche gefunden werden kann. Z.B. über den String „Rechnung“ nicht jedoch über „*Rechnung*“
  • Die Option „AutoScale“ muss aktiviert werden.

Leere Seiten erkennen und entfernen:

Beim Scan von Dokumenten kann es bei doppelseitigen Scans vorkommen dass leere Seiten (der teilweise unbedruckten Rückseiten) im Dokument enthalten sind. Nicht immer verfügen Scanner über eine Funktion um diese automatisch beim Scanvorgang zu entfernen. Für die Weiterverarbeitung und Archivierung sind Leerseiten  störend und sollten entfernt werden können. Mit der aktuellen PDFmdx Version 2.8.1 gibt es  jetzt eine Funktion um leere Seiten automatisch zu erkennen und zu entfernen. Als Kriterium für die Erkennung einer leeren Seite dient ein Schwellwert der standardmäßig auf 95% gestellt ist. Wir empfehlen einen Wert zwischen 95 und 98%. Der Wert gibt den %-tuellen Anteil der „weißen Pixel“ auf einer Seite an. Eine Seite wird als „Leer“ identifiziert sobald der Anteil der weißen Pixel größer/gleich dem eingestellten Wert z.B. 95% ist. Leere Seiten werden vor Beginn aller anderen PDFmdx Verarbeitungen entfernt.

1_Entferne alle leere Seiten aus den Dokument - vor dem Start der Verarbeitung mit Schwellwert-Parameter

Seiten / Leere Seiten nach der Trennseite entfernen:

Wird ein Dokument geteilt werden so kann die gefundene Trennseite auch gelöscht werden. Neu hinzugekommen ist jetzt auch eine Funktion um Folgeseiten der Trennseite zu löschen. Dabei kann entweder eine bestimmte Anzahl an zu entfernenden Folgeseiten festgelegt oder es wird die Funktion zur automatischen Leerseiten-Erkennung/Entfernung mit Schwellwertangabe verwendet.

2_Entferne leere Seiten nach der Trennseite mit Schwellwert Parameter  3_Entferne eine eingestellte Zahl an Seiten nach der Trennseite

Regular Expression Parameter um gezielt Zahlen aus einem Feld zu extrahieren:

Über den RegEx Ausdruck “\d+” können Zahlen eines Feldes zurückgeliefert werden. Wird kein Parameter angegeben so wir automatisch die „erste der längsten der gefundenen Zahlen“ zurückgeliefert. z.B. der ausgelesene Feldinhalt ist „Seite 15 / 110“  so wird “110” zurückgeliefert. Zusammen mit dem Parameter “Treffer” kann gezielt eine Zahl einer bestimmten Position aus dem String extrahiert werden. Mit dem Parameter = 1 wird die erste in dem String gefundene Zahl “15” mit 2 die zweite “110” usw. zurückgeliefert.

RegEx auch in Kombination mit den zusätzlichen String-Aufbereitungen verwendbar:

Bisher konnte entweder nur die RegEx Verarbeitung oder alternativ die anderen String Aufbereitungs-Funktionen verwendet werden. Jetzt ist es auch möglich diese beiden Funktionen zu kombinieren – RegEx kann also zusammen mit den Funktionen – Teilstring, Entferne – Links / Rechts / Leerzeichen / Führende Nullen sowie der Funktion Zeichen ersetzen und Typ-Auswahl verwendet werden. Dabei wird immer unabhängig vom Typ des Feldes zuerst die RegEx Verarbeitung  ausgeführt  und anschließend die weiteren Aufbereitungen.

%TIME% Variable – jetzt im 24 Stunden Format

Update auf SQL Compact Version 4.x – Die Version ist jetzt bereits im Setup enthalten und muss nicht mehr wie bisher mit Version 3.5 extra nachgeladen und zusätzlich installiert werden.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 2.7.1 – mit SOAP / REST Schnittstelle sowie umfangreichen Erweiterungen und Verbesserungen

Neuerungen PDFmdx Version 2.7.1:

1. Web-Service Schnittstelle über SOAP / REST – PDFmdx kann damit in andere Anwendungen und Dienste eingebunden werden. Um zu testen welche Funktionen über die Web Services zur Verfügung stehen wird mit dem Setup ein Test-Client sowie der SourceCode dieser Anwendung als C# Projekt mit installiert.

Funkionen Web-Service Test-Client:

  • Liste der verfügbaren Templates – Refresh / Upload / Download / Löschen
  • Job neu anlegen – Beschreibung, Auswahl der Layouts, Verarbeiten ohne Bedingungen – Ja/Nein, Vorab-Teilen – nach Vorlagen, nach Seiten, nach Feldänderung bzw. falls sich das Layout oder Template ändert.
  • Über die “Upload” Funktion wird ein angelegter Job mit PDF-Dateien zur Verarbeitung „befüllt“
  • “Start” – Verarbeiten der hochgeladenen PDF´s über mit den Job-Einstellungen am PDFmdx-Server
  • Nach der Verarbeitung können die Ergebnisse über “Download” komplett heruntergeladen bzw. über Job-Info die Details angesehen und  die Ergebnisdateien einzeln heruntergeladen werden.
  • Für den “Download” kann ausgewählt werden ob nur die PDF-Ergebnis Dateien, nur die Metadaten oder beides zusammen heruntergeladen werden soll.
  • Andere zu verarbeitende Dateien können über “Upload” in einen angelegten Job nachgeladen und mit „Restart“ ebenfalls verarbeitet werden.
  • „Delete“ ermöglicht es  bestehende Jobs zu löschen.
  • Jobs können abgefragt bzw. als Liste angezeigt werden – ID, Status (created, uploaded, started, finished, downloaded) , User, Beschreibung – werden angezeigt. Die Job-Liste kann über den User sowie den Status gefiltert werden.

1_PDFmdx - Web-Service Beispielanwendung mit SourceCode für REST und SOAP  2_PDFmdx Windows Service Prozessor - Web-Service Konfiguration  3_PDFmdx - Web-Service Test-Client um alle verfügbaren Funktionen testen zu können  4_PDFmdx Web-Service Test-Client - Neuen Job anlegen  5_PDFmdx Web-Service Test-Client - Job Details nach dem Ende der Verarbeitung

2. EMail Anhang Negativliste – Externe Liste von EMail Empfängern an die der zusätzlich ausgewählte Anhang nicht verschickt werden soll. Die in der Liste angeführten Empfänger erhalten nur das aus der Verarbeitung entstandene Dokument. Ein zusätzlich konfigurierter Anhang wird nicht verschickt. Alle anderen EMail Empfänger erhalten auch die zusätzlichen Anhänge.

3. EMail Ersatzliste – Eine EMail Adresse von „An:“  „CC:“ und „BCC:“ kann über eine externe ASCII/ TXT Liste durch eine andere EMail Adresse ersetzt werden.

Die Anhang-Negativliste sowie die Ersatzliste kann generell oder pro Vorlage festgelegt werden. Die Vorlagenlisten der Vorlagen übersteuern die generell in der EMail Konfiguration festgelegten Listen.

7_PDFmdx Editor - EMail Konfiguration - EMail Adressen ersetzen und Negativ-Liste für Anhänge  8_PDFmdx Prozessor - EMail Konfiguration inkl. EMail Ersatzlisten und Negativ Listen für Anhänge

4. Bedingungs-Editor wurde erweitert um vorhandene Bedingungen kopieren / ausschneiden und einfügen zu können. Bedingungen können damit auch zwischen den Vorlagen ausgetauscht werden.

9_PDFmdx Vorlagen Editor - Ausschneiden, Kopieren und Einfügen von Bedingungen

5. Die Auswahl der 1D / 2D Barcode-Typen für die Erkennung ist pro Vorlage und Feld individuell möglich –Bisher konnten die Barcode Typen nur generell für die ganze Anwendung und damit für alle Vorlagen und für alle Felder einheitlich gesetzt werden – jetzt ist dies individuell bis auf Feldebene möglich.

6. 2D-Barcode Erkennung für Felder bzw. über die ganze Seite.  2D Barcodes der Typen DataMatrix, PDF417, Micro QR-Code sowie QR-Code können jetzt über die ganze Seite bzw. in einem Feldbereich erkannt und ausgelesen werden.

10_PDFmdx - Vorlagen Editor - 1D und 2D Barcodes Typen können pro Feld für eine Vorlage individuell konfiguriert werden

7. Erhalten der PDF Infofelder, Erhalten von Datum / Uhrzeit – Dabei können die PDF Informationsfelder sowie das Erstellungs- und Änderungs-Datum der Ursprungsdatei auf die Ausgabedatei übernommen werden. Ohne diese Option werden diese Informationen neu geschrieben.

11_PDFmdx - Vorlagen Editor - PDF Infofelder und Datum der Ausgangsdatei übernehmen und erhalten

8. Unterdrücken des Dokumenten Datensatzes bei der XLS / CSV Ausgabe, da mit den Felder der gleitenden Gruppe (Einzelpositionsdatensätze) auch alle Dokumenten Felder mit ausgeben werden können.

9. Das XML Ausgabeformat wurde verbessert und korrekt implementiert – Die Dokumenten-Felder und die Datensätze für die Felder der „gleitenden Gruppe“ (Positionsfelder) werden in der XML Struktur getrennt ausgegeben. Die verwendeten Einheit „mm“ wird als XML-Element mit ausgegeben.

14_PDFmdx - XML Ausgabe - Dokumenten und Positionsfelder als XML #1  15_PDFmdx - XML Ausgabe - Dokumenten und Positionsfelder als XML #2

 10. Suchfunktion in der PDF-Voransicht – damit können Texte in der aktuell angezeigten PDF Prototyp Datei gesucht und werden über eine Hervorhebung angezeigt. Die Suche kann Vorwärts / Rückwärts erfolgen und wird automatisch als Teilstringsuche ausgeführt. Diese Funktion erleichtert ein Überprüfen der Bedingungen und der Anker-Suchfunktion.

16_PDFmdx - Vorlagen Editor - Suchfunktion in der Voransicht mit Hervorheben der Fundstelle

11. Die Standard Voransicht wurde auf  maximale Breite am oberen Dokumentenrand geändert – bisher war die Standardansicht die vertikale Mitte des Dokuments.

12. Die Testfunktion wurde überarbeitet und erweitert. Die definierte Bedingung kann für den Test abgeschaltet werden. Das zu verwendende Layout kann manuell ausgewählt werden um die über das Layout ausgelesenen Felder unabhängig von der definierten Bedingung anzuzeigen. Damit wird die Analyse und das Feintuning einfacher. Die Dokumentenfelder und die Felder der gleitenden Gruppe werden bei der Test-Funktion jetzt korrekt ausgewertet und richtig angezeigt.

12_PDFmdx - Vorlagen Editor - Testfunktion für Bedinungen und Auslesen der Dokumenten und Positionsfelder #1  13_PDFmdx - Vorlagen Editor - Testfunktion für Bedinungen und Auslesen der Dokumenten und Positionsfelder #2

13. Default / Standardwerte für Felder festlegen – diese können über die %-Variablen abgerufen und verwendet werden. Damit lassen sich Werte zuordnen auch wenn das Feld nicht positioniert wurde bzw. falls der ausgelesene Bereich leer ist.

14. Umfangreiche Korrekturen und Fehlerbehebungen wurden im Bereich von Seitenangabe bei den Bedingungen, Feld-Suchanker, sowie bei der Seitenfunktion der Suchankerdefinitionen vorgenommen. Es wird jetzt zuverlässig der erste gefundene Suchstring auf der angegebenen Seite gefunden und als Ankerreferenz für die Felder verwendet. Ebenso wurden Verbesserungen bei der Text Extraktion vorgenommen – speziell was die korrekte Reihenfolge der extrahierten der Worte betrifft. Durch diese Verbesserungen wurde PDFmdx für die Verarbeitung gescannter bzw. OCRter Dokumente optimiert.

15. Ein / Ausblenden von Jobs in der ausführbaren PDFmdx Prozessor Verarbeitung. Um die Übersichtlichkeit bei einer großen Anzahl von konfigurierten Jobs zu erhöhen können Job-Definitionen über eine Checkbox  „versteckt“ und damit am Benutzerinterface ausgeblendet werden.

6_PDFmdx - Prozessor ausführbare Anwendung - Jobs ein und ausblenden

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 2.5.0 verfügbar

Neuerungen PDFmdx Version 2.5.0:

  • pmdx – Vorlagen Export / Import – Die PDF Prototyp Dateien aller Layouts sind jetzt in der pmdx Datei enthalten. Wurde bisher eine Vorlage aus dem PDFmdx Editor exportiert und auf einem anderen Rechner wieder importiert, so musste die PDF Prototypen Datei separat kopiert und auf dem Zielrechner vor dem Aufruf im richtigen Pfad vorhanden sein. War sie nicht vorhanden so ging die Position  verloren und die Felder mussten neu eingefügt werden. Die PDF Prototypen sind jetzt in der pmdx Datei enthalten und werden nicht mehr extern abgelegt. Das vereinfacht den Austausch sowie den PDFmdx Editor und den PDFmdx Prozessor auf unterschiedlichen Rechnern auszuführen.

6_PDFmdx - Export & Import von Vorlagen - die PDF Prototypen Dateien aller Layouts werden mit der pmdx Datei exportiert und wieder importiert

  • Seiten / Trennblätter (vorab-)löschen – Über Bedingungen können Seiten / Trennblätter erkannt sowie vor bzw. während der Verarbeitung gelöscht werden. Falls die gelöschte Seite nicht auch für die Erkennung des Layouts bzw. zum Trennen verwendet wird gibt es eine eigene Funktion um die erkannte Seite “Vor der Verarbeitung” zu löschen. In diesem Fall werden zuerst alle zu löschenden Seiten gesucht und erst in einem zweiten Durchgang die weiteren Erkennungen und Teilungen für das “Restdokument” durchgeführt. Das Kriterium kann über ein ausgewähltes Feld oder über “die ganze Seite” festgelegt werden. Ebenso kann die Suche auf einer bestimmten Seite, eine Folge von Seiten oder über alle Seiten erfolgen. Es kann mit einem exakten String oder mit Hilfe von Platzhaltern wie #,? und * gearbeitet werden.

1_PDFmdx - dieses Trennblatt soll gelöscht werden  2_PDFmdx - Seiten nur löschen, Das Layout soll hier nicht erkannt werden, Trennung wird auch nicht durchgeführt  3_PDFmdx - Sollen Dokumente an der Trennseite auch geteilt werden so ist dies auch möglich

  • Vorab-Teilen von Dokumentenstapel an Hand von Layouts bzw. Vorlage – Sind unterschiedliche Layouts bzw.  Vorlagen in einem Dokumentenstapel enthalten und sollen die unterschiedlichen Dokumente an Hand von Kriterien erkannt und in Einzeldokumente aufgeteilt werden so muss dies im PDFmdx Prozessor über die Funktion “Vorab-Teilen falls sich das Layout oder die Vorlage ändern” erfolgen. Eine in einem Layout definierte “S = Split” Bedingung wirkt im Dokumentenstapel nur bei gleichen Layouts, nicht jedoch bei verschiedenen Layouts und Vorlagen. Liegen die zu verarbeitenden Dokumente bereits als getrennte Einzeldokumente vor so ist diese Option nicht erforderlich.

4_PDFmdx - Unterschiedliche Belege = Layouts werden erkannt und geteilt falls sich gleiche Belege hintereinander befinden  5_PDFmdx - Für die Verarbeitung von Dokumentenstapel müssen die Dokumente vor der Erkennung noch geteilt werden - dies erfolgt auf Basis der Layouts und Vorlagen

  • Barcode – Erkennung – Bei den Feldtypen gibt es jetzt auch die Möglichkeit “Barcode” auszuwählen. Damit lassen sich 1D-Barcodes innerhalb des markierten Feldbereiches erkennen. Der Barcodewert wird als als Feldinhalt zurückgeliefert. Über die Barcode-Einstellungen kann festgelegt werden welche Barcode Typen erkannt werden sollen. Die Barcode-Erkennung wird auch direkt auch bei der Feldpositionierung und bei der Test-Funktion  ausgeführt. Damit ist gleich ersichtlich ob der Barcode erkannt wird bzw. welchen Wert der Barcode aufweist.

7_PDFmdx - Der Feldtyp Barcode ermöglicht das Auslesen von Barcodes innerhalb des festgelegten Feldbereiches  07_PDFmdx - Feldtyp Barcode  8_PDFmdx - Mit den Barcode Einstellungen kann festgelegt werden welche Barcode Typen erkannt werden sollen

  • Datums- und Zeit-Format der Ausgabe-Variablen konfigurierbar – Das Format für die Ausgabe Variablen %DATE% und %TIME% kann jetzt über die Variablen “dd” “mm” “yyyy” sowie “hh” “mm” “ss” individuell festgelegt werden.

9_PDFmdx - Datums und Zeitformatierung für die Ausgabevariablen DATE und TIME individuell konfigurierbar

  • Test Funktion zeigt die extrahierten sowie die aufbereiteten Feldinhalte – Bei der Testfunktion werden nicht nur die aus dem PDF extrahierten sondern auch die durch die Felddefinition aufbereiteten Feldinhalte die von PDFmdx für die Weiterverarbeitung verwendet werden angezeigt.

10_PDFmdx - Extrahierte Feldinhalte können aufbereitet werden  11_PDFmdx - Testfunktion zeigt sowohl den extrahierten als auch den aufbereiteten Feldinhalt an

  • Text bzw. 1D/2D Barcode Stempel aufbringen – PDFmdx ist nicht nur in der Lage Texte aus PDF Dokumenten auszulesen sondern es können auch Text bzw. Barcode-Stempel auf Seiten aufgebracht werden. Dabei kann fixer Text, Standard-Variablen wie Datum, Zeit, Rechner-, Benutzer-, Vorlagen-Name, Layout Seitennummer, Seitenzahl-Gesamt aber auch ausgelesene Feldwerte über konfigurierte Variablen verwendet werden. Für Text-Stempel stehen Schriftstil, Schriftgröße, Farbe sowie die Formatierungen – Fett, Kursiv, Kontur, Unterstrichen, Durchgestrichen als Parameter zur Verfügung. Die Text Ausrichtung kann innerhalb der positionierten Box – Links / Mitte / Rechts, Oben / Mitte / Unten ausgewählt werden. Ein Wert kann aber auch als 1D / 2D Barcode-Stempel aufgebracht werden. Es stehen 36 Barcode-Typen zur Auswahl. Ein weiterer Parameter legt fest ob der Stempel auf bestimmten Seiten, in einem Seitenbereich, auf allen Seiten bzw. nur auf der letzten Seite aufgebracht werden soll.

12_PDFmdx - Ein über den Barcode ausgelesene Wert wird als QR-Code auf dem Dokument aufgebracht  13_PDFmdx - Die ausgelesene Rechnugnsnummer soll als CODE128 Barcode auf allen Seiten aufgebracht werden  14_PDFmdx - Text und Barcode Stempel können aufgebracht und ausgelesene Werte als Inhalt verwendet werden  15_PDFmdx - Barcode als QR-Code und Rechnugsnummer als Barcode aufgestempelt

Download – PDFmdx Template Editor & Processor >>>