PDFmdx Version 3.3.0 verfügbar

Neuerungen PDFmdx Version 3.3.0:

  • Zusätzliche Formate exportieren – Über die Integration des PDF2DOCX Konverters können zusätzlich zum erzeugten PDF jetzt auch ein HTML, DOCX, XML, TXT und XLS erstellt werden. Diese zusätzlichen Dateien werden aus dem erstellten PDF erzeugt und im gleichen Ausgabepfad wie das PDF abgelegt. Es können gleichzeitig ein- oder mehrere zusätzliche Datei-Formate erzeugt werden.

  • PDFmdx Editor – Speichern und Laden der im Editor erstellten Bedingungen als XML Datei um verschiedene Zustände der Bedingungen einfach und schnell speichern und wieder laden zu können. Der Dateiname wird beim Speichern  automatisch auf Basis von – Vorlagenname, Datum und Uhrzeit vorgeschlagen.

  • PDFmdx Editor – Bedingungen nach oben / unten bzw. an den Anfang / Ende – verschieben. Damit können Bedingungen einfach neu sortiert und gruppiert werden um zusammengehörige Zeilen untereinander anzuordnen.

 

  • PDFmdx Editor – Bedingungen – Trennlinie einfügen / umbenennen. Bedingungen können mit zusätzlichen Trennzeilen versehen werden um die Lesbarkeit und Übersichtlichkeit umfangreicher Strukturen zu erhöhen. Eine eingefügte Trennzeile kann entfernt und der Text kann wieder bearbeitet werden.

  • Fehlerkorrektur – Eine Aktion welche mit einer Bedingung – Erkennen, Teilen, Löschen, Gleitende Gruppen – verknüpft ist kann auf bestimmte Seiten begrenzt werden. Z.B. Nur auf die erste oder auf die erste und zweite Seite. Damit lässt sich die Verarbeitung beschleunigen, da nicht alle Seiten eines Stapels durcharbeitet werden müssen Es wurde der Fehler behoben dass die Angabe der Seitenbeschränkung nicht angewendet und immer alle Seiten durchsucht wurden. Mit der Version 3.3.0 werden jetzt nur die angegebenen Seiten verarbeitet.

  • Feldinhalte aus gelöschten Seiten erhalten. Werden Seiten über Bedingungen gelöscht so war es bisher nicht möglich die Feldinformation von diesen Seiten für Bedingungen, für die Ausgabe der Metadaten sowie auch für die Bildung des Pfads und Dateinamens zu verwenden. Z.B. um einen Barcode Wert eines Deckblattes als Dokumenten-Kennung, für die Trennung eines Stapels, für die Auswahl des Layouts, für den Dateinamen zu verwenden und um schlussendlich diese Trennseite zu löschen. Um Feldinhalte trotz der Löschung von Seiten zu erhalten gibt es jetzt bei der Felddefinition die Option „Erhaltener Wert“. Damit ist es möglich in einem Schritt mit einer einzigen Bedingung eine Layout zu erkennen, den Stapel zu teilen, die Seiten zu löschen und den ausgelesenen Wert für den  Dateinamen zu verwenden.

  • PDFmdx Editor – Vorlagen / Layout-Struktur als XML speichern. Die Baumstruktur der im PDFmdx Editor erstellten Vorlagen und Layouts kann in eine XML Datei weggeschrieben und beim Beenden des PDFmdx Editors automatisch aktualisiert werden.

  • PDFmdx Editor – Neuer Feldtyp – „Dateiname“ – Damit kann der Dateiname der Eingangsdatei auch für die Bedingungen der Verarbeitung und Layout-Erkennung verwendet werden. Z.B. kann das zu verwendende Layout damit über den Dateinamen bzw. Teile des Namens gesteuert werden.

    

  • PDFmdx Editor – Bedingungen – Direkte Auswahl des zu verwendenden Layouts über Option <VALUE>. Will man ein Layout über einen Wert einer Variablen z.b. über den Dateinamen auswählen so muss entweder für jedes Layout eine eigene Bedingung erfasst und mit „OR“ verknüpft werden oder man verwendet bei den Bedingungen die Auswahl <VALUE>. Damit wird die angegebene Variable automatisch gegen jeden für die Vorlage angelegten Layout Namen geprüft und jene Layout-Vorlage ausgewählt bei dem der Layout-Name mit dem Inhalt des Feldes übereinstimmt.

 

  • %FILENAME% Variable – Die Groß / Klein Schreibung des Dateinamens bleibt erhalten – bisher wurde der Dateiname immer in Kleinbuchstaben umgewandelt.
  • Datei überschreiben / Zähler anhängen – Es gibt jetzt eine Option um bei der Verarbeitung Dateien mit gleichem Namen zu überschreiben. Ist diese Option nicht angehakt so wird wie bisher eine neue Datei angelegt und ein Zähler an den vorhandenen Dateinamen angehängt.

Download – PDFmdx Template Editor & Processor >>>

iPaper 3.x – MDX Option – Produktvideo verfügbar – Inhalte auslesen und als Variablen verwenden

Für iPaper Version 3.x gibt es das “MDX – MetaDataXtraction” Zusatzmodul. Dabei wurden wesentliche Funktionen der PDFmdx Anwendung in iPaper integriert. Dokumente können an Hand von Inhalten erkannt, das entsprechende Briefpapier ausgewählt, bzw. über Feld-, Template- und Layout Definitionen können Informationen aus dem Dokument ausgelesen werden. Dabei werden Felder / Variablen mit Werten befüllt die in weiterer Folgen bei den iPaper Aktionen verwendet werden können. Fixe oder aus dem Dokument ausgelesene Infos lassen sich auch als Text oder als 1D / 2D / QR – Barcode auf das PDF “aufstempeln”.

iPaper MDX Anwendungsbereiche:

  • Das zu verwendende Briefpapier über den Dokumenteninhalt automatisch auswählen.
  • Bei Serien-Briefen oder Dokumenten-Stapel kann erkannt werden bei welcher Seite ein neues Dokument beginnt um das Briefpapier neu auszuwählen bzw. wieder mit der ersten BP-Seite zu starten.
  • E-Mail Adressen aus dem Dokument auslesen um das Dokument damit sofort zu versenden.
  • Dokumente können an Hand von Kriterien erkannt, Felder über Layout-Masken aus dem Dokument ausgelesen, Variablen zugeordnet und für iPaper Aktionen wie z.b. dem EMail Versand, Speichern unter, Programmaufruf usw. verwendet werden.
  • QR-Code Barcodes z.B. für Schnellüberweisungen bzw. auch andere 1D/2D Barcodes oder Text-Stempel können auf Belege aufgebracht werden. Dabei können auch ausgelesenen Feld-Inhalte aus dem Dokument zugewiesen werden.

iPaper MDX Produktvideo – Inhalte auslesen und als Dateinamen verwenden:

PDFmdx Version 3.2.7 verfügbar

Neuerungen PDFmdx Version 3.2.7:

  • Multiline Edit Box für Barcode- und Text-Stempel – QR-Code für Zahlungsanweisungen erstellen – Bisher konnte für die Text und Barcode Stempelung nur ein einzeiliger String angegeben werden. CR/LF wurde nicht berücksichtigt.  Jetzt gibt es zum Erfassen der Texte ein mehrzeiliges Eingabefeld. Zeilenumbrüche (CR/LF) und Leerzeilen werden korrekt auf die Stempel und Barcodes übernommen. Damit lassen sich jetzt z.b. auch QR-Codes für die Erstellung von SEPA Zahlungsanweisungen generieren – Siehe QR-Code “Zahlen mit Code”.  Die Grundlage für diesen QR-Code bildet eine Norm des European Payments Council. Viele Banken bieten eBanking Apps für Smartphones an, mit deren Funktionalität solche QR-Code gelesen werden können. Die Information wird dabei automatisch in eine Überweisung transferiert.

    

  • Gleiche Empfänger zusammenfassen – Bisher konnte jedes erzeugte PDF-Dokument nur in einer eigenen EMail Nachricht verschickt werden. Jetzt ist es auch möglich bei der Verarbeitung eines Jobs alle Dokumente mit der gleichen Empfänger-Adresse zu sammeln und in nur einer Nachricht zu versenden. Der Empfänger erhält also statt bisher mehrere EMails mit nur je einem Anhang eine EMail in der alle Dokumente enthalten sind.

  • Zeichen entfernen – Bisher hat es nur die Funktion gegeben um an Beginn bzw. am Ende  eines ausgelesenen Feldes bestimmte Zeichen zu entfernen. Jetzt gibt es auch die Möglichkeit ein oder mehrere festgelegte Zeichen aus dem ganzen ausgelesenen String zu entfernen – egal an welcher Stelle diese stehen.

  • Mehrere Zeichen auf einmal ersetzen – Es gab bereits die Funktion um mehrere Zeichen zu definieren die ersetzt werden sollten. Jedoch wurde die Funktion nicht “auf einmal” sondern nacheinander ausgeführt. Damit war es z.b. nicht möglich 1,234.56 auf 1.234,56 zu konvertieren. Das wurde geändert und die Funktion wird mit allen definierten Ersatz-Zeichen auf einmal ausgeführt wodurch solche Konvertierungen jetzt möglich sind.

  • XLSX statt XLS – sowie Blattname konfigurierbar – Das MS-Excel XLS Format wurde durch das XLSX Format ersetzt. Ebenso kann jetzt der Blattname frei vergeben werden. Bisher was der Blatt-Name im XLS mit “PDFmdx” fix vorgegeben.

  • Job wöchentlich ausführen – Zeitgesteuertes ausführen eines Jobs – Neben der Option “Täglich” gibt es jetzt auch die Option “Wöchentlich”

 

  • EMail Adressen suchen – Dokument / Seite – Fehlerbehebung – Neben dem Auslesen von EMail Adressen über Felder gibt es auch die Möglichkeit alle EMail Adressen aus den Dokument bzw. auf bestimmten Seiten zu suchen und für den Versand zu verwenden.

  • HTML Body – Bilder einbetten –  Fehlerbehebung beim HTML EMail Versand – Bei manchen EMail Clients / Web-basierenden EMail Diensten (z.b. Web.de) wurde falls Bilder im Body eingebettet wurden die Nachricht als HTML Code / Text und damit nicht richtig dargestellt .

Download – PDFmdx Template Editor & Processor >>>

PDFmdx-CL Version 1.0.25 – Commandline Anwendung für PDFmdx verfügbar

PDFmdx-CL ist eine Kommandozeilen Anwendung die es ermöglicht PDF Dokumente bzw. ganze Ordnerstrukturen über die Web-Service Schnittstelle an einen PDFmdx Service zur Verarbeitung zu übergeben und die Ergebnisse der Verarbeitung in einem Zielordner abzulegen.

PDFmdx-CL ist ein kostenloses Add-On für den PDFmdx Server, kann auf beliebigen MS-Windows Arbeitsplätzen installiert werden und erfordert keine zusätzliche Lizenzierung.

PDFmdx-CL Anwendungsbereich:

  • PDF Dokumente über Felder und deren Inhalte mittels hinterlegter Kriterien zu erkennen
  • Dokumentenstapel an Hand von Kriterien in Einzeldokumente zu teilen
  • Feldinformationen aus den Dokumenten auszulesen und als Metadaten (ASCII-TXT) Datei zu schreiben
  • PDF Briefpapier über Feldinhalte gesteuert zu hinterlegen / überlagern
  • PDF Dokumente zu signieren
  • PDF/A-1b bzw. PDF/A-3b konforme Dokumente zu erzeugen
  • PDF Infofelder mit den ausgelesenen Metadaten zu befüllen
  • Textstempel / Wasserzeichen aufbringen – fix bzw. über Inhalte / Variablen aus dem Dokument
  • 1D / 2D Barcodes aufbringen – fix bzw. über Inhalte / Variablen aus dem Dokument

Der PDFmdx Server bietet auch die Möglichkeit die Dokumente neu zu benennen, am Server in einer Folderstruktur zu speichern, per EMail zu versenden oder über den PDF2Printer Druckserver auszudrucken. Diese Funktionen können momentan nur über die Verarbeitung direkt am PDFmdx Server jedoch noch nicht über die PDFmdx-CL Anwendung genutzt werden.

PDFmdx-CL Funktionen:

  • Kommandozeilen Anwendung für PDFmdx.

 

  • Web-Service Kommunikation (SOAP) – local(host) oder remote PDFmdx Verarbeitungs-Service.
  • Verarbeitung einzelner PDF Dateien sowie aller PDF´s eines Ordners / ZIP Datei bzw. von Ordner-Strukturen.
  • User-Interface für die Konfiguration sowie um Standardeinstellungen vorzugeben.

  • Job-Vorlagen erzeugen (Name / Beschreibung) und die Verarbeitungs-Vorlage(n) auswählen. Verarbeitungs-Vorlagen werden über den PDFmdx Editor erzeugt und sind am PDFmdx Server hinterlegt.

  • Neue Verarbeitungsjobs können über eine bereits angelegte Job-Vorlage erzeugt und mit Dokumenten (einzelnen oder ganze Ordner) befüllt und verarbeitet werden – Erforderliche Parameter werden entweder angegeben oder werden standardmäßig über die Voreinstellungen belegt.

  • Die Ergebnisdokumente (PDF´s+Metadaten) werden in den vorgegebenen Ziel-Ordner heruntergeladen
  • Job-Details können über die Job Liste angezeigt werden.

 

Download – PDFmdx-CL Commandline Add-on Client für PDFmdx >>>

pdfFM – PDF Folder Merge – Dokumente mit gleichem Namen zu einem Gesamt-PDF(/A) zusammenfügen

Mit PDFmdx können Dokumentenstapel sehr einfach nach den unterschiedlichsten Kriterien in Einzeldokumente geteilt und ausgelesene Bereichsinhalte benannt werden. Manchmal kann es aber auch erforderlich sein Dokumente die mit gleichem Namen aus unterschiedlichen Quellen entstanden sind in einer bestimmten Reihenfolge automatisch zu einem Gesamtdokument zusammenzuführen.

Im Rahmen eines Kundenprojekts haben wir pdfFM entwickelt – eine Anwendung bei der 3 Ordner angegeben werden. Bei der Verarbeitung werden die Ordner nach Dokumenten mit gleichem Namen durchsucht, die namens gleichen Dokumente zu einem neuen Gesamt-PDF in der Reihenfolge der angegebenen Ordner zusammengefügt und in einem Zielordner abgelegt. Fehlt eine Datei in einem der Ordner so werden diese Dokumente in den Fehlerordner verschoben. Eine Log Datei protokolliert die Verarbeitung. Die Verarbeitung kann entweder interaktiv oder auch über Kommandozeilenaufruf ausgeführt werden.

Zusätzlich zum Zusammenfügen zu einer Gesamt PDF kann die Ausgabedatei auch in eine ISO – PDF/A-1b,2b oder 3b Datei konvertiert werden.

pdfFM - Konfiguration  pdfFM - Commandline Parameter

PDFmdx – Video – Rechnungen automatisiert per EMail versenden

Mit diesem PDFmdx Anwendungs-Beispiel wird gezeigt wie aus einem PDF Dokument Bereiche ausgelesen und die Information in weiterer Folge für den automatisierten EMail Versand der fertigen Rechnung verwendet wird.

  • Es werden Felder und Bereiche definiert um – die Firma, die Rechnungsnummer, das Rechnungsdatum und die EMail Adresse aus dem Beleg auszulesen.
  • Die Eingangsdatei wird auf Basis der ausgelesenen Information benannt. Ein PDF Briefpapier wird hinterlegt. Weiters wird die ausgelesene Rechnungsnummer als 1D Barcode sowie ein 2D QR-Code mit einem Web-Link auf die Rechnung aufgebracht.
  • Als letzten Schritt wird dann über ein HTML EMail Template eine EMail Nachricht generiert. Dabei werden Variablen welche im Betreff und im Nachrichtentext eingefügt wurden mit der ausgelesenen Information ersetzt. Die PDF Rechnung sowie zusätzliche Dateien werden als Anhang eingefügt und danach automatisiert über einen SMTP EMail Server verschickt.

 

 

PDFmdx Version 3.2.5 verfügbar

Neuerungen PDFmdx Version 3.2.5:

  • Neue Option für den Versand von HTML EMails – Bisher war es nur möglich externe Links die auch für den Empfänger erreichbar waren für Bilder in der Nachricht zu verwenden. Nun werden die Bilder direkt in die HTML Nachricht eingebettet – entweder “alle Bilder” oder “nur die lokalen Bilder”. Damit müssen keine externen für alle Empfänger erreichbaren Ressourcen mehr verwendet werden.

HTML Body - Referenzierte Bilder werden im EMail eingebettet verschickt

  • Ist die Option zum Erhalt des Erstellungs-Datums / Uhrzeit aktiviert so wird jetzt auch bei Dateien oder Teil-Dateien die in den Fehler Ordner verschoben werden diese Information von der Ausgangsdatei übernommen.
  • Die %COUNTER% Variable unterstützt jetzt auch Werte >9999
  • Ist die Funktion “Leere Seiten löschen” aktiv und wird ein Dokument mit nur einer einzigen leeren Seite verarbeitet so landet diese jetzt korrekt im Fehler- und nicht im Ziel-Ordner.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.2.4 verfügbar

Neuerungen PDFmdx Version 3.2.4:

  • PDFmdx Editor – Neuer HTML Editor für den Nachrichtentext der EMail Funktion.

PDFmdx Editor - Neuer HTML Editor für den Body Text

  • EMail Versand – Die Option im PDFmdx Editor um den EMail Versand zu aktivieren war nicht sichtbar und konnte daher nicht aktiviert werden.
  • Der PDF/A Konverter wurde aktualisiert.
  • Fehlerkorrektur im PDFmdx Editor – Beim Erstellen von Vorlagen wurde ein Fehler bei der automatischen Speicherung behoben. Das Problem trat nur beim Erstellen der ersten Voralge auf.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 3.2.2 verfügbar

Neuerungen PDFmdx Version 3.2.2:

  • PDFmdx ist jetzt eine 64bit Version und kann somit nur mehr auf 64bit Windows Versionen installiert werden. Dadurch ist es erforderlich bei bestehenden Installationen die Lizenz zu “moven” d.h. an unseren Lizenz-Server zurückzugeben und danach wieder abzurufen. Die neue Version setzte auch das .NET Runtime Version 4 voraus.
  • Neue Basisroutinen für PDF-, Image-, Barcode und OCR Verarbeitung sowie für die Extraktion von Text aus dem PDF
  • Erweiterte Liste an unterstützten 1D und 2D Barcodes um Barcodes zu erkennen und auf dem Dokument aufzubringen.

Erweiterte Barcode Unterstützung für 1D und 2D Barcodes

  • PDF/A – 1b, 2b, 3b – Konvertierung und Dokumentenausgabe

PDFmdx kann Dokumente im Format PDFA 1 bis 3 ausgeben

  • Neue und verbesserte Funktion um leere Seiten in Schwarzweiß- und Farb-PDF-Dokumenten automatisch zu erkennen und zu entfernen. %Satz der Schwärzung dient als Parameter. Zusätzlich kann auch die Information über im Hintergrund vorhandenen Text als Kriterium herangezogen werden.  Die Test-Funktion zeigt jetzt auch die identifizierten Leerseiten des ausgewählten Musterdokuments sowie deren Schwärzungsgrad an. Die Leerseiten werden ganz zu Beginn der PDFmdx Verarbeitung entfernt.

Funktion um Leere Seiten über einen Schwellwert zu finden und zu löschen

  • Die Auswerteliste der Leerseiten Erkennung lässt sich nach den angezeigten Spalten auf bzw. absteigend sortieren.

Testfunktion zeigt an welche Seiten bei dem eingestellten Schwellwert löschbar sind

  • Beim Test aus dem PDFmdx Editor heraus wird jetzt auch der Name des über die D – Bedingung identifizierten Layouts angezeigt. Dadurch kann festgestellt werden ob sowie als welches Layout mit dem getesteten Dokument erkannt wird.
  • Vereinfachtes Erfassen und Ändern der Bedingungen im PDFmdx Editor z.b. kann eine UND / ODER Bedingung jetzt auch nachträglich am Startknoten eingefügt werden.

Bei den Bedigungen gibt es jetzt alle Möglichkeiten der nachträglichen Bearbeitung

  •  Bei den Bedingungen wird die Seiten-Bereichsdefinition jetzt korrekt verarbeitet.

Bei jeder Bedingung kann festgelegt werden auf welchen Seiten diese geprüft werden sollen

  • Fuzzy / Näherungssuche für Bedingungen und Anker Felder. Gibt an, für wie viele Zeichen eine Abweichung vom angegebenen String noch akzeptiert wird – steht bei der deaktivierten Teilstring-Suche zur Verfügung.

Unschärfte = Fuzzy Funktion für die Bedingungen  Unschärfte = Fuzzy Funktion für die Ankerfeld Suche

  • Textbereiche / Felder werden jetzt auch auslesen falls die Textbox im PDF über den sichtbaren Seitenrand hinausragt.
  • Text–Suche sowie Auswahl/Kopier-Funktion: In der Voransicht des PDFmdx Editors kann ein Text im ganzen Dokument vorwärts bzw. rückwärts gesucht werden. Die gefundene Textstelle wird herausgehoben markiert. Ebenso ist es jetzt auch möglich im Editor Text zu markieren und in die Zwischenablage zu kopieren.

Im PDFmdx Editor kann im Markiermodus Text in der Voransicht ausgewählt und kopiert werden  Im PDFmdx Editor kann nach Text-Strings vorwärts und rückwärts gesucht werden - die Fundstelle wird markiert

  • Funktion um das Erstellungs-Datum bzw. -Uhrzeit der Ausgangsdatei für die Zieldatei zu übernehmen und zu erhalten. Diese Information stehen auch über Variablen für den Pfad / Dateinamen sowie für die Metadaten-Ausgabe z.b. über XLS zur Verfügung.

Erstellungs-Datum & Uhrzeit der Ursprungsdatei kann für die Ausgabedatei erhalten werden sowie als Variablen verwendet werden

  • Bei Verwendung der Variable für den Dateinamen der Eingangsdatei bleibt die Groß / Kleinschreibung des Dateinamens erhalten – bisher wurde der Dateiname immer in Kleinbuchstaben umgewandelt.
  • Im PDFmdx Service-Prozessor kann  die max. Anzahl der parallel auszuführenden Prozesse von 1,2,3,4,5,10 usw. festgelegt werden. Bisher war der minimale Wert von 5 aufwärts.

Die max. Anzahl an parallelen Verarbeitungsprozessen kann konfiguriert werden

  • Die Web-Service Schnittstelle über REST / SOAP wird bei der Installation standardmäßig aktiviert.

Die Web-Service Schnittstelle ist jetzt standardmäßig aktiviert

Neue Web-Service Funktionen (REST / SOAP) für die Benutzer- und Job-Template Verwaltung.

Die neuen Funktionen sind im mitgelieferten .NET / C# Beispielprojekt berücksichtigt und können damit getestet werden. Diese Erweiterungen sind für die Umsetzung der in Zukunft verfügbaren PDFmdx Commandline Anwendung erforderlich.

  • Benutzerverwaltung – Neue Benutzer anlegen, Löschen, Passwort rücksetzen / Neu setzen,  Bisher hat es nur einen „admin“ Benutzer gegeben. Jetzt ist es auch möglich weitere Benutzer anzulegen. Die Jobs und die Job-Vorlagen werden auf Basis der Benutzer verwaltet. Über den „Admin“ können weitere Benutzer angelegt werden. Das “Admin” Passwort kann über den PDFmdx Service-Prozessor zurück gesetzt werden.

Web-Service Benutzerverwaltung

  • Job-Template Funktion – Um neue Jobs über die Web-Service Schnittstelle einfach ohne viel Konfigurationsaufwand anzulegen gibt es jetzt auch die Möglichkeit Job-Templates zu verwenden. Job-Templates dienen als Referenz für neue Jobs. Ein bestehender Job kann über eine Checkbox zu einem Job-Template gemacht werden. Jobs die über ein Template erzeugt wurden sind darauf referenziert.

1_Neuen Job über Web-Service anlegen  2_Ein vorhandender Job kann als Templete verwendet werden um daraus neue Jobs anzulegen  3_Ein neuer Job Nummer #2 wurde durch Auswahl aus einem Template angelegt

Download – PDFmdx Template Editor & Processor >>>

PDFmdx – Version 2.8.1 verfügbar

Neuerungen PDFmdx Version 2.8.1:

Vorlagen-Synchronisation:

Der PDFmdx Template Editor kann jetzt die lokal erstellten Vorlagen und Layouts per Web-Service Verbindung mit einem oder mehreren PDFmdx Server abgleichen. Damit können Templates lokal entwickelt und getestet werden um diese dann auf die Verarbeitungs-Server zu replizieren. Die Kommunikation erfolgt über SOAP per http/https. Damit wird der Abgleich und die Verteilung von neuen und aktualisierten Templates wesentlich vereinfacht und beschleunigt.

8_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#1  9_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#2

Text-Stempel mit Drehwinkel: 

Um einen Text nicht nur horizontal sondern in jedem beliebigen Winkel aufzubringen gibt es jetzt den zusätzlichen „Drehwinkel“ Parameter.

6_Text-Stempel mit Drehwinkel Option  7_Text-Stempel mit Drehwinkel Option - Ergebnis

Ankerfeld-Suche – Neue Funktionen:

Bisher wurde der String für die Positionierung des Ankerfelds auf der ganze Seite gesucht (von oben weg) und die erste Fundstelle wurde als Position für das Ankerfeld angenommen. Es kann jedoch speziell bei der Teilstringsuche vorkommen dass der Begriff auf der Seite nicht die erste sondern eine weitere Fundstelle die gesuchte Position ist und es keine andere eindeutige Möglichkeit gibt das Feld über einen Suchstring zu positionieren. Deswegen wurde die Funktion erweitert.

Standardmäßig erfolgt die Ankerfeld-Suche nun von der Feldposition der Vorlage aus. Der nächstgelegene passende String wird als Position für das Ankerfelder genommen. Neu hinzugekommen ist die Option „Treffer“. Ist sie aktiviert und eine Nummer angegeben so wird die Seite von oben nach unten und von links nach rechts nach dem Anker-Text durchsucht. Die Zahl gibt an, der wievielte Treffer als Position für das Ankerfeld genommen wird. Damit kann also auch z.b. der 2. Treffer auf einer Seite als Ankerfeld-Position gefunden werden.

4_Anker-Felder mit Teilstring Suche - Such-Treffer Nummer kann angegeben werden

AutoScale-Funktion:

Speziell bei gescannten Dokumenten kann es vorkommen dass die Inhalte der Dokumente auf der Seite nicht nur in ihrer Positionierung horizontal bzw. vertikal variieren sondern Dokumente können auch unterschiedliche Skalierungen und Größen aufweisen. Z.B. falls ein gescannter Ausdruck mit unterschiedlichen  Skalierungen erstellt wurde. Die relative Position und Größe der auszulesenden Felder zueinander ist prozentuell zwischen den Dokumenten zwar gleich, die absoluten Werte sind aber unterschiedlich. Das Layout für das Auslesen der Felder wird an Hand eine typischen Dokuments erstellt und berücksichtigte bisher nur die absoluten Abstände und Größen der Felder zueinander. Ein Dokument das also z.b. um ca. 10% kleiner auf der A4 Seite erscheint konnte so nicht verarbeitet werden da die Felder im Vergleich zum erstellten Layout sowohl von der Position also auch von der Größe nicht passen. Dafür haben wir jetzt eine AutoScale Funktion implementiert welche in der Lage ist solche unterschiedlichen Skalierungen in einem bestimmten Umfang automatisch auszugleichen.

5_AutoScale für Ankerfelder - gleicht Skalierungen der Dokumente aus

Was ist zu beachten:

  • Das Layout sollte von der „größten“ Ausprägung aus erstellt werden
  • Es muss ein Ankerfeld verwendet werden das ohne Teilstringsuche gefunden werden kann. Z.B. über den String „Rechnung“ nicht jedoch über „*Rechnung*“
  • Die Option „AutoScale“ muss aktiviert werden.

Leere Seiten erkennen und entfernen:

Beim Scan von Dokumenten kann es bei doppelseitigen Scans vorkommen dass leere Seiten (der teilweise unbedruckten Rückseiten) im Dokument enthalten sind. Nicht immer verfügen Scanner über eine Funktion um diese automatisch beim Scanvorgang zu entfernen. Für die Weiterverarbeitung und Archivierung sind Leerseiten  störend und sollten entfernt werden können. Mit der aktuellen PDFmdx Version 2.8.1 gibt es  jetzt eine Funktion um leere Seiten automatisch zu erkennen und zu entfernen. Als Kriterium für die Erkennung einer leeren Seite dient ein Schwellwert der standardmäßig auf 95% gestellt ist. Wir empfehlen einen Wert zwischen 95 und 98%. Der Wert gibt den %-tuellen Anteil der „weißen Pixel“ auf einer Seite an. Eine Seite wird als „Leer“ identifiziert sobald der Anteil der weißen Pixel größer/gleich dem eingestellten Wert z.B. 95% ist. Leere Seiten werden vor Beginn aller anderen PDFmdx Verarbeitungen entfernt.

1_Entferne alle leere Seiten aus den Dokument - vor dem Start der Verarbeitung mit Schwellwert-Parameter

Seiten / Leere Seiten nach der Trennseite entfernen:

Wird ein Dokument geteilt werden so kann die gefundene Trennseite auch gelöscht werden. Neu hinzugekommen ist jetzt auch eine Funktion um Folgeseiten der Trennseite zu löschen. Dabei kann entweder eine bestimmte Anzahl an zu entfernenden Folgeseiten festgelegt oder es wird die Funktion zur automatischen Leerseiten-Erkennung/Entfernung mit Schwellwertangabe verwendet.

2_Entferne leere Seiten nach der Trennseite mit Schwellwert Parameter  3_Entferne eine eingestellte Zahl an Seiten nach der Trennseite

Regular Expression Parameter um gezielt Zahlen aus einem Feld zu extrahieren:

Über den RegEx Ausdruck “\d+” können Zahlen eines Feldes zurückgeliefert werden. Wird kein Parameter angegeben so wir automatisch die „erste der längsten der gefundenen Zahlen“ zurückgeliefert. z.B. der ausgelesene Feldinhalt ist „Seite 15 / 110“  so wird “110” zurückgeliefert. Zusammen mit dem Parameter “Treffer” kann gezielt eine Zahl einer bestimmten Position aus dem String extrahiert werden. Mit dem Parameter = 1 wird die erste in dem String gefundene Zahl “15” mit 2 die zweite “110” usw. zurückgeliefert.

RegEx auch in Kombination mit den zusätzlichen String-Aufbereitungen verwendbar:

Bisher konnte entweder nur die RegEx Verarbeitung oder alternativ die anderen String Aufbereitungs-Funktionen verwendet werden. Jetzt ist es auch möglich diese beiden Funktionen zu kombinieren – RegEx kann also zusammen mit den Funktionen – Teilstring, Entferne – Links / Rechts / Leerzeichen / Führende Nullen sowie der Funktion Zeichen ersetzen und Typ-Auswahl verwendet werden. Dabei wird immer unabhängig vom Typ des Feldes zuerst die RegEx Verarbeitung  ausgeführt  und anschließend die weiteren Aufbereitungen.

%TIME% Variable – jetzt im 24 Stunden Format

Update auf SQL Compact Version 4.x – Die Version ist jetzt bereits im Setup enthalten und muss nicht mehr wie bisher mit Version 3.5 extra nachgeladen und zusätzlich installiert werden.

Download – PDFmdx Template Editor & Processor >>>