PDFmdx – Version 2.8.1 verfügbar

Neuerungen PDFmdx Version 2.8.1:

Vorlagen-Synchronisation:

Der PDFmdx Template Editor kann jetzt die lokal erstellten Vorlagen und Layouts per Web-Service Verbindung mit einem oder mehreren PDFmdx Server abgleichen. Damit können Templates lokal entwickelt und getestet werden um diese dann auf die Verarbeitungs-Server zu replizieren. Die Kommunikation erfolgt über SOAP per http/https. Damit wird der Abgleich und die Verteilung von neuen und aktualisierten Templates wesentlich vereinfacht und beschleunigt.

8_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#1  9_PDFmdx Editor - Abgleich von Vorlagen und Layouts mit entfernten Servern_#2

Text-Stempel mit Drehwinkel: 

Um einen Text nicht nur horizontal sondern in jedem beliebigen Winkel aufzubringen gibt es jetzt den zusätzlichen „Drehwinkel“ Parameter.

6_Text-Stempel mit Drehwinkel Option  7_Text-Stempel mit Drehwinkel Option - Ergebnis

Ankerfeld-Suche – Neue Funktionen:

Bisher wurde der String für die Positionierung des Ankerfelds auf der ganze Seite gesucht (von oben weg) und die erste Fundstelle wurde als Position für das Ankerfeld angenommen. Es kann jedoch speziell bei der Teilstringsuche vorkommen dass der Begriff auf der Seite nicht die erste sondern eine weitere Fundstelle die gesuchte Position ist und es keine andere eindeutige Möglichkeit gibt das Feld über einen Suchstring zu positionieren. Deswegen wurde die Funktion erweitert.

Standardmäßig erfolgt die Ankerfeld-Suche nun von der Feldposition der Vorlage aus. Der nächstgelegene passende String wird als Position für das Ankerfelder genommen. Neu hinzugekommen ist die Option „Treffer“. Ist sie aktiviert und eine Nummer angegeben so wird die Seite von oben nach unten und von links nach rechts nach dem Anker-Text durchsucht. Die Zahl gibt an, der wievielte Treffer als Position für das Ankerfeld genommen wird. Damit kann also auch z.b. der 2. Treffer auf einer Seite als Ankerfeld-Position gefunden werden.

4_Anker-Felder mit Teilstring Suche - Such-Treffer Nummer kann angegeben werden

AutoScale-Funktion:

Speziell bei gescannten Dokumenten kann es vorkommen dass die Inhalte der Dokumente auf der Seite nicht nur in ihrer Positionierung horizontal bzw. vertikal variieren sondern Dokumente können auch unterschiedliche Skalierungen und Größen aufweisen. Z.B. falls ein gescannter Ausdruck mit unterschiedlichen  Skalierungen erstellt wurde. Die relative Position und Größe der auszulesenden Felder zueinander ist prozentuell zwischen den Dokumenten zwar gleich, die absoluten Werte sind aber unterschiedlich. Das Layout für das Auslesen der Felder wird an Hand eine typischen Dokuments erstellt und berücksichtigte bisher nur die absoluten Abstände und Größen der Felder zueinander. Ein Dokument das also z.b. um ca. 10% kleiner auf der A4 Seite erscheint konnte so nicht verarbeitet werden da die Felder im Vergleich zum erstellten Layout sowohl von der Position also auch von der Größe nicht passen. Dafür haben wir jetzt eine AutoScale Funktion implementiert welche in der Lage ist solche unterschiedlichen Skalierungen in einem bestimmten Umfang automatisch auszugleichen.

5_AutoScale für Ankerfelder - gleicht Skalierungen der Dokumente aus

Was ist zu beachten:

  • Das Layout sollte von der „größten“ Ausprägung aus erstellt werden
  • Es muss ein Ankerfeld verwendet werden das ohne Teilstringsuche gefunden werden kann. Z.B. über den String „Rechnung“ nicht jedoch über „*Rechnung*“
  • Die Option „AutoScale“ muss aktiviert werden.

Leere Seiten erkennen und entfernen:

Beim Scan von Dokumenten kann es bei doppelseitigen Scans vorkommen dass leere Seiten (der teilweise unbedruckten Rückseiten) im Dokument enthalten sind. Nicht immer verfügen Scanner über eine Funktion um diese automatisch beim Scanvorgang zu entfernen. Für die Weiterverarbeitung und Archivierung sind Leerseiten  störend und sollten entfernt werden können. Mit der aktuellen PDFmdx Version 2.8.1 gibt es  jetzt eine Funktion um leere Seiten automatisch zu erkennen und zu entfernen. Als Kriterium für die Erkennung einer leeren Seite dient ein Schwellwert der standardmäßig auf 95% gestellt ist. Wir empfehlen einen Wert zwischen 95 und 98%. Der Wert gibt den %-tuellen Anteil der „weißen Pixel“ auf einer Seite an. Eine Seite wird als „Leer“ identifiziert sobald der Anteil der weißen Pixel größer/gleich dem eingestellten Wert z.B. 95% ist. Leere Seiten werden vor Beginn aller anderen PDFmdx Verarbeitungen entfernt.

1_Entferne alle leere Seiten aus den Dokument - vor dem Start der Verarbeitung mit Schwellwert-Parameter

Seiten / Leere Seiten nach der Trennseite entfernen:

Wird ein Dokument geteilt werden so kann die gefundene Trennseite auch gelöscht werden. Neu hinzugekommen ist jetzt auch eine Funktion um Folgeseiten der Trennseite zu löschen. Dabei kann entweder eine bestimmte Anzahl an zu entfernenden Folgeseiten festgelegt oder es wird die Funktion zur automatischen Leerseiten-Erkennung/Entfernung mit Schwellwertangabe verwendet.

2_Entferne leere Seiten nach der Trennseite mit Schwellwert Parameter  3_Entferne eine eingestellte Zahl an Seiten nach der Trennseite

Regular Expression Parameter um gezielt Zahlen aus einem Feld zu extrahieren:

Über den RegEx Ausdruck „\d+“ können Zahlen eines Feldes zurückgeliefert werden. Wird kein Parameter angegeben so wir automatisch die „erste der längsten der gefundenen Zahlen“ zurückgeliefert. z.B. der ausgelesene Feldinhalt ist „Seite 15 / 110“  so wird „110“ zurückgeliefert. Zusammen mit dem Parameter “Treffer” kann gezielt eine Zahl einer bestimmten Position aus dem String extrahiert werden. Mit dem Parameter = 1 wird die erste in dem String gefundene Zahl „15“ mit 2 die zweite „110“ usw. zurückgeliefert.

RegEx auch in Kombination mit den zusätzlichen String-Aufbereitungen verwendbar:

Bisher konnte entweder nur die RegEx Verarbeitung oder alternativ die anderen String Aufbereitungs-Funktionen verwendet werden. Jetzt ist es auch möglich diese beiden Funktionen zu kombinieren – RegEx kann also zusammen mit den Funktionen – Teilstring, Entferne – Links / Rechts / Leerzeichen / Führende Nullen sowie der Funktion Zeichen ersetzen und Typ-Auswahl verwendet werden. Dabei wird immer unabhängig vom Typ des Feldes zuerst die RegEx Verarbeitung  ausgeführt  und anschließend die weiteren Aufbereitungen.

%TIME% Variable – jetzt im 24 Stunden Format

Update auf SQL Compact Version 4.x – Die Version ist jetzt bereits im Setup enthalten und muss nicht mehr wie bisher mit Version 3.5 extra nachgeladen und zusätzlich installiert werden.

Download – PDFmdx Template Editor & Processor >>>

Webshop