PDFmdx Version 3.5.3 verfügbar

Neuerungen PDFmdx Version 3.5.3:

  • Feld / Bereichs OCR / Bereich invertieren / OCR immer ausführen:

Normalerweise werden für die PDFmdx Verarbeitung PDF Dateien als Input verwendet die bereits Text enthalten – entweder “normale” PDF oder gescannte PDF die über einen vorangegangenen OCR Prozess (z.b. über AutoOCR oder FileConverterPro) eine zusätzliche Textebenen erhalten haben.

PDFmdx verfügt auch über eine integrierte OCR Funktion um den Text in den Bereichen der positionierten Feldern aus der Bildinformation ermitteln zu können.

Bei den allgemeinen PDFmdx OCR Einstellungen gibt es die Möglichkeit festzulegen wie die Texte aus dem PDF gewonnen werden sollen – “Original”, “OCR” oder “SmartOCR”. Bei “Original” wird der Text immer aus dem PDF genommen, bei OCR – wird der Text immer über einen PDFmdx OCR Vorgang gewonnen, auch falls bereits ein Text im PDF vorhanden ist. Bei der “SmartOCR” Einstellung wird die PDFmdx OCR Funktion nur ausgeführt falls im PDF noch kein Text vorhanden ist, ansonsten wird der im PDF vorhandene Text genommen. Diese Einstellungen gelten generell für die ganze Vorlage und alle damit verbundenen Layouts.

In dem Zusammenhang gibt es jetzt 2 neue Funktionen die es ermöglichen weißen Text auf schwarzem Hintergrund zu erkennen.

Einzelne Bereiche mit Text in weißer Schrift auf schwarzen Hintergrund können über einen automatischen OCR Vorgang nicht erkannt werden, da vor dem OCR Vorgang der Bereich invertiert werden müsste um erkannt werden zu können. Das kann nur interaktiv erfolgen in dem der zu Bereiche manuell ausgewählt wird.

Im PDFmdx Editor gib es jetzt die Möglichkeit bei der Feldkonfiguration die Option “Bereich invertieren” zu aktivieren. Dabei wird für die OCR Verarbeitung der Feldbereich invertiert. Dadurch entsteht schwarze Schrift auf weißem Hintergrund welche durch die OCR erkannt werden kann.

In dem Zusammenhang gibt es eine weitere neue Feldfunktion “OCR immer ausführen” – Damit kann die generelle Einstellung „SmartOCR“ übersteuert werden. Die OCR Erkennung wird dann für dieses Feld immer ausgeführt, auch wenn bereits ein darunterliegender Text vorhanden ist.

  

  • PDFmdx Editor – Bedingung suchen, Layout aufrufen: Es gib jetzt eine Suchfunktion um in den Bedingungen nach einem (Teil)String zu Vorwärts und Rückwärts zu suchen. Damit kann eine Zeile in den Bedingungen direkt angesprungen werden. Aus der Bedingungszeile kann dann auch das verknüpfte Layout direkt aufgerufen werden. Diese Funktion erleichtert die Arbeit mit einer großen Zahl an Bedingungen.

  • Die Web-Service Funktionen wurden überarbeitet, im Web-Service Beispiel können die Metadaten jetzt auch als XML heruntergeladen werden.
  • Bei der Metadaten XML wurden die neu hinzugekommenen Variablen JobID, JobName, JobDescription und ProzessID ergänzt.

Download – PDFmdx Template Editor & Processor >>>