Kategorie: PDFmdx

PDFmdx Version 3.24.11

Neuerungen PDFmdx Version 3.24.11:

  • Textstring ersetzen / externe Tabelle – Teilstring- oder Exakte-Suche: Beim Ersetzen von Variableninhalten wurde der Text bisher nur über  Teilstrings ausgeführt. Dabei wurde der Erste in der externen Tabelle gefundene Teilstring für das Ersetzen des Texts verwendet. Diese Funktion wurde erweitert, Alternativ kann auch nach dem exakten String zu gesucht und falls vorhanden, ersetzt werden.

  • EMail Adressen – neuer Variablentyp: Die EMail Funktion wurde erweitert. Bisher stand für die EMail Adress Variablen für die Felder – „An“ / „CC“ / „BCC“ nur der Variablentyp „Text“ zur Verfügung. Nun gibt es dafür einen eigenen Variablentyp „EMail“. In den Feldern „An“ / „CC“ / „BCC“ lassen sich jetzt nur mehr Variablen diese Typs auswählen und zuordnen. Anderer Variablentypen stehen in diesen Feldern nicht zur Auswahl. Bestehende PDFmdx EMail Versand Konfigurationen müssen also entsprechende angepaßt werden, ansonsten bleiben diese Felder leer und das EMail kann nicht verschickt werden.

  • EMail Adress Validierung: Dabei wird die ausgelesene bzw. über eine externe Tabelle gefundene EMail Adresse einer Validierung unterzogen. Dabei wird nach Kriterien und externen Abfragen festgestellt ob es sich um eine gültige EMail Adresse handelt oder nicht. Die Adresse Validierung kann auch deaktiviert werden. Ist sie deaktieiert so erfolgt lediglich eine Basis-Validierung nach „@“, nicht erlaubten Zeichen und doppelten Punkten am Beginn und Ende der EMail Adresse. Um dabei verhindern zu können dass an sich gültige EMail Adressen nicht angenommen werden, können solche auch explizit als „gültige Adressen“ in einer Tabelle hinterlegt werden. Für Variablen dieses Typs wird in der in der Test-Ergebnisanzeige des PDFmdx Editors der Status der Adress Validierung über einen „grünen Haken“ oder „rotes X“  angezeigt.
  • EMail Adressen ersetzen: Über eine TXT Tabelle können ausgelesene EMail Adressen vor dem Versand durch andere EMail Adressen ersetzt werden.
  • EMail Anhänge nicht an bestimmte EMail Adressen senden: Dabei wird über eine externe TXT EMail Adressliste gesteuert welche Empfänger keine Anhänge, sondern nur die EMail Nachricht alleine erhalten.
  • Max. Anhang Größe: Dieser Parameter ermöglicht es die max. Größe der EMail Anhänge zu steuern. Wird für einen Empfänger die eingestellte Größe überschritten so erhält er autoatisch mehrere EMail Nachrichten mit Anhängen kleiner / gleich der eingestellten max. Größe.
  • Versandte / Fehler EMail als EML/XML protokollieren: Die Protokollierung kann aktiviert / deaktiviert, der Log-Ordner kann festgelegt werden. Dadurch  erhält man eine lückenlose Protokollierung aller EMail Nachrichten die erfolgreich versandt wurden, bzw. auch jener Nachrichten die bei der Übergabe an den EMail Server einen Fehler erzeugt haben. Die Nachrichten werden im EML Format zusammen mit den Metadaten der Nachricht im XML Format im Log Ordner abgelegt und können im PDFmdx Prozessor aufgelistet und angezeigt werden.

     

  • EMail Log – Anzeige Funktion: Die versandten EMail können im PDFmdx Prozessor in Form einer Liste über Tagesordner getrennt abgerufen werden. Die Tabelle kann über die Spalten „Versandzeitpunkt“, „Empfänger“ bzw. „Betreff“ sortiert werden und zeigt in einer Liste rechts daneben, über deren Namen, die in der Nachricht enthaltenen Anhänge. Der Log Odner kann gelöscht oder geöffnet werden. Ebenso lassen sich die EML Nachrichten bzw. deren Anhänge über ihre verknüpften Anwendungen aufrufen und anzeigen.

  • Start der Verarbeitung – monatlich wiederholend:  Neben der Intervallsteuerung – „täglich“ sowie „wöchentlich“ gibt es jetzt auch die Option die Verarbeitung „monatlich“ wiederkehrend durchführen zu lassen.

  • Neuer  Variablentyp „Spezial“: Auslesen von PDF Infofeldern bzw. Eingangs-Ordnername. Um auch Informationen aus anderen Quellen als über Bereiche aus dem Dokument einer Variable zuordnen zu können, wurde der neue Variablentyp „Spezial“ implementiert. Damit können felxibel weitere Quellen aus dem Dokument hinzugefügt werden ohne diese Variablen fix an allen Stellen im Programm Einzeln hinzufügen zu müssen. Damit lassen sich jetzt auch  die PDF Infofelder: Titel, Autor, Betreff, Schlagworte 1-8 (durch „;“ getrennt), sowie der Eingangs-Ordnername einer Variable zuordnen und für die Verarbeitung verwenden.

Download – PDFmdx Template Editor & Processor >>>

 

 

PDFmdx Version 3.21.0

Neuerungen PDFmdx Version 3.21.0:

Teile Seiten über Barcode:

Es gibt Anwendungsfälle z.b.: Rollkarten von Speditionen, bei denen es erforderlich ist Dokumente nicht mit einer ganzen Seite zu teilen, sondern es sollen Seiten horizontal geteilt werden, um daraus einzelne neue Dokumente zu erzeugen. Dafür wurde die neue Funktion „Teile Seiten über Barcode“ implementiert.

Als Kriterium wird ein Barcode und eine Bedingung über den ausgelesenen Barcode Wert verwendet. Es wird jede Seite nach Barcodes durchsucht. Wird ein Barcode mit einer zutreffenden Bedingung gefunden, *,? und # können für die Teilstringsuche verwendet werden, so wird die Seite an dieser Stelle horizontal in ein neues Dokument geteilt. An dieser Stelle „endet“ das bestehende Dokument. Der verbleibende Rest der Seite wird am oberen Rand einer neuen Seite beginnend, als neues Dokument erstellt, solange bis wieder ein zutreffender Barcode bzw. das Ende der Ausgangsdatei erreicht wird.

Funktionen – Teile Seiten über Barcode:

  • Die Eingangsdatei wird seitenweise nach bestimmten Barcodetypen mit einem bestimmten Wert durchsucht, Teilstringplatzhalter (*,?,#) können verwendet werden.
  • Wird ein entsprechender Barcode auf einer Seite gefunden so wird die Seite horizontal an dieser Stelle geteilt. Ab dieser Position wird eine neue Datei erzeugt.
  • Der auf den Seiten gefundene Barcode Wert kann als Variable für Dateiname / Ordner oder Metadaten verwendet werden.
  • Wegscheiden – Oberer / Unterer Rand der Eingangsdatei in mm: Diese Bereiche werden „gelöscht“ und in der Ergebnisdatei nicht berücksichtigt. z.B. Briefkopf und Fußzeilen
  • Die Seitengröße der Ausgabedatei richtet sich automatisch nach der Eingangsdatei oder kann fix auf das A4 Hochformat festgelegt werden.
  • Um die geteilten Blöcke kontinuierlich aneinander zu reihen, werden weiße Bereiche (vor bzw. nach dem Block) erkannt und entfernt. (Schwarzanteil in % als Parameter)
  • Zur Formatierung der Ergebnisdatei kann der obere / untere Rand sowie der Abstand zwischen den Blöcken in mm festgelegt werden.

PDF Passwortunterstützung deaktivieren: Mit der PDFmdx Version 3.19.0 wurde eine neue Funktion implementiert um das PDF „Öffnen“ Passwort auch im Layout hinterlegen zu können. Dabei wurde im PDFmdx Editor bei allen geschützten Dateien, auch bei PDF Dateien die nur ein „Admin“ und kein „Öffnen“ Passwort besitzen, der Dialog mit der Passwortabfrage angezeigt. Um das zu verhindern kann man diese Funktion jetzt über einen Button im PDFmdx Editor generell deaktivieren.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.20.0

Neuerungen / Verbesserungen PDFmdx Version 3.20.0:

  • Wiederholungen & Wartezeit bei gesperrten Dateien: Falls eine Datei in einem der überwachten Eingangordnern beim Start der Verarbeitung durch eine andere Anwendung noch gesperrt ist so wird für diese Dateien automatisch eine *.lock Datei angelegt. Das passiert falls z.b. ein Scanner die Scans direkt in einen überwachten Ordner ablegt. Oft wird dabei zuerst die PDF Datei angelegt, gesperrt um dann Seite für Seite hinzuzufügen. Eine Datei fertig zu schreiben und die Sperre aufzuheben kann das je nach Umfang des Dokumentenstapels einige Minuten dauern. Um auch solche Situationen abzufangen wurden 2 Parameter implementiert um *.lock Dateien automatisch wieder zu entfernen. Damit lassen sich Anfangs gesperrten Dateien nach deren Freigabe automatisch verarbeiten.

Konfigurierbar sind die „Anzahl der Wiederholungen“ sowie die „Wartezeit zwischen den Wiederholungen“. Es wird also wiederholt überprüft ob die Datei noch gesperrt ist und falls diese freigegeben wurde, wird die *.lock Datei gelöscht und das PDF wird verarbeitet.

  • PDF Öffnen Passwort – XML Export der Vorlagen / Layouts: Beim XML Export der Vorlagen / Layouts können jetzt auch die im PDFmdx Layout hinterlegten Passworte zum Öffnen einer geschützten PDF Datei exportiert werden.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.19.0

Neuerungen / Verbesserungen PDFmdx Version 3.19.0:

  • Verbesserte Barcode Performance durch Vorverarbeitung: Es gibt jetzt einen neue Option um die Barcode Erkennung und Verarbeitung zu beschleunigen. Die bisherige Barcode Verarbeitung ist weiterhin vorhanden da es Anwendungsfälle geben kann bei der die bisherige Verarbeitung einen Vorteil bietet. Beide Implementierungen haben je nach Situation ihren Vorteil. Die Barcode Erkennung erfordert ein Image und nicht eine normale PDF Struktur mit Text und Linien. Für die Barcode Erkennung muss das PDF daher vorher gerendert werden.

Bei der bisherigen Implementierung wird nur der durch das Feld markierte Bereich gerendert. Da das nicht sehr lange dauert und um auch bei schlechten Scans ein besseres Ergebnis zu erzielen, wird das Rendering 3fach ausgeführt – mit 200, 300, und 400dpi.  Vorteil: Falls nur in einem einzelnen kleinen Bereich eine Barcode Erkennung stattfinden soll muss nicht alles gerendert werden bzw. falls Scans mit minderer Qualität verarbeitet werden.

Bei der neuen Funktion der „Barcode Vorverarbeitung“ wird das ganze PDF vorab mit 300dpi gerendert, alle im Template definierten Barcodetypen werden erkannt und für die spätere Verwendung gecached. Das funktioniert schneller da das Redering bzw. die Barcode Erkennung nur einfach mit 300dpi durchgeführt wird und die erkannten Werte für die Weiterverarbeitung gespeichert werden.  Vorteil: Falls es auf einer Seite mehrere Bereiche mit Barcodes gibt oder bei guter Qualität der Dokument bei der ein mehrfach Rendering nicht erforderlich ist.

  • Geschützte PDF verarbeiten – Öffnen Passwort: Bisher konnten Passwort geschützte PDF nicht verarbeitet werden. Jetzt gibt es eine Funktion um beim Layout das „PDF Öffnen“ Passwort zu hinterlegen. Für die Verarbeitung sind alle für den Job hinterlegten Passworte der ausgewählten Layouts geladen. Erkennt PDFmdx eine geschützte PDF Datei so wird mit der Passwortliste versucht das PDF hintereinander zu öffnen und zu entschlüsseln. Passt ein Passwort so wird das PDF geöffnet und entschlüsselt. Danach wird daraus ein neues, ungeschütztes PDF erstellt und normal über PDFmdx verarbeitet.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.18.0

Neuerungen / Verbesserungen PDFmdx Version 3.18.0:

  • Verbesserte Textextraktion – Durch die verbesserte Testextraktion konnten wir an Hand uns von Kunden zur Verfügung gestellten problematischen PDF´s die Textextraktion verbessern. Damit wurden auch bestimmte „problematische“ PDF verarbeitbar- Z.B.: bei sehr kleinem Text wurden Phantom Leerstellen eingefügt, bei Beträgen wurde der „.“ oder „,“ verschoben ausgegeben, bzw. horizontale Trennlinien erzeugt durch aneinandergereihte „_“ verhinderten das Auslesen in diesen Zeilen.
  • Ausgefüllte PDF Formulare verarbeiten – Formulare werden jetzt „gerendert“. Das PDF wird „verflacht“ in ein normales nicht mehr veränderbares PDF umgewandelt. Somit können die Felder wie bei jedem anderen PDF ausgelesen und von PDFmdx verarbeitet werden.
  • Neue Zähler Variablen für die Metadaten-Ausgabe – %COUNTER_GLOBAL% – Ein „globaler“ Zähler für den ein Startwert vorgegeben werden kann. Dieser wird jedes mal bei Ausgabe eines Datensatzes erhöht. %COUNTER_LOCAL% – der „lokale“ Zähler, wird nur für die Datensätze der aktuellen Verarbeitung erhöht und beginnt mit jedem Verarbeitungsjob wieder bei 1.

  • Performance-Optimierung bei Verwendung des Dateinamens um das Layout direkt über den Namen und nicht über Bedingungen auszuwählen.
  • PDFmdx Editor – Split Test Funktion – basiert jetzt auf der gleichen Routine wie die echte Verarbeitung. Fehlermeldungen werden direkt angezeigt und entsprechen den Fehlermeldungen die auch bei der Verarbeitung ausgegeben werden.
  • PDFmdx Editor – Felder / gleitende Gruppen auf anderen Seiten anzeigen – Normalerweise werden Felder auf einer bestimmten Seite des Musterdokuments positioniert. Felder können jedoch z.B. beim Auslesen von Positionsdaten über gleitenden Gruppen/Untergruppen auch auf anderen oder mehreren Seiten auszulesen sein. Um überprüfen zu können wie / wo die Felder auf anderen Seiten positioniert sind, bzw. welche Werte bei „gleitenden Feldern“ ausgelesen werden, gibt es jetzt eine Funktion um die positionierten Felder auch auf anderen Seiten einzublenden. Diese Anzeige wird beim Wechsel auf eine andere Seite wieder automatisch deaktiviert. Durch <CTRL>+<Pfeiltaste hinauf  / hinunter> lassen sich die Felder auch vertikal verschieben. Zusammen mit der <Shift> Taste mit größerer Schrittweite. Klickt man in ein angezeigtes Feld so wird in der Statuszeile der Feldname und der ausgelesene Text angezeigt.

  • Konfiguration des Ausgabenamens – Wird im Feld für den PDF Ausgabe Dateinamen ein nicht erlaubtes Zeichen z.b. einen „\“ verwendet, so werden bei der Verarbeitung nicht erlaubte Zeichen automatisch durch einen „_“ ersetzt.

  • ZUGFeRD XML über Variablen – Für die Festlegung der einzubettenden ZUGFeRD XML Datei können die „über PDFmdx zur Verfügung stehenden Variablen verwendet werden.

  • Zusammenfügen von PDF Dateien – Über die neue Funktion „Zusammenfügen“ können weitere PDF Dateien mit der verarbeiteten Datei zu einem Gesamt PDF zusammengefügt werden.

Funktionen Zusammenfügen:

    • „Zusammenfügen“ ermöglicht es ein oder mehrere PDF mit der über PDFmdx erzeugten Datei zu einem Gesamt-PDF zusammenzufügen.
    • Über eine Liste kann die Reihenfolge der zusammenzufügenden Dateien festgelegt werden.
    • Über Kriterien (UND / ODER / NICHT) kann an Hand von aus dem Dokument ausgelesenen Texten entschieden werden ob ein „Zusammenfügen“ erfolgen soll oder nicht.
    • Es können mehrere verschiedene „Zusammenfüge-Listen“ erstellt werden. Eine solche Liste kann mit einem bestimmten Layout verknüpft werden. Ein Layout kann über Kriterien erkannt und ausgewählt werden.
    • In der Zusammenfüge-Liste können entweder fix ausgewählte Dateien oder Pfade / Namen verwenden, die über aus dem Dokument ausgelesen Texte dynamisch bei der Verarbeitung erzeugt werden.
  • Neuimplementierung der EMail Funktion:
    • Für den Versand und EMail Verarbeitung wurde eine neue EMail Komponente implementiert.
    • Damit werden alle aktuellen Verschlüsselungsprotokolle (SSL2, SSL3, TLS1, TLS1.1, TLS1.2) unterstützt. Zu Beginn der Kommunikation mit dem SMTP EMail Server wird automatisch das am besten geeignete und unterstützte Protokoll  ausgehandelt und festgelegt.
    • Max. Größe der EMail konfigurierbar: Beim EMail Versand gibt es eine Option um alle EMail die an die gleiche EMail Adresse verschickt werden sollen zu einer einzigen EMail Nachricht zusammenzufassen. Es gibt jetzt einen eigenen Parameter um die Größe einer einzelnen zusammengefassten Nachricht zu limitieren,  z.B.: auf 10MB, Wird der Wert für eine Nachricht überschritten, erfolgt eine Aufteilung in mehrere EMails damit die max. eingestellte Größe nicht überschritten wird.
    • Im PDFmdx Prozessor gibt es für den EMail Versand jetzt eine eigene Logging / Protokoll Funktion. Diese kann für die erfolgreich verschickten als auch für die Fehler-Mail einzeln aktiviert werden. Ebenso kann der Ablage Pfad konfiguriert werden.
    • Die protokollierten EMail werden als EML Datei in zwei konfigurierbare Ordner (Erfolgreich/Fehler) abgelegt. Für ein Fehler EMail wird zusätzlich eine XML Datei mit Metadaten und Fehlermeldung angelegt. Für die Ablage der erfolgreich verschickten EMail kann pro Tag ein eigener Unterordner angelegt werden.
    • Anzeige der verschickten / Fehler EMail im PDFmdx Prozessor als Liste, über 2 Schaltflächen aufrufbar. Funktionen: Sortierung der Liste über Datum/Zeit, An, Betreff, Fehlermeldung, Ordner öffnen, EMail Nachricht anzeigen, Dateianhang öffnen. Lösche einzelne Nachrichten, Lösche alle Nachrichten.

 

Korrekturen PDFmdx Version 3.18.0:

  • Ausgelesene Barcodes wurden nicht auf Variablen zugeordnet und damit nicht in die Metadaten-Datei geschrieben.
  • Ausgelesener Text wurde für Variablen an verschieden Stellen nicht entsprechend der Konfiguration aufbereitet.
  • Barcodes konnten bei PDF mit Seitenrotation nicht ausgelesen werden – die Anzeige-Seitenrotation wurde nicht berücksichtigt.
  • „Erhaltener Wert“ Funktion hat die Werte für die Unterdatensätze nicht erhalten.
  • MRC-PDF (Mixed Raster Content) konnten nicht verarbeitet werden. Ein defektes PDF wurde ausgegeben.
  • PDFmdx Service Prozessor – Der Start zu einem vorgegebenen / wiederholten Zeitpunkt hat nicht funktioniert.
  • PDFmdx Prozessor – Bei der parallelen Verarbeitung konnte manchmal nicht in die Metadaten XLS(X) geschrieben werden, da diese von einem anderen Prozess noch offen und damit blockiert war.
  • PDFmdx Editor – Import von Vorlagen – Abfrage nach dem Überschreiben ist immer gekommen auch wenn keine Datei überschrieben werden sollte.
  • PDFmdx Editor – Erststart ohne Vorlage & Layout, danach Import einer Vorlage – Es wurde kein automatischer Refresh ausgeführt und die importierten Vorlagen & Layouts waren nicht sichtbar.
  • PDFmdx Editor – Beim Verschieben / Kopieren eines Layouts von einer Vorlage in eine Andere ist keine Abfrage hochgekommen dass ein Layout mit dem gleichen Namen bereits vorhanden war.
  • PDFmdx Editor – Löschen eines Layouts mit mehrfach verknüpften Bedingungen. Dabei blieben die AND / OR Knoten im Editor erhalten und wurden nicht automatisch bereinigt, was Verarbeitungsprobleme verursacht hat.
  • PDFmdx Editor – Bilder im HTML Body wurden beim Zusammenfassen der EMail an den gleichen Empfänger nicht in das EMail eingefügt und fehlten in der verschickten Nachricht.
  • EMails Versand – Trat beim EMail Versand unter bestimmten Bedingungen ein Fehler auf, so wurde die Verarbeitung abgebrochen bzw. der Dienst angehalten. Aus diesem Grund wurde der EMail Versand neu implementiert und um ein Logging der erfolgreichen und der Fehler EMail erweitert. (siehe Neuerungen).

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.16.6

Neuerungen PDFmdx Vorlagen Editor:

  • Vorlagen / Template Gruppen: Um die Übersichtlichkeit und die Verwaltung bei einer umfangreichen Anzahl an Vorlagen / Templates zu ermöglichen wurde eine zusätzliche „Gruppen“ Ebene implementiert. Damit lassen sich Vorlagen in Gruppen zusammenfassen. Im PDFmdx Editor bilden die Gruppen die oberste Ebene in der Baumansicht. Gruppen können – angelegt, der Name geändert, gelöscht bzw. hinauf und hinunter verschoben werden. Vorlagen einer ausgewählten Gruppe können Gesamt oder Einzeln exportiert bzw. importiert werden. Vorlagen einer Gruppe können in eine andere oder neue Gruppe verschoben werden.

 

  • E-Mail – Konfiguration über Profile: In einem Template können jetzt mehrere E-Mail Konfigurationen angelegt werden. Die E-Mail Konfigurationen werden dabei über Profile mit Namen verwaltet. E-Mail Profile können angelegt, kopiert, umbenannt und gelöscht werden. Bei den E-Mail Bedingungen kann ein bestimmtes E-Mail Profil zugeordnet werden. Damit ist nicht nur die E-Mail Funktion selbst, sondern auch das zu verwendende E-Mail Profil über Bedingungen steuerbar.

 

  • E-Mail – Verwendung von Variablen für Anhänge: Bisher konnten nur fix auswählbare und damit vorgegebene Anhänge mit dem PDFmdx Hauptdokument per E-Mail verschickt werden. Jetzt ist es auch möglich Variable für den Pfad und Dateinamen der zusätzlichen Anhänge zu verwenden. Über eine Option kann festgelegt werden ob, falls ein Anhang nicht vorhanden ist bzw. nicht gefunden werden kann, das E-Mail trotz dem verschickt, oder ob das als ein Fehler behandelt werden soll. Bei der Konfiguration wird zuerst eine Datei ausgewählt, in die Liste eingefügt, anschließend editiert und um die Variablen ergänzt.

  • E-Mail – Hauptdokument immer als erster Anhang: Beim E-Mail Versand kann neben dem über PDFmdx erzeugten Hauptdokument auch weitere zusätzliche Anhänge verschickt werden. Jetzt wird das von PDFmdx erzeugte Hauptdokument immer als erster Anhang eingefügt, die anderen zusätzlichen Anhänge werden immer danach eingefügt.
  • Gleitende Gruppe über 2 Seiten: Bei manchen Belegen kann es vorkommen dass ein Datensatz einer gleitenden Gruppen auf einer Seite beginnt und sich auf der Folgeseite fortsetzt. Gleitende Gruppen wurden bisher nur über eine Bedingung (DG) für den Beginn der Gruppe identifiziert. Der Datensatz wird zwar erkannt, kann aber nicht vollständig ausgelesen werden, da sich ein Teil davon auf der Folgeseite befindet.  Um für solche Fälle auch die Information der Folgeseite zu erfassen sind mindestens zwei „DG“ Bedingungen mit OR / ODER Verknüpfung erforderlich. Eine für den Anfang und eine für den Rest des Datensatzes auf der Folgeseite. Damit wird der ganze Datensatz erkannt und verarbeitet auch wenn sich dieser auf getrennten Seiten befindet.

  • Metadaten als XLS: Manche nachgelagerte Anwendungen können nur das alte XLS und nicht das aktuelle XLSX Format verarbeiten. Deswegen wurde jetzt auch wieder das XLS Format für die Metadaten-Ausgabe implementiert.
  • Neue PDF Voransicht Funktionen – Anzeige Text Ebene / Anzeige Text Blöcke: Eine gescanntes PDF das über OCR durchsuchbar gemacht wurde besteht sowohl aus eine Bild- als auch aus einer Text-Ebene. Die Bildebene zeigt das nur das gescannte Dokument. Aus dieser Ansicht ist nicht zu erkennen ob, wo und welcher Text dahinter liegt. Es gibt jetzt in der PDFmdx Editor Voransicht sowohl die Möglichkeit nur die Textebene anzuzeigen und die Bildebene auszublenden, als auch bei jeder dieser Darstellungen die Möglichkeit die Umgrenzung der Text Blöcke als grüne Rechtecke darzustellen. Damit kann einfach und schnell ersichtlich gemacht werden, welcher Text vorhanden ist und wo genau sich die Textblöcke befinden.

 

  • Felder / Variablen – Ersetzen von Werten über XLSX Tabelle: Bisher konnte nur eine CSV Datei verwendet werden um die Werte von Feldern/Variablen zu ersetzen. Jetzt ist es auch möglich eine XLSX Datei zu verwenden. Konfiguriert wird der Name der Spalte für den Suchschlüssel sowie die Spalte für den Ersatzwert.

  • Zähler als Stempel-Variable: Für Text- oder Barcode-Stempel gibt es jetzt auch eine Zähler Variable.  Über eine Option kann konfiguriert werden, ob der Zähler bei mehrfach Verwendung innerhalb des Dokuments oder erst mit jedem neuen Dokument erhöht werden soll. Der Startwert kann ebenfalls vorgegeben werden.

 

  • Visuelle PDF Signatur – Unterstützung transparenter Bilddateien: Mit der aktuellen Version können für die visuelle Darstellung der PDF-Signatur auch transparente Bilddateien (PNG, TIFF) verwendet werden.
  • Vorlagen als PMDX Einzeldaten exportieren: Bisher konnten mehrere oder alle Vorlagen nur als eine einzige PMDX Datei exportiert werden. bzw. falls man mehrere oder bestimmte Vorlagen als Einzeldateien exportieren wollte, musste das für jede Vorlage einzeln erfolgen. Jetzt kann über eine Option aus einer Template Gruppe heraus, jede in der Gruppen enthaltene Vorlage auch einzeln als separate PMDX Datei exportiert werden. Als Dateiname wird der Vorlagen Name verwendet.

 

Neuerungen PDFmdx Verarbeitung:

  • Erkennen und Exportieren einer im PDF enthaltenen ZUGFeRD XML Datei: Beim PDFmdx Job kann diese Option aktiviert werden. Dabei wird vorab jede zu verarbeitende PDF Datei geprüft ob diese eine ZUGFeRD XML Datei enthält. Falls eine solche XML im PDF als Anhang enthalten ist so wird die XML aus dem PDF extrahiert und in den konfigurierten Ordner unter dem PDF-Namen mit der Endung *.XML gespeichert. Wurde die Option „Verschiebe PDF“ aktiviert, so wird auch das PDF in diesen Ordner verschoben und nicht von PDFmdx verarbeitet.

  • Alle Layouts automatisch aktivieren: Fügt man einer Vorlage ein neues Layout hinzu, so muss im PDFmdx Prozessor beim Job dieses Layout auch aktiviert werden. Dies musste bisher manuell gemacht werden und wurde manchmal „vergessen“, wodurch das neu angelegte Layout nicht erkannt wird.  Für eine Vorlage als auch bei der Job Konfiguration gibt es jetzt eine Option um alle Layouts automatisch zu aktivieren. Damit werden immer alle neu hinzugekommenen Layouts automatisch aktiviert und können so nicht mehr „vergessen“ werden.

 

  • Fehler Protokoll mit Kopfzeile: Um den Inhalt der einzelnen Spalten des Fehlerprotokolls (Error.csv) einfacher interpretieren zu können wurde eine Kopfzeile mit den Namen der Spalten eingefügt um einen Rückschluss auf die Information der Felder zu bekommen.

 

PDFmdx Korrekturen:

  • E-Mail HTML Body – Dateinamen für Bilder können jetzt auch Leerstellen enthalten.
  • Ankerfeld nicht gefunden – Verknüpfte Felder bleiben jetzt leer und bekommen keine Werte zugeordnet.
  • Fuzzy Anker Suchfunktion wurde verbessert.
  • Fehlermeldung – XLSX blockiert: Im Laufe der Zeit kann eine XLSX Metadaten Datei sehr umfangreich werden. So ist es vorgekommen dass das Öffnen und Schreiben dieser XLSX länger gedauert hat und mehrere Prozesse auf diese Datei zugreifen wollten. Dadurch kam es zu Fehlermeldungen, der Zugriff war nicht möglich da die XLSX von einem andere Prozess noch gesperrt war. Dieses Problem wurde behoben. Es sollte jedoch trotz dem auch darauf geachtet werden dass solche Metadaten Dateien nicht unnötig groß werden.
  • Gleitende Gruppe – Eine Erkennung war bei PDF mit „Display Rotation“ nicht möglich.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.13.2

Neuerungen PDFmdx Vorlagen Editor:

  • Vorlagen teilen: Vorlagen können mit der Zeit auch sehr viele Layouts und Bedingungen enthalten. Enthält z.b. in einer Vorlage mehrere hundert Layouts so wird die Bearbeitung dieser langsam und unübersichtlich. Dafür bietet es sich an mehrere Vorlagen zu verwenden und die Layouts aufzuteilen. Für die Verarbeitung macht es keinen Unterschied. Um bestehende Vorlagen aufzuteilen gibt es dafür jetzt eine eigene Funktion. Dabei wird die Anzahl der Layouts pro Vorlage angegeben. Der PDFmdx Editor erzeugt daraus dann automatisch Vorlagenkopien und teilt die Layouts und die damit zusammenhängenden Bedingungen auf. Danach enthält jede Vorlage nur mehr die angegebene Anzahl an Layouts.

 

  • Layouts kopieren/verschieben: Zusammen mit der Funktion „Vorlagen teilen“ wurde auch die Funktion um Layouts in eine oder mehrere andere Vorlagen zu kopieren bzw. auch zu verschieben erweitert und neu implementiert. Bisher war es nur möglich ein Layout in eine andere Vorlage zu kopieren. Jetzt können in einer Vorlage die Layouts (ein oder mehrere) und die Ziel-Vorlagen (ein oder mehrere) ausgewählt werden. Ebenso ist es möglich die ausgewählten Layouts zu verschieben und nicht nur zu kopieren. Die Felder und deren Position in den Layouts bleiben erhalten bzw. werden in der Zielvorlage hinzugefügt.

  • Teilbereiche von Feldern auslesen: Beim Auslesen von Feldinhalten gibt es jetzt eine neue Funktion um gezielt und einfach einen bestimmten Teil eines Textes zu erhalten. z.b Falls ein einziges Feld alle Informationen zusammengefasst und über Trennzeichen z.b. „/“ getrennt enthält. z.b. „XKEY GmbH\Gerstlgasse30\1210\Wien“. Mit Hilfe der neu implementierten Regex Funktion kann über die Angabe von „#SPLIT#\“ plus der Position im String konfiguriert werden welcher Teil ausgelesen und für die Belegung der Variablen verwendet werden soll. So kann z.b. die PLZ = 1210 durch die Angabe von „#SPLIT#\“ + „3“ ausgelesen und ermittelt werden.

      

  • Seitenlimit für Verarbeitung konfigurierbar: Oft befindet sich die für die Verarbeitung erforderliche Information nur auf der ersten bzw. auf den ersten Seiten. Um die Verarbeitung sehr umfangreicher PDF Dokumente welche auch einige hundert Seiten umfassen können zu beschleunigen, kann bei der Vorlage jetzt auch ein Seitenlimit (z.B.: 2) gesetzt werden. Damit wird festgelegt dass nur die angegebenen Seiten und nicht immer alle Seiten des Dokuments einlesen und verarbeitet werden.

  • Bedingungs-Editor
    • Einzelne Bedingungen, Teilstrukturen aber auch der ganze Bedingungsbaum kann über das Clipboard von einer Vorlage in eine Andere kopiert werden.
    • Trennzeilen können kopiert / ausgeschnitten und an einer beliebigen Stelle in der Struktur wieder eingefügt werden.
    • (M)emory Funktion um eine bestehende Bedingung als Vorüberlegung für alle neu hinzugefügten Bedingungen zu verwenden. M – setzt die aktuell ausgewählte Bedingung als Default, C – Löscht diese Vorbelegung wieder. Diese Voreinstellung ist Vorlagen spezifisch und wird mit dieser auch gespeichert und wiederhergestellt.
    • Checkbox um festzulegen ob eine neu anzulegende Bedingung am Beginn oder am Ende der aktuellen Ebene in der Baumstruktur eingefügt wird. Bisher wurden eine neue Bedingung immer am Anfang einer Knotenebene eingefügt wodurch es bei großen Baumstrukturen notwendig war die Bedingung immer nachträglich nach unten zu verschieben um wieder an den Ausgangspunkt zu kommen.

   

  • Briefpapier beim Ausdruck / EMail Versand nicht anwenden: Werden Dokumente sowohl auf Drucker ausgegeben bzw. auch als EMail verschickt so kann es erforderlich sein das Briefpapier für die Druckausgabe nicht anzuwenden da sich im Drucker bereits Briefpapier befindet, das EMail aber mit Briefpapier verschickt werden soll. Mit dieser Option kann das gezielt gesteuert werden.

  • Einzeldokumente sortiert zusammenfügen: Um beim Erfassen von Belegen vorher nicht auf eine bestimmte Reihenfolge/Sortierung achten zu müssen, bzw. um Einzelbelege über einen ausgelesenen Feldinhalt  sortiert zu einem Gesamtdokument zusammenzufügen, wurden 2 neue Funktionen – „Anhängen“ sowie „Sortiert einfügen“ bei der Ausgabekonfiguration implementiert.
    • „Anhängen“ – Wird bei der Ausgabe ein PDF mit dem gleichen Namen gefunden so wird die neue Datei an die bestehende Datei hinten angefügt.
    • „Sortiert einfügen“ – Bei der Konfiguration muss ein Feld ausgewählt werden nach dem die Sortierung erfolgen soll. Dabei wird ein PDF Lesezeichen mit dem Text des ausgewählten Sortierfeldes erzeugt. Wird bei einer nachfolgenden Ausgabe eine Datei mit dem gleichen Namen gefunden so wird das neue Dokument an Hand des Sortierfelds an der richtigen Stelle im PDF eingefügt oder angehängt. Bei „Leer“ bzw. gleichem Inhalt wird hinten angehängt.

 

  • PDF Display Rotation wird berücksichtigt: PDF Dateien können über einen „Display Roatation“ Parameter (0,90,180,270) enthalten. Z.B.: Kann bei Dokumenten die gedreht eingescannt wurden über den „Display Rotation“ Parameter die Darstellung entsprechend korrigiert werden um die Seiten immer im Hochformat anzuzeigen. Der Parameter dient aber nur für die Anzeige am Bildschirm, intern ist die PDF Datenstruktur jedoch weiterhin rotiert (z.b. am Kopf stehend). Die aktuelle Version von PDFmdx erkennt die PDF „Display Rotation“ und berücksichtigt diese, so dass die Darstellung auch der Verarbeitung entspricht und die Felder von den richtigen Positionen ausgelesen werden.
  • EasyArchiv (IMP) Export Format: Das EasyArchiv IMP Metadaten Ausgabeformat ist eine Art CSV Format. Es enthält eine individuell zu konfigurierende Kopfzeile sowie Folgezeilen mit den PDFmdx Metadaten. Als  Feldbegrenzung ist das „^“ und als Feldtrennzeichen der „,“ (Beistrich) vorgegeben. Für die Folgezeilen stehen wie bei allen anderen Formaten die Felder / Variablen zur Auswahl zur Verfügung.

Beispiel einer IMP Kopfzeile: @FOLDER,FT:B2B_Netz,FN:Partner,FN:B2BMessageID,FN:MailMessageID,FN:RefNr,FN:Sender,FN:B2BSystem,BI:2001
FT: = Dokument Typ, FN: = Feldnamen. Diese Zeile muss entsprechend dem Archiv in das importiert werden soll individuell konfiguriert werden.

  • OCR Zuverlässigkeit beim Bereichs OCR: Für die positionierten Felder gibt es bei PDFmdx auch die Möglichkeit den Text aus dem Bild über eine OCR Funktion zu ermitteln. Bisher war intern die OCR Zuverlässigkeit fix mit 60% vorgegeben. Jetzt ist dieser Schwellwert konfigurierbar und wird auch bei der Voransicht für die Textausgabe in der Fußzeile des PDFmdx Editors, als Information ausgegeben.

 

Neuerungen PDFmdx Verarbeitung:

  • Job Trigger Funktion:  Der Start der Verarbeitung einer oder mehrere Jobs kann durch das Ende der Verarbeitung eines anderen Jobs angestoßen werden. Alle Jobs die über einen Trigger gestartet werden müssen in der Jobliste deaktiviert sein ansonsten wird die Verarbeitung über die Ordner Überwachung ausgelöst und nicht über den Trigger. Bei diesen Jobs wird der Start der Verarbeitung nur mehr über den Trigger eines anderen Jobs ausgelöst. Durch einen Trigger kann auch die sortierte Verarbeitung sichergestellt werden. Dabei wird der nächste Verarbeitungsschritt erst gestartet nachdem alle Dateien eines vorangegangenen Jobs fertig verarbeitet wurden.

  • Sortierte Verarbeitung von Eingangsdateien: Dateien in überwachten Ordnern können jetzt auch sortiert (auf / absteigend) nach Name, Größe, Erstellungs- und Änderungs-Datum verarbeitet werden. Dazu muss die Option „Blockverarbeitung“ aktiviert sein. Der Start einer sortierten Verarbeitung erfordert einen definierten Zeitpunkt. Er kann über den Intervalltimer, zu einem eingestellten Zeitpunkt,  durch eine *.rd Datei, durch den Trigger eines anderen Jobs oder durch Drücken von „Start Verarbeitung“ ausgelöst werden.

  • Fehler EMail Adresse pro Job: Pro Job kann eine individuelle Fehler EMail Adresse festgelegt werden. Diese übersteuert die generell im PDFmdx Prozessor festgelegte, für alle Jobs geltende Fehler EMail Adresse.

  • Parallele Verarbeitung: Erfolgt auf Basis der Jobs, nicht jedoch um innerhalb eines Jobs mehrere Dokumente parallel zu verarbeiten.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.11.1

Neuerungen der PDFmdx Version 3.11.1:

  • PDF Passwortschutz über Variablen: Immer mehr PDF Dokumente sollen per EMail verschickt werden. Oft enthalten diese aber Informationen die nicht ungeschützt per EMail übermittelt werden sollen und dürfen. z.b. Dokumente aus der Lohnverrechnung. Für solche Anwendungsfälle muss ein mit dem Empfänger individuell vereinbartes Passwort verwendet werden. Mit der neuen PDFmdx Version können jetzt auch Variablen und damit Werte die aus dem Dokument ausgelesen werden für die Verschlüsselung und den Schutz der PDF verwendet werden. Durch die ebenfalls neue Funktion eine externe CSV Dateien als Ersatztabellen zu verwenden, können Passwortlisten auch extern gehalten werden um z.b. eine Kundennummer aus dem Dokument als Schlüssel für die Passwortvergabe zu nutzen.
  • AES 256 – Verschlüsselung: Durch die Aktualisierung der PDFSecureSign Komponente ist es jetzt auch möglich die PDF Dateien durch eine AES 265 Verschlüsselung noch besser zu schützen.

  • CSV Lookup Datei: Bei der Felddefinition gibt es eine Funktion um ausgelesene Werte zu ersetzen. Bisher mussten die Werte über den PDFmdx Editor erfasst und verwaltet werden. Jetzt gibt es auch die Möglichkeit eine externe CSV Datei als Ersatztabelle zu verwenden. <Text>;<Ersetzen mit>. z.b. für EMail Adressen oder Passwortlisten wobei beispielsweise die Kundennummer als Schlüssel verwendet wird. Der CSV Lookup wird an die über den Editor konfigurierte Ersatztabelle angefügt und hat damit niedrigere Priorität.

  • ZUGFeRD XML Extraktion: Falls eine zu verarbeitende PDF Datei bereits eine ZUGFeRD XML enthält gibt es jetzt eine Funktion um diese XML zu erkennen und in einen konfigurierbaren Ordner zu exportieren. Der Name der XML wird auf Basis der über PDFmdx erstellten PDF Datei  erzeugt.

  • EMail Absender über Variablen: Bei der EMail Konfiguration konnte bisher nur pro Vorlage eine individuelle Absenderadresse angegeben werden. Jetzt ist es auch möglich die Absenderadresse für jedes Dokument / EMail individuell über Variablen zu vergeben.

  • Bedingungen für EMail und Druck: Bisher konnte der EMail Versand und die Druckausgabe für eine Vorlage nur entweder generell aktiv oder inaktiv geschaltet sein. Jetzt ist es auch möglich den EMail Versand und die Druckausgabe individuell pro Dokument über Bedingungen zu steuern. Dafür steht ein Bedingungseditor gleich wie für das Erkennen / Teilen der Dokumente zur Verfügung.

  • Fehlerbehebung: Konfigurationsänderungen im PDFmdx Editor wurden nicht gespeichert.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.9.0

Neuerungen der PDFmdx Version 3.9.0:

  • Manuelle Sicherung von Vorlagen: Funktion um die Sicherung aller oder einzelne Vorlagen manuell anzustoßen. Die Sicherungsdateien (*.pmdx) werden in einem konfigurierbaren Ordner abgelegt und über ihren Namen bestehend aus Vorlage / Datum / Zeit unterschieden.

 

  • Über Bedingungen, Dateien in einen in einen anderen Ordner verschieben: Damit können Dateien die nicht verarbeitet werden sollen, vor der eigentlichen PDFmdx Verarbeitung über Bedingungen ausgesondert bzw. in einen anderen Verarbeitungsordner „umgeleitet“ werden. Dafür wird eine normale Vorlage mit Bedingungen verwendet. Trifft eine Bedingung zu so wird die Datei aus dem Eingangsordner ohne weitere PDFmdx Verarbeitung direkt in den konfigurierten Zielordner verschoben.

  • Die PDF2Printer – Druck-Integration wurde überarbeitet und erweitert: Die Auswahl der Variablen zur Steuerung erfolgt direkt über die Felder einer Vorlage. Über den Dokumenteninhalt kann neben dem Drucker jetzt auch der Papierschacht ausgewählt werden.

  • Variablen für den Dateinamen der Metadaten-Datei (CSV, XLS…): Statt einen fix vorgegebenen Namen können jetzt alle zur Verfügung stehenden Variablen verwendet werden.

  • Vertikal dynamische Felder sind jetzt nicht nur bei Gruppen- sondern auch bei Untergruppenfeldern verwendbar.

  • Feldposition bleibt erhalten und kann wiederhergestellt werden: Wurde für ein Layout eine andere PDF Vorlagen Datei ausgewählt so konnte es vorkommen dass die Positionierung/Größe der Felder auf der Vorlage „verlorenging“. Z.b.: falls das neue PDF weniger Seiten hatte oder Felder entfernt und danach wieder hinzugefügt wurden. Dabei blieb die Feld Position und Größe nicht erhalten. Die Felder musste neu positioniert und der Auslesebereich neu festgelegt werden. Jetzt wird diese Information in der Datenstruktur gespeichert auch falls das Feld nicht mehr auf einer Seite positioniert ist. Damit kann die Feld-Position und Größe über „Bereich hinzufügen“ wieder hergestellt werden.

 

  • Datei / Ordner-Link im XLS hinterlegen:  Eine neue Option ermöglicht es in der XLS Ausgabedatei einen Link unter die Spalten für „%OUTPATH%“, „%OUTFILENAME%“ und „%OUTFOLDER%“ zu hinterlegen. Damit lässt sich die PDF-Datei bzw. der Ordner direkt über eine Klick auf die Zelle im XLS öffnen.

  • Aktualisierung der PDFCompressor, PDFSign, PDF2PDFA Basiskomponenten auf den aktuellen Stand.
  • Die Endverarbeitung für PDF/A Konvertierung, PDF Komprimierung und PDF Signatur erfolgt jetzt nicht mehr im Ausgabe- sondern in einem temporären Ordner. Erst nachdem alle Verarbeitungsschritte abgeschlossen sind, wird die PDF Datei in den endgültigen Zielordner verschoben.
  • Fehlerbehebungen: PDFmdx Editor: Email Einstellungen für alle Bilder einbetten, Email versenden, EMail Filter Optionen wurde nicht gespeichert, Aus über iPaper erzeugte PDF Dateien konnte kein Text ausgelesen werden, Metadaten Datei wurde nicht erzeugt, falls keine Felder auf dem Layout positioniert wurden.

Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.8.1 – DataMatrix 2D Barcode für Pitney Bowes Relay Kuvertiersystem

Neuerungen der PDFmdx Version 3.8.1:

  • Pitney Bowes DataMatrix Barcode:

Mit dem Pitney Bowes Relay Kuvertiersystem ist es möglich Briefe oder Rechnungen automatisch zu kuvertieren. Das Kuvertiersystem verfügt über eine Kamera um einen auf der Seite aufgebrachten DataMatrix 2D Barcode zu erkennen, auszulesen und damit die Kuvertiermaschine zu steuern.  Der 2D Barcode muss einen genau definierten Aufbau haben. Er enthält eine 14 stellige Kennung des Dokuments, z.b. die Rechnungsnummer, die Seitennummer im Dokument, die Anzahl der Seiten des Dokumentes und am Ende einen Zähler der über das ganze Dokument fortlaufend sein muss. Über diesen Code kann die Kuvertiermaschine erkennen wann ein neuer Brief beginnt und auch feststellen ob ein Blatt fehlt oder nicht in der richtigen Reihenfolge im Stapel liegt.

Bei der Stempel Variablendefinition gibt es jetzt eine eigene „Pitney Bowes“ Checkbox um einen solchen vorgegebenen Aufbau zu erzeugen und als DataMatrix 2D Barcode auf die einzelnen Seiten aufzubringen.

Die Eingangs- als auch die Ausgangsdateien werden über den Dateinamen sortiert verarbeitet, sowie sortiert ausgegeben, z.B. über die aus der Rechnung ausgelesene Rechnungsnummer. Mit Hilfe der Merge2Print Kommandozeilen Anwendung kann anschließend eine sortierte PDF Gesamt-Datei für den Ausdruck erzeugt werden.  Auf Grund der Anforderung, dass der gesamte Ablauf sortiert erfolgen muss, kann nur der ausführbare EXE Prozessor von PDFmdx nicht jedoch der PDFmdx Dienst verwendet werden. Zusätzlich muss „Blockverarbeitung“ aktiviert werden.

 

Download – 2D Barcode Spezifikation – Pitney Bowes Relay >>>

  • Start der Verarbeitung über *.rd Datei:

Bisher konnte die PDFmdx Verarbeitung (ausführbare EXE Anwendung oder Windows Dienst) entweder zeitgesteuert (Timer, Datum, Täglich, Wöchentlich) oder über das Einfügen von PDF Dateien in einen überwachten Ordner gestartet werden. Es gibt jedoch Anwendungen bei denen es wichtig ist, dass zuerst alle Dateien im Eingangsordner vorhanden sind um erst dann eine sortierte Verarbeitung zu starten. Dafür gibt es jetzt die *.rd Option. Ist diese Option aktiviert so startet die Verarbeitung erst wenn eine *.rd Datei z.b. „Ready.rd“ in den überwachten Ordner kopiert wird. Damit kann die Verarbeitung kontrolliert zum gewünschten Zeitpunkt gestartet werden.

 

Info: Ab der PDFmdx Version 3.8.0 ist .NET Runtime Version 4.5 erforderlich

Download – PDFmdx Template Editor & Processor >>>

Webshop