PDFmdx Version 3.5.0 verfügbar

Neuerungen PDFmdx Version 3.5.0:

  • Untergruppen – zusätzliche Hierarchie für gleitende Gruppen: Eine gleitende Gruppe dienen dazu um z.b. Rechnungspositionen die in einem Dokument bzw. auf einer Seite mehrfach vorkommen zu erkennen und um daraus mehrere Datensätze bilden zu können. Es gibt jedoch Belege bei denen diese Datensätze eine weitere Hierarchiestufe erfordern, z.b. falls unter einer Position mehrere Unterdatensätze vorkommen um z.B. verschiedene Ausprägungen eines Artikels nach Farbe oder Größe zu unterscheiden. Das kann entweder als Liste oder aber auch in Form einer Matrix erfolgen. Um solche zusätzlichen Ausprägungen auch erkennen und auslesen zu können gibt es jetzt die Möglichkeit „Untergruppen“ zu einer gleitenden Gruppe zu bilden.

Es gibt damit jetzt 3 Feldebenen – die „Dokumentenfelder“, die „Gruppenfelder“ und die „Untergruppenfelder“. Untergruppen-Datensätze werden wie die Gruppen-Datensätze über Bedingungen definiert. Bei der Ausgabe stehen für Untergruppen-Datensätze auch die Information des Dokuments und der Gruppe zur Verfügung.

Für die Ausgabe kann konfiguriert werden ob – alle Datensätze ausgegeben, oder ob die Gruppen bzw. der Dokumenten Datensätze unterdrückt werden sollen. Die Felder der darüber liegenden Ebenen stehen bei der Ausgabe auch im Gruppen / Untergruppen-Datensatz zur Verfügung.  Zur Identifikation der Datensatzebene kann die Variable  %RECORD_LEVEL% mit den Werten (D)ocument, (G)roup, (S)ubgroup verwendet werden.

Die Felder der unterschiedlichen Ebenen werden im PDFmdx Editor farblich unterschiedlich dargestellt – Dokumentenfelder „Blau“, Gruppenfelder „Rot“ und Untergruppenfelder „Grün“.

Der Arbeits-/Suchbereich für die gleitende Gruppe / Untergruppe wird im PDFmdx Editor über 2 horizontale rote Linien dargestellt, welche Vertikal in der Voransicht positioniert werden können. Die Suche nach Datensätzen erfolgt nur innerhalb des festgelegten Bereichs.

  • MS-SQL Datenbank Support für Metadaten / Log & Error Log Funktion: Neben dem Export der Metadaten in eine XLSX / CSV / XML Datei gibt es jetzt auch die Möglichkeit die Datensätze in MS-SQL Datenbank-Tabellen zu schreiben. Die ausgelesenen Werte werden als Dokumenten / Gruppen / Subgruppen Datensätze mit konfigurierbaren Feldern und Inhalten geschrieben, die Log- Tabelle mit einem fix festgelegten Aufbau.

MS-SQL Export Funktionen:

    • Konfiguration – MS-SQL Server / Datenbank.
    • SQL Tabellen anlegen / löschen / Daten aus den Tabellen löschen.
    • SQL Spalten in der ausgewählten Tabelle anlegen / löschen.
    • Für jedes Template kann, der SQL Export aktiviert, sowie die SQL Tabelle ausgewählt werden. Jeder SQL Spalte können Felder (Variablen) oder fixer Text zugeordnet werden.
    • SQL – Logging / Error Log aktivieren. Der Name der Log-Tabelle ist konfigurierbar.
    • Das SQL-Log enthält folgende Informationen: PROCESS_ID, Rechnername (WsName), Benutzername (UserName), Vorlage (Template), Layout, Status (OK, ERROR), Fehler Code (ErrorCode), Fehlernachricht als Text (ErrorMessage), Info über die Ein / Ausgabedatei (InputPath, InputFileName, InputFolder, OutputPath, OutputFileName, OutputFolder), Beginn/Ende der Verarbeitung (StartTime, EndTime), Verarbeitungsdauer (ProcessingTime).

PDFmdx Fehler Codes im Log:

    • 0 = Erfolgreiche Verarbeitung.
    • 1 = Keine im PDF verbleibenden Seiten.
    • 2 = Konfiguriertes Briefpapier konnte nicht gefunden werden.
    • 3 = Fehlende Lizenz.
    • 4 = Fehler beim Laden des Text Plugins.
    • 5 = Fehler beim Schreiben der PDF Datei.
    • 6 = Keine für die angegebenen Kriterien passende Vorlage / Layout gefunden.
    • 7 = Fehler beim Schreiben der Drucker (PCF) Konfigurationsdatei.
    • 8 = Verarbeitungsfehler.
    • 9 = Fehler beim Anlegen des Ausgabe Ordners.
    • 10 = Fehler beim Erzeugen der Ausgabedatei.
    • 11 = Fehler beim Überlagern / Hinterlegen des Briefpapiers.
    • 12 = Fehler beim Signieren.
    • 13 = Fehler beim EMail Versand.
    • 14 = Fehler beim Schreiben der Metadaten.
    • 15 = Fehler beim Erzeugen der XML Datei.

  • PDFmdx Editor – Test Funktion: Die Test-Funktion im PDFmdx Editor und die PDFmdx Verarbeitung basieren jetzt auf der gleichen Komponente. Damit wird sicher gestellt dass das Ergebnis beim „Test“ im PDFmdx Editor für die Erkennung, das Teilen und Auslesen das gleiche Ergebnis bringt wie bei der Verarbeitung durch den PDFmdx Prozessor.

In einer PDFmdx Vorlage kann konfiguriert werden ob und wie ein Layout über Bedingungen identifiziert werden soll. Bei der „Test“ Funktion im PDFmdx Editor werden die Bedingungen geprüft, das erkannte Layout identifiziert und die über das Layout festgelegten Felder ausgelesen. Auf der Test-Maske gibt es jetzt eine Checkbox um die Layout-Erkennung / Kriterien zu ignorieren. Die Felder werden dann nur über das manuell ausgewählte Layout gelesen und angezeigt.

  • Feld-Teilstring vom Ende. Die Teilstring-Feldfunktion ist jetzt nicht nur vom Beginn eines Feldes, sondern auch vom Ende aus möglich (umschaltbar).

  • Neue OCR Version, mehrere Erkennungssprachen: Die Bereichs OCR Funktion für Felder wurde aktualisiert und basiert jetzt auf der Tesseract Version 4.0. Damit ist jetzt auch die Erkennung mehrere Sprachen möglich.

  • Vorgabewerte für Felder – Layout bezogen: Es gibt neben der Funktion einen generellen Vorgabewert zu vergeben, jetzt auch eine Funktion um für jedes Layout einen individuellen Vorgabewert für ein Feld zu vergeben. Eine Variable bekommt den Vorgabewert zugewiesen falls das Feld auf einem Layout nicht positioniert wurde bzw. wenn ein Feld positioniert wurde  aber nichts ausgelesen werden kann da der Bereich leer (=blank) ist. Damit kann über die Layouterkennung einer Variablen ein fixer Wert zugewiesen werden. z.b. eine Kundennummer die nicht direkt aus dem Dokument ausgelesen werden kann.
  • Neuer „Zusammengesetzt“ Feldtyp: Der Typ „Zusammengesetzt“ erlaubt es kombinierte Felder zu erzeugen, die aus mehreren anderen Feldern bzw. Text bestehen. Solche zusammengesetzten Felder stehen für die Ausgabe (Ordner, Dateiname, Metadaten), nicht jedoch für Bedingungen zur Auswahl. Diese Felder können aus Variablen der Dokumenten / Gruppen und Untergruppen zusammengesetzt werden.

  • Option – Keine verbleibenden Seiten – Dokument nicht in den Fehler Ordner verschieben: Beim Teilen, Löschen von Seiten (Deckblätter) sowie Löschen von leeren Seiten kann es vorkommen dass das Restdokument über keine weiteren für die Verarbeitung verbleibenden Seiten mehr verfügt. Diese Option legt fest ob das „Rumpfdokument“ erhalten bleiben soll und in den Fehler Ordner verschoben wird oder ob ein solches Dokument nicht erhalten bleibt und der Vorgang nur im Error-Log protokolliert wird.

  • Export zusätzlicher Formate, auswählbar für – „Erfolgreich / Fehler / Beides“: Damit ist es jetzt auch möglich die in den Error Folder verschobenen PDF Dateien zusätzlich in andere Formate z.b. TXT zu konvertieren um weitere Auswertungen durchzuführen.

Download – PDFmdx Template Editor & Processor >>>

Webshop