PDFmdx Version 3.20.0

Neuerungen / Verbesserungen PDFmdx Version 3.20.0:

  • Wiederholungen & Wartezeit bei gesperrten Dateien: Falls eine Datei in einem der überwachten Eingangordnern beim Start der Verarbeitung durch eine andere Anwendung noch gesperrt ist so wird für diese Dateien automatisch eine *.lock Datei angelegt. Das passiert falls z.b. ein Scanner die Scans direkt in einen überwachten Ordner ablegt. Oft wird dabei zuerst die PDF Datei angelegt, gesperrt um dann Seite für Seite hinzuzufügen. Eine Datei fertig zu schreiben und die Sperre aufzuheben kann das je nach Umfang des Dokumentenstapels einige Minuten dauern. Um auch solche Situationen abzufangen wurden 2 Parameter implementiert um *.lock Dateien automatisch wieder zu entfernen. Damit lassen sich Anfangs gesperrten Dateien nach deren Freigabe automatisch verarbeiten.

Konfigurierbar sind die „Anzahl der Wiederholungen“ sowie die „Wartezeit zwischen den Wiederholungen“. Es wird also wiederholt überprüft ob die Datei noch gesperrt ist und falls diese freigegeben wurde, wird die *.lock Datei gelöscht und das PDF wird verarbeitet.

  • PDF Öffnen Passwort – XML Export der Vorlagen / Layouts: Beim XML Export der Vorlagen / Layouts können jetzt auch die im PDFmdx Layout hinterlegten Passworte zum Öffnen einer geschützten PDF Datei exportiert werden.

Download – PDFmdx Template Editor & Processor >>>

SplitBarcode – 1D / 2D Barcodes erkennen, auslesen, PDF Dokumente teilen

SplitBarcode dient dazu um 1D / 2D Barcodes in PDF Dokumenten zu erkennen bzw. auch in Einzeldokumente zu teilen. Die ausgelesene Barcode-Information kann über Variablen für die Namensgebung und Ablage der neu erzeugten Dateien verwendet werden. Metadaten über die erkannten Barcodes können für jedes PDF einzeln, oder auch als XML, XLSX, CSV Gesamtdatei erzeugt werden.

Unterstützte 1D / 2D Barcode-Typen: Australian Post, Aztec, Codabar, Code11, Code128, Code16K, Code39, Code93, DataMatrix, DotCode, DutchKIX, EAN13, EAN13Plus2, EAN13Plus5, EAN8, EAN8Plus2, EAN8Plus5, HanXinCode, IATA2of5, IntelligentMail, Interleaved2of5, MailMark4StateC, MailMark4StateL, Matrix2of5, MatrixCode, MicroPDF417, MicroQR, MSI, PatchCode, PDF417, PDF417Compact, Pharmacode, Planet, Plus2, Plus5, Postnet, QR, RoyalMail, RSS14, RSS14Stacked, RSSExpanded, RSSExpandedStacked, RSSLimited, Standard2of5, Telepen, UPCA, UPCAPlus2, UPCAPlus5, UPCE, UPCEPlus2, UPCEPlus5.

SplitBarcode Funktionen:

  • Erkennen und Auslesen von 1D / 2D Barcodes (51 Barcodetypen).
  • Teilen von Dokumentenstapel in Einzeldateien.
  • Löschen von Leerseiten.
  • Erzeugen von XML, CSV, XLSX Metadaten Dateien.
  • Die Konfiguration erfolgt über den SplitBarcode Editor, um Vorlagen (unterschiedliche Einstellungen und Konfigurationen), mit mehreren mit der Vorlage verknüpften Layouts (unterschiedliche Positionen der Felder) zu erzeugen.

SplitBarcode Editor: Eine Vorlage enthält alle Einstellungen und Konfigurationen (Felder, Bedingungen, Ausgabe, PDF Infofelder, Barcodes). Mit der Vorlage verknüpft sind ein oder mehrere Layouts. Ein Layout benötigt eine PDF Musterdatei auf der die durch die Vorlage definierten Felder in Größe und Position festgelegt werden.

SplitBarcode Vorlagen Editor – Funktionen:

  • Vorlage – hinzufügen, umbenennen, kopieren, löschen, importieren / exportieren, Layout – hinzufügen, umbenennen, kopieren, löschen.
  • Definition von Feldern um die ausgelesenen Barcode Infos über Variablen verwenden zu können.
  • Zuordnung der zu erkennenden Barcode-Typen zu den Feldern. Pro Feld kann festgelegt werden welche der 51 Barcode Typen erkannt werden sollen.
  • Aufbereitung der ausgelesenen Barcode-Werte über RegEx, Entferne: Rechts / Links / Leerzeichen / Nullen, Text ersetzen über Tabelle oder über externe CSV / XLS Datei.
  • Für jedes Barcode Feld stehen neben dem ausgelesenen Wert auch weitere Informationen als „Untervariablen“ zur Verfügung: bc_read – der originär ausgelesene Barcode, bc_processed – der gemäß Konfiguration aufbereitetet Barcode Wert, bc_page – die Seite auf dem der Barcode gefunden wurde, bc_type – die Barcode Type, bc_dir – die Barcode Ausrichtung in Grad, bc_left – die Barcode Position links in mm, bc_top – die Barcode Position oben in mm, bc_width – die Barcode Breite in mm, bc_height – die Barcode Höhe in mm,
  • Identifizieren und Zuordnen der zu verarbeitenden Dokumente über Vorlage / Layout, an Hand von Bedingungen (UND / ODER / NICHT) sowie Teilstring (*, #, ?) Kriterien.
  • Teilen von Dokumentenstapel in Einzeldateien – über Seitenzahl, Änderung eines Feldwertes oder über Kriterien.
  • Erkennen und Entfernen von Leerseiten über Festlegung eines max. Schwarzanteils in %
  • Ausfüllen der PDF Infofelder (Titel, Autor, Betreff, Schlüsselworte) mit Text bzw. über ausgelesene Feldwerte.

   

SplitBarcode Layout Editor – Funktionen:

  • PDF Musterdatei (Prototyp) auswählen / speichern,  Seite wählen, hinauf, hinunter, Zoom, Ansichtsauswahl.
  • Je Layout können die definierten Felder visuell / interaktiv auf einer geladenen PDF Musterdatei positioniert und in ihrer Größe festgelegt werden.
  • Anzeige für positionierte Felder: Position, Größe, Barcode Wert, Barcode Type
  • Feldfunktionen: Barcode Type automatisch erkennen, Bedingung aus dem Feld erstellen und in den Bedingungseditor einfügen.
  • SplitBarCode Layout Editor Testfunktion – Test der aktuellen Konfiguration an Hand des PDF Prototyps bzw. gegen andere PDF Dateien – Testet die Kriterien für das Erkennen und Teilen.  Das erkannte Layout, die ausgelesenen und aufbereiteten Feldwerte, die Seiten an denen das Dokument geteilt wird, sowie die zu löschende Seiten werden angezeigt.

       

SplitBarcode Verarbeitung:

  • Für die Verarbeitung werden die zu verwendenden Vorlagen / Layouts aktiviert und können über Profile verwaltet werden.
  • Das zu verarbeitende PDF Dokument wird gegen alle aktivierten Vorlagen / Layouts entsprechend der definierten Kriterien validiert. Trifft ein Kriterium zu so wird das Dokument entsprechend der Vorlagendefinition verarbeitet. Trifft kein Kriterium zu so wird ein Fehler ausgeworfen bzw. die Datei in den Fehlerordner verschoben.
  • PDF-Dateiausgabe – Konfiguration von Zielpfad und Dateiname unter Verwendung der definierten Felder/Variablen. Für bestehende Dateien kann Überschreiben, Dateinamen-Zähler sowie Anhängen konfiguriert werden.
  • Metadaten Ausgabe: Konfiguration von Zielpfad und Dateiname unter Verwendung der definierten Felder/Variablen. Ausgabe als XML, XLSX, CSV Datei, als Gesamtdatei oder als Einzeldatei pro erzeugtem PDF, Spaltendefinition für die XLSX / CSV Datei über Feld / Variablenauswahl.

Download SplitBarCode Anwendungen:

PDFmdx Version 3.19.0

Neuerungen / Verbesserungen PDFmdx Version 3.19.0:

  • Verbesserte Barcode Performance durch Vorverarbeitung: Es gibt jetzt einen neue Option um die Barcode Erkennung und Verarbeitung zu beschleunigen. Die bisherige Barcode Verarbeitung ist weiterhin vorhanden da es Anwendungsfälle geben kann bei der die bisherige Verarbeitung einen Vorteil bietet. Beide Implementierungen haben je nach Situation ihren Vorteil. Die Barcode Erkennung erfordert ein Image und nicht eine normale PDF Struktur mit Text und Linien. Für die Barcode Erkennung muss das PDF daher vorher gerendert werden.

Bei der bisherigen Implementierung wird nur der durch das Feld markierte Bereich gerendert. Da das nicht sehr lange dauert und um auch bei schlechten Scans ein besseres Ergebnis zu erzielen, wird das Rendering 3fach ausgeführt – mit 200, 300, und 400dpi.  Vorteil: Falls nur in einem einzelnen kleinen Bereich eine Barcode Erkennung stattfinden soll muss nicht alles gerendert werden bzw. falls Scans mit minderer Qualität verarbeitet werden.

Bei der neuen Funktion der „Barcode Vorverarbeitung“ wird das ganze PDF vorab mit 300dpi gerendert, alle im Template definierten Barcodetypen werden erkannt und für die spätere Verwendung gecached. Das funktioniert schneller da das Redering bzw. die Barcode Erkennung nur einfach mit 300dpi durchgeführt wird und die erkannten Werte für die Weiterverarbeitung gespeichert werden.  Vorteil: Falls es auf einer Seite mehrere Bereiche mit Barcodes gibt oder bei guter Qualität der Dokument bei der ein mehrfach Rendering nicht erforderlich ist.

  • Geschützte PDF verarbeiten – Öffnen Passwort: Bisher konnten Passwort geschützte PDF nicht verarbeitet werden. Jetzt gibt es eine Funktion um beim Layout das „PDF Öffnen“ Passwort zu hinterlegen. Für die Verarbeitung sind alle für den Job hinterlegten Passworte der ausgewählten Layouts geladen. Erkennt PDFmdx eine geschützte PDF Datei so wird mit der Passwortliste versucht das PDF hintereinander zu öffnen und zu entschlüsseln. Passt ein Passwort so wird das PDF geöffnet und entschlüsselt. Danach wird daraus ein neues, ungeschütztes PDF erstellt und normal über PDFmdx verarbeitet.

Download – PDFmdx Template Editor & Processor >>>

PDFCompressor – PDF-MRC (Mixed Raster Content) Komprimierung – Dokumenten-Farbscans um den Faktor 8 bis 10 verkleinern

In fast jedem Unternehmen findet man heute Dokumenten-Scanner und Multifunktionsgeräte für die Erfassung, Archivierung und Weiterleitung von Dokumenten. Alle modernen Geräte sind in der Lage die Dokumente in Farbe und als PDF zu erzeugen. Die Erfassung und Verarbeitung von Dokumenten in Farbe wird also immer verbreiteter und beliebter. Der Nachteil: Die Datei eines Farbscans mit der für Farbe üblichen JPEG Komprimierung ist um ein Vielfaches größer als ein vergleichbarer SW-Scan. Die JPEG Komprimierung ist gut für Farbbilder/Fotos , für Text ist die JPEG Komprimierung jedoch auf Grund der durch die Komprimierung erzeugten Artefakte sehr schlecht geeignet. Text benötigt scharfe Kanten um gut lesbar zu sein. Bei der JPEG Komprimierung verschwimmen diese Kanten und damit werden speziell kleinere Schriften unleserlich.

Die PDF-MRC (Mixed Raster Content) Komprimierung löst das Problem – Sie erzeugt aus Farbscans sehr kleine PDF Dateien und ermöglicht eine gute Lesbarkeit von Texten.

Die MRC Komprimierung ist auch als „Hyper Komprimierung“ bekannt und verwendet die Methode der Bild Segmentierung, Sie ist für typische Geschäfts-Dokumente bestehend aus Text und Bildern, die in Farbe gescannt werden, sehr effizient und gut anwendbar.

Die PDF-MRC Komprimierung in Kürze:

Der wesentliche Punkt dabei ist, dass bei der PDF-MRC Komprimierung Seiten Bereiche des Scans in getrennte Bilder – sogenannte „Ebenen“ aufgeteilt werden. Jeder dieser Ebenen wird entsprechend angepasst und optimal komprimiert. Das PDF Format ermöglicht es, die ursprüngliche Darstellung einer Seite aus diesen getrennten Ebenen wieder als Gesamtbild darzustellen. Siehe auch Wikipedia >>>

Die 4 Ebenen der PDF-MRC Komprimierung:

  • Hintergrund Ebene (Farbbild) – enthält den Hintergrund, die Hintergrund „Verschmutzungen“ und alle anderen Grafik Elemente welche nicht als Text, Linien Grafik oder Bild identifiziert werden können.
  • Bild Ebene (Set an Farbbildern) – enthält alle Farbbilder der Seite.
  • Maskierungs Ebene (Schwarz-Weiss Bild) – enthält den Text und die Linien Grafik.
  • Vordergrund Eben (Paletten Bild) – enthält die Information über die Farben der Maskierungs-Ebene, speichert damit die Farbe des Textes und der Linien Grafik.

PDFCompressor mit PDF-MRC Komprimierung:

Die aktuelle PDFCompressor Komponente die im PDFCompressor-CL, -FM und -CS-Service, sowie auch in unseren anderen Anwendungen (z.b. AutoOCR, FileConverterPro…) zum Einsatz kommt, unterstützt jetzt auch die PDF-MRC Komprimierung. Die PDF-MRC Komprimierung ist für Farb-Dokumente/-Scans anwendbar, nicht jedoch für Schwarz-Weiß und Graustufen-Scans.

Unterstützte Dateiformate: PDF, JPEG, PNG, BMP, TIFF, JPEG2000, JBIG2, ICO, PCX, GIF, WMF, EMF – für Dateiformat mit mehreren Seiten wird automatisch ein mehrseitiges PDF erzeugt.

Vordefinierte PDF-MRC Profile: PDF-Dokumente werden vor der MRC Komprimierung mit der eingestellten Auflösung (150, 200, 300dpi) „gerendert“ also in ein Farbbild konvertiert und anschließend der MRC Komprimierung unterzogen. Um es dem Anwender zu erleichtern sind die wesentlichen MRC Komprimier-Einstellungen bereits als fertig vordefinierte Profile auswählbar. „MRC – nur Text“ bzw. „MRC – Text und Bilder“ für 150 bzw. 200dpi Auflösung.

   

Beispiel – PDF-MRC Komprimierung:

 

PDF-MRC Anwendung:

Die PDF-MRC Komprimierung ist ist speziell für die Komprimierung von Dokumenten-Farbscans gedacht und ermöglicht im Vergleich zur herkömmlichen JPEG Komprimierung eine Reduktion der Dateigröße um den Faktor 8 oder 10. „Normale“ PDF die nur aus Linien und Text bestehen können auch MRC komprimiert werden, jedoch sollte beachtet werden dass das PDF vor der MRC Komprimierung gerendert, also in eine Bilddatei umgewandelt wird, um danach als MRC-PDF ausgegeben zu werden. Der vorher im PDF enthaltene Text wird wieder in die MRC-PDF eingefügt. Normalerweise macht es also nur Sinn gescannte Farbdateien bzw. PDF Dateien die OCR verarbeitet wurden, einer MRC Komprimierung zu unterziehen.

Die Textdarstellung in einer MRC-PDF Datei ist trotz einer mit 150-200dpi geringen Auflösung auch bei kleinen Schriften klar lesbar und ohne Artefakte. Die PDF-MRC Komprimierung ist also die ideale Lösung um im Unternehmen anfallende Dokumente in Farbe zu archivieren, wobei die Dateigröße nicht wesentlich über jener von Schwarz-Weiß Scans liegt, die Texte gut lesbar bleiben und der Vorteil der Farbdarstellung besteht.

PDFCompressor Komponente Test & Beispielanwendung >>>

FileConverterPro (FCpro) als eigenständige C# / .NET Komponente

Bisher haben wir den FileConverterPro (FCpro) nur als Windows Service mit REST/SOAP Web-Service Schnittstelle verwendet. Jetzt haben wir daraus auch eine eigenständige C# / .NET Komponente gemacht. Damit können wir alle im FileConverterPro (FCpro) zur Verfügung stehenden Funktionen zur Dokumentenkonvertierung auch direkt in andere Anwendungen implementieren. Darauf aufbauend werden wir in Kürze den FCpro Konverter als eigenständige Anwendung mit Kommandozeile sowie als Windows Dienst mit Verzeichnisüberwachung (Hotfolder) erstellen. Ebenso werden wir diese Konverter Komponente direkt in PDFMerge / EasyMerge bzw. im EMailArchiver und in weiteren Anwendungen integrieren.

Diese FCpro C# / .NET Komponente wird von uns nicht als eigenständiges Produkt angeboten und wird nur im Rahmen unserer Anwendungen sowie bei individuellen Softwareprojekten verwendet. Für die FCpro Konverter Komponente steht eine Beispiel & Testanwendung zur Verfügung mit der interaktiv alle FCpro Konvertierfunktionen ausprobiert werden können.

Funktionen der FCpro Komponenten Testanwendung:

  • Eigenständige Testanwendung um interaktiv die FCpro PDF & PDF/A Konvertierfunktionen testen zu können
  • Erzeugt – PDF, PDF/A, Text, Bild-Voransicht, Miniaturen Ansicht aus den verschiedensten Datei- und Containerformaten (ZIP, EML, MSG…)
  • FCpro Konvertier Profil-Funktionen:  Erstellen, Kopieren, Bearbeiten, Profil exportieren / importieren
  • Konfiguration der Anzahl der parallelen Prozesse für die Konvertierung
  • Ein oder mehrere Dateien können zur Konvertierung in den gelb markierten per Drag & Drop Bereich gezogen werden.  Die Ergebnisdateien (PDF, TXT, JPEG, PNG) werden im Ordner der Ausgangsdatei abgelegt.

Download – FileConverterPro (FCpro) Komponenten Testanwendung ~600MB >>>

Beispielprojekt Aufruf der PDF2PDFA-CL Kommandozeilenanwendung aus .NET / C#

Wir haben ein C# / .NET Beispielprojekt erstellt um zu zeigen wie die PDF2PDFA-CL Kommandozeilen Anwendung aus einem .NET / C# Programm heraus aufgerufen werden kann.

Funktionen:

  • PDF nach PDF/A Konvertierung mit Hilfe unserer PDF2PDFA-CL Anwendung
  • .NET / C# Beispielprojekt im Source Code inkl. ausführbarer Anwendung
  • Auswahl – Konvertierprofildatei (*.ppa) von PDF2PDFA-CL
  • Auswahl – Ausgabeordner
  • Auswahl – Pfad zur PDF2PDFA-CL EXE
  • Start der Verarbeitung durch Drag & Drop einer oder mehrere PDF Dateien in den markierten Drop-Bereich.

Download – PDF2PDFA-CL_C# Beispielprojekt >>>

FileConverterPro (FCpro) 1.0.118

Neuerungen der FCpro Version 1.0.118:

  • Erweiterungen für Platzhalterseiten bei der Verarbeitung von Container (ZIP, MSG, EML..) Dateien – Bisher konnte bei Container Dateien, bei der eine der enthaltenen Dateien nicht konvertiert bzw. nicht weiter verarbeitet werden konnte, nur ausgewählt werden ob eine Platzhalterseite eingefügt wird oder nicht. Der Status des Jobs ist dabei nie auf einen Fehler gelaufen und es wurde immer eine PDF Ergebnisdatei erzeugt. Bei der Jobabfrage gab es bisher auch keine zusätzliche Info darüber ob einzelne Teile nicht konvertiert, bzw. ob Platzhalterseiten eingefügt wurden.

Im FCpro Konvertierprofil kann jetzt konfiguriert werden:

    • Ob Platzhalterseiten eingefügt werden sollen oder nicht.
    • Ob immer eine PDF Ergebnisdatei (mit oder ohne Platzhalterseiten), oder ob kein PDF erzeugt werden soll. Dabei bekommt, falls eine Komponente des Containers nicht konvertierbar bzw. nicht verarbeitbar ist, der Job den Status „Error“,
    • Neben nicht konvertierbaren Dateien werden für Container auch PDF Dateien erkannt, die nicht weiter verarbeitbar sind. z.b. falls sie eine PDF Restriktion / Passwort Schutz aufweisen und dadurch nicht zu einer PDF Gesamtdatei zusammengefügt werden können.
    • Am Server kann ein eigenes Platzhalterseiten-Log aktiviert werden in der die Verwendung von Platzhalterseiten protokolliert wird.
    • Jede Anwendung einer Platzhalterseite kann auch über eine SMTP EMail protokolliert werden.
    • Falls eine Platzhalterseite bei einem Job eingefügt wurde, bekommt man diese Info über die Web-Service Jobabfrage.

   

  • Web-Service – REST – Verbesserungen / Erweiterungen:

REST Endpunkt UploadJobEx6 – Bisher wurden einige Parameter immer vom FCpro Service überschrieben wenn diese nicht konfiguriert wurden. Das wurde jetzt geändert so dass nur jene Parameter die über den REST Endpunkt UploadJobEx6 übergeben und gesetzt werden die Job Parameter überschreiben.

GetJob function(jobGuid) Aufruf liefert mehr Informationen:

Es gibt einige neue Zeilen in der Job Information

    • PlaceholderUsed (true/false)
    • ProcessId
    • ProcessName
    • SettingsName (Name des verwendeten FCpro Konverter Profils)

ProcessName liefert die Info über welchen Konverter die PDF Konvertierung durchgeführt wurde. Entweder „FileConverterPro“ (intern) oder durch eine „externe“ Komponente (z.b. MS-Office)

Beispiel-Antwort auf einen GetJob function(jobGuid) Aufruf:

{
„GetJobResult“: {
„ConversionStartedDate“: „/Date(1637056353767+0200)/“,
„ConversionStartedDateISO“: „2021-11-16T11:52:33+02:00“,
„CreationDate“: „/Date(1637056352797+0200)/“,
„CreationDateISO“: „2021-11-16T11:52:32+02:00“,
„Errors“: „“,
„FinishedDate“: „/Date(1637056366843+0200)/“,
„FinishedDateISO“: „2021-11-16T11:52:46+02:00“,
„JobGuid“: „84726eef-0383-4094-b15f-de7ce122dce7“,
„JobID“: 255,
„JobLabel“: „C:\\Users\\Admin\\AppData\\Local\\DropConverterProE\\Downloads\\211116-115230\\20211116115232058.pdf“,
„PageCount“: 1,
„PdfData“: null,
„PlaceholderUsed“: false,
„ProcessId“: -1,
„ProcessName“: „FileConverterPro“,
„SettingsName“: „default“,
„Status“: 5,
„UserName“: „admin“
}
}

 

  • MS-Office automatisch beenden – Manchmal kommt es vor dass der FCpro Dienst auf einem Arbeitsplatz auf dem ein Anwender arbeitet, installiert wird. Bei der FCPro Verarbeitung werden MS-Office Anwendungen in regelmäßigen Abständen „bereinigt“ und dabei automatisch beendet. Bisher auch falls MS-Office nicht als Konverter konfiguriert und verwendet wurde. Das wurde jetzt geändert. Die Bereinigung von MS-Office Prozessen findet nur statt, falls MS-Office auch als Konverter konfiguriert und verwendet wird.
  • Gemeinsame PDF2PDFA Komponente – Der FCpro PDF nach PDF/A Konverter wurde durch unserer PDF2PDFA Standardkomponente ersetzt um in allen unseren Anwendungen den gleichen einheitlichen Konverter zu verwenden. Damit ist FCpro jetzt auch in der Lage ZUGFeRD 2.1.1 konforme Dateien mit XRechnung Profilen zu erstellen.
  • FCPro Versionsnummer kann als Variable für das Ersteller / Erzeugerfeld verwendet werden um im PDF hinterlegen zu können mit welcher FCpro Version das Dokument erzeugt wurde.
  • SWF – Flash Datei Erzeugung wurde entfernt – Da das Flash SWF Format aus Sicherheitsgründen in der IT nicht mehr unterstützt wird haben wird die Erzeugung diese zusätzlichen Dateiformats aus allen FCpro Funktionen entfernt.
  • iOCR – Defekten Text in bestehenden PDF´s erkennen und korrigieren – Infos dazu siehe AutoOCR >>>
  • Beenden von zu lange laufenden OCR Prozessen durch Zeitablauf – Falls bei einem Job der OCR Prozess zu lange dauert und der vorgegebene Zeitablauf-Wert erreicht wird so wird der Job abgebrochen und alle damit zusammenhängenden Sub-Prozesse automatisch beendet.

Korrekturen und Fehlerbehebungen:

  • Bei der parallelen Verarbeitung von ZIP Containern, mit TIFF Dateien und parallelen Prozessen ist es zu Zugriffsproblemen gekommen. – Fehler „Can not access the file“
  • Der PDF (Passwort) Schutz wurde für die PDFExport Einstellungen und beim PDFSign nicht ausgeführt.
  • Die Container Sortierung (ZIP, MSG, EML…) nach dem Dateinamen / Ordner hat nicht funktioniert.
  • Die konfigurierbaren JPEG Qualitätseinstellungen für die zusätzlich zu erzeugenden Bilder für Voransicht und Miniaturen wurden nicht angewendet.
  • Setup – Bei der Installation ohne Internetverbindung wurde die iOCR Engine nicht automatisch installiert.

Download – FileConverterPro (FCpro) ~600MB >>>
Download – OmniPage OCR Engine als Option für FCpro (ca. 235MB) >>>

PDFmdx Version 3.18.0

Neuerungen / Verbesserungen PDFmdx Version 3.18.0:

  • Verbesserte Textextraktion – Durch die verbesserte Testextraktion konnten wir an Hand uns von Kunden zur Verfügung gestellten problematischen PDF´s die Textextraktion verbessern. Damit wurden auch bestimmte „problematische“ PDF verarbeitbar- Z.B.: bei sehr kleinem Text wurden Phantom Leerstellen eingefügt, bei Beträgen wurde der „.“ oder „,“ verschoben ausgegeben, bzw. horizontale Trennlinien erzeugt durch aneinandergereihte „_“ verhinderten das Auslesen in diesen Zeilen.
  • Ausgefüllte PDF Formulare verarbeiten – Formulare werden jetzt „gerendert“. Das PDF wird „verflacht“ in ein normales nicht mehr veränderbares PDF umgewandelt. Somit können die Felder wie bei jedem anderen PDF ausgelesen und von PDFmdx verarbeitet werden.
  • Neue Zähler Variablen für die Metadaten-Ausgabe – %COUNTER_GLOBAL% – Ein „globaler“ Zähler für den ein Startwert vorgegeben werden kann. Dieser wird jedes mal bei Ausgabe eines Datensatzes erhöht. %COUNTER_LOCAL% – der „lokale“ Zähler, wird nur für die Datensätze der aktuellen Verarbeitung erhöht und beginnt mit jedem Verarbeitungsjob wieder bei 1.

  • Performance-Optimierung bei Verwendung des Dateinamens um das Layout direkt über den Namen und nicht über Bedingungen auszuwählen.
  • PDFmdx Editor – Split Test Funktion – basiert jetzt auf der gleichen Routine wie die echte Verarbeitung. Fehlermeldungen werden direkt angezeigt und entsprechen den Fehlermeldungen die auch bei der Verarbeitung ausgegeben werden.
  • PDFmdx Editor – Felder / gleitende Gruppen auf anderen Seiten anzeigen – Normalerweise werden Felder auf einer bestimmten Seite des Musterdokuments positioniert. Felder können jedoch z.B. beim Auslesen von Positionsdaten über gleitenden Gruppen/Untergruppen auch auf anderen oder mehreren Seiten auszulesen sein. Um überprüfen zu können wie / wo die Felder auf anderen Seiten positioniert sind, bzw. welche Werte bei „gleitenden Feldern“ ausgelesen werden, gibt es jetzt eine Funktion um die positionierten Felder auch auf anderen Seiten einzublenden. Diese Anzeige wird beim Wechsel auf eine andere Seite wieder automatisch deaktiviert. Durch <CTRL>+<Pfeiltaste hinauf  / hinunter> lassen sich die Felder auch vertikal verschieben. Zusammen mit der <Shift> Taste mit größerer Schrittweite. Klickt man in ein angezeigtes Feld so wird in der Statuszeile der Feldname und der ausgelesene Text angezeigt.

  • Konfiguration des Ausgabenamens – Wird im Feld für den PDF Ausgabe Dateinamen ein nicht erlaubtes Zeichen z.b. einen „\“ verwendet, so werden bei der Verarbeitung nicht erlaubte Zeichen automatisch durch einen „_“ ersetzt.

  • ZUGFeRD XML über Variablen – Für die Festlegung der einzubettenden ZUGFeRD XML Datei können die „über PDFmdx zur Verfügung stehenden Variablen verwendet werden.

  • Zusammenfügen von PDF Dateien – Über die neue Funktion „Zusammenfügen“ können weitere PDF Dateien mit der verarbeiteten Datei zu einem Gesamt PDF zusammengefügt werden.

Funktionen Zusammenfügen:

    • „Zusammenfügen“ ermöglicht es ein oder mehrere PDF mit der über PDFmdx erzeugten Datei zu einem Gesamt-PDF zusammenzufügen.
    • Über eine Liste kann die Reihenfolge der zusammenzufügenden Dateien festgelegt werden.
    • Über Kriterien (UND / ODER / NICHT) kann an Hand von aus dem Dokument ausgelesenen Texten entschieden werden ob ein „Zusammenfügen“ erfolgen soll oder nicht.
    • Es können mehrere verschiedene „Zusammenfüge-Listen“ erstellt werden. Eine solche Liste kann mit einem bestimmten Layout verknüpft werden. Ein Layout kann über Kriterien erkannt und ausgewählt werden.
    • In der Zusammenfüge-Liste können entweder fix ausgewählte Dateien oder Pfade / Namen verwenden, die über aus dem Dokument ausgelesen Texte dynamisch bei der Verarbeitung erzeugt werden.
  • Neuimplementierung der EMail Funktion:
    • Für den Versand und EMail Verarbeitung wurde eine neue EMail Komponente implementiert.
    • Damit werden alle aktuellen Verschlüsselungsprotokolle (SSL2, SSL3, TLS1, TLS1.1, TLS1.2) unterstützt. Zu Beginn der Kommunikation mit dem SMTP EMail Server wird automatisch das am besten geeignete und unterstützte Protokoll  ausgehandelt und festgelegt.
    • Max. Größe der EMail konfigurierbar: Beim EMail Versand gibt es eine Option um alle EMail die an die gleiche EMail Adresse verschickt werden sollen zu einer einzigen EMail Nachricht zusammenzufassen. Es gibt jetzt einen eigenen Parameter um die Größe einer einzelnen zusammengefassten Nachricht zu limitieren,  z.B.: auf 10MB, Wird der Wert für eine Nachricht überschritten, erfolgt eine Aufteilung in mehrere EMails damit die max. eingestellte Größe nicht überschritten wird.
    • Im PDFmdx Prozessor gibt es für den EMail Versand jetzt eine eigene Logging / Protokoll Funktion. Diese kann für die erfolgreich verschickten als auch für die Fehler-Mail einzeln aktiviert werden. Ebenso kann der Ablage Pfad konfiguriert werden.
    • Die protokollierten EMail werden als EML Datei in zwei konfigurierbare Ordner (Erfolgreich/Fehler) abgelegt. Für ein Fehler EMail wird zusätzlich eine XML Datei mit Metadaten und Fehlermeldung angelegt. Für die Ablage der erfolgreich verschickten EMail kann pro Tag ein eigener Unterordner angelegt werden.
    • Anzeige der verschickten / Fehler EMail im PDFmdx Prozessor als Liste, über 2 Schaltflächen aufrufbar. Funktionen: Sortierung der Liste über Datum/Zeit, An, Betreff, Fehlermeldung, Ordner öffnen, EMail Nachricht anzeigen, Dateianhang öffnen. Lösche einzelne Nachrichten, Lösche alle Nachrichten.

 

Korrekturen PDFmdx Version 3.18.0:

  • Ausgelesene Barcodes wurden nicht auf Variablen zugeordnet und damit nicht in die Metadaten-Datei geschrieben.
  • Ausgelesener Text wurde für Variablen an verschieden Stellen nicht entsprechend der Konfiguration aufbereitet.
  • Barcodes konnten bei PDF mit Seitenrotation nicht ausgelesen werden – die Anzeige-Seitenrotation wurde nicht berücksichtigt.
  • „Erhaltener Wert“ Funktion hat die Werte für die Unterdatensätze nicht erhalten.
  • MRC-PDF (Mixed Raster Content) konnten nicht verarbeitet werden. Ein defektes PDF wurde ausgegeben.
  • PDFmdx Service Prozessor – Der Start zu einem vorgegebenen / wiederholten Zeitpunkt hat nicht funktioniert.
  • PDFmdx Prozessor – Bei der parallelen Verarbeitung konnte manchmal nicht in die Metadaten XLS(X) geschrieben werden, da diese von einem anderen Prozess noch offen und damit blockiert war.
  • PDFmdx Editor – Import von Vorlagen – Abfrage nach dem Überschreiben ist immer gekommen auch wenn keine Datei überschrieben werden sollte.
  • PDFmdx Editor – Erststart ohne Vorlage & Layout, danach Import einer Vorlage – Es wurde kein automatischer Refresh ausgeführt und die importierten Vorlagen & Layouts waren nicht sichtbar.
  • PDFmdx Editor – Beim Verschieben / Kopieren eines Layouts von einer Vorlage in eine Andere ist keine Abfrage hochgekommen dass ein Layout mit dem gleichen Namen bereits vorhanden war.
  • PDFmdx Editor – Löschen eines Layouts mit mehrfach verknüpften Bedingungen. Dabei blieben die AND / OR Knoten im Editor erhalten und wurden nicht automatisch bereinigt, was Verarbeitungsprobleme verursacht hat.
  • PDFmdx Editor – Bilder im HTML Body wurden beim Zusammenfassen der EMail an den gleichen Empfänger nicht in das EMail eingefügt und fehlten in der verschickten Nachricht.
  • EMails Versand – Trat beim EMail Versand unter bestimmten Bedingungen ein Fehler auf, so wurde die Verarbeitung abgebrochen bzw. der Dienst angehalten. Aus diesem Grund wurde der EMail Versand neu implementiert und um ein Logging der erfolgreichen und der Fehler EMail erweitert. (siehe Neuerungen).

Download – PDFmdx Template Editor & Processor >>>

PDF2Printer – Version 2.0.22 – Seiten/-Bereiche drucken, Erweiterte PCF Steuerdatei

Neuerungen PDF2Printer Version 2.0.22:

Bestimmte Seiten / Seitenbereiche drucken:

  • Seitenbereiche – von / bis – durch das Minuszeichen: z.B. 6-8
  • Einzelne Seiten – mit Beistrich getrennt: z.B. 1,4,6-8
  • Alle Seiten ab einer bestimmten Seite bis zum Ende des Dokuments – durch das Dollar Zeichen: z.B. 1,4,6-8,10-$

Erweiterte PCF Steuerdatei:

Eine wesentliche Funktion von PDF2Printer ist die Möglichkeit den Druckvorgang über eine PCF- Print Control Format Datei zu steuern. Die PCF Steuerdatei wurde jetzt um die neuen Funktionen der PDFPrint .NET Komponente erweitert.

PDF2Printer kann einen Eingangsordner überwachen. PDF Dateien die darin landen werden sofort mit den konfigurierten Standardeinstellungen ausgedruckt. Im überwachten Ordner können beliebige Unterordner angelegt, in welche PDF Dateien kopiert werden. Der Ausdruck dieser PDF Dateien kann aber nur über eine *.PCF Datei ausgelöst werden.

Eine PCF Datei kann die Namen einer oder mehrere PDF Dateien enthalten die gedruckt werden sollen. Die zu druckenden PDF müssen bereits im Unterordner vorhanden sein, bevor die PCF Datei dort erzeugt oder hinein kopiert wird. Die PCF Datei kann eine oder mehrere Zeilen enthalten, pro PDF eine Zeile. Gedruckte PDF Dateien werden gelöscht. Sind alle Dateien gedruckt und ist der Unterorder leer so wird auch der Unterordner und die PCF Datei automatisch gelöscht.

Syntax der PCF Zeilen:

<PDF Dateiname>\t<Druckername>\t<Papierfach_Typ>:<Papierfach_Name>\t<Kopien>\t<Graustufen>\t<Seitenbereich>

  • \t = TAB Zeichen als Trennzeichen zwischen den Parametern.
  • <PDF Dateiname> = Name der zu druckenden PDF Datei, ohne Pfad, Das PDF muss sich im gleichen Unterordner wie die PCF Datei befinden.
  • <Druckername> und <Papierfach_Typ>:<Papierfach_Name> = Ist aus der „printers.pnames“ Datei zu entnehmen. Diese Datei wird von der PDF2Printer Anwendung beim Start des Dienstes im überwachten Ordner automatisch angelegt und enthält die Liste alle verfügbaren Drucker/Papiereinzugsschächte. Zu beachten ist dass der System Account unter dem ein Windows Dienst standardmäßig läuft keine Zugriff auf Netzwerk Drucker hat. Daher sollte ein User Account verwendet werden. Sie sollten sich mit diesem User Account anmelden, die PDF2Printer Konfiguration sowie den Test der Drucker unter diesem User Account durchführen. Dieser Benutzer sollte dann auch für die PDF2Printer Dienst verwendet werden.  Damit kann sicher gestellt werden dass der PDF2Printer Dienst die gleichen Drucker verfügbar hat wie bei der Konfiguration über die Benutzeroberfläche.
  • <Kopien> = Anzahl der Kopien für den Ausdruck
  • <Graustufen> = true / false – Ob in Farbe oder in Graustufen gedruckt werden soll.
  • <Seitenbereich> = Einzelne Seiten mit Beistrich getrennt, von/bis mit dem Minuszeichen, bzw. bis zum Dateiende mit dem $ Zeichen: z.B. 1,3-4,10-$

Download – PDF2Printer –  Dienst um PDF´s automatisiert zu drucken >>>

PDFPrint .NET Komponente Version 1.3.6 – bestimmte Seiten / Seitenbereich drucken

Mit der PDFPrint .NET Komponente Version 1.3.6 gibt es jetzt die Möglichkeit nur bestimmte Seiten (einzelne Seiten, Seitenbereiche, alle Seiten bis zum Dokumentenende) des PDF Dokuments zu drucken

Funktionen:

  • Seitenbereiche – von / bis – durch das Minuszeichen: z.B. 6-8
  • Einzelne Seiten – mit Beistrich getrennt: z.B. 1,4,6-8
  • Alle Seiten ab einer bestimmten Seite bis zum Ende des Dokuments – durch das Dollar Zeichen: z.B. 1,4,6-8,10-$

Da alle unserer PDFPrint Produkte – PDFPrint-CL, FM, CS, PDF2Printer, eDocPrintPro PDFPrint Plugin – auf der PDFPrint .NET Komponente aufbauen, steht diese neue Funktion in allen neuen Versionen unserer PDFPrint Produkte automatisch zur Verfügung.

Download – PDFPrint –  Druckt PDF´s >>>

Webshop