PDFmdx Version 3.21.0

Neuerungen PDFmdx Version 3.21.0:

Teile Seiten über Barcode:

Es gibt Anwendungsfälle z.b.: Rollkarten von Speditionen, bei denen es erforderlich ist Dokumente nicht mit einer ganzen Seite zu teilen, sondern es sollen Seiten horizontal geteilt werden, um daraus einzelne neue Dokumente zu erzeugen. Dafür wurde die neue Funktion „Teile Seiten über Barcode“ implementiert.

Als Kriterium wird ein Barcode und eine Bedingung über den ausgelesenen Barcode Wert verwendet. Es wird jede Seite nach Barcodes durchsucht. Wird ein Barcode mit einer zutreffenden Bedingung gefunden, *,? und # können für die Teilstringsuche verwendet werden, so wird die Seite an dieser Stelle horizontal in ein neues Dokument geteilt. An dieser Stelle „endet“ das bestehende Dokument. Der verbleibende Rest der Seite wird am oberen Rand einer neuen Seite beginnend, als neues Dokument erstellt, solange bis wieder ein zutreffender Barcode bzw. das Ende der Ausgangsdatei erreicht wird.

Funktionen – Teile Seiten über Barcode:

  • Die Eingangsdatei wird seitenweise nach bestimmten Barcodetypen mit einem bestimmten Wert durchsucht, Teilstringplatzhalter (*,?,#) können verwendet werden.
  • Wird ein entsprechender Barcode auf einer Seite gefunden so wird die Seite horizontal an dieser Stelle geteilt. Ab dieser Position wird eine neue Datei erzeugt.
  • Der auf den Seiten gefundene Barcode Wert kann als Variable für Dateiname / Ordner oder Metadaten verwendet werden.
  • Wegscheiden – Oberer / Unterer Rand der Eingangsdatei in mm: Diese Bereiche werden „gelöscht“ und in der Ergebnisdatei nicht berücksichtigt. z.B. Briefkopf und Fußzeilen
  • Die Seitengröße der Ausgabedatei richtet sich automatisch nach der Eingangsdatei oder kann fix auf das A4 Hochformat festgelegt werden.
  • Um die geteilten Blöcke kontinuierlich aneinander zu reihen, werden weiße Bereiche (vor bzw. nach dem Block) erkannt und entfernt. (Schwarzanteil in % als Parameter)
  • Zur Formatierung der Ergebnisdatei kann der obere / untere Rand sowie der Abstand zwischen den Blöcken in mm festgelegt werden.

PDF Passwortunterstützung deaktivieren: Mit der PDFmdx Version 3.19.0 wurde eine neue Funktion implementiert um das PDF „Öffnen“ Passwort auch im Layout hinterlegen zu können. Dabei wurde im PDFmdx Editor bei allen geschützten Dateien, auch bei PDF Dateien die nur ein „Admin“ und kein „Öffnen“ Passwort besitzen, der Dialog mit der Passwortabfrage angezeigt. Um das zu verhindern kann man diese Funktion jetzt über einen Button im PDFmdx Editor generell deaktivieren.

Download – PDFmdx Template Editor & Processor >>>

eDocPrintPro free, PDF/A & ZUGFeRD Version 5.5.0 verfügbar

Neuerungen eDocPrintPro Version 5.5.0:

  • PDF/A und ZUGFeRD wurde auf den aktuellsten Stand gebracht und bietet jetzt die gleiche Funktionalität wie der PDF2PDFA Konverter.
  • eDocPrintPro PDF/A unterstützt jetzt auch die Erstellung von PDF/A2u und PDF/A-3u Dateien,

 

  • Die konfigurierbare PDF Seitengröße wurde auf das maximal mögliche und von PS / GhostScript unterstützte Format von 5080 x 5080mm erweitert.

  • Die Standard Papier Größen Auswahlliste  wurde um mehrere „Oversize“ Seitenformate ergänzt. (914 x 1300,  914 x 11600, 914 x 2100, 914 x 2500, 914 x 3250mm)

  • Für den Dateinamen und den Ausgabepfad können jetzt neben den direkt auswählbaren Variablen auch alle vom Betriebssystem unterstützen und selbst definierten Systemvariablen verwendet werden. Diese werden zur Laufzeit bei der Ausgabe der PDF Datei ausgelesen und verwendet.

 

  • Der Ausgabepfad wird auf die max. vom Betriebssystem unterstützte Länge von 256 Zeichen hin überprüft und gegebenenfalls abgeschnitten.
  • Fehlerkorrektur bei der Funktion „Einfügen am Beginn“ / „Anhängen am Ende“ für PDF und TIFF Dateien.

Download – eDocPrintPro free 64bit Version

Download – eDocPrintPro 64bit PDF/A & ZUGFeRD

Download GhostScript 9.56.1 64bit Setup

Download – eDocPrintPro 32bit Version 4.0.2

Download – eDocPrintPro 4.0.2 32bit (ca. 66 MB) >>>
Download – eDocPrintPro PDF/A & ZUGFeRD 32bit (ca. 105 MB) >>>
Download – GhostScript 9.27 MSI Setup – 32bit (ca. 26MB) >>>

 

GenOCR Version 1.2.0 / iOCR5 / vsOCR5 – basierend auf Google OCR tesseract 5.0

Unserer Standard OCR Engine – iOCR / vsOCR wurde aktualisiert und basiert jetzt auf der aktuellen Google / tesseract OCR Version 5.0.

Info über zusätzliche Sprachen für iOCR5 / vsOCR5 – siehe >>>

     

Download – GenOCR – OCR Testanwendung für iOCR (ca. 680MB) >>>
Download – iOCR5 (vsOCR5) Setup – Basis Sprachen (ca. 400MB) >>>
Download – iOCR5 (vsOCR5) Setup – zusätzliche Sprachen (ca. 1200MB) >>>

PDF2PDFA – Konverter Komponente 1.9.0 unterstützt ZUGFeRD / XRechnung 2.2.2 und XSD Validierung

Die aktuelle Version 1.9.0 unseres PDF nach PDF/A Konverters unterstützt jetzt auch den neuesten ZUGFeRD / XRechnung Standard der Version 2.2.2

Zusätzlich wurde auch eine Option implementiert um die einzubettende XML Datei gegen ein entsprechendes XSD zu validieren.

PDF2PDFA Konverter – Test & Beispielanwendung >>>
PDF2PDFA-CL – PDF/A – Kommandozeilen Konverter >>>
PDF2PDFA-FM – PDF nach PDF/A Konverter mit Ordnerüberwachung >>>
PDF2PDFA-CS – PDF to PDFA Converter Service >>>
eDocPrintPro PDF/A & ZUGFeRD >>>

 

PDFmdx Version 3.20.0

Neuerungen / Verbesserungen PDFmdx Version 3.20.0:

  • Wiederholungen & Wartezeit bei gesperrten Dateien: Falls eine Datei in einem der überwachten Eingangordnern beim Start der Verarbeitung durch eine andere Anwendung noch gesperrt ist so wird für diese Dateien automatisch eine *.lock Datei angelegt. Das passiert falls z.b. ein Scanner die Scans direkt in einen überwachten Ordner ablegt. Oft wird dabei zuerst die PDF Datei angelegt, gesperrt um dann Seite für Seite hinzuzufügen. Eine Datei fertig zu schreiben und die Sperre aufzuheben kann das je nach Umfang des Dokumentenstapels einige Minuten dauern. Um auch solche Situationen abzufangen wurden 2 Parameter implementiert um *.lock Dateien automatisch wieder zu entfernen. Damit lassen sich Anfangs gesperrten Dateien nach deren Freigabe automatisch verarbeiten.

Konfigurierbar sind die „Anzahl der Wiederholungen“ sowie die „Wartezeit zwischen den Wiederholungen“. Es wird also wiederholt überprüft ob die Datei noch gesperrt ist und falls diese freigegeben wurde, wird die *.lock Datei gelöscht und das PDF wird verarbeitet.

  • PDF Öffnen Passwort – XML Export der Vorlagen / Layouts: Beim XML Export der Vorlagen / Layouts können jetzt auch die im PDFmdx Layout hinterlegten Passworte zum Öffnen einer geschützten PDF Datei exportiert werden.

Download – PDFmdx Template Editor & Processor >>>

SplitBarcode – 1D / 2D Barcodes erkennen, auslesen, PDF Dokumente teilen

SplitBarcode dient dazu um 1D / 2D Barcodes in PDF Dokumenten zu erkennen bzw. auch in Einzeldokumente zu teilen. Die ausgelesene Barcode-Information kann über Variablen für die Namensgebung und Ablage der neu erzeugten Dateien verwendet werden. Metadaten über die erkannten Barcodes können für jedes PDF einzeln, oder auch als XML, XLSX, CSV Gesamtdatei erzeugt werden.

Unterstützte 1D / 2D Barcode-Typen: Australian Post, Aztec, Codabar, Code11, Code128, Code16K, Code39, Code93, DataMatrix, DotCode, DutchKIX, EAN13, EAN13Plus2, EAN13Plus5, EAN8, EAN8Plus2, EAN8Plus5, HanXinCode, IATA2of5, IntelligentMail, Interleaved2of5, MailMark4StateC, MailMark4StateL, Matrix2of5, MatrixCode, MicroPDF417, MicroQR, MSI, PatchCode, PDF417, PDF417Compact, Pharmacode, Planet, Plus2, Plus5, Postnet, QR, RoyalMail, RSS14, RSS14Stacked, RSSExpanded, RSSExpandedStacked, RSSLimited, Standard2of5, Telepen, UPCA, UPCAPlus2, UPCAPlus5, UPCE, UPCEPlus2, UPCEPlus5.

SplitBarcode Funktionen:

  • Erkennen und Auslesen von 1D / 2D Barcodes (51 Barcodetypen).
  • Teilen von Dokumentenstapel in Einzeldateien.
  • Löschen von Leerseiten.
  • Erzeugen von XML, CSV, XLSX Metadaten Dateien.
  • Die Konfiguration erfolgt über den SplitBarcode Editor, um Vorlagen (unterschiedliche Einstellungen und Konfigurationen), mit mehreren mit der Vorlage verknüpften Layouts (unterschiedliche Positionen der Felder) zu erzeugen.

SplitBarcode Editor: Eine Vorlage enthält alle Einstellungen und Konfigurationen (Felder, Bedingungen, Ausgabe, PDF Infofelder, Barcodes). Mit der Vorlage verknüpft sind ein oder mehrere Layouts. Ein Layout benötigt eine PDF Musterdatei auf der die durch die Vorlage definierten Felder in Größe und Position festgelegt werden.

SplitBarcode Vorlagen Editor – Funktionen:

  • Vorlage – hinzufügen, umbenennen, kopieren, löschen, importieren / exportieren, Layout – hinzufügen, umbenennen, kopieren, löschen.
  • Definition von Feldern um die ausgelesenen Barcode Infos über Variablen verwenden zu können.
  • Zuordnung der zu erkennenden Barcode-Typen zu den Feldern. Pro Feld kann festgelegt werden welche der 51 Barcode Typen erkannt werden sollen.
  • Aufbereitung der ausgelesenen Barcode-Werte über RegEx, Entferne: Rechts / Links / Leerzeichen / Nullen, Text ersetzen über Tabelle oder über externe CSV / XLS Datei.
  • Für jedes Barcode Feld stehen neben dem ausgelesenen Wert auch weitere Informationen als „Untervariablen“ zur Verfügung: bc_read – der originär ausgelesene Barcode, bc_processed – der gemäß Konfiguration aufbereitetet Barcode Wert, bc_page – die Seite auf dem der Barcode gefunden wurde, bc_type – die Barcode Type, bc_dir – die Barcode Ausrichtung in Grad, bc_left – die Barcode Position links in mm, bc_top – die Barcode Position oben in mm, bc_width – die Barcode Breite in mm, bc_height – die Barcode Höhe in mm,
  • Identifizieren und Zuordnen der zu verarbeitenden Dokumente über Vorlage / Layout, an Hand von Bedingungen (UND / ODER / NICHT) sowie Teilstring (*, #, ?) Kriterien.
  • Teilen von Dokumentenstapel in Einzeldateien – über Seitenzahl, Änderung eines Feldwertes oder über Kriterien.
  • Erkennen und Entfernen von Leerseiten über Festlegung eines max. Schwarzanteils in %
  • Ausfüllen der PDF Infofelder (Titel, Autor, Betreff, Schlüsselworte) mit Text bzw. über ausgelesene Feldwerte.

   

SplitBarcode Layout Editor – Funktionen:

  • PDF Musterdatei (Prototyp) auswählen / speichern,  Seite wählen, hinauf, hinunter, Zoom, Ansichtsauswahl.
  • Je Layout können die definierten Felder visuell / interaktiv auf einer geladenen PDF Musterdatei positioniert und in ihrer Größe festgelegt werden.
  • Anzeige für positionierte Felder: Position, Größe, Barcode Wert, Barcode Type
  • Feldfunktionen: Barcode Type automatisch erkennen, Bedingung aus dem Feld erstellen und in den Bedingungseditor einfügen.
  • SplitBarCode Layout Editor Testfunktion – Test der aktuellen Konfiguration an Hand des PDF Prototyps bzw. gegen andere PDF Dateien – Testet die Kriterien für das Erkennen und Teilen.  Das erkannte Layout, die ausgelesenen und aufbereiteten Feldwerte, die Seiten an denen das Dokument geteilt wird, sowie die zu löschende Seiten werden angezeigt.

       

SplitBarcode Verarbeitung:

  • Für die Verarbeitung werden die zu verwendenden Vorlagen / Layouts aktiviert und können über Profile verwaltet werden.
  • Das zu verarbeitende PDF Dokument wird gegen alle aktivierten Vorlagen / Layouts entsprechend der definierten Kriterien validiert. Trifft ein Kriterium zu so wird das Dokument entsprechend der Vorlagendefinition verarbeitet. Trifft kein Kriterium zu so wird ein Fehler ausgeworfen bzw. die Datei in den Fehlerordner verschoben.
  • PDF-Dateiausgabe – Konfiguration von Zielpfad und Dateiname unter Verwendung der definierten Felder/Variablen. Für bestehende Dateien kann Überschreiben, Dateinamen-Zähler sowie Anhängen konfiguriert werden.
  • Metadaten Ausgabe: Konfiguration von Zielpfad und Dateiname unter Verwendung der definierten Felder/Variablen. Ausgabe als XML, XLSX, CSV Datei, als Gesamtdatei oder als Einzeldatei pro erzeugtem PDF, Spaltendefinition für die XLSX / CSV Datei über Feld / Variablenauswahl.

Download SplitBarCode Anwendungen:

PDFmdx Version 3.19.0

Neuerungen / Verbesserungen PDFmdx Version 3.19.0:

  • Verbesserte Barcode Performance durch Vorverarbeitung: Es gibt jetzt einen neue Option um die Barcode Erkennung und Verarbeitung zu beschleunigen. Die bisherige Barcode Verarbeitung ist weiterhin vorhanden da es Anwendungsfälle geben kann bei der die bisherige Verarbeitung einen Vorteil bietet. Beide Implementierungen haben je nach Situation ihren Vorteil. Die Barcode Erkennung erfordert ein Image und nicht eine normale PDF Struktur mit Text und Linien. Für die Barcode Erkennung muss das PDF daher vorher gerendert werden.

Bei der bisherigen Implementierung wird nur der durch das Feld markierte Bereich gerendert. Da das nicht sehr lange dauert und um auch bei schlechten Scans ein besseres Ergebnis zu erzielen, wird das Rendering 3fach ausgeführt – mit 200, 300, und 400dpi.  Vorteil: Falls nur in einem einzelnen kleinen Bereich eine Barcode Erkennung stattfinden soll muss nicht alles gerendert werden bzw. falls Scans mit minderer Qualität verarbeitet werden.

Bei der neuen Funktion der „Barcode Vorverarbeitung“ wird das ganze PDF vorab mit 300dpi gerendert, alle im Template definierten Barcodetypen werden erkannt und für die spätere Verwendung gecached. Das funktioniert schneller da das Redering bzw. die Barcode Erkennung nur einfach mit 300dpi durchgeführt wird und die erkannten Werte für die Weiterverarbeitung gespeichert werden.  Vorteil: Falls es auf einer Seite mehrere Bereiche mit Barcodes gibt oder bei guter Qualität der Dokument bei der ein mehrfach Rendering nicht erforderlich ist.

  • Geschützte PDF verarbeiten – Öffnen Passwort: Bisher konnten Passwort geschützte PDF nicht verarbeitet werden. Jetzt gibt es eine Funktion um beim Layout das „PDF Öffnen“ Passwort zu hinterlegen. Für die Verarbeitung sind alle für den Job hinterlegten Passworte der ausgewählten Layouts geladen. Erkennt PDFmdx eine geschützte PDF Datei so wird mit der Passwortliste versucht das PDF hintereinander zu öffnen und zu entschlüsseln. Passt ein Passwort so wird das PDF geöffnet und entschlüsselt. Danach wird daraus ein neues, ungeschütztes PDF erstellt und normal über PDFmdx verarbeitet.

Download – PDFmdx Template Editor & Processor >>>

PDFCompressor – PDF-MRC (Mixed Raster Content) Komprimierung – Dokumenten-Farbscans um den Faktor 8 bis 10 verkleinern

In fast jedem Unternehmen findet man heute Dokumenten-Scanner und Multifunktionsgeräte für die Erfassung, Archivierung und Weiterleitung von Dokumenten. Alle modernen Geräte sind in der Lage die Dokumente in Farbe und als PDF zu erzeugen. Die Erfassung und Verarbeitung von Dokumenten in Farbe wird also immer verbreiteter und beliebter. Der Nachteil: Die Datei eines Farbscans mit der für Farbe üblichen JPEG Komprimierung ist um ein Vielfaches größer als ein vergleichbarer SW-Scan. Die JPEG Komprimierung ist gut für Farbbilder/Fotos , für Text ist die JPEG Komprimierung jedoch auf Grund der durch die Komprimierung erzeugten Artefakte sehr schlecht geeignet. Text benötigt scharfe Kanten um gut lesbar zu sein. Bei der JPEG Komprimierung verschwimmen diese Kanten und damit werden speziell kleinere Schriften unleserlich.

Die PDF-MRC (Mixed Raster Content) Komprimierung löst das Problem – Sie erzeugt aus Farbscans sehr kleine PDF Dateien und ermöglicht eine gute Lesbarkeit von Texten.

Die MRC Komprimierung ist auch als „Hyper Komprimierung“ bekannt und verwendet die Methode der Bild Segmentierung, Sie ist für typische Geschäfts-Dokumente bestehend aus Text und Bildern, die in Farbe gescannt werden, sehr effizient und gut anwendbar.

Die PDF-MRC Komprimierung in Kürze:

Der wesentliche Punkt dabei ist, dass bei der PDF-MRC Komprimierung Seiten Bereiche des Scans in getrennte Bilder – sogenannte „Ebenen“ aufgeteilt werden. Jeder dieser Ebenen wird entsprechend angepasst und optimal komprimiert. Das PDF Format ermöglicht es, die ursprüngliche Darstellung einer Seite aus diesen getrennten Ebenen wieder als Gesamtbild darzustellen. Siehe auch Wikipedia >>>

Die 4 Ebenen der PDF-MRC Komprimierung:

  • Hintergrund Ebene (Farbbild) – enthält den Hintergrund, die Hintergrund „Verschmutzungen“ und alle anderen Grafik Elemente welche nicht als Text, Linien Grafik oder Bild identifiziert werden können.
  • Bild Ebene (Set an Farbbildern) – enthält alle Farbbilder der Seite.
  • Maskierungs Ebene (Schwarz-Weiss Bild) – enthält den Text und die Linien Grafik.
  • Vordergrund Eben (Paletten Bild) – enthält die Information über die Farben der Maskierungs-Ebene, speichert damit die Farbe des Textes und der Linien Grafik.

PDFCompressor mit PDF-MRC Komprimierung:

Die aktuelle PDFCompressor Komponente die im PDFCompressor-CL, -FM und -CS-Service, sowie auch in unseren anderen Anwendungen (z.b. AutoOCR, FileConverterPro…) zum Einsatz kommt, unterstützt jetzt auch die PDF-MRC Komprimierung. Die PDF-MRC Komprimierung ist für Farb-Dokumente/-Scans anwendbar, nicht jedoch für Schwarz-Weiß und Graustufen-Scans.

Unterstützte Dateiformate: PDF, JPEG, PNG, BMP, TIFF, JPEG2000, JBIG2, ICO, PCX, GIF, WMF, EMF – für Dateiformat mit mehreren Seiten wird automatisch ein mehrseitiges PDF erzeugt.

Vordefinierte PDF-MRC Profile: PDF-Dokumente werden vor der MRC Komprimierung mit der eingestellten Auflösung (150, 200, 300dpi) „gerendert“ also in ein Farbbild konvertiert und anschließend der MRC Komprimierung unterzogen. Um es dem Anwender zu erleichtern sind die wesentlichen MRC Komprimier-Einstellungen bereits als fertig vordefinierte Profile auswählbar. „MRC – nur Text“ bzw. „MRC – Text und Bilder“ für 150 bzw. 200dpi Auflösung.

   

Beispiel – PDF-MRC Komprimierung:

 

PDF-MRC Anwendung:

Die PDF-MRC Komprimierung ist ist speziell für die Komprimierung von Dokumenten-Farbscans gedacht und ermöglicht im Vergleich zur herkömmlichen JPEG Komprimierung eine Reduktion der Dateigröße um den Faktor 8 oder 10. „Normale“ PDF die nur aus Linien und Text bestehen können auch MRC komprimiert werden, jedoch sollte beachtet werden dass das PDF vor der MRC Komprimierung gerendert, also in eine Bilddatei umgewandelt wird, um danach als MRC-PDF ausgegeben zu werden. Der vorher im PDF enthaltene Text wird wieder in die MRC-PDF eingefügt. Normalerweise macht es also nur Sinn gescannte Farbdateien bzw. PDF Dateien die OCR verarbeitet wurden, einer MRC Komprimierung zu unterziehen.

Die Textdarstellung in einer MRC-PDF Datei ist trotz einer mit 150-200dpi geringen Auflösung auch bei kleinen Schriften klar lesbar und ohne Artefakte. Die PDF-MRC Komprimierung ist also die ideale Lösung um im Unternehmen anfallende Dokumente in Farbe zu archivieren, wobei die Dateigröße nicht wesentlich über jener von Schwarz-Weiß Scans liegt, die Texte gut lesbar bleiben und der Vorteil der Farbdarstellung besteht.

PDFCompressor Komponente Test & Beispielanwendung >>>

FileConverterPro (FCpro) als eigenständige C# / .NET Komponente

Bisher haben wir den FileConverterPro (FCpro) nur als Windows Service mit REST/SOAP Web-Service Schnittstelle verwendet. Jetzt haben wir daraus auch eine eigenständige C# / .NET Komponente gemacht. Damit können wir alle im FileConverterPro (FCpro) zur Verfügung stehenden Funktionen zur Dokumentenkonvertierung auch direkt in andere Anwendungen implementieren. Darauf aufbauend werden wir in Kürze den FCpro Konverter als eigenständige Anwendung mit Kommandozeile sowie als Windows Dienst mit Verzeichnisüberwachung (Hotfolder) erstellen. Ebenso werden wir diese Konverter Komponente direkt in PDFMerge / EasyMerge bzw. im EMailArchiver und in weiteren Anwendungen integrieren.

Diese FCpro C# / .NET Komponente wird von uns nicht als eigenständiges Produkt angeboten und wird nur im Rahmen unserer Anwendungen sowie bei individuellen Softwareprojekten verwendet. Für die FCpro Konverter Komponente steht eine Beispiel & Testanwendung zur Verfügung mit der interaktiv alle FCpro Konvertierfunktionen ausprobiert werden können.

Funktionen der FCpro Komponenten Testanwendung:

  • Eigenständige Testanwendung um interaktiv die FCpro PDF & PDF/A Konvertierfunktionen testen zu können
  • Erzeugt – PDF, PDF/A, Text, Bild-Voransicht, Miniaturen Ansicht aus den verschiedensten Datei- und Containerformaten (ZIP, EML, MSG…)
  • FCpro Konvertier Profil-Funktionen:  Erstellen, Kopieren, Bearbeiten, Profil exportieren / importieren
  • Konfiguration der Anzahl der parallelen Prozesse für die Konvertierung
  • Ein oder mehrere Dateien können zur Konvertierung in den gelb markierten per Drag & Drop Bereich gezogen werden.  Die Ergebnisdateien (PDF, TXT, JPEG, PNG) werden im Ordner der Ausgangsdatei abgelegt.

Download – FileConverterPro (FCpro) Komponenten Testanwendung ~600MB >>>

Webshop