AutoOCR Version 2.4.1

Neuerungen AutoOCR Version 2.4.1:

  • Prioritäten bei der Abarbeitung der Jobs:

Bei der Jobkonfiguration kann jetzt ein Prioritätslevel (0 bis 9) vergeben werden. Damit kann bei der Überwachung mehrerer Ordner festgelegt werden in welcher Reihenfolge und mit welcher Priorität die Dateien welche in diesen Ordnern landen abgearbeitet werden. Zusätzlich kann für den überwachten Ordner auch festgelegt werden in welcher Reihenfolge die Dateien daraus abgearbeitet werden. Undefiniert / Ältere Dateien zuerst / Neuere Dateien zuerst.

Priorität = 0 bedeutet, dass die Dateien aus diesen Foldern zuallererst vor allen Anderen abgearbeitet werden. 0 ist damit die höchste Prioritätsstufe.

Priorität = 1 bis 9, definiert die Priorität während der Laufzeit. Diese entspricht zu Beginn auch der konfigurierten Priorität, erhöht sich aber während der Verarbeitung. Als Ergebnis davon werden Jobs mit niedriger Priorität öfter abgearbeitet als Jobs mit höherer Priorität.

  • Multipage PDF aus Einzeldateien:

Es gibt Anwendungsfälle bei welchen Einzeldateien (z.B: JPEG, TIF, PNG, PDF) verarbeitet werden sollen, wobei das Ergebnis der OCR Verarbeitung eine einzelne durchsuchbare, komprimierte PDF Multipage Datei sein soll.

Dafür gibt es jetzt die Möglichkeit bei der Jobkonfiguration eine „Multipage“ Option zu aktivieren. Zusätzlich kann auch die Reihenfolge festgelegt werden mit der die Einzeldateien in der Gesamtdatei sortiert werden sollen. Entweder nach „Name“ oder nach „Datum/Uhrzeit“.

Um die Verarbeitung definiert zu starten dient eine „Triggerdatei“ standardmäßig mit der Endung „*.rd“. Die Verarbeitung des überwachten Folders startet erst wenn eine Datei mit der *.rd Endung erkannt wird. Entweder man kopiert eine *.rd Datei in den/die überwachten Folder bzw. gibt es auch den Button „Start Multip.“ um die Triggerdatein automatisch zu erzeugen und in die aktiven Jobfolder zu kopieren.

Die PDF Multipage Ergebnisdatei wird im konfigurierten Ausgabefolder abgelegt. Als Dateiname für die Multipage PDF wird der Ordnername des Ursprungsfolders der Einzeldaten vergeben. Die Einzel-Ausgangsdateien bleiben nach der Verarbeitung erhalten und werden weder gelöscht noch verschoben.

 

  • Portugiesisch – als neue Sprache für die Benutzeroberfläche:

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 670MB) >>>
Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 1200MB) >>>

PDF2PDFA – Konverter – ZUGFeRD Version 2.3 / XRECHNUNG 3.x

Neuerungen PDF2PDFA Konverter:

  • Aktualisierung der PDF/A Konverter Komponente auf den aktuellen Stand.
  • Anpassungen an den aktuellen ZUGFeRD Standard Version 2.3 und XRECHNUNG 3.x

PDF2PDFA Konverter – Test & Beispielanwendung >>>

PDF2PDFA-CL – PDF/A – Kommandozeilen Konverter >>>
PDF2PDFA-FM – PDF nach PDF/A Konverter mit Ordnerüberwachung >>>
PDF2PDFA-CS – PDF to PDFA Converter Service >>>
DropPDFA – PDF per Drag&Drop nach PDF/A & ZUGFeRD konvertieren >>>

AutoOCR Version 2.2.4

Neuerungen AutoOCR Version 2.2.4:

  • Aktualisierung der AutoOCR Basiskomponenten – iOCR, PDF2PDFA, PDFCompressor auf den aktuellen Stand.
  • Neue vorkonfigurierte MRC Farbprofile für die PDFCompressor Option: 150 / 200 / 300dpi mit unterschiedlichen Komprimierstufen.

  • Neues Setup für die iOCR erweiterte Sprachunterstützung / zusätzliche Sprachen

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 670MB) >>>
Download – AutoOCR light – Low Cost OCR Server (ca. 670MB) >>>
Download – GenOCR – OCR Testanwendung für iOCR (ca. 680MB) >>>
Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 1200MB) >>>

PDFCompressor – Erweiterungen der PDF-MRC (Mixed Raster Content) Farb-Komprimierung

Der größte Effekt bei der Komprimierung und Verkleinerung von Farbscans / Farbdokumenten kann durch die MRC Komprimierung erreicht werden. Üblicherweise bestehen Dokumente aus Bildern / Grafiken und Schrift. Alle diese Elemente in der gleichen Art und Weise zu komprimieren bringt Nachteile. Will man eine hohe Komprimierungsrate erreichen so verschlechtert sich oft die Lesbarkeit der Schrift und des Textes. Auch haben farblich gescannte Dokumente oft einen nicht weißen Hintergrund. Der Hintergrund einer Seite enthält jedoch keine relevante Information, kann aber eine PDF Datei erheblich vergrößern.

Der aktuelle PDFCompressor arbeitet jetzt mit einer erweiterten MRC Komprimierung und ist jetzt in der Lage PDF Farbdokumente in mehrere Ebenen zu splitten, diese unterschiedlich zu komprimieren, um sowohl eine möglichst kleine Dateigröße, als auch eine gute Lesbarkeit der Texte zu erreichen.

PDFCompressor Erweiterungen:

  • Neue vorkonfigurierte MRC Farbprofile: 150 / 200 / 300dpi mit unterschiedlichen Komprimierstufen.

  • Graustufen- in Farb-Bilder zu konvertieren: Die MRC Komprimierung ist nur für Farbscans anwendbar. Graustufen Scans können daher nur dann als MRC verarbeitet werden, wenn diese vorher in Farbbilder konvertiert werden.

  • Neue Ebenen Funktion: Aus Basis dieser Ebenen Funktion werden jetzt 3 Ebenen erstellt. Eine Ebene für die reine schwarz-weiß Darstellung welche üblicherweise die Schrift / Text des Dokuments enthält. Eine Ebene für die Textfarbe und eine Ebene für den Seitenhintergrund. Für jede dieser Ebenen wird die optimal geeignete Komprimierung angewendet um möglichste kleine Dateien und optimale Lesbarkeit zu erreichen. Normalerweise werden diese Ebenen im PDF automatisch übereinander angezeigt. Man sieht das Gesamtbild kann aber die einzelnen Ebenen visuell nicht unterscheiden / erkennen.  Im PDF gibt es jedoch die Möglichkeit die Ebenen in der Datenstruktur zu trennen und die Ebenen zu benennen. Im Adobe Reader lassen sich dann die Ebenen einzeln oder in Kombination darstellen. Die Ebenen können also einzeln deaktiviert und aktiviert werden.

  • PDF Ebenen – einzeln darstellbar

  • Text dünner / stärker darstellen: Für die Erstellung der Text / Schwarz-weiß Ebene aus dem Farbbild gibt es einen Parameter um den Text dünner oder stärker / fetter zu erzeugen. Der Parameter geht von 0 bis 50 (dünner) bzw. 51 bis 100 (fetter). Der Standardwert ist mit 45 voreingestellt.

Neben den reinen PDFCompressor Anwendungen sind die PDFCompressor Funktionen auch in folgenden Anwendungen als Funktion / Option integriert zu finden:

SplitBarcode – Barcodes als PDF Annotations, neue Regex Funktion

Barcodes als PDF Annotations erfordern Rendering: Nicht immer sind die Barcodes in PDF Dateien als Bild auf dem gescannten Dokument vorhanden. Diese können auch nachträglich als PDF Anmerkung / Annotation z.b. als Stempel aufgebracht werden. In diesem Fall kann dann nicht das gescannte Bild für die Barcode Erkennung herangezogen werden. Das PDF muss nochmals gerendert (in ein Bild umgewandelt) werden. Erst dann können alle Barcodes des PDF für die Erkennung verwendet werden.

Bisher wurde für die Barcode Erkennung immer nur der im PDF vorhandene Scan des Dokuments verwendet. Jetzt gibt es auch die Möglichkeit das PDF vor der Verarbeitung zu rendern. Der Rendervorgang verbraucht sowohl Zeit als auch Rechnerressourcen , ist also langsamer als die direkte Verarbeitung der Bilder. Deswegen gibt es auch eine Option um nur jene Seiten zu rendern welche Anmerkungen enthalten. Ebenso kann die Rendering Auflösung konfiguriert werden.

Neue Regex Funktion – Zeichen am Ende ersetzen / entfernen:  #REPLACE#<regex>##<text>, wobei <regex> ein Regular Expression Ausdruck und <text> der ersetzende String ist. Dieser kann auch <leer> sein. z.B.: Die Funktion #REPLACE#.{4}$## „entfernt“ die letzten 4 Zeichen des Strings und ersetzt diese durch einen leeren String. Als Erleichterung gibt es den „Fx“ Button um die bereits vordefinierten Regex Ausdrücke direkt abzurufen und als Vorlage einzufügen.

Download SplitBarCode Anwendungen:

eDocPrintPro Version 5.8.0 – Neue PDF/A Formate

Neuerungen:

  • Umgehung des Adobe Reader Problems das nach dem August Update auftritt, durch geänderte Voreinstellungen der Ghostscript Konvertierung – siehe >>>
  • Aktualisierung der PDF2PDFA Konverter Komponente auf den aktuellsten Stand.
  • Neue PDF/A Formate – Erzeugen von PDF/A 4/4e/4f Dateien, basierend auf dem PDF Level 2.0

Download – eDocPrintPro free 64bit Version

Download – eDocPrintPro 64bit PDF/A & ZUGFeRD

Download GhostScript 10.03.1 64bit Setup

iPaper Client Version 3.3.5 – Adobe Reader – Probleme bei der Anzeige von Schriften

Aufgrund des Adobe Reader August Updates Version 2024.002.21005 ist eine neue iPaper Version erforderlich um das Problem mit der Darstellung der Schriften zu umgehen. Nach der Installation der iPaper Version 3.3.5 sollte zuerst ein Probeausdruck über den iPaper PDF Druckertreiber gemacht werden und danach ein nochmaliger Ausdruck. Die geänderten Einstellungen werden beim erstmaligen Druck in die Registry geschrieben und wirken erst für die nachfolgenden Ausdrucke.

Siehe: Adobe Reader August Update 2024.002.21005 – Probleme bei der Anzeige von Schriften

Adobe Reader August Update 2024.002.21005 – Probleme bei der Anzeige von Schriften

Adobe hat mit seinem August Update Version 2024.002.21005 plötzlich das Problem dass Text im PDF nicht richtig gerendert, mit dem falschen Font in der falschen Größe und ineinander verschoben angezeigt wird. Es handelt sich hier um einen Bug von Adobe, da das Problem nicht nur mit PDF Dateien, sondern auch mit validen PDF/A Dateien auftritt. PDF/A ist ein seit vielen Jahren festgelegter internationaler Standard.

Speziell PDF/A wurde ja für die Langzeitarchivierung normiert und festgelegt damit auch in vielen Jahren PDF/A Dateien noch angesehen und verarbeitet werden können. Mit einem solchen Problem in einer so weit verbreiteten Software wie dem Adobe Reader konterkariert Adobe diesen ISO Standard.

Dieser Bug ist insofern problematisch, da der Adobe Reader normalerweise auf jedem PC installiert ist und somit die Anwender nach dem Update plötzlich vor der Tatsache stehen, dass PDF Dateien die seit 20 Jahren einwandfrei angesehen und ausgedruckt werden konnten, plötzlich mit dem Adobe Reader „nicht mehr lesbar“ sind.

 

Wir verwenden für die Erstellung der PDF Dateien den Standard PostScript Treiber von MS-Windows um eine PostScript Datei zu erzeugen. Diese wird dann mittels GhostScript nach PDF konvertiert. Ein seit Jahren zuverlässiger und vielfach genutzter Weg um PDF in hoher Qualität zu erzeugen.

Nach unseren Analysen konnten wir das Problem eingrenzen und haben festgestellt dass der Adobe Reader Version 2024.002.21005 plötzlich nicht mehr in der Lage ist Schriften die als „Outline/Kontur Schriften“ im PDF eingebettet sind, darzustellen und zu rendern, was aber seit 20 Jahren immer problemlos funktioniert hat. Bei der GhostScript Konvertierung ist das eine mögliche Einstellung welche wir bisher als Standard für die Konvertierung verwendet haben. Diese Einstellung wurde bewusst verwendet um Probleme mit speziellen, lizenzrechtlich geschützten Schriften zu umgehen und diese im PDF auch überall darstellen zu können.

Man kann nur hoffen, dass Adobe diesen Fehler möglichst schnell eingesteht und durch ein Update behebt. Bisher gibt es wie von einem „Monopolisten“ zu erwarten keine Reaktion auf das gemeldete Problem.

Änderung der Einstellungen im eDocPrintPro Druckertreiber um das aktuelle Adobe Reader Problem zu umgehen:

 

In Kürze werden wir eine neue Version von eDocPrintPro (free und PDF/A) sowie iPaper verfügbar machen welche diese geänderten Einstellungen berücksichtigen, da es  nicht abschätzbar ist ob, bzw. bis wann es eine neue Adobe Reader Version geben wird welche wieder in der Lage ist alle validen PDF darzustellen.

Update vom 19.8.24: Das Problem wurde von uns bereits an Adobe gemeldet. Über informelle Kontakte haben wir erfahren dass Adobe diesen Fehler anerkannt hat. Es ist jedoch abzuwarten wie lange eine Behebung dauern wird.

Update vom 27.8.24: Adobe hat reagiert und das Problem mit der seit dem 27.8.2024 verfügbaren Adobe Reader Version 2024.003.20054 behoben. Damit werden alle über eDocPrintPro und iPaper erstellen PDF´s wieder korrekt angezeigt.

Webshop