Autor: Wolfgang May

FineOCR – ABBYY Commandline OCR – neue Version 1.0.2

Neuerungen Version 1.0.2:

  • Userinterface Deutsch / Englisch umschaltbar bzw. automatische Auswahl
  • Verarbeitung aller Dokumente aus Ordnern und Unterordnern

Parameter:

  • /src=[„]<source file>[„] – The source file (or directory) path. Supported formats: PDF, BMP, PCX, DCX, JPG, JPEG2000, TIF, GIF, PNG, DjVu.
  • /dst=[„]<destination file path>[„] – The destination file (or directory) path. If this parameter is not present the path and file name of the destination file will be the same like the source file but with PDF extension. Supported destination formats: PDF, DOC/RTF, HTML, XLS, TXT however only the PDF export settings can be configured. Other formats will be exported using the engine’s default settings.
  • /configfile=[„]<config file path>[„] – The path of the configuration settings file. If the /src and /dst parameters are not specified the application will display the configuration window. If the configuration file does not exists the default configuration will be displayed.
  • /overwrite=true|false – Specifies whether the destination file will be overwritten (default: false).
  • /exts=tif,jpg,…. – List of extensions which should be processed in a folder structure.
  • /subfolders=true|false – Specifies whether the subfolders should be processed in a folder structure (default: false).
  • /log=[„]<log file path>[„]\ – The path of the log file.
  • /lang=en|de – The user interface language of the configuration window.

Beispiele:

  • FineOCR.exe /src=“c:\temp\test1.tif“
  • FineOCR.exe /src=“c:\temp\test1.tif“ /dst=“c:\temp\output.pdf“ /configfile=“c:\temp\config.xml“
  • FineOCR.exe /configfile=“c:\temp\config.xml
  • FineOCR.exe /src=“c:\temp\inputfolder“ /dst=“c:\temp\outputfolder“ /exts=tif,jpg /subfolders=true /overwrite=false

Download – FineOCR Commandline OCR für ABBYY FineReader >>>
Download – FineReader OCR Engine 9.x >>>
FineOCR 1.0.2 – Readme >>>

Für die Verwendung der ABBYY FineReader OCR Engine ist eine Demokey erforderlich – dieser ermöglicht Ihnen alle Optionen mit 500 Seiten innerhalb von 30 Tagen kostenlos zu testen. Falls Sie das Produkt mit der FineReader OCR Engine testen wollen so fordern Sie bei uns bitten einen Demo-Lizenzkey  an.

Demolizenzkey für FineReader OCR Engine anfordern
Aktivierung Demo Lizenz Abbyy FineReader OCR Engine Version 9.x >>>

eDocPrintPro Utility – parallel mehrere Druckertreiber gewünscht ?

eDocPrintPro verfügt auch über die Möglichkeit zusätzlich zum standardmäßig angelegten Drucker weitere Drucker unter anderen Namen hinzuzufügen. Damit können mehrere Druckertreiber parallel angesprochen werden.

Mit Hilfe der „eDocPrintPro Utility“ – lassen sich weitere Treiber mit unterschiedlichen Namen anlegen. Jeder Treiber verfügt dann über seine eigenen Einstellungen die unabhängig voneinander konfiguriert werden können. Damit muss je nach Anwendung einfach nur ein anderer Drucker ausgewählt werden um andere Einstellungen und Funktionen nutzen zu können.  So wird die Bedienung für den Anwender denkbar einfach.  Es kann z.B. ein eigener “Archiv” Treiber eingerichtet werden der über bestimmte nicht änderbare Voreinstellungen verfügt und alle Dokumente die darüber ausgedruckt werden landen automatisch im zentralen Dokumentenarchiv. Da der eDocPrintPro Druckertreiber auch über Plugins erweitert werden kann kann  jeder Treiber auch andere Plugins und Plugin Einstellungen verwenden.

Funktionsübersicht

  • eDocPrintPro Toolbox mit Userinterface bzw als Commandline Tool
  • Weitere eDocPrintPro Drucker mit unterschiedlichen Namen & Einstellungen hinzufügen
  • Definition der ESF Folder – Ordner in dem die ESF Druckerprofile gespeichert werden
  • eDocPrintPro Userinterface  Sperren (=Read Only setzen), Öffnen, oder nur ESF Profilauswahl erlauben.
  • ESF Profileinstellungen laden
  • 32 und 64bit Version verfügbar

eDocPrintPro Utility

Commandline Parameter:

/PRINTER=name or /PRINTER=“name“ eDocPrintPro printer name; if missing “eDocPrintPro” is assumed; if “*”, the command line is applied to all avilable eDocPrintPro printers
/ESFFOLDER=folder or /ESFFOLDER=”folder” The ESF files folder. Use “” for reset to default.
/SILENT Disables user interface for this tool
/LOCKED=value Locks user interface; valid values are T(rue), F(alse), P(rofile). P locks the user interface, but allows user to select a profile.
/PROFILEPATH=path or /PROFILEPATH=”path” Loads the settings from the specified ESFprofile file.
/PROFILENAME=name or /PROFILENAME=”name” Loads the settings from the specified profile name from the specified printer ESF folder; the option keeps track of the /ESFFOLDER above, if present.
/ADDPRINTER Adds the eDocPrintProPrinter with the given name.

Samples:

  • /silent /printer=Test3 /locked=true /profilepath=“c:\temp\profile1.esf“ /addprinter – will add a new printer with the name Test3, will set it locked and will load the settings from the profile1 ESF file;
  • /AddPrinter /Printer=”new printer” – will add a printer with the given name and will show user interface to allow additional changes;
  • /esffolder=”c:\eDoc\EdocPrintPro” /locked=f – will unlock the eDocPrintPro printer and will redirect its ESF folder.

Download – eDocPrintPro Utility – 32 / 64bit >>>

eDocPrintPro – gemischte Seitenorientierungen im PDF erzeugen

Nicht jedes Dokument hat auf jeder Seite die gleiche Orientierung  – es kommt immer wieder vor dass z.b. ein MS-Word Dokument das normalerweise im A4 Hochformat geschrieben wird einzelne Seiten im Querformat aufweist um z.b. Tabellen oder Grafiken besser darstellen zu können. Behält man die Standardeinstellung des eDocPrintPro Druckertertreibers bei so wird normalerweise das ganze PDF Dokument  in der Orientierung der ersten Seite erzeugt. Es gibt jedoch auch eine einfache Möglichkeit die Seitenorientierung im PDF Dokument gleich dem Layout im Ursprungsdokument zu gestalten und damit automatisch pro Seite die Seitenorientierungzwischen zwischen Hoch- und Querformat umzuschalten.

Es gibt dazu einen eigene Option im Druckertreiber die entsprechend umgestellt werden muss. Die Option „Seite drehen“ in den PDF Einstellungen muss auf „Seite für Seite“ gestellt werden. Wichtig ist auch dass die Option „Seitenformat des Programms verwenden“ aktiviert ist.

Seite drehen - Seite für Seite Seitenformat des Programms verwenden

Verflachen von Adobe LiveCycle PDF Formularen über eDocPrintPro Druckvorgang

Normalerweise kann man ausgefüllte PDF Formulare direkt verflachen und die Feldinformation „einbrennen“. Es gibt jedoch auch eine spezielle Art von PDF Formularen die über den Adobe LiveCycle Server erstellt wurden und die nicht wie normale PDF Formulare mit der herkömmlichen Datenstruktur aufgebaut sind. Diese spezielle Form der PDF Formulare kann nur mit dem Adobe Reader ausgefüllt, gespeichert und gedruckt werden. Alternative PDF Viewer von anderen Herstellern funktionieren nicht und können die Formulare und deren Inhalte nicht richtig auslesen, darstellen und ausdrucken.

Speziell falls man solche Formulare langzeitarchivieren möchte muss man sicherstellen dass diese auch in Zukunft von jedem beliebigen PDF Programm angezeigt und ausgedruckt werden können. Das ist jedoch nur möglich wenn diese in normale PDF Dokumente umwandelt.  Der Adobe Reader ist die einzige Anwendung mit dem man solche Abobe LiveCycle Formulare anzeigen und ausdrucken kann. Die einfachste und kostengünstigste Möglichkeit ist die Konvertierung über einen PDF-Druckvorgang. In diesem Fall verwenden wir unseren eDocPrintPro Druckertreiber um über einen automatisierten Druckprozess daraus „verflachte“ und überall lesbare PDF oder PDF/A Dokumente zu erzeugen. Diese können dann über jeden beliebigen PDF Viewer angezeigt und wie ein normales PDF Dokument weiterverarbeitet werden.

Wir haben auf Basis unserer vorhandenen Tools eine solche C# .NET Anwendung erstellt um diesen Vorgang zu automatisieren und in eigene Anwendungen einbinden zu können.

Adobe LiveCycle PDF Formular verflachen mit eDocPrintPro und Adobe  Reader

Download – Verflachen von PDF Formularen über eDocPrintPro Druck >>>
Download – eDocPrintPro 32bit (~5MB) >>>

Verflachen von ausgefüllten PDF Formularen mit dem pdfNET SDK

Will man ausgefüllte PDF Formulare archivieren und die Formularfeldinhalte vor nachträglicher Veränderung schützen so macht es Sinn diese Formulare in normale PDF Dokumente umzuwandeln. Diese Aktion nennt man „Verflachen“ von PDF Formularen. Dabei werden die Inhalte der Formularfelder „eingebrannt“ und in normalen PDF Text konvertiert. Auf Basis unsereres pdfNET SDK Toolkits haben wir eine C# – .NET Beispielanwendung erstellt mit der PDF Formulare verflacht und in normale PDF Dokumente umgewandelt werden können.

PDF Form  Flattening Sample

Download Beispiel – Verflachen von ausgefüllten PDF Formularen >>>
Beispiel – PDF Formular ausgefüllt und gespeichert >>>
Beispiel – PDF Formular verflacht – Feldinhalte in Text umgewandelt >>>

FineOCR – Commandline OCR mit ABBYY

FineOCR ist eine auf der ABBYY FineReader OCR Engine basierende Anwendung die es erlaubt per Commandline Aufruf Image- bzw. auch PDF Dokumente einer Schrifterkennung zu unterziehen und daraus Textdokumente bzw. durchsuchbare PDF bzw. PDF/A Dokumente zu erzeugen.

Parameter:

  • /src – legt den Input fest – PDF, BMP, PCX, DCX, JPG, JPEG2000, TIF, GIF, PNG, DjVu
  • /dst – legt das Zieldokument fest – PDF, DOC/RTF, HTML, XLS, TXT
  • /configfile – legt die zu verwendende Konfigurationparameter fest
  • /log – definiert wohin die Log-Datei während der Verarbeitung geschrieben werden soll.

Beispiele:

  • FineOCR.exe /src=“c:\temp\test1.tif“
  • FineOCR.exe /src=“c:\temp\test1.tif“ /dst=“c:\temp\output.pdf“ /configfile=“c:\temp\config.xml“
  • FineOCR.exe /configfile=“c:\temp\config.xml“

Download – FineOCR Commandline OCR für ABBYY FineReader >>>
Download – FineReader OCR Engine 9.x >>>
FineOCR – Readme >>>

Für die Verwendung der ABBYY FineReader OCR Engine ist eine Demokey erforderlich – dieser ermöglicht Ihnen alle Optionen mit 500 Seiten innerhalb von 30 Tagen kostenlos zu testen. Falls Sie das Produkt mit der FineReader OCR Engine testen wollen so fordern Sie bei uns bitten einen Demo-Lizenzkey  an.

Demolizenzkey für FineReader OCR Engine anfordern
Aktivierung Demo Lizenz Abbyy FineReader OCR Engine Version 9.x >>>

Office2PDFA – Version 1.0.18 verfügbar

Mit der Version 1.0.18 unterstützt Office2PDFA jetzt auch die Abbyy FineReader Engine der Version 9.x

Download – Office2PDFA – 30 Tage Demo >>>
Download – eDocPrintPro PDF/A 32bit – 30 Tage Demo >>>

Office2PDFA – weitere Informationen >>>

Download – FineReader OCR Engine 9.x >>>
Aktivierung Demo Lizenz Abbyy FineReader OCR Engine Version 9.x >>>

Für die Verwendung der FineReader OCR Engine ist eine Demokey erforderlich – dieser ermöglicht Ihnen alle Optionen mit 500 Seiten innerhalb von 30 Tagen kostenlos zu testen. Falls Sie das Produkt mit der FineReader OCR Engine testen wollen so fordern Sie bei uns bitten einen Demo-Lizenzkey  an.

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Version 1.8.2 verfügbar

Erweiterungen der Version 1.8.2 :

Einzelseiten Verarbeitung von mehrseitigen Dokumenten: Split vor der OCR Verarbeitung von Multipage auf Singlepage Dokumente für TIFF und PDF – Bei der Verarbeitung von sehr umfangreichen Dokumenten mit hunderten oder tausenden Seiten lädt die OCR Engine normalerweise alle Seiten in den Speicher und startet dann die Verarbeitung. Das benötigt bei großen Dokumenten sehr viel an Speicher – ist dieser nicht vorhanden so verlangsamt dies die Verarbeitung. Falls ein solches Mehrseitendokument einzelne fehlerhafte Seiten aufweist die nicht verarbeitet werden können – so kann bei einer „Gesamtverarbeitung“ das ganze Dokument nicht verarbeitet werden. Das ist jedoch speziell bei umfangreichen Dokumenten ein Nachteil. Aus diesem Grund wurde eine Funktion implementiert mit der es möglich ist die OCR Verarbeitung auf Basis von Einzelseiten durchzuführen – wobei der Input als auch der Output wieder als Mehrseiten-Dokument erfolgt. Damit können auch mit wenig Hauptspeicher beliebig große Dokumente ohne Probleme und mit immer der gleichen Performance verarbeitet werden. Bei einem Fehler auf einer einzelnen Seite wird damit nicht das ganze Dokument als fehlerhaft abgelehnt.

Ersetzen von OCR Error Seiten  durch PDF Image Seiten – falls ein Fehler bei der Einzelseiten OCR Verarbeitung auftritt wird so kann eine einzelne Seite auch durch eine direkt konvertierte PDF Image Seite ersetzt werden.  Dies kann speziell bei sehr umfangreichen Dokumenten mit hunderten oder tausenden Seiten die Lösung zur erfolgreichen Verarbeitung der Gesamtdatei darstellen.

Löschen von leeren Seiten – Bei der Einzelseitenverarbeitung gibt es jetzt auch eine Option die es ermöglicht einen Schwellwert für leere Seiten festzulegen – Liegt die Dateigröße einer Seite unter dem eingestellten Schwellwert so wird diese in einen vordefinierten „Leere Seiten Ordner“ verschoben und in der Verarbeitung übersprungen. Sie wird damit auch nicht in die Ausgangsdatei eingefügt.

Einzelseitenverarbeitung & Löschen von leeren Seiten

Image2PDF Verarbeitung als Verarbeitungs-Option bei Ordnern – AutoOCR kann jetzt auch dazu verwendet werden um per Foldermonitoring – Imagedateien direkt nach PDF oder PDF/A zu konvertieren. Es wurden die Funktionen unserer Image nach PDF(/A) Verarbeitung in die AutoOCR Software integriert. Weitere Informationen zur Image nach PDF(/A) Konvertierung finden sie hier >>>

OCR Engine oder Image nach PDF stehen zur Auswahl

Unterstützung der Abbyy FineReader Engine Version 9.x – Neben der zuletzt gültigen Version 8.1 unterstützt AutoOCR jetzt auch die Version 9.x – die Version der installierten Engine sowie die von Ihr unterstützten Dateiformate werden erkannt und als „Verfügbar“ bei der Konfiguration der zu überwachenden Ordner angezeigt.

Download – AutoOCR – OCR Server >>>
Download – FineReader OCR Engine 9.x >>>

Für die Verwendung der FineReader OCR Engine ist eine Demokey erforderlich – dieser ermöglicht Ihnen alle Optionen mit 500 Seiten innerhalb von 30 Tagen kostenlos zu testen. Falls Sie das Produkt mit der FineReader OCR Engine testen wollen so fordern Sie bei uns bitte einen Demo-Lizenzkey  an.

Demolizenzkey für FineReader OCR Engine anfordern

MakePDFA.NET – Version 1.0.21 verfügbar

MakePDFA.NET unterstützt jetzt auch die aktuelle ABBYY FineReader OCR Engine in der Version 9.x.  Voraussetzung für die Verwendung ist die vorherige Installation der OCR Engine mit dem unserem Setup. Je nach installierter Version der ABBYY Engine kann in der MakePDFA Konfiguration entweder die Version 8.x oder die Version 9.x für die OCR Verarbeitung von Image oder PDF Dateien ausgewählt werden.

Download – MakePDFA.NET >>>
Download – FineReader OCR Engine 9.x >>>

Für die Verwendung der FineReader OCR Engine ist eine Demokey erforderlich – dieser ermöglicht Ihnen alle Optionen mit 500 Seiten innerhalb von 30 Tagen kostenlos zu testen. Falls Sie das Produkt mit der FineReader OCR Engine testen wollen so fordern Sie bei uns bitte einen Demo-Lizenzkey  an.

Demolizenzkey für FineReader OCR Engine anfordern

Webshop