Neue OmniPage OCR Engine für AutoOCR & AutoOCRLight ab 2.0.7

Vorteile der OmniPage OCR:

  • Erkennungsgenauigkeit auf höchstem Niveau auch bei schwierigen Dokumenten
  • Schnellste OCR Verarbeitung – wesentlich schneller und performanter als alles was wir bisher getestet und implementiert haben. 1-2 Sekunden um ein durchsuchbares PDF pro Seite zu erzeugen sind möglich.
  • Kostengünstig – 25.000 Seiten Lizenz mit geringeren Lizenzkosten als die bisherige 10.000 Seiten Abbyy Lizenz
  • Einfacheres Freischalten der (Demo)Lizenz – Die OmniPage OCR Engine kann über unseren Lizenzserver inkl. 30 Tage Demoversion zusammen mit der Basisanwendung aktiviert werden.

Zu beachten ist dass die OmniPage OCR Engine aus lizenzrechtlichen Gründen nur auf Client Betriebssystemen – Windows 7 / 10  nicht jedoch auf Microsoft Server 2008, 2012, 2016 oder 2019 installiert werden kann. Das Setup lässt sich nur unter Windows 7 / 10  ausführen. Hinsichtlich Performance und Stabilität ist das kein Nachteil. OCR Prozesse sind rechenintensiv und sollten für einen optimalen Durchsatz auf einer eigenen Hardware (z.b. Intel NUC) mit möglichst vielen CPU Cores und SSD Disk ausgeführt werden.

Die OmniPage OCR Engine kann für AutoOCR bzw. AutoOCRLight ab der Version 2.0.7 als Option zusätzlich zur iOCR (Tesseract OCR) lizenziert werden und ist im AutoOCR Setup bereits enthalten. Für AutoOCRLight kann die OmniPage OCR separat heruntergeladen und installiert werden.

Download – OmniPage OCR Engine als Option für AutoOCRLight (ca. 235MB) >>>

Download – AutoOCRLight – Low Cost OCR Server (ca. 410MB) >>>

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>

AutoOCR / AutoOCR light 2.0 – iOCR Neuerungen

Neuerungen der AutoOCR / AutoOCR light Version 2.0:

  • Die iOCR Standard OCR Komponente von AutoOCR / AutoOCR light basiert jetzt auf der neuen Tesseract OCR Version 4.0.
  • Mehrere Sprachen können für die OCR Erkennung ausgewählt werden.
  • Zusätzliche Option zur Auswahl der OCR Genauigkeit/Geschwindigkeit.

  • Konfigurierbarer Parameter für das Teilen von Dokumenten in kleinere Einzeldokumente um Dokumente mit großer Seitenzahl mit geringen / begrenzten Speicherressourcen verarbeiten zu können.

  • Bedingte OCR Verarbeitung – über Dateiformat, Seitenzahl, Seitenformat – Breite / Höhe in mm oder Pixel, Auflösung, Dateigröße und Farbtiefe  – für Ordnerüberwachung und für die Web-Service Verarbeitung konfigurierbar. Damit kann pro Datei-Format über Kriterien gesteuert werden – ob eine OCR Verarbeitung oder eine Konvertierung in ein PDF-Image erfolgen bzw. ob die OCR Verarbeitung solcher Dateien geblockt werden soll. Damit kann verhindert werden dass die OCR Verarbeitung durch “sinnlose” Verarbeitungen blockiert wird. z.b. falls große JPEG Fotos in den OCR Verarbeitungsprozess gelangen und die Schrifterkennung dabei keinen Sinn macht.

  

Weitere Informationen zu den AutoOCR / AutoOCR light – iOCR Erweiterungen siehe hier >>>

Download – AutoOCR – OCR Server (ca. 410MB) >>>

Download – AutoOCRLight – Low Cost OCR Server (ca. 410MB) >>>
Für das Update der AutoOCR light Version 1.x auf 2.x ist eine neue Lizenz erforderlich.

Ordnerüberwachung – “Datei-System Event” / “Blockweise Verarbeitung”

Bei Anwendungen zu Überwachung von Ordnern – z.b. AutoOCR / AutoOCRlight usw. gibt es Optionen die festlegen wie die Dateien zur Verarbeitung aus den Ordnern erkannt werden und wann deren Verarbeitung gestartet wird.

Datei-System Event:

Dabei wird eine Betriebssystem Funktion genutzt um Änderungen an Dateien sowie neue Dateien in einem Ordner / Ordnerstruktur zu erkennen und um die Verarbeitung unmittelbar zu starten. Diese Option sollte nur für lokale Ordner/Ordnerstrukturen, nicht jedoch für die Verarbeitung von Netzwerkfreigaben verwendet werden.

Blockweise Verarbeitung:

Dabei wird der Ordner “blockweise” eingelesen. d.h. es werden immer Blöcke in der eingestellten max. Anzahl von Dateien eingelesen und verarbeitet. Nach der Verarbeitung eines “Blocks” startet der nächste “Block” usw. bis alle Dateien abgearbeitet sind. Falls keine weiteren Dateien gefunden werden so wird der Ordner danach alle 10msek. nach neuen Dateien abgefragt. Die “blockweise Verarbeitung” sollte für die Ordnerüberwachung von Netzwerklaufwerken verwendet werden.

Start der Verarbeitung / Verzögerter Start:

Der Start der Verarbeitung einer neu erkannten Datei erfolgt normalerweise sofort, jedoch kann es auch Gründe geben um die Verarbeitung verzögert zu starten. Für jeden überwachten Ordner gibt es eine Einstellung um den Start der Verarbeitung um x Sek. zu verzögern. Dabei wird zuerst die eingestellte Zeit in Sek. gewartet und erst dann wird die Verarbeitung gestartet – siehe auch >>> – Nach Ablauf der Verzögerung werden die zu verarbeitenden Dateien geprüft ob diese bereits frei und nicht Read-only  sind. Dabei wird nochmals max. 10sek. auf die Freigabe der Datei gewartet.

AutoOCRLight Version 1.17.2 verfügbar

Da AutoOCR und AutoOCRLight auf der gleichen Basis aufbauen ist jetzt zusammen mit der AutoOCR Version 1.17.2 auch AutoOCRLight Version 1.17.2 verfügbar. Die “Light” Version unterscheidet sich von der AutoOCR Vollversion durch folgende Einschränkungen:

  • Nur ein Ordner kann überwacht werden
  • Es kann nur die iOCS / vsOCR und nicht auch die Abbyy OCR verwendet werden
  • Es ist keine PDF/A Ausgabe möglich
  • Die Light Version verfügt über keine Web-Service (REST / SOAP) Schnittstelle

Alle anderen Funktionen sind gleich wie beim Standard AutoOCR Server

Download – AutoOCRLight – Low Cost OCR Server >>>

iOCR / vsOCR Setup geteilt in Standard- und zusätzliche Sprachen

Das iOCR / vsOCR Setup das die Sprach- und Wörterbuchdaten unserer Standard-OCR Engine enthält ist insgesamt über 270MB groß. Um die Downloads und die Setup´s kleiner zu machen haben wir uns entschieden das iOCR / vsOCR in ein “Basis” und ein “zusätzliches Setup” zu teilen. Das Basis-Setup das über unsere Anwendungen z.b. AutoOCR, FileConverterPro oder PDFmdx installiert wird enthält jetzt nur mehr eine Auswahl an wichtigen europäischen Sprachen und wurde damit auf  127MB reduziert.

Sollen alle verfügbaren Sprachen installiert werden so ist das jederzeit möglich. Die zusätzlich verfügbaren “exotischen Sprachen” lassen sich über ein eigenes Setup nachinstallieren.

iOCR Basis-Sprachen:

Dänisch, Deutsch, Englisch, Finnisch, Französisch, Italienisch, Katalanisch, Neu Griechisch, Holländisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Schwedisch, Slowakisch, Slowenisch, Spanisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch

iOCR Erweiterte Sprachen:

Afrikaanis, Albanisch, Arabisch, Aserbaidschanisch, Bahasa Indonesisch, Bengali, Bulgarisch, Cherokee, Chinesisch – traditionell, Chinesisch – vereinfacht, Estnisch, Fränkisch, Gallisch, Hebräisch, Hindi, Isländisch, Japanisch, Koreanisch, Kroatisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Serbisch, Swahili, Tagalog, Tamil, Telugu, Thailändisch, Vietnamese, Weißrussisch

Download – iOCR (vsOCR) Setup – Basis Sprachen (ca. 127MB) >>>

Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 200MB) >>>

 

AutoOCR – Installationsvoraussetzungen ab Version 1.15.3

Bei der AutoOCR Installation ab der Version 1.15.3 werden geänderte Installationsvoraussetzungen geprüft – sind sie erfüllt so werden diese Installationsschritte vom Setup übersprungen und nicht ausgeführt.

Folgende Komponenten werden geprüft und gegebenenfalls nachinstalliert:

Sind diese Komponenten bereits installiert so werden sie nicht nachgeladen und nur AutoOCR wird installiert. Sind alle oder einzelne Komponenten nicht oder nicht in der passenden Version vorhanden so versucht das AutoOCR Setup diese von unserem FTP Server nachzuladen und zu installieren. D.h. falls eine Installation ohne Internet Verbindung gemacht werden soll, so sollten die Setup´s diese Komponenten vorher heruntergeladen und installiert werden.

Die AutoOCR Einstellungen und die Lizenz bleiben bei der Deinstallation / Update auf die neue Version erhalten.

AutoOCR kann mit einer oder mehren unterschiedlichen OCR Engines betrieben werden. Standardmäßig mit dabei ist die iOCR (vsOCR) – Verarbeitung.

Download – AutoOCR – OCR Server (ca. 10MB) >>>

Optional zusätzlich oder auch nur alleine kann die Abbyy OCR für AutoOCR verwendet werden. Dazu muss jedoch ein zusätzliches Abbyy Setup heruntergeladen und installiert werden.  Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – die sie bei uns anfordern können.

Falls nur die Abbyy OCR Engine verwendet werden soll so kann der Download und die Installation von iOCR beim Setup übersprungen werden.

Setup Option - iOCR herunterladen und installieren

Download – Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

 

AutoOCRLight Version 1.15.3 verfügbar

Neuerungen AutoOCRLight Version 1.15.3:

  • Aktualisierung der auf den neusten Stand / gleichen Level wie AutoOCR Version 1.15.2
  • Neue iOCR Engine – vsOCR
  • Wesentliche Steigerung der Verarbeitungsperformance durch Mulithreading und Multicore CPU Support der neuen vsOCR Engine bei der Verarbeitung von mehrseitigen TIFF und PDF Dokumenten.

Unterschiede und Highlights zwischen AutoOCR und AutoOCRLight finden sie hier >>>

Download – AutoOCRLight ohne iOCR (vsOCR) Engine (ca. 10MB) >>>

Download – iOCR Basis (vsOCR) Engine (ca. 127MB) >>>

Low Cost OCR Server- AutoOCRLight – OCR Verarbeitung ohne Limits

Ausgehend von unserem seit viele Jahren bewährten und erprobten OCR Server – AutoOCR bieten wir jetzt mit “AutoOCRLight” einen low cost Variante an. Diese hat im Vergleich zum AutoOCR Vollprodukt einen niedrigeren Preis jedoch aber auch eine eingeschränkter Funktionalität.

Unterschiede AutoOCRLight zu AutoOCR:

  • nur ein In / Out Folder kann konfiguriert werden
  • mit iOCR steht nur eine OCR Engine zur Verfügung – die Abbyy OCR Engine wird nicht unterstützt.
  • kein  PDF/A Support – nur PDF und TXT Output
  • keine SOAP / REST Web-Service Schnittstelle und damit keine Verwendung der kostenlosen AutoOCR Zusatzanwendungen DropOCR, FineOCR, ifresco Transformer

Vorteile / Highlights AutoOCRLight:

  • Installierbar als Windows Service oder als normale Anwendung unter 32 und 64bit OS
  • Folder – Monitoring – neu hinzukommende Dateien werden automatisch erkannt und verarbeitet
  • Verarbeitet – PDF bzw. Imagedateien (TIFF, JPEG) – Schwarz&Weiss, Graustufen, Farbe
  • iOCR – OCR Engine ohne Seitenlimit zur Erzeugung von durchsuchbaren PDF oder TXT
  • Image Prozessing Funktionen zur Verbesserung der Ausgangsdokumente – Automatisches – Drehen – Seitenorientierung erkennen, Gerade ausrichten, Rand beschneiden, Verunreinigungen entfernen, Lochungen entfernen, Linien entfernen.
  • Intelligente PDF-OCR Verarbeitung gemischter Dokumente – Seitenweise wird geprüft ob eine OCR Verarbeitung erforderlich ist.
  • Hoher Durchsatz durch parallele Verarbeitung

1 AutoOCR light - Userinterface  2 AutoOCR light - iOCR Settings  3 AutoOCR light - iOCR - Bildverarbeitung  4 AutoOCR light Einstellungen  5 AutoOCR light - Verarbeitungsoptionen  6 AutoOCR light - Archiv und Error Folder Konfiguration  7 AutoOCR light - E-Mail Konfiguration für Fehlerbenachrichtigung  8 AutoOCR light - Logging

Download – AutoOCRLight – Low Cost OCR Server >>>