Neue Features ifresco Transformer für Alfresco – mit AutoOCR Version 1.10.3

Wegen der neuen AutoOCR Version 1.10.3 sind neue features für den ifresco AutoOCR Transformer verfügbar:

  • iOCR – neue standard OCR Engine, zusätzlich zu Abbyy
  • Intelligente Verarbeitung von PDF Dokumenten
  • Alfresco Integration – OCR Server bereit zum testen, ohne Installation – Sie können unseren, vom Internet zugänlichen AutoOCR Test Server verwenden.
  • New Step by Step installation and setup documentation.

iOCR – zusätzliche OCR Engine verfügbar

Beginnend mit der AutoOCR Version 1.10.3 installiert das Setup iOCR als standard OCR Engine, welche alleine oder zusätzlich zur Abbyy OCR Engine verwendet werden kann. iOCR hat keine Seiten Lizenz Limits und kann als Input PDF, TIFF oder JPEG verarbeiten und durchsuchbare PDF’s und TXT Dateien erstellen.

Unterschiede zwischen iOCR und Abbyy

  • iOCR unterstützt nicht so viele Sprachen wie Abbyy
  • keine gemischte Spracherkennung – es kann nur eine Hauptsprache gewählt werden
  • nicht das gleiche Level an Genauigkeit und Erkennungsqualität wie Abbyy
  • keine Bild-Vorbearbeitungs Funktionen
  • keine Seitenausrichtungserkennung (Auto-Drehen)
  • Nicht so viele konfigurierbare Funktionen und Features und In-/Output Formate.

Aber iOCR ist eine gute Lösung für kostengünstige und umfangreiche OCR Erkennung z.B. um Text-Informationen von PDF’s und Bildern zu extrahieren, um einen Volltext Index aufzubauen (z.B. Alfresco Transformer > TXT) und durchsuchbare PDF’s von Scans mit guter Qualität zu erstellen.

Am besten ist es Tests mit eigenen Dokumenten durchzuführen, um zu sehen welche OCR Engine am besten Ihren Bedürfnissen entspricht. Beide Engines Abbyy und iOCR können parallel installiert und verwendet werden – Sie müssen nur verschiedene OCR Profile für die unterschiedlichen Einstellungen und OCR Engines erstellen. Auch beide OCR Engines können auf unserem zur Verwendung fertigen AutoOCR Test Server getestet werden (autoocr.may.co.at)

Intelligente PDF Verarbeitung:

Ein PDF Dokument kann nur Bilder von einem Scanner enthalten oder erstellt werden z.B. von einem Druckertreiber oder durch direkten PDF Export. Ein Bild-PDF enthält keinen Text und muss OCR verarbeitet werden. Die anderen “normalen” PDF’s enthalten Text und müssen nicht mehr OCR verarbeitet werden. Der Alfresco Transformer erkennt das und entscheidet ob ein PDF verarbeitet werden muss oder nicht. OCR Verarbeitung kostet Zeit und Ressourcen und deshalb haben wir, beginnend mit der AutoOCR Version 1.10.3, “intellegente PDF-OCR Verarbeitung” eingebaut. Wenn diese Option ausgewählt ist wird jedes PDF, welches zum AutoOCR Server geschickt wird überprüft und wenn es bereits Text enthält, nicht verarbeitet. In diesem Fall wird das PDF oder der extrahierte Text ohne Verarbeitung zurück gesendet. Um dieses Feature zu aktivieren muss der Server für “Intelligente OCR Verarbeitung von PDF Dateien” konfiguriert sein.

PDF - intelligent OCR processing - Abbyy PDF - intelligent OCR processing - iOCR

AutoOCR Test server – fertig zur Verwendung 

Mit der Installation von 2 AMP’s kann der AutoOCR Server mit Alfresco integriert werden. Die Integration arbeitet wie der standard Alfresco Transformer oder kann auch durch Scripting oder Java verwendet werden. Die Kommunikation zwischen AutoOCR und Alfresco findet durch HTTP(S) – REST statt. Um das testen von AutoOCR und der Alfresco Integration noch einfacher zu machen, können Sie unseren AutoOCR Test Server verwenden (autoocr.may.co.at), welcher über das Internet erreichbar ist und beide OCR Engines (Abbyy und iOCR) installiert hat.

Step by Step – Installation und Setup Dokumentation

Mit diesem Dokument wird jeder Schritt für die Installation der Abbyy Engine, von AutoOCR, der Lizensierung, der Verwendung unseres Test Servers und der Integration mit Alfresco mit Screenshots genau erklärt.

Download – Installation und Setup Dokumentation – ifresco AutoOCR transformer for Alfresco >>>

Test und Demo Version ist verfügbar – bitte kontaktieren Sie uns >>>