Kategorie: OCR Server

AutoOCR – Alfresco Transformer Modul / JavaScript / Java Client

Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über  Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen  – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code.  Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter MS-Windows

1_AutoOCR - alfresco transformer - status 2_AutoOCR - alfresco transformer connection configuration 3_AutoOCR - alfresco transformer configuration 4_AutoOCR - alfresco transformer job status

AutoOCR 1.9.6 – HTTPS / SSL Verschlüsselung und Authentifizierung

Mit der Version 1.9.6. von AutoOCR kann der Web-Service jetzt auch mit einer HTTPS / SSL Verschlüsselung arbeiten. Ebenso wird die MS-Windows Authentifizierung über Benutzernamen und Password unterstützt.  Das mitgelieferte C# Beispielprogramm zeigt wie diese Erweiterung funktioniert.

AutoOCR_HTTPS_Authentifizierung mit Username und Passwort AutoOCR - WebService Testanwendung

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – PHP Library für REST Kommunikation

Die jetzt verfügbare AutoOCR PHP Library ermöglicht es die REST-Service basiernde OCR Verarbeitung von AutoOCR in eigene PHP Web-Anwendungen einzubinden. Ein erstes Beispiel einer solchen Integration ist der ifresco Client für das DMS / ECM System von Alfresco. Durch diese Integration mit ifresco ist es jetzt möglich sowohl beim Upload von Dokumenten bzw. bei Dokumenten die sich bereits im ifresco / Alfresco Repository befinden eine OCR Verarbeitung anzustoßen und durchsuchbare PDF Dokumente zu erzeugen.

Download – AutoOCR PHP Library für REST Kommunikation >>>

Voraussetzung: PEAR muss installiert sein mit „http/request“ und  „net/socket“

AutoOCR 1.9.5 – Web-Service Endpoint, Netzwerk-Port und Abruf der WSDL Info

Mit der AutoOCR Version 1.9.5. gibt es jetzt auch eine Funktion um die für den AutoOCR  Web-Service notwendige WSDL Information abrufen zu können.

AutoOCR verfügt über den Web-Service Endpoint:

z.B.: http://localhost:8001/AutoOCRService2/

Über eine URL kann die WSDL Information abgerufen werden:

z.B.: http://localhost:8001/AutoOCRService2/?wsdl

Entwickler (z.b. Java) benötigen die WSDL Info um den AutoOCR Web-Service verwenden und die verwendete Entwicklungsumgebung (IDE) importieren zu können.

AutoOCR – WSDL – XML >>>

AutoOCR - WSDL file

Weiters ist es jetzt auch möglich eine Konfiguration der Endpoint Adressen sowie des verwendeten Netzwerks Ports (Default = 8001) durchzuführen.

AutoOCR Web-Service Konfiguration

AutoOCR – ReadMe  >>>

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR 1.9.4 – OCR Web-Service liefert mehrere Dokumentenformate

Mit der Version AutoOCR 1.9.4 ist es jetzt möglich über die Web-Service Schnittstelle parallel neben dem PDF Format auch weitere Dokumentenformate für das OCRte Dokument abzurufen.

Folgende Dokumentenformate stehen zusätzlich zur Verfügung: DOC, DOCX, RTF, XLS, XLSX, HTM, HTML, XML, PPT

13_AutoOCR - C# WFC - Web-Service Communication Sample

AutoOCR – ReadMe  >>>

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Neue Version 1.9.3 – Abbyy FineReader 10 Support

Mit der neuen AutoOCR Version 1.9.3 unterstützen wir neben der Abbyy FineReader OCR Engine Version 9.x, jetzt auch die aktuellste Version 10. Damit stehen alle neuen Funktionen und Features der Abbyy OCR Engine 10 sowie die verbessererte Nutzung der CPU und Rechnerkerne auch für AutoOCR zur Verfügung. Die Neuerungen zur Abbyy OCR Engine 10 – finden Sie hier beschrieben  >>>

1_AutoOCR - Definition der Verarbeitungs-Folder 1_AutoOCR - Ordner Eigenschaften 1_AutoOCR - Ordner Eigenschaften, PDFA, PDF Info-Felder 2_AutoOCR - Einstellungen 2_AutoOCR - Service Account Konfiguration 3_AutoOCR - Verarbeitungsoptionen 4_AutoOCR - Konfiguration Archiv & Fehler Ordner 5_AutoOCR - SMTP - Fehler Benachrichtigungen & Konfiguration 6_AutoOCR - Verarbeitungsprotokoll 7_AutoOCR - Verarbeitungslog 10_AutoOCR - Icon Tray Anwendung

Zusätzlich haben wir die Web-Service Funktionen erweitert. Mit der neuen Version wird jetzt auch eine .NET / C# / WCF – Beispielanwendung inkl. Source Code mitinstalliert. Die Anwendung verbindet sich über eine URL mit dem AutoOCR Server, ein OCR Profil kann ausgewählt und Dokumente können per Drag&Drop zur Verarbeitung in eine Queue eingefügt werden. Die Anwendung stellt die Kommunikation mit dem AutoOCR Server her, überträgt die Dateien zur Verarbeitung an den Server und zeigt den aktuellen Verarbeitungsstatus an. Nach erfolgreicher OCR Verarbeitung können die Ergebnisdokumente per Link aus der Queueliste direkt aufgerufen werden. Eine Statistikfunktion zeigt den Status der Verarbeitungsqueue, die durchschnittliche Verarbeitungszeit pro Dokument sowie das noch zur Verfügung stehende Seitenkontingent der Abbyy Lizenz.

11_AutoOCR - Web-Service Configuration - OCR Profile Config for web-service 13_AutoOCR - C# WFC - Web-Service Communication Sample12_AutoOCR - Web-Service - Statistics function

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

Abbyy FineReader 10 Release 3 – OCR-Engine Runtime verfügbar

Wir haben jetzt als neue Basis für unsere Anwendungen die aktuellste Version der Abbyy FineReader OCR Engine 10 Release 3 implementiert. Damit stehen eine Vielzahl an Neuerungen und Verbesserungen bei der OCR Verarbeitung zur Verfügung.

Neuerungen Abbyy FineReader OCR-Engine 10 Release 3:

  • Vordefinierte OCR Profile
  • Bild Vor-Verarbeitungsfunktionen
  • Spezielle Funktionen  für die Verarbeitung von Kamera Bildern

Unterstützt werden alle gängigen 32 und 64bit Versionen von MS-Windows. Multiprozessor und Multi-Core Verarbeitung wird zur Beschleunigung der OCR Verarbeitung ebenfalls unterstützt und empfehlen eine Speicherausstattung von mindestens 2GB RAM.

Was ist Neu mit der Abbyy FineReader 10 Engine >>>
Abbyy FineReader 10 – Produktübersicht >>>
Abbyy FineReader Gesamt Funktionsübersicht – Version 5 bis 10 >>>

1_Abbyy FineReader 10 Engine - Vordefinierte Profile 2_Abbyy FineReader 10 Engine - Allgemeine Einstellungen 3_Abbyy FineReader 10 Engine - Bildverarbeitung 4_Abbyy FineReader 10 Engine - Einstellungen - Seiten Analyse5_Abbyy FineReader 10 Engine - Einstellungen - Seiten Zusammensteellung 6_Abbyy FineReader 10 Engine - Einstellungen - PDF Export 7_Abbyy FineReader 10 Engine - Einstellungen - XML Export

Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Abbyy FineReader 10.x Dongle Updater Tool >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Version 1.8.8 – Web-Service Erweiterungen

Mit der Version 1.8.8 von AutoOCR wurden einige Erweiterungen für die Web-Service Schnittstelle implementiert.

Web-Services – AutoOCR Server:

  • GetSettingsCollection – Abfrage der verfügbaren OCR Settings Collections
  • UploadJob mit Übergabe des Namens für das OCR Profil (SettingsCollection)
  • User Authentication – Username / Password
  • GetNrOfPages – Abfrage der Seiten für einen Job
  • GetStatus – Abfrage aktueller Jobstatus – 0 bis 7
  • GetJob – Abfrage von Status, Seitenanzahl, Job GUID, Job ID
  • GetResultCount – 0/1 – vor/nach OCR Verarbeitung
  • GetResultExt – Extension der OCR Ergebnisdatei – z.B.: PDF
  • GetResultEx – Job abholen mit Möglichkeit den Job direkt zu löschen
  • RemoveJob – Job löschen
  • GetAvailablePages – Anzahl der verfügbaren Seiten der OCR Engine
  • GetNrOfPagesInQueue – Anzahl der Seiten in der Job Queue
  • GetNrOfDocumentsInQueue – Anzahl der Dokumente in der Job Queue
  • GetAvgSecPerPage – Durchschnittliche Zeit pro Seite in Sek.

AutoOCR – Service Contract Signature >>>

Der Web-Service hat eine Funktion GetStatus(jobID) über die von Zeit zu Zeit der Status für einen Job mit einer bestimmten JobID abgefragt werden kann. Die JobID wird von der Job Upload Funkton UploadJobEx (oder UploadJob) zurückgeliefert. Wird der Wert „0“ zurückgeliefert bedeutet dies dass der Job noch nicht hochgeladen wurde.

GetStatus liefert folgene Werte zurück:

  • 1 – Created – Job wurde angelegt und noch nicht hochgeladen – intern verwendeter Status – wird nie zurückgeliefert.
  • 2 – Uploaded – Job wurde hochgeladen und befindet sich in der Verarbeitungs-Warteschlange
  • 3 – Converting – Job befindet sich gerade in der OCR Verarbeitung
  • 4 – Converted – Job wurde erfolgreich OCR verarbeitet und steht zum Donwload bereit.
  • 5 – Downloaded – Job wurde bereits heruntergeladen.
  • 6 – Conversion Error – Fehler bei der Verarbeitung des Jobs.
  • 7 – Expired – Job abgelaufen, Dateien wurden nach einer eingestellten Zeit von x Tagen automatisch gelöscht.

Weitere Neuerungen:

  • Web-Service Jobs können priorisiert werden d.h. ein Job über Web-Service übergeben wird einem Eingangsfolder-Job vorgezogen.
  • OCR Profile für den Web-Service lassen sich über ein Infofeld detailliert beschreiben.  Die Remote Applikation kann also neben dem Namen zusätzliche beschreibende Information anzeigen.
  • Aktualisierte Web-Service Beispiel Anwendung

Download – AutoOCR – OCR Server >>>
Download – ASP.NET – Beispiel für Web-Service >>>

Download- Abbyy FineReader 9.x OCR Engine Setup >>>
Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Version 1.8.7 – REST – Web-Service Schnittstelle

Mit der Version 1.8.7. unseres OCR Servers AutoOCR wurde eine Web-Service Schnittstelle auf Basis von WCF / REST implementiert. Damit kann die OCR Verarbeitung von Anwendungen, Prozessen oder Serverdiensten im Netzwerk bzw. über Internet per HTTP Protokoll angesprochen werden.

Die Web-Service Schnittstelle kann parallel zur Folder Verarbeitung oder auch eigenständig aktiviert werden. Um die Konfiguration und die Übergabe der OCR Parameter möglichst einfach und flexibel zu halten werden OCR Profile verwendet. Dabei werden die OCR Einstellungen sowie OCR-Engine über Profilnamen am Server abgespeichert.  Die verfügbaren OCR Profile lassen sich über die Web-Service Schnittstelle abfragen. Wird eine Datei zur Verarbeitung an den OCR Server übergeben so kann der OCR Profilname mitgegeben und damit die Verarbeitungs-Einstellungen ausgewählt werden.

Alle gängigen Programmierumgebungen  – z.b. .NET, Java, PHP, JavaScript usw. – werden unterstützt. AutoOCR bietet damit im Netzwerk einen system- und anwendungsübergreifenden OCR Service der einfach angebunden und integriert werden kann.

AutoOCR - Web-Service Web-Service OCR Profile konfigurieren

Web-Service Konfiguration:

  • Auswahl – Folder für die Web-Service Jobs
  • Aufbewahrungsdauer der Jobs in Tagen –  verbliebene, nicht bereits gelöschte Jobs werden automatisch nach x Tagen gelöscht
  • Web-Service aktivieren / deaktivieren
  • Web-Service OCR Profile verwalten  (Anlegen / Bearbeiten / Löschen) – Konfiguration der OCR Engine / Parameter, Default festlegen

Mitgeliefert wird eine ASP.NET basierende Beispiel Web-Applikation um die Funktionen des Web-Services testen und demonstrieren zu können. Diese muss über Microsoft Visual Studio aufgerufen und ausgeführt werden. Ist der OCR-Server auf einem anderen Rechner installiert so muss in der „AutoOCRDemo.htm“ sowie „Web.config“ Datei die AutoOCRBaseUrl Adresse entsprechend angepaßt werden. Die AutoOCRBaseUrl für den lokalen Aufruf lautet: http://localhost:8001/AutoOCRService/

Download – AutoOCR – OCR Server >>>
Download – ASP.NET – Beispiel für Web-Service >>>

Download- Abbyy FineReader 9.x OCR Engine Setup >>>
Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Version 1.8.6 – als Service

Beim Setup kann entschieden werden ob AutoOCR als normale Anwendung oder als Dienst installiert wird.

Bei der Verwendung als Dienst sind verschiedene Dinge zu beachten:

Download- Abbyy FineReader 9.x OCR Engine Setup >>>
Download – AutoOCR – OCR Server >>>
Demolizenzkey für FineReader OCR Engine anfordern

Webshop