Kategorie: AutoOCR

Android Library für FileConverterPro und AutoOCR verfügbar

Um einfach und schnelle Android Anwendungen und Apps entwickeln zu können die unseren FileConverterPro bzw. AutoOCR Server über die REST Schnittstelle ansprechen haben wir eine eigene Android Library veröffentlicht. Auf Basis dieser Library wurde auch unsere FileConverterPro Android App entwickelt die ab sofort über Google Play zum Download zur Verfügung steht. Diese Library kann auch als Basis für Java Anwendungen auf anderen Plattformen herangezogen werden.

Download – Android Library für FileConverterPro und AutoOCR >>>

AutoOCR – Installation auf einem anderen Laufwerk

Manchmal besteht die Anforderung AutoOCR auf einem anderen Laufwerk als unter “C:” zu installieren. Dafür waren einige Anpassungen erforderlich die wir ab der AutoOCR Version 1.10.16 implementiert haben.

Folgende Funktionen wurden dafür implementiert:

  • Auswahl des Installationsortes über das Setup.
  • Konfiguration auf welchem Laufwerk / Ordner die Abbyy OCR Engine installiert wurde. (TXT Datei im Installationsverzeichnis)
  • Konfiguration auf welchem Laufwerk / Ordner Abbyy seine *.tmp Dateien ablegen soll.
  • Konfigmöglichkeit  nach wie vielen Tagen (Standard = 2) die Abbyy *.tmp Dateien automatisch gelöscht werden.

Vorgehensweise:

1.) Installation der Abbyy OCR Engine – Definition des Zielverzeichnisses über Commandline Parameter:

z.b.: msiexec.exe /i FREngine10R4_x86.msi TARGETDIR=D:\FREngine

2.) Installation von AutoOCR – Auswahl – Zielverzeichnis im Setup:

Setup now allows to select the install folder

3.) Erstellen einer “FREngine10.txt” Datei mit einer Zeile welche den Pfad auf die Abbyy OCR DLL (FREngine.dll) enthält. Diese Datei wird dann in das Installationsverzeichnis von AutoOCR kopiert. Ist diese Datei vorhanden so wird die Abbyy OCR DLL wie dort angegeben gesucht – ist sie nicht vorhanden so wird der Default (C:\Program Files (x86)\Common Files\MAYComputer\OCR10\FREngine.dll) angenommen.

4.) Konfiguration des Folders für die Abbyy *.tmp Dateien:

Configure the temp folder for the Abbyy OCR engine

 5.) Konfiguration nach wie vielen Tagen die Abbyy *.tmp Dateien automatisch gelöscht werden sollen:

AutoOCR - Clear Temp files from Abbyy OCR proessing

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>
Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

AutoOCR Version 1.10.12.1 – Ältere Abbyy *.tmp Dateien werden automatisch gelöscht

Bei der aktuellen Version der Abbyy OCR Engine und bei hohen Dokumenten-Aufkommen kann es vorkommen dass die bei der Verarbeitung angelegten *.tmp Dateien nicht gelöscht werden und damit die Festplatte anfüllen. Um dieses Problem zu lösen haben wir eine Funktion implementiert bei der die *.tmp Dateien im Folder: c:\windows\temp\Abbyy Finereader Engine 10 die älter als x-Tage sind automatisch gelöscht werden. Die Standardeinstellung sind 2 Tage.

AutoOCR - clear temp folders

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

ifresco Tools – RepoWorker Scripts – Alfresco Dokumente automatisiert in durchsuchbare PDF bzw. PDF/A konvertieren

Das Modul ifresco Tools stellt die folgenden Funktionen für das Alfresco ECM / DMS zur Verfügung:

  • ifresco-RepoWorker – ermöglicht die zeitgesteuerte Ausführung eines Repository-JavaScript auf einer definierbaren Menge von Dokumenten.
  • ifresco-ScriptAction – ermöglicht die Definition von Share-Actions, die Repository-JavaScript auf Dokumenten ausführen.

RepoWorker – Scripts integrieren AutoOCR und FileConverterPro:

Mit dem RepoWorker haben wir eine Erweiterung für den ifresco Transformer auf Basis von Scripts geschaffen. Dabei werden alle bestehenden bzw. alle neu hinzukommenden Dokumente bestimmter Content- bzw. MIME-Typen eines Alfresco Servers in durchsuchbare PDF bzw. PDF/A Dokumente konvertiert. Der Benutzer muss sich nicht darum kümmern, die Konvertierung erfolgt automatisch am Server, egal über welchen Weg die Dokumente ins Alfresco ECM / DMS kommen.

Funktionen:

  • zeitgesteuerte Ausführung von JavaScripts auf einer definierbaren Menge von Dokumenten
  • bestehende Dokumente bestimmter Content- und MIME-Typen werden über AutoOCR bzw. FileConverterPro in durchsuchbare PDF bzw. PDF/A konvertiert und ersetzen die Urspungs-Dokumente.
  • Verarbeitete Dokumente werden mit dem “Transform” Aspekt markiert um eine nochmalige Verarbeitung zu verhindern.
  • einmalige bzw. in einstellbaren Zeitintervallen wiederholende Script-Ausführung. z.b. alle 5 min.
  • Scripte sind schnell und einfach an neue Gegebenheiten und Anforderungen anpassbar.
  • Einfache Installation und Konfiguration

Beschreibung – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

GitHub – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

Voraussetzungen:

  • Alfresco 4.x,
  • AutoOCR oder FileConverterPro ,
  • ifresco Transformer (AMP).
  • ifresco Tools (AMP)

Eine Demoinstallation befindet sich auch auf unserem ifresco / Alfresco Testserver (admin / admin)

1_TIFF Datei in einen Alfresco Folder kopiert    2_TIFF Datei wird gefunden in ein durchsuchbares PDF konvertiert und ersetzt die Ursprungsdatei

FileConverterPro & AutoOCR – Test Web-Seite verfügbar

Um die Funktionen von FileConverterPro sowie AutoOCR testen und um eigene Konvertierungen durchführen zu können ohne sich selbst die Software installieren zu müssen haben wir frei und kostenlos im Internet zugänglich einen Server mit FileConverterPro und AutoOCR verfügbar gemacht.

Unter MS-Windows können die Anwendungen DropConvert (für FileConverterPro) bzw. DropOCR (für AutoOCR) installiert werden um Verarbeitungen durchzuführen und Tests mit diesen Programmen machen zu können.

Diese Dienste können jetzt auch ohne Installation einer Client Software bzw. von allen Plattformen aus nur über den Browser genutzt werden. Dafür haben wir eigene Test-Web-Seiten eingerichtet um Dokumente hochzuladen und nach PDF bzw. PDF/A zu konvertieren bzw. eine PDF-OCR Konvertierung durchzuführen.

FileConverterPro – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/fcpro

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

Bei allen Profilen werden Platzhalter Seiten bei Konvertier-Fehlern und nicht konvertierbaren Datei Formaten eingefügt.

  • Default – Direkte Konvertierung ohne MS-Office 2010, keine OCR Verarbeitung
  • Direct + iOCR German – Direkte Konvertierung ohne MS-Office 2010, iOCR Deutsch
  • Direct – no OCR – PDFA – Direkte Konvertierung ohne MS-Office 2010, PDF/A, keine OCR Verarbeitung
  • Direct – no OCR – with draft stamp and overlay – Direkte Konvertierung ohne MS-Office 2010, Stempeln Oben Links mit Dateiname / Datum / Uhrzeit,  Wasserzeichen (Stempel)  “Draft / Entwurf”,  Beispiel Briefpapier wird hinterlegt, keine OCR Verarbeitung
  • MS-Office + Abbyy + PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, Abbyy OCR- Deutsch & Englisch
  • MS-Office + Abbyy – Konvertierung der Office Dokumente mit MS-Office 2010, Abbyy OCR- Deutsch & Englisch
  • MS-Office – no OCR – PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, keine OCR Verarbeitung

 

AutoOCR – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/autoocr

Unterstützte Eingangs-Dokumentenformate:

  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

  • Abbyy PDFA – German & English – PDF/A Ausgabe, Sprachen – Englisch & Deutsch
  • AbbyyFR10 – English & German – kein PDF/A, Sprachen – Englisch & Deutsch
  • iOCR – English – PDFA – PDF/A – Ausgabe, Sprache – Englisch
  • iOCR – English – kein PDF/A, Sprache – Englisch
  • iOCR – German kein PDF/A, Sprache – Deutsch

Auf den Test-Seiten kann direkt zwischen der FileConverterPro und der AutoOCR Test Seite hin und hergeschaltet werden.

 

Node.js als Basis für die Test Web-Seiten:

Zur Implementierung der Test Web-Seiten für den FileConverterPro und AutoOCR haben wir die momentan modernsten Tools der Web-Software-Entwicklung verwendet. Die Programmierung wurde sowohl Client- als auch Server-seitig rein über JavaScript realisiert.

Folgende Komponenten kommen hier zum Einsatz:

  1.  Node.js – JavaScript für den Server – http://nodejs.org/
  2. Node.js  FileConverterPro / AutoOCR Libraryhttps://github.com/XKEYGmbH/node-fcpro
  3. Bootstraphttp://getbootstrap.com/
  4. AngularJShttps://angularjs.org/

1_FileConverterPro - Test Site - Dokumente hochladen und nach PDF bzw. PDFA konvertieren3_Die eingefügten Dateien werden in der Liste angezeigt - die Auswahl des Verarbeitungsprofils ist pro Datei möglich   4_Mit Start der Konvertierung - werden die Dateien auf den Testserver hochgeladen und gleich konvertiert  5_Nach der Konvertierung können die erzeugten PDFs über den Download Link abgerufen werden  2_AutoOCR Test Site - Scans, Images und PDF hochladen und in durchsuchbare PDF bzw.PDFA konvertieren

DropOCR – Version 1.2.5 verfügbar

Neuerungen DropOCR Version 1.2.5:

  • Direkt Auswahl des AutoOCR Verarbeitungsprofils über das Context Menü der Icon Tray Anwendung
  • Funktion “Alle Jobs abbrechen” – damit können laufende Übertragungen und Verarbeitungen umgehend beendet werden.
  • Die “AutoStart” Option ist jetzt standardmäßig aktiviert.
  • Max. Seitenzahl ist per Default auf 1000 voreingestellt
  • Die Verbindungsdaten des AutoOCR Testservers sind durch die Installation bereits vorbelegt.

DropOCR - Context Menu - Icon Tray Anwendung  DropOCR - Konfigurationseinstellungen 1.2.5

Download – DropOCR >>>

DropOCR – Version 1.2.1 verfügbar

Neuerungen DropOCR Version 1.2.1 :

  • Userinterface Sprache Deutsch / Englisch umschaltbar
  • HTTP und HTTPS Support
  • Logging der Konvertiervorgänge, Löschen der Log Datei.
  • AutoStart Funktion um die Anwendung beim Hochfahren des Rechners gleich zu starten.
  • Doppelclick auf die Drop Zone öffnet den Zielfolder
  • AutoOCR Testserver vorkonfiguriert

Unser AutoOCR Testserver ist über folgende URL erreichbar und kann für Testzwecke verwendet werden:

  • URL: https://autoocr.may.co.at:8001/AutoOCRService2/
  • User: admin
  • Passwort: autoocr

DropOCR Konfiguration DropOCR - Context Menü - DropZone

Download – DropOCR >>>

AutoOCR Version 1.10.11 – nachgelagerte Verarbeitung über DLL ausführen

Mit der Version 1.10.9 wurde eine neue Funktion implementiert um nach dem OCR und dem Erzeugen der Zieldatei  eine nachgelagerte  Aktion auszuführen. Dies konnte sowohl bei überwachten Ordnern als auch bei der Verarbeitung über Web-Services in Form von C# oder VB.NET Scripts erfolgen.

Mit der AutoOCR Version 1.10.11 wurde diese Möglichkeit noch erweitert – Es ist jetzt auch möglich externe DLL´s zu verwenden um eine nachgelagerte Funktionen auszuführen.

Über eine Checkbox kann zwischen Source Code (Script) und DLL Verarbeitung umgeschaltet werden und über eine Auswahlliste die DLL ausgewählt werden.

Es gibt dafür eine neue Interface Aktion IAction2 welche von IAction vererbt wird. Damit die DLL zur Auswahl zur Verfügung steht muss diese in den AutoOCR Installations-Ordner kopiert werden. Es werden alle DLL´s referenziert die mit %NAME%.AutoOCRPlugin.dll enden. Bitte beachten Sie dass bei Installation von AutoOCR als Windows Dienst keine Message Boxen oder andere Benutzer Interaktionen möglich sind und daher nicht verwendet werden können.

Damit dieser zusätzliche Tab eingeblendet und konfiguriert werden kann muss AutoOCR mit dem Commandline Parameter /ShowAction gestartet werden.

Zusätzlicher Tab bei den Ordner Eigenschaften für Aktionen über DLL oder Script  Zusätzlicher Tab bei den OCR Profilen für die Web-Service Schnittstelle Aktionen über DLL oder Script

Download – Beispielprojekt – DLL Aktion – C# / .NET >>>
Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>
Demolizenzkey für FineReader OCR Engine anfordern