Kategorie: AutoOCR

Android App für FileConverterPro und AutoOCR verfügbar

Promotion

Es gibt jetzt auch eine frei und kostenlos verfügbare Android App die mit unserem FileConverterPro und AutoOCR – Server / Service zusammenarbeitet. Damit lassen sich die verschiedensten Dokumentenformate inkl. Schrifterkennung (OCR) in durchsuchbare PDF bzw. PDF/A Dateien konvertieren. Über ZIP Container könne auch mehrere Dateien zusammengefasst werden, um aus den Einzeldateien ein Gesamt PDF zu erhalten (Merge).

AfterStart  ProfileSelect  FilePickerNew  Converting  MyFiles

Anwendungsbereich:

  • Mobiltelefon / Tablett als Scanner – erzeugt durchsuchbare PDF´s
  • Mobil Dokumente erstellen – z.b. über Google DOCS – um diese dann als PDF mit Briefpapier bzw. Wasserzeichen zu versehen.
  • Mehrere Dateien als ZIP zusammenfassen – Erzeugen einer Gesamt-PDF mit Bookmarks.

Unterstützte Input-Formate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Unterstützte Output-Formate:

  • PDF
  • PDF/A-1b
  • PDF/A-3b
  • ZUGFeRD

Wie die Konvertierung erfolgen soll kann über am Server hinterlegte Verarbeitungsprofile über die App ausgewählt werden. Hinter den Profilen kann ein ganzer Set an Optionen und Einstellungen liegen welche nicht nur die Konvertierung sondern auch zusätzliche erweiterte Funktionen steuern können- z.B:

  • Briefpapier hinterlegen
  • Wasserzeichen und Stempel aufbringen
  • Seiten nummerieren
  • Kopf und Fußzeilen einfügen
  • Inhaltsverzeichnis erzeugen
  • Berechtigungen und Dokumenten-Schutz steuern

Als gute Ergänzung zu unserer App macht es Sinn sich folgende Apps zusätzlich zu installieren:

  • Google DOCS / Tabellen – um Word / Excel Dateien zu schreiben – diese können dann gleich als PDF konvertiert und z.b. mit Briefpapier hinterlegt werden
  • Scanbot – um Dokumente schnell und einfach zu scannen
  • ES Datei Explorer – um die Dokumente und Dateien einfach zu verwalten und um ZIP Dateien zu erzeugen – Einzeldateien können über ZIP zu Gesamt PDF verarbeitet werden.

Die App hat nach der Installation unseren gehosteten FileConverterPro Test-Server voreingestellt womit sofort ohne weiteren Aufwand und Kosten Tests mit eigenen Dokumenten durchgeführt werden können.

smartphone_googleplay

Android Library für FileConverterPro und AutoOCR verfügbar

Um einfach und schnelle Android Anwendungen und Apps entwickeln zu können die unseren FileConverterPro bzw. AutoOCR Server über die REST Schnittstelle ansprechen haben wir eine eigene Android Library veröffentlicht. Auf Basis dieser Library wurde auch unsere FileConverterPro Android App entwickelt die ab sofort über Google Play zum Download zur Verfügung steht. Diese Library kann auch als Basis für Java Anwendungen auf anderen Plattformen herangezogen werden.

Download – Android Library für FileConverterPro und AutoOCR >>>

AutoOCR – Installation auf einem anderen Laufwerk

Manchmal besteht die Anforderung AutoOCR auf einem anderen Laufwerk als unter „C:“ zu installieren. Dafür waren einige Anpassungen erforderlich die wir ab der AutoOCR Version 1.10.16 implementiert haben.

Folgende Funktionen wurden dafür implementiert:

  • Auswahl des Installationsortes über das Setup.
  • Konfiguration auf welchem Laufwerk / Ordner die Abbyy OCR Engine installiert wurde. (TXT Datei im Installationsverzeichnis)
  • Konfiguration auf welchem Laufwerk / Ordner Abbyy seine *.tmp Dateien ablegen soll.
  • Konfigmöglichkeit  nach wie vielen Tagen (Standard = 2) die Abbyy *.tmp Dateien automatisch gelöscht werden.

Vorgehensweise:

1.) Installation der Abbyy OCR Engine – Definition des Zielverzeichnisses über Commandline Parameter:

z.b.: msiexec.exe /i FREngine10R4_x86.msi TARGETDIR=D:\FREngine

2.) Installation von AutoOCR – Auswahl – Zielverzeichnis im Setup:

Setup now allows to select the install folder

3.) Erstellen einer „FREngine10.txt“ Datei mit einer Zeile welche den Pfad auf die Abbyy OCR DLL (FREngine.dll) enthält. Diese Datei wird dann in das Installationsverzeichnis von AutoOCR kopiert. Ist diese Datei vorhanden so wird die Abbyy OCR DLL wie dort angegeben gesucht – ist sie nicht vorhanden so wird der Default (C:\Program Files (x86)\Common Files\MAYComputer\OCR10\FREngine.dll) angenommen.

4.) Konfiguration des Folders für die Abbyy *.tmp Dateien:

Configure the temp folder for the Abbyy OCR engine

 5.) Konfiguration nach wie vielen Tagen die Abbyy *.tmp Dateien automatisch gelöscht werden sollen:

AutoOCR - Clear Temp files from Abbyy OCR proessing

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>
Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

AutoOCR Version 1.10.12.1 – Ältere Abbyy *.tmp Dateien werden automatisch gelöscht

Bei der aktuellen Version der Abbyy OCR Engine und bei hohen Dokumenten-Aufkommen kann es vorkommen dass die bei der Verarbeitung angelegten *.tmp Dateien nicht gelöscht werden und damit die Festplatte anfüllen. Um dieses Problem zu lösen haben wir eine Funktion implementiert bei der die *.tmp Dateien im Folder: c:\windows\temp\Abbyy Finereader Engine 10 die älter als x-Tage sind automatisch gelöscht werden. Die Standardeinstellung sind 2 Tage.

AutoOCR - clear temp folders

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

ifresco Tools – RepoWorker Scripts – Alfresco Dokumente automatisiert in durchsuchbare PDF bzw. PDF/A konvertieren

Das Modul ifresco Tools stellt die folgenden Funktionen für das Alfresco ECM / DMS zur Verfügung:

  • ifresco-RepoWorker – ermöglicht die zeitgesteuerte Ausführung eines Repository-JavaScript auf einer definierbaren Menge von Dokumenten.
  • ifresco-ScriptAction – ermöglicht die Definition von Share-Actions, die Repository-JavaScript auf Dokumenten ausführen.

RepoWorker – Scripts integrieren AutoOCR und FileConverterPro:

Mit dem RepoWorker haben wir eine Erweiterung für den ifresco Transformer auf Basis von Scripts geschaffen. Dabei werden alle bestehenden bzw. alle neu hinzukommenden Dokumente bestimmter Content- bzw. MIME-Typen eines Alfresco Servers in durchsuchbare PDF bzw. PDF/A Dokumente konvertiert. Der Benutzer muss sich nicht darum kümmern, die Konvertierung erfolgt automatisch am Server, egal über welchen Weg die Dokumente ins Alfresco ECM / DMS kommen.

Funktionen:

  • zeitgesteuerte Ausführung von JavaScripts auf einer definierbaren Menge von Dokumenten
  • bestehende Dokumente bestimmter Content- und MIME-Typen werden über AutoOCR bzw. FileConverterPro in durchsuchbare PDF bzw. PDF/A konvertiert und ersetzen die Urspungs-Dokumente.
  • Verarbeitete Dokumente werden mit dem „Transform“ Aspekt markiert um eine nochmalige Verarbeitung zu verhindern.
  • einmalige bzw. in einstellbaren Zeitintervallen wiederholende Script-Ausführung. z.b. alle 5 min.
  • Scripte sind schnell und einfach an neue Gegebenheiten und Anforderungen anpassbar.
  • Einfache Installation und Konfiguration

Beschreibung – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

GitHub – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

Voraussetzungen:

  • Alfresco 4.x,
  • AutoOCR oder FileConverterPro ,
  • ifresco Transformer (AMP).
  • ifresco Tools (AMP)

Eine Demoinstallation befindet sich auch auf unserem ifresco / Alfresco Testserver (admin / admin)

1_TIFF Datei in einen Alfresco Folder kopiert    2_TIFF Datei wird gefunden in ein durchsuchbares PDF konvertiert und ersetzt die Ursprungsdatei

FileConverterPro & AutoOCR – Test Web-Seite verfügbar

Um die Funktionen von FileConverterPro sowie AutoOCR testen und um eigene Konvertierungen durchführen zu können ohne sich selbst die Software installieren zu müssen haben wir frei und kostenlos im Internet zugänglich einen Server mit FileConverterPro und AutoOCR verfügbar gemacht.

Unter MS-Windows können die Anwendungen DropConvert (für FileConverterPro) bzw. DropOCR (für AutoOCR) installiert werden um Verarbeitungen durchzuführen und Tests mit diesen Programmen machen zu können.

Diese Dienste können jetzt auch ohne Installation einer Client Software bzw. von allen Plattformen aus nur über den Browser genutzt werden. Dafür haben wir eigene Test-Web-Seiten eingerichtet um Dokumente hochzuladen und nach PDF bzw. PDF/A zu konvertieren bzw. eine PDF-OCR Konvertierung durchzuführen.

FileConverterPro – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/fcpro

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

Bei allen Profilen werden Platzhalter Seiten bei Konvertier-Fehlern und nicht konvertierbaren Datei Formaten eingefügt.

  • Default – Direkte Konvertierung ohne MS-Office 2010, keine OCR Verarbeitung
  • Direct + iOCR German – Direkte Konvertierung ohne MS-Office 2010, iOCR Deutsch
  • Direct – no OCR – PDFA – Direkte Konvertierung ohne MS-Office 2010, PDF/A, keine OCR Verarbeitung
  • Direct – no OCR – with draft stamp and overlay – Direkte Konvertierung ohne MS-Office 2010, Stempeln Oben Links mit Dateiname / Datum / Uhrzeit,  Wasserzeichen (Stempel)  „Draft / Entwurf“,  Beispiel Briefpapier wird hinterlegt, keine OCR Verarbeitung
  • MS-Office + Abbyy + PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, Abbyy OCR- Deutsch & Englisch
  • MS-Office + Abbyy – Konvertierung der Office Dokumente mit MS-Office 2010, Abbyy OCR- Deutsch & Englisch
  • MS-Office – no OCR – PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, keine OCR Verarbeitung

 

AutoOCR – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/autoocr

Unterstützte Eingangs-Dokumentenformate:

  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

  • Abbyy PDFA – German & English – PDF/A Ausgabe, Sprachen – Englisch & Deutsch
  • AbbyyFR10 – English & German – kein PDF/A, Sprachen – Englisch & Deutsch
  • iOCR – English – PDFA – PDF/A – Ausgabe, Sprache – Englisch
  • iOCR – English – kein PDF/A, Sprache – Englisch
  • iOCR – German kein PDF/A, Sprache – Deutsch

Auf den Test-Seiten kann direkt zwischen der FileConverterPro und der AutoOCR Test Seite hin und hergeschaltet werden.

 

Node.js als Basis für die Test Web-Seiten:

Zur Implementierung der Test Web-Seiten für den FileConverterPro und AutoOCR haben wir die momentan modernsten Tools der Web-Software-Entwicklung verwendet. Die Programmierung wurde sowohl Client- als auch Server-seitig rein über JavaScript realisiert.

Folgende Komponenten kommen hier zum Einsatz:

  1.  Node.js – JavaScript für den Server – http://nodejs.org/
  2. Node.js  FileConverterPro / AutoOCR Libraryhttps://github.com/XKEYGmbH/node-fcpro
  3. Bootstraphttp://getbootstrap.com/
  4. AngularJShttps://angularjs.org/

1_FileConverterPro - Test Site - Dokumente hochladen und nach PDF bzw. PDFA konvertieren3_Die eingefügten Dateien werden in der Liste angezeigt - die Auswahl des Verarbeitungsprofils ist pro Datei möglich   4_Mit Start der Konvertierung - werden die Dateien auf den Testserver hochgeladen und gleich konvertiert  5_Nach der Konvertierung können die erzeugten PDFs über den Download Link abgerufen werden  2_AutoOCR Test Site - Scans, Images und PDF hochladen und in durchsuchbare PDF bzw.PDFA konvertieren

DropOCR – Version 1.2.5 verfügbar

Neuerungen DropOCR Version 1.2.5:

  • Direkt Auswahl des AutoOCR Verarbeitungsprofils über das Context Menü der Icon Tray Anwendung
  • Funktion „Alle Jobs abbrechen“ – damit können laufende Übertragungen und Verarbeitungen umgehend beendet werden.
  • Die „AutoStart“ Option ist jetzt standardmäßig aktiviert.
  • Max. Seitenzahl ist per Default auf 1000 voreingestellt
  • Die Verbindungsdaten des AutoOCR Testservers sind durch die Installation bereits vorbelegt.

DropOCR - Context Menu - Icon Tray Anwendung  DropOCR - Konfigurationseinstellungen 1.2.5

Download – DropOCR >>>

DropOCR – Version 1.2.1 verfügbar

Neuerungen DropOCR Version 1.2.1 :

  • Userinterface Sprache Deutsch / Englisch umschaltbar
  • HTTP und HTTPS Support
  • Logging der Konvertiervorgänge, Löschen der Log Datei.
  • AutoStart Funktion um die Anwendung beim Hochfahren des Rechners gleich zu starten.
  • Doppelclick auf die Drop Zone öffnet den Zielfolder
  • AutoOCR Testserver vorkonfiguriert

Unser AutoOCR Testserver ist über folgende URL erreichbar und kann für Testzwecke verwendet werden:

  • URL: https://autoocr.may.co.at:8001/AutoOCRService2/
  • User: admin
  • Passwort: autoocr

DropOCR Konfiguration DropOCR - Context Menü - DropZone

Download – DropOCR >>>

Webshop