Kategorie: AutoOCR

DropOCR – Version 1.3.2 verfügbar

Mit der DropOCR Version 1.3.2 wurde das parallele Upload sowie die Kommunikation mit dem AutoOCR Server komplett überarbeitet. Damit wurden Unzulänglichkeiten der vorhergegangenen Version behoben. Speziell bei umfangreichen Dokumenten mit vielen Seiten, langen Verarbeitungszeiten und bei einer großen Zahl an zu verarbeitenden Dokumenten ist es zu Problemen mit der Verarbeitung gekommen – es wurde nicht alle Dokumente verarbeitet, es wurden Fehler registriert die nicht vorhanden waren, bzw. ist es zu Abbrüchen bei der Kommunikation mit dem AutoOCR Server gekommen. Alle diese Probleme wurden jetzt mit der Version 1.3.2 behoben.

DropZone & DropOCR icon tray context menu  DropOCR - Konfiguration

Download – DropOCR >>>

OwnCloud Integration für FileConverterPro und AutoOCR verfügbar

OwnCloud ist die populärste und weit verbreitetste OpenSource Cloud Software die sowohl Privat- als auch Public-Clouds eingesetzt wird. OwnCloud ist sowohl in einer OpenSource (Community Edition) als auch in einer erweiterten Enterprise Version erhältlich. Wir setzen OwnCloud auch bei uns im Unternehmen ein um Dateien einfach und schnell extern zugänglich zu machen und mit unseren Partnern zu teilen. Dateien lassen sich automatisch synchronisieren und können auch über Mobile Apps  vom Smartphone bzw. Tablett abgerufen werden.

Die Funktionalität von OwnCloud kann über Server Apps erweitert werden, wobei mittlerweile eine große Zahl unterschiedlicher Apps für die verschiedensten Anwendungsbereiche zum kostenlosen Download zur Verfügung stehen.

Auf dieser Basis haben wir eine Integration zwischen AutoOCR bzw. unserem FileConverterPro Server / Service entwickelt. Damit lassen sich die verschiedensten Office, CAD und EMail Dokumentenformate direkt aus OwnCloud heraus entweder automatisch oder interaktiv/manuell inkl. OCR in durchsuchbare PDF bzw. PDF/A-1b oder PDF/A-3b konvertieren.

1_AutoOCR & FileConverterPro Plugin für OwnCloud  2_Über die Admin Funktionen erfolgt die Konfiguration  3.1_Über das MIME-Type Mapping kann eine automatische Konvertierung nach PDF konfiguriert werden   4_Die Convert Funktion ermöglicht es alle unterstützten Dateitypen auch interaktiv nach PDF zu konvertieren  5_Aus einem gescannten Image wird eine mit Text hinterlegte durchsuchbare PDF Datei  6_OwnCloud sowie der integrierte PDF Viewer bieten Suchfunktionen um Dokumente üpber deren Inhalt zu suchen  7_Aus Containerdateien wie ZIP oder MSG werden Gesamt PDF mit Bookamrksstrukturen erzeugt

Unterstützte FCpro Datei-Formate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Unterstützte Output-Formate:

  • PDF
  • PDF/A-1b
  • PDF/A-3b
  • ZUGFeRD

Wie die Konvertierung erfolgen soll kann über die am FileConverterPro/AutoOCR Server hinterlegte Verarbeitungsprofile ausgewählt werden. Hinter den Profilen kann ein ganzer Set an Optionen und Einstellungen liegen welche nicht nur die Konvertierung sondern beim FCpro auch zusätzliche erweiterte Funktionen bieten z.B:

  • Briefpapier hinterlegen
  • Wasserzeichen und Stempel aufbringen
  • Seiten nummerieren
  • Kopf und Fußzeilen einfügen
  • Inhaltsverzeichnis erzeugen
  • Berechtigungen und Dokumenten-Schutz steuern

Containerformate wie z.b.: ZIP, RAR, 7Zip bzw. EMail Container wie MSG / EML die mehrere Dateien bzw. verschachtelte Attachments enthalten können werden von FCpro aufgelöst, konvertiert und zu Gesamt PDF´s mit Bookmarks zusammengefügt.

Download – OwnCloud App – Integration mit AutoOCR / FileConverterPro >>>

Achtung: Die Konvertierung wird vom OwnCloud Server über einen “Crown” Job mit einem einstellbaren Intervall angestoßen. Um die Wartezeiten zu verkürzen sollte der auf standardmäßig 15 min. voreingestellte Intervall auf 1 bis 5 min. eingestellt werden

Android App für FileConverterPro und AutoOCR verfügbar

Promotion

Es gibt jetzt auch eine frei und kostenlos verfügbare Android App die mit unserem FileConverterPro und AutoOCR – Server / Service zusammenarbeitet. Damit lassen sich die verschiedensten Dokumentenformate inkl. Schrifterkennung (OCR) in durchsuchbare PDF bzw. PDF/A Dateien konvertieren. Über ZIP Container könne auch mehrere Dateien zusammengefasst werden, um aus den Einzeldateien ein Gesamt PDF zu erhalten (Merge).

AfterStart  ProfileSelect  FilePickerNew  Converting  MyFiles

Anwendungsbereich:

  • Mobiltelefon / Tablett als Scanner – erzeugt durchsuchbare PDF´s
  • Mobil Dokumente erstellen – z.b. über Google DOCS – um diese dann als PDF mit Briefpapier bzw. Wasserzeichen zu versehen.
  • Mehrere Dateien als ZIP zusammenfassen – Erzeugen einer Gesamt-PDF mit Bookmarks.

Unterstützte Input-Formate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Unterstützte Output-Formate:

  • PDF
  • PDF/A-1b
  • PDF/A-3b
  • ZUGFeRD

Wie die Konvertierung erfolgen soll kann über am Server hinterlegte Verarbeitungsprofile über die App ausgewählt werden. Hinter den Profilen kann ein ganzer Set an Optionen und Einstellungen liegen welche nicht nur die Konvertierung sondern auch zusätzliche erweiterte Funktionen steuern können- z.B:

  • Briefpapier hinterlegen
  • Wasserzeichen und Stempel aufbringen
  • Seiten nummerieren
  • Kopf und Fußzeilen einfügen
  • Inhaltsverzeichnis erzeugen
  • Berechtigungen und Dokumenten-Schutz steuern

Als gute Ergänzung zu unserer App macht es Sinn sich folgende Apps zusätzlich zu installieren:

  • Google DOCS / Tabellen – um Word / Excel Dateien zu schreiben – diese können dann gleich als PDF konvertiert und z.b. mit Briefpapier hinterlegt werden
  • Scanbot – um Dokumente schnell und einfach zu scannen
  • ES Datei Explorer – um die Dokumente und Dateien einfach zu verwalten und um ZIP Dateien zu erzeugen – Einzeldateien können über ZIP zu Gesamt PDF verarbeitet werden.

Die App hat nach der Installation unseren gehosteten FileConverterPro Test-Server voreingestellt womit sofort ohne weiteren Aufwand und Kosten Tests mit eigenen Dokumenten durchgeführt werden können.

smartphone_googleplay

Android Library für FileConverterPro und AutoOCR verfügbar

Um einfach und schnelle Android Anwendungen und Apps entwickeln zu können die unseren FileConverterPro bzw. AutoOCR Server über die REST Schnittstelle ansprechen haben wir eine eigene Android Library veröffentlicht. Auf Basis dieser Library wurde auch unsere FileConverterPro Android App entwickelt die ab sofort über Google Play zum Download zur Verfügung steht. Diese Library kann auch als Basis für Java Anwendungen auf anderen Plattformen herangezogen werden.

Download – Android Library für FileConverterPro und AutoOCR >>>

AutoOCR – Installation auf einem anderen Laufwerk

Manchmal besteht die Anforderung AutoOCR auf einem anderen Laufwerk als unter “C:” zu installieren. Dafür waren einige Anpassungen erforderlich die wir ab der AutoOCR Version 1.10.16 implementiert haben.

Folgende Funktionen wurden dafür implementiert:

  • Auswahl des Installationsortes über das Setup.
  • Konfiguration auf welchem Laufwerk / Ordner die Abbyy OCR Engine installiert wurde. (TXT Datei im Installationsverzeichnis)
  • Konfiguration auf welchem Laufwerk / Ordner Abbyy seine *.tmp Dateien ablegen soll.
  • Konfigmöglichkeit  nach wie vielen Tagen (Standard = 2) die Abbyy *.tmp Dateien automatisch gelöscht werden.

Vorgehensweise:

1.) Installation der Abbyy OCR Engine – Definition des Zielverzeichnisses über Commandline Parameter:

z.b.: msiexec.exe /i FREngine10R4_x86.msi TARGETDIR=D:\FREngine

2.) Installation von AutoOCR – Auswahl – Zielverzeichnis im Setup:

Setup now allows to select the install folder

3.) Erstellen einer “FREngine10.txt” Datei mit einer Zeile welche den Pfad auf die Abbyy OCR DLL (FREngine.dll) enthält. Diese Datei wird dann in das Installationsverzeichnis von AutoOCR kopiert. Ist diese Datei vorhanden so wird die Abbyy OCR DLL wie dort angegeben gesucht – ist sie nicht vorhanden so wird der Default (C:\Program Files (x86)\Common Files\MAYComputer\OCR10\FREngine.dll) angenommen.

4.) Konfiguration des Folders für die Abbyy *.tmp Dateien:

Configure the temp folder for the Abbyy OCR engine

 5.) Konfiguration nach wie vielen Tagen die Abbyy *.tmp Dateien automatisch gelöscht werden sollen:

AutoOCR - Clear Temp files from Abbyy OCR proessing

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>
Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

AutoOCR Version 1.10.12.1 – Ältere Abbyy *.tmp Dateien werden automatisch gelöscht

Bei der aktuellen Version der Abbyy OCR Engine und bei hohen Dokumenten-Aufkommen kann es vorkommen dass die bei der Verarbeitung angelegten *.tmp Dateien nicht gelöscht werden und damit die Festplatte anfüllen. Um dieses Problem zu lösen haben wir eine Funktion implementiert bei der die *.tmp Dateien im Folder: c:\windows\temp\Abbyy Finereader Engine 10 die älter als x-Tage sind automatisch gelöscht werden. Die Standardeinstellung sind 2 Tage.

AutoOCR - clear temp folders

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

ifresco Tools – RepoWorker Scripts – Alfresco Dokumente automatisiert in durchsuchbare PDF bzw. PDF/A konvertieren

Das Modul ifresco Tools stellt die folgenden Funktionen für das Alfresco ECM / DMS zur Verfügung:

  • ifresco-RepoWorker – ermöglicht die zeitgesteuerte Ausführung eines Repository-JavaScript auf einer definierbaren Menge von Dokumenten.
  • ifresco-ScriptAction – ermöglicht die Definition von Share-Actions, die Repository-JavaScript auf Dokumenten ausführen.

RepoWorker – Scripts integrieren AutoOCR und FileConverterPro:

Mit dem RepoWorker haben wir eine Erweiterung für den ifresco Transformer auf Basis von Scripts geschaffen. Dabei werden alle bestehenden bzw. alle neu hinzukommenden Dokumente bestimmter Content- bzw. MIME-Typen eines Alfresco Servers in durchsuchbare PDF bzw. PDF/A Dokumente konvertiert. Der Benutzer muss sich nicht darum kümmern, die Konvertierung erfolgt automatisch am Server, egal über welchen Weg die Dokumente ins Alfresco ECM / DMS kommen.

Funktionen:

  • zeitgesteuerte Ausführung von JavaScripts auf einer definierbaren Menge von Dokumenten
  • bestehende Dokumente bestimmter Content- und MIME-Typen werden über AutoOCR bzw. FileConverterPro in durchsuchbare PDF bzw. PDF/A konvertiert und ersetzen die Urspungs-Dokumente.
  • Verarbeitete Dokumente werden mit dem “Transform” Aspekt markiert um eine nochmalige Verarbeitung zu verhindern.
  • einmalige bzw. in einstellbaren Zeitintervallen wiederholende Script-Ausführung. z.b. alle 5 min.
  • Scripte sind schnell und einfach an neue Gegebenheiten und Anforderungen anpassbar.
  • Einfache Installation und Konfiguration

Beschreibung – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

GitHub – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

Voraussetzungen:

  • Alfresco 4.x,
  • AutoOCR oder FileConverterPro ,
  • ifresco Transformer (AMP).
  • ifresco Tools (AMP)

Eine Demoinstallation befindet sich auch auf unserem ifresco / Alfresco Testserver (admin / admin)

1_TIFF Datei in einen Alfresco Folder kopiert    2_TIFF Datei wird gefunden in ein durchsuchbares PDF konvertiert und ersetzt die Ursprungsdatei

FileConverterPro & AutoOCR – Test Web-Seite verfügbar

Um die Funktionen von FileConverterPro sowie AutoOCR testen und um eigene Konvertierungen durchführen zu können ohne sich selbst die Software installieren zu müssen haben wir frei und kostenlos im Internet zugänglich einen Server mit FileConverterPro und AutoOCR verfügbar gemacht.

Unter MS-Windows können die Anwendungen DropConvert (für FileConverterPro) bzw. DropOCR (für AutoOCR) installiert werden um Verarbeitungen durchzuführen und Tests mit diesen Programmen machen zu können.

Diese Dienste können jetzt auch ohne Installation einer Client Software bzw. von allen Plattformen aus nur über den Browser genutzt werden. Dafür haben wir eigene Test-Web-Seiten eingerichtet um Dokumente hochzuladen und nach PDF bzw. PDF/A zu konvertieren bzw. eine PDF-OCR Konvertierung durchzuführen.

FileConverterPro – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/fcpro

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

Bei allen Profilen werden Platzhalter Seiten bei Konvertier-Fehlern und nicht konvertierbaren Datei Formaten eingefügt.

  • Default – Direkte Konvertierung ohne MS-Office 2010, keine OCR Verarbeitung
  • Direct + iOCR German – Direkte Konvertierung ohne MS-Office 2010, iOCR Deutsch
  • Direct – no OCR – PDFA – Direkte Konvertierung ohne MS-Office 2010, PDF/A, keine OCR Verarbeitung
  • Direct – no OCR – with draft stamp and overlay – Direkte Konvertierung ohne MS-Office 2010, Stempeln Oben Links mit Dateiname / Datum / Uhrzeit,  Wasserzeichen (Stempel)  “Draft / Entwurf”,  Beispiel Briefpapier wird hinterlegt, keine OCR Verarbeitung
  • MS-Office + Abbyy + PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, Abbyy OCR- Deutsch & Englisch
  • MS-Office + Abbyy – Konvertierung der Office Dokumente mit MS-Office 2010, Abbyy OCR- Deutsch & Englisch
  • MS-Office – no OCR – PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, keine OCR Verarbeitung

 

AutoOCR – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/autoocr

Unterstützte Eingangs-Dokumentenformate:

  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

  • Abbyy PDFA – German & English – PDF/A Ausgabe, Sprachen – Englisch & Deutsch
  • AbbyyFR10 – English & German – kein PDF/A, Sprachen – Englisch & Deutsch
  • iOCR – English – PDFA – PDF/A – Ausgabe, Sprache – Englisch
  • iOCR – English – kein PDF/A, Sprache – Englisch
  • iOCR – German kein PDF/A, Sprache – Deutsch

Auf den Test-Seiten kann direkt zwischen der FileConverterPro und der AutoOCR Test Seite hin und hergeschaltet werden.

 

Node.js als Basis für die Test Web-Seiten:

Zur Implementierung der Test Web-Seiten für den FileConverterPro und AutoOCR haben wir die momentan modernsten Tools der Web-Software-Entwicklung verwendet. Die Programmierung wurde sowohl Client- als auch Server-seitig rein über JavaScript realisiert.

Folgende Komponenten kommen hier zum Einsatz:

  1.  Node.js – JavaScript für den Server – http://nodejs.org/
  2. Node.js  FileConverterPro / AutoOCR Libraryhttps://github.com/XKEYGmbH/node-fcpro
  3. Bootstraphttp://getbootstrap.com/
  4. AngularJShttps://angularjs.org/

1_FileConverterPro - Test Site - Dokumente hochladen und nach PDF bzw. PDFA konvertieren3_Die eingefügten Dateien werden in der Liste angezeigt - die Auswahl des Verarbeitungsprofils ist pro Datei möglich   4_Mit Start der Konvertierung - werden die Dateien auf den Testserver hochgeladen und gleich konvertiert  5_Nach der Konvertierung können die erzeugten PDFs über den Download Link abgerufen werden  2_AutoOCR Test Site - Scans, Images und PDF hochladen und in durchsuchbare PDF bzw.PDFA konvertieren

DropOCR – Version 1.2.5 verfügbar

Neuerungen DropOCR Version 1.2.5:

  • Direkt Auswahl des AutoOCR Verarbeitungsprofils über das Context Menü der Icon Tray Anwendung
  • Funktion “Alle Jobs abbrechen” – damit können laufende Übertragungen und Verarbeitungen umgehend beendet werden.
  • Die “AutoStart” Option ist jetzt standardmäßig aktiviert.
  • Max. Seitenzahl ist per Default auf 1000 voreingestellt
  • Die Verbindungsdaten des AutoOCR Testservers sind durch die Installation bereits vorbelegt.

DropOCR - Context Menu - Icon Tray Anwendung  DropOCR - Konfigurationseinstellungen 1.2.5

Download – DropOCR >>>