iOCR / vsOCR Setup geteilt in Standard- und zusätzliche Sprachen

Das iOCR / vsOCR Setup das die Sprach- und Wörterbuchdaten unserer Standard-OCR Engine enthält ist insgesamt über 270MB groß. Um die Downloads und die Setup´s kleiner zu machen haben wir uns entschieden das iOCR / vsOCR in ein “Basis” und ein “zusätzliches Setup” zu teilen. Das Basis-Setup das über unsere Anwendungen z.b. AutoOCR, FileConverterPro oder PDFmdx installiert wird enthält jetzt nur mehr eine Auswahl an wichtigen europäischen Sprachen und wurde damit auf  127MB reduziert.

Sollen alle verfügbaren Sprachen installiert werden so ist das jederzeit möglich. Die zusätzlich verfügbaren “exotischen Sprachen” lassen sich über ein eigenes Setup nachinstallieren.

iOCR Basis-Sprachen:

Dänisch, Deutsch, Englisch, Finnisch, Französisch, Italienisch, Katalanisch, Neu Griechisch, Holländisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Schwedisch, Slowakisch, Slowenisch, Spanisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch

iOCR Erweiterte Sprachen:

Afrikaanis, Albanisch, Arabisch, Aserbaidschanisch, Bahasa Indonesisch, Bengali, Bulgarisch, Cherokee, Chinesisch – traditionell, Chinesisch – vereinfacht, Estnisch, Fränkisch, Gallisch, Hebräisch, Hindi, Isländisch, Japanisch, Koreanisch, Kroatisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Serbisch, Swahili, Tagalog, Tamil, Telugu, Thailändisch, Vietnamese, Weißrussisch

Download – iOCR (vsOCR) Setup – Basis Sprachen (ca. 127MB) >>>

Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 200MB) >>>

 

FileConverterPro & AutoOCR – Test Web-Seite verfügbar

Um die Funktionen von FileConverterPro sowie AutoOCR testen und um eigene Konvertierungen durchführen zu können ohne sich selbst die Software installieren zu müssen haben wir frei und kostenlos im Internet zugänglich einen Server mit FileConverterPro und AutoOCR verfügbar gemacht.

Unter MS-Windows können die Anwendungen DropConvert (für FileConverterPro) bzw. DropOCR (für AutoOCR) installiert werden um Verarbeitungen durchzuführen und Tests mit diesen Programmen machen zu können.

Diese Dienste können jetzt auch ohne Installation einer Client Software bzw. von allen Plattformen aus nur über den Browser genutzt werden. Dafür haben wir eigene Test-Web-Seiten eingerichtet um Dokumente hochzuladen und nach PDF bzw. PDF/A zu konvertieren bzw. eine PDF-OCR Konvertierung durchzuführen.

FileConverterPro – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/fcpro

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

Bei allen Profilen werden Platzhalter Seiten bei Konvertier-Fehlern und nicht konvertierbaren Datei Formaten eingefügt.

  • Default – Direkte Konvertierung ohne MS-Office 2010, keine OCR Verarbeitung
  • Direct + iOCR German – Direkte Konvertierung ohne MS-Office 2010, iOCR Deutsch
  • Direct – no OCR – PDFA – Direkte Konvertierung ohne MS-Office 2010, PDF/A, keine OCR Verarbeitung
  • Direct – no OCR – with draft stamp and overlay – Direkte Konvertierung ohne MS-Office 2010, Stempeln Oben Links mit Dateiname / Datum / Uhrzeit,  Wasserzeichen (Stempel)  “Draft / Entwurf”,  Beispiel Briefpapier wird hinterlegt, keine OCR Verarbeitung
  • MS-Office + Abbyy + PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, Abbyy OCR- Deutsch & Englisch
  • MS-Office + Abbyy – Konvertierung der Office Dokumente mit MS-Office 2010, Abbyy OCR- Deutsch & Englisch
  • MS-Office – no OCR – PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, keine OCR Verarbeitung

 

AutoOCR – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/autoocr

Unterstützte Eingangs-Dokumentenformate:

  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

  • Abbyy PDFA – German & English – PDF/A Ausgabe, Sprachen – Englisch & Deutsch
  • AbbyyFR10 – English & German – kein PDF/A, Sprachen – Englisch & Deutsch
  • iOCR – English – PDFA – PDF/A – Ausgabe, Sprache – Englisch
  • iOCR – English – kein PDF/A, Sprache – Englisch
  • iOCR – German kein PDF/A, Sprache – Deutsch

Auf den Test-Seiten kann direkt zwischen der FileConverterPro und der AutoOCR Test Seite hin und hergeschaltet werden.

 

Node.js als Basis für die Test Web-Seiten:

Zur Implementierung der Test Web-Seiten für den FileConverterPro und AutoOCR haben wir die momentan modernsten Tools der Web-Software-Entwicklung verwendet. Die Programmierung wurde sowohl Client- als auch Server-seitig rein über JavaScript realisiert.

Folgende Komponenten kommen hier zum Einsatz:

  1.  Node.js – JavaScript für den Server – http://nodejs.org/
  2. Node.js  FileConverterPro / AutoOCR Libraryhttps://github.com/XKEYGmbH/node-fcpro
  3. Bootstraphttp://getbootstrap.com/
  4. AngularJShttps://angularjs.org/

1_FileConverterPro - Test Site - Dokumente hochladen und nach PDF bzw. PDFA konvertieren3_Die eingefügten Dateien werden in der Liste angezeigt - die Auswahl des Verarbeitungsprofils ist pro Datei möglich   4_Mit Start der Konvertierung - werden die Dateien auf den Testserver hochgeladen und gleich konvertiert  5_Nach der Konvertierung können die erzeugten PDFs über den Download Link abgerufen werden  2_AutoOCR Test Site - Scans, Images und PDF hochladen und in durchsuchbare PDF bzw.PDFA konvertieren

DropOCR – Version 1.2.5 verfügbar

Neuerungen DropOCR Version 1.2.5:

  • Direkt Auswahl des AutoOCR Verarbeitungsprofils über das Context Menü der Icon Tray Anwendung
  • Funktion “Alle Jobs abbrechen” – damit können laufende Übertragungen und Verarbeitungen umgehend beendet werden.
  • Die “AutoStart” Option ist jetzt standardmäßig aktiviert.
  • Max. Seitenzahl ist per Default auf 1000 voreingestellt
  • Die Verbindungsdaten des AutoOCR Testservers sind durch die Installation bereits vorbelegt.

DropOCR - Context Menu - Icon Tray Anwendung  DropOCR - Konfigurationseinstellungen 1.2.5

Download – DropOCR >>>

FileConverterPro (FCpro) – PDF(/A) Konvertier Dienst mit SOAP / REST – Web-Service

Der FileConverterPro wird als Windows Dienst installiert und bietet Funktionen zur Konvertierung der wichtigsten Dokumentenformate nach PDF, PDF/A inkl. OCR über eine Web-Service Schnittstelle (SOAP oder REST).

Bei FCpro werden die gleichen Basiskomponenten wie für den FileConverter, PDFMerge sowie AutoOCR verwendet. Anpassungen und Erweiterungen stehen damit sofort in allen diesen Programmen in gleicher Weise zur Verfügung.

Das Web-Service Interface von FCpro ist kompatibel zum Web-Service Interface von AutoOCR womit Anwendungen ohne Anpassungen mit beiden Diensten lauffähig sind. So kann z.B. unsere Alfresco / ifresco Transformer Integration ohne Änderung sowohl mit AutoOCR – für reine OCR Verarbeitung bzw. mit dem FCpro – um alle Dokumentenformate inkl. OCR zu verarbeiten – betrieben werden.

Genauso wie für AutoOCR steht auch für den FCpro Service eine fertige .NET / C# Beispielanwendung mit EXE und Source Code zur Verfügung. Damit können die FCpro Funktionen sofort getestet bzw. kann der Code als Basis für die Integration eigener Anwendungen herangezogen werden.

PDF bzw. PDF/A Konvertierung – alle wichtigen Dateiformate – MS-Office, Image, E-Mail, HTML usw. werden automatisch nach PDF bzw. PDF/A konvertiert. Standardmäßig werden keine weiteren Komponenten bzw. MS-Office benötigt. Die Konvertierung erfolgt direkt ohne zusätzliche Anwendungen oder Druckertreiber. Optional kann jedoch auch falls vorhanden bzw. falls eine „High Fidelity“ Konvertierung für Office Formate gefordert ist auch MS-Office 2010/2013 als Konverter Komponente verwendet werden. Image und PDF Dokumente können über die integrierte iOCR durchsuchbar gemacht werden. Optional über eine Zusatzlizenz kann auch die Abbyy OCR Engine verwendet werde.

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, RTF, TXT,
  • XLS, XLSX,
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)

Funktionen – Allgemein:

  • MS-Windows Service Anwendung mit SOAP / REST Web-Service Schnittstelle zur Dokumentenkonvertierung von Office, PDF, Image, HTML, ZIP, MSG und E-Mail nach PDF bzw. PDF/A. Die Kommunikation erfolgt verschlüsselt über HTTPS.
  • Verarbeitungsprofile – alle Einstellungen können vorkonfiguriert und über Profile abgerufen und verwendet werden.
  • Direkte Konvertierung ohne Verwendung zusätzlich erforderlicher Original Anwendungen.
  • Für die „high fidelity“ Konvertierung von MS-Office Dokumenten kann auch MS-Office 2010 / 2013 installiert und verwendet werden.
  • Auflösen und Konvertieren von  Containerdateien – ZIP, 7Zip, RAR, MSG, EML, PMTX – um Gesamtdateien zu erzeugen. Strukturen werden als Bookmarks abgebildet, für nicht konvertierbare Dokumente werden Platzhalterseiten eingefügt.
  • Images und Scans (TIF, JPEG, PNG, BMP, GIF, PDF) lassen sich über die integrierte iOCR in durchsuchbare PDF´s konvertieren – Abbyy OCR Engine als Option.
  • Parallele Verarbeitung mit konfigurierbarer Anzahl an Prozessen und Prioritäten  – erlaubt die optimale Ausnutzung der Hardware und garantiert die schnelle Abarbeitung.

Besondere Funktionen:

  • Bei ZIP/RAR/7Z Containern werden alle enthaltenen und unterstützen Dokumente automatisch extrahiert, konvertiert und zu einem einzigen PDF-Gesamtdokument zusammengefügt. Die im Container enthaltene Ordnerstruktur wird im PDF Ausgabedokument über die Bookmark Struktur abgebildet.
  • MSG / EML – E-Mails können beliebige auch verschachtelte Anhänge enthalten. Auch diese Dokumente werden extrahiert, für nicht konvertierbare Formate werden Platzhalterseiten eingefügt und die Struktur wird über die PDF-Bookmarks abgebildet.
  • PDF/A Konvertierung – Der FCpro ist auch ein PDF nach PDF/A Converter. Die konvertierten Dokumente können als PDF/A-1b oder aber auch mit eingebetteten Originaldateien im ISO normierten PDF/A-3b Format erzeugt werden. Damit eignet sich der FCpro Service ideal für die Langzeitarchivierung von Dokumenten und E-Mails.
  • PMTX – ist ein XML Datenformat von PDFMerge welches Struktur- und Verarbeitungsinformation als auch die Dokumente selbst enthält. FCpro  erzeugt daraus eine einzige Gesamt PDF Datei die aus den konvertierten und zusammengefügten Einzeldateien besteht. Die PDFMerge Struktur wird über die PDF-Bookmarks abgebildet.
  • FDF, XFDF – PDF Formulardaten – können mit dem PDF Formularen verschmolzen und in „normale“ PDF konvertiert werden.
  • Stempel, Wasserzeichen, Briefpapier – können konfiguriert und aufgebracht werden.
  • Intelligentes OCR von PDF – PDF Dokumente werden seitenweise analysiert ob OCR erforderlich ist oder nicht – Seiten die bereits Text enthalten werden nicht nochmals OCR verarbeitet, Bookmarks und Links bleiben erhalten. Das spart Zeit und Ressourcen und steigert die Qualität.

Funktionen – PDF-Export Einstellungen –Teil der Verarbeitungsprofile

  • Ausfüllen der PDF Profilfelder mit fixen Werten bzw. Variablen (Ursprungswerte, Profilname, Datum, Zeit, Rechnername, User, Dateiname, Anwendung, Seiten, PDF-Level, User Variablen)
  • Web-Optimierung  (Ja / Nein)
  • Bestehende Bookmarks erhalten (Ja / Nein)
  • Einstellungen für das Öffnen des PDF´s
  • Sicherheitseinstellungen – Passwort- Öffnen, System, Beschränkungen
  • Seiten-Nummerierung: Position, Start, Offset, Text (aktuelle Seite, Seiten), Schrift, Farbe, Bereich darunter abdecken
  • Briefpapier / PDF Wasserzeichen – Hinterlegen / Überlagern, Dateiauswahl, Deckkraft(%), Position
  • Textstempel – Ein oder mehrere Stempel, Text bzw. Variablen (wie Profilfelder inkl. Bookmarks), Start, Offset, Schrift, Stil (inkl. Outline), Größe, Farbe, Deckkraft (%), Drehwinkel

FCpro Userinterface:

UI1_FCpro - Config of web-service endpoints UI2_FCpro - Conversion profiles UI3_FCpro - Advanced settings UI4_FCpro - Advanced settings - web-service user config and rights UI5_FCpro - Advanced settings - service account config UI6_FCpro - Advanced settings - MIME types config UI7_FCpro - Icon tray functions

FCpro – Konvertier Profile:

CO1_FCpro - Conversion profile config - office documents CO2_FCpro - Conversion profile config - image documentsCO3_FCpro - Conversion profile config - HTML documents CO4_FCpro - Conversion profile config - XML CO5_FCpro - Conversion profile config - PDFA and PDFExport settings CO6_FCpro - Conversion profile config - FDF XFDF forms CO7_FCpro - Conversion profile config - OCR settings

FCpro – Konvertier Profile – OCR:

OC1_FCpro - Conversion profile config - iOCR settings #1 OC2_FCpro - Conversion profile config - iOCR settings #2 - image processing OC3_FCpro - Conversion profile config - iOCR settings #3 - language selection OC4_FCpro - Conversion profile config - iOCR settings #4 - language selection OC5_FCpro - Conversion profile config - Abbyy OCR settings - predefined profiles OC6_FCpro - Conversion profile config - Abbyy OCR settings - general settings OC7_FCpro - Conversion profile config - Abbyy OCR settings - recognition - image processing OC8_FCpro - Conversion profile config - Abbyy OCR settings - recognition - page analysis OC9_FCpro - Conversion profile config - Abbyy OCR settings - recognition - page synthesis OC10_FCpro - Conversion profile config - Abbyy OCR settings - PDF export parameter

Verfügbare FCpro Anwendungen / Clients:

Der FCpro Server stellt seine Funktionen über eine SOAP / REST – Web Service Schnittstelle anderen Anwendungen zur Verfügung. Folgende Anwendungen und Integrationen sind für den FCpro verfügbar bzw. nutzen seine Funktionen:

1.)    FileConverterPro – WCF Service Beispiel  – diese Clientanwendung wird mit dem FCpro Setup mit installiert. Damit können alle per Web-Service verfügbaren Funktionen probiert und getestet werden. Neben dem EXE ist diese Anwendung auch als C# Source Code verfügbar um einfach und schnell FCpro Funktonen aus eigenen Anwendungen heraus nutzen zu können.

2.)    DropConvert – Dokumente per Drag & Drop bzw. Orderüberwachung nach PDF(/A) konvertieren. DropConvert ist eine Windows Client Anwendung die mit dem FCpro Service kommuniziert um Dokumente die per Drag & Drop über eine immer „on top“ angezeigten „DropZone“ oder in einen überwachten Ordner gezogen werden nach PDF oder PDF/A zu konvertieren. Die Ergebnisdateien werden an den Client zurück übertragen und in einem konfigurierbaren Ausgabeordner abgelegt. Der FCpro Server wird https verschlüsselt über das lokale Netz oder auch extern über das Internet  angesprochen.

3.)    EMail Archiver – Der EMail Archiver ist ein Microsoft Outlook 2010 /2013 Plug-In mit dem direkt aus MS-Outlook heraus einzelne oder mehrere markierte E-Mails oder auch ganze E-Mail Ordner und Unterordner mit allen darin enthaltenen E-Mail Nachrichten nach PDF bzw. PDF/A konvertiert werden können. Die Verarbeitung und Konvertierung der E-Mail erfolgt über den FCpro Server der verschlüsselt über https entweder lokal im Netzwerk oder extern über das Internet angesprochen wird. Die Ergebnis PDF(/A) werden über einen festgelegten Start-Ordner und Pfad mit aus den E-Mails entnommenen variablen Informationen im Dateisystem abgelegt.

PDF und speziell PDF/A-3 sind besonders gut für die Archivierung bzw. ISO normierte Langzeitarchivierung von E-Mails geeignet. Bei PDF/A-3 werden die Original MSG / EML Nachrichten  mit in den PDF Container eingebettet.

4.)    Alfresco / ifresco – Transformer – Die Installation der „ifresco Transformer“  AMP´s für Alfresco erlaubt die PDF(/A) Konvertierung bzw. die OCR Verarbeitung über den FileConverterPro Server. Ist nur OCR gefordert so kann stattdessen auch der AutoOCR Server verwendet werden. Die Verarbeitung der unterstützten Dokumentenformate nach PDF, PDF/A bzw. mit OCR steht dann über Java, JavaScript, REST, die „Transform“ Aktion über Ordner sowie in Alfresco Share als „Transform“ Dokumenten Aktion zur Verfügung.

FCpro – Versionen, Lizenzierung, Umfang

Der FileConverterPro ist in einer Basisversion sowie in einer erweiterten Version inkl. PDF/A und OCR verfügbar. Bei der erweiterten Version kann optional zusätzlich zur iOCR Engine  auch noch die Abbyy OCR Engine lizenziert werden. Abbyy Lizenzen sind Seiten- (Monatliches- oder Gesamt-Volumen) sowie Prozessorabhängig verfügbar. Die FCpro Standard Lizenz ist pro Server, es sind jedoch auch „Enterprise“ für eine beliebige Anzahl an Servern pro Unternehmen, sowie „OEM“ Lizenzen zur Integration durch Entwickler in deren eigene Software verfügbar.

Mit im Umfang  des FCpro Servers enthalten ist die – WCF Service Beispiel Anwendung inkl. Source Code  sowie die MS-Windows Anwendung „DropConvert“- Diese kann ohne Einschränkungen auf beliebigen Arbeitsplätzen installiert und verwendet werden.

Download – FileConverterPro (FCpro) ~250MB >>>

DropOCR – Version 1.2.1 verfügbar

Neuerungen DropOCR Version 1.2.1 :

  • Userinterface Sprache Deutsch / Englisch umschaltbar
  • HTTP und HTTPS Support
  • Logging der Konvertiervorgänge, Löschen der Log Datei.
  • AutoStart Funktion um die Anwendung beim Hochfahren des Rechners gleich zu starten.
  • Doppelclick auf die Drop Zone öffnet den Zielfolder
  • AutoOCR Testserver vorkonfiguriert

Unser AutoOCR Testserver ist über folgende URL erreichbar und kann für Testzwecke verwendet werden:

  • URL: https://autoocr.may.co.at:8001/AutoOCRService2/
  • User: admin
  • Passwort: autoocr

DropOCR Konfiguration DropOCR - Context Menü - DropZone

Download – DropOCR >>>

AutoOCR Version 1.10.11 – nachgelagerte Verarbeitung über DLL ausführen

Mit der Version 1.10.9 wurde eine neue Funktion implementiert um nach dem OCR und dem Erzeugen der Zieldatei  eine nachgelagerte  Aktion auszuführen. Dies konnte sowohl bei überwachten Ordnern als auch bei der Verarbeitung über Web-Services in Form von C# oder VB.NET Scripts erfolgen.

Mit der AutoOCR Version 1.10.11 wurde diese Möglichkeit noch erweitert – Es ist jetzt auch möglich externe DLL´s zu verwenden um eine nachgelagerte Funktionen auszuführen.

Über eine Checkbox kann zwischen Source Code (Script) und DLL Verarbeitung umgeschaltet werden und über eine Auswahlliste die DLL ausgewählt werden.

Es gibt dafür eine neue Interface Aktion IAction2 welche von IAction vererbt wird. Damit die DLL zur Auswahl zur Verfügung steht muss diese in den AutoOCR Installations-Ordner kopiert werden. Es werden alle DLL´s referenziert die mit %NAME%.AutoOCRPlugin.dll enden. Bitte beachten Sie dass bei Installation von AutoOCR als Windows Dienst keine Message Boxen oder andere Benutzer Interaktionen möglich sind und daher nicht verwendet werden können.

Damit dieser zusätzliche Tab eingeblendet und konfiguriert werden kann muss AutoOCR mit dem Commandline Parameter /ShowAction gestartet werden.

Zusätzlicher Tab bei den Ordner Eigenschaften für Aktionen über DLL oder Script  Zusätzlicher Tab bei den OCR Profilen für die Web-Service Schnittstelle Aktionen über DLL oder Script

Download – Beispielprojekt – DLL Aktion – C# / .NET >>>
Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>
Demolizenzkey für FineReader OCR Engine anfordern

ifresco AutoOCR – Version 1.18 verfügbar

Mit der Version 1.18 von ifresco AutoOCR – der OCR Server Integration für Alfresco gibt es neue Funktionen und Erweiterungen:

  • Implementierung der neuen Paging API für die Jobs-Liste des AutoOCR Servers – Seitenblättern (vorwärts/rückwärts), Löschen aller Jobs, Löschen älter als x Tage, Sortieren der Jobs, Selektion der Jobs nach Datum.
  • Frei konfigurierbare Run-time Transformer. Sowohl Datei- als auch Pipe-IO basierende Commandline Tools können verwendet werden um zusätzliche Transformatoren zu konfigurieren.
  • Gleich wie die Commandline basierenden Run-Time Transformatoren können jetzt auch Transformer über JavaScripts verwendet werden.
  • AutoOCR Content Model Erweiterung für den OCR Status (Aspect) wird installiert um den OCR Status einer Datei bzw. die auftretenden Fehler als Metadaten hinterlegen und abfragen zu können.
  • Das optionale ifresco Tools AMP – ermöglicht die Hintergrund OCR Verarbeitung in festgelegten Intervallen zur Erstverarbeitung bestehender Dokumentenbestände bzw. zum nachfolgenden Aufarbeiten der neu hinzugekommenen Dokumente. Die Ermittlung der zu verarbeitenden Dokumente sowie die Verarbeitung erfolgt über JavaScripts welche Batchorientiert und Zeitgesteuert im Hintergrund am Server ausgeführt werden. Damit können auch zusätzliche Alfresco Share – Dokumenten Aktionen über JavaScripts konfiguriert und ausgeführt werden z.b. um die ausgewählte(n) PDF und Image Dokumente über den AutoOCR Server in durchsuchbare PDF´s bzw. PDF/A Dateien zu konvertieren und die Ausgangsdatei automatisch durch diese zu ersetzen. Durch die ifresco Tools stehen über JavaScripts somit die AutoOCR Funktionen unabhängig von den konfigurierten Alfresco Transformern sowohl für die Massen-Batch- sowie die für interaktive Einzelverarbeitung zur Verfügung.

AMP der Version 1.18 sind für folgende Alfresco Versionen verfügbar: 4.0.1 EE, 4.0.2 EE, 4.0d CE, 4.1.1 EE, 4.1.2 EE, 4.1.3 EE, 4.1.4 EE, 4.2b CE, 4.2c CE
AMP der ifresco Tools 1.1 für: 4.2c CE, 4.2d CE

ifresco AutoOCR - New Job functions  ifresco AutoOCR - Runmtime transformer  ifresco AutoOCR - Transformer configuration Content Model for ifresco-AutoOCR

Download – ifresco AutoOCR – Runtime Transformer Beschreibung >>>
Download – ifresco AutoOCR – Transformer über JavaScript Beschreibung >>>
Download – ifresco AutoOCR – Beispiel JavaScript Transformer >>>

ifresco AutoOCR – JavaScript Binding für Alfresco

Alfresco und AutoOCR sind durch die Installation der AMP´s über eine REST Web-Service Schnittstelle integriert. Server-basierendes JavaScript bietet eine einfache, flexible und schnell umsetzbare Möglichkeit Alfresco Funktionen zu erweitern und anzupassen.

JavaScripts können als Batchprozesse zeitgesteuert angestoßen werden um z.B. eine größere Zahl an Dokumenten im Hintergrund bearbeiten. Sie können aber auch über den Client z.b. Alfresco Share als Dokumenten-Aktion für einzelne oder mehre ausgewählte Dokumente aufgerufen werden.

Das JavaScript Binding  der AutoOCR Funktionen ermöglicht den direkten Zugriff auf den AutoOCR Service aus Alfresco Scripts heraus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer. Es ermöglicht OCR Funktionen aus JavaScripts heraus zu nutzen, die im Alfresco hinterlegt dann direkt am Server ausgeführt werden.

Download – Dokumentation JavaScript Binding für Alfresco >>>
Download – Umfangreicher Demo Script >>>

Low Cost OCR Server- AutoOCRLight – OCR Verarbeitung ohne Limits

Ausgehend von unserem seit viele Jahren bewährten und erprobten OCR Server – AutoOCR bieten wir jetzt mit “AutoOCRLight” einen low cost Variante an. Diese hat im Vergleich zum AutoOCR Vollprodukt einen niedrigeren Preis jedoch aber auch eine eingeschränkter Funktionalität.

Unterschiede AutoOCRLight zu AutoOCR:

  • nur ein In / Out Folder kann konfiguriert werden
  • mit iOCR steht nur eine OCR Engine zur Verfügung – die Abbyy OCR Engine wird nicht unterstützt.
  • kein  PDF/A Support – nur PDF und TXT Output
  • keine SOAP / REST Web-Service Schnittstelle und damit keine Verwendung der kostenlosen AutoOCR Zusatzanwendungen DropOCR, FineOCR, ifresco Transformer

Vorteile / Highlights AutoOCRLight:

  • Installierbar als Windows Service oder als normale Anwendung unter 32 und 64bit OS
  • Folder – Monitoring – neu hinzukommende Dateien werden automatisch erkannt und verarbeitet
  • Verarbeitet – PDF bzw. Imagedateien (TIFF, JPEG) – Schwarz&Weiss, Graustufen, Farbe
  • iOCR – OCR Engine ohne Seitenlimit zur Erzeugung von durchsuchbaren PDF oder TXT
  • Image Prozessing Funktionen zur Verbesserung der Ausgangsdokumente – Automatisches – Drehen – Seitenorientierung erkennen, Gerade ausrichten, Rand beschneiden, Verunreinigungen entfernen, Lochungen entfernen, Linien entfernen.
  • Intelligente PDF-OCR Verarbeitung gemischter Dokumente – Seitenweise wird geprüft ob eine OCR Verarbeitung erforderlich ist.
  • Hoher Durchsatz durch parallele Verarbeitung

1 AutoOCR light - Userinterface  2 AutoOCR light - iOCR Settings  3 AutoOCR light - iOCR - Bildverarbeitung  4 AutoOCR light Einstellungen  5 AutoOCR light - Verarbeitungsoptionen  6 AutoOCR light - Archiv und Error Folder Konfiguration  7 AutoOCR light - E-Mail Konfiguration für Fehlerbenachrichtigung  8 AutoOCR light - Logging

Download – AutoOCRLight – Low Cost OCR Server >>>