DropOCR – Version 1.2.5 verfügbar

Neuerungen DropOCR Version 1.2.5:

  • Direkt Auswahl des AutoOCR Verarbeitungsprofils über das Context Menü der Icon Tray Anwendung
  • Funktion “Alle Jobs abbrechen” – damit können laufende Übertragungen und Verarbeitungen umgehend beendet werden.
  • Die “AutoStart” Option ist jetzt standardmäßig aktiviert.
  • Max. Seitenzahl ist per Default auf 1000 voreingestellt
  • Die Verbindungsdaten des AutoOCR Testservers sind durch die Installation bereits vorbelegt.

DropOCR - Context Menu - Icon Tray Anwendung  DropOCR - Konfigurationseinstellungen 1.2.5

Download – DropOCR >>>

FileConverterPro (FCpro) – PDF(/A) Konvertier Dienst mit SOAP / REST – Web-Service

Der FileConverterPro wird als Windows Dienst installiert und bietet Funktionen zur Konvertierung der wichtigsten Dokumentenformate nach PDF, PDF/A inkl. OCR über eine Web-Service Schnittstelle (SOAP oder REST).

Bei FCpro werden die gleichen Basiskomponenten wie für den FileConverter, PDFMerge sowie AutoOCR verwendet. Anpassungen und Erweiterungen stehen damit sofort in allen diesen Programmen in gleicher Weise zur Verfügung.

Das Web-Service Interface von FCpro ist kompatibel zum Web-Service Interface von AutoOCR womit Anwendungen ohne Anpassungen mit beiden Diensten lauffähig sind. So kann z.B. unsere Alfresco / ifresco Transformer Integration ohne Änderung sowohl mit AutoOCR – für reine OCR Verarbeitung bzw. mit dem FCpro – um alle Dokumentenformate inkl. OCR zu verarbeiten – betrieben werden.

Genauso wie für AutoOCR steht auch für den FCpro Service eine fertige .NET / C# Beispielanwendung mit EXE und Source Code zur Verfügung. Damit können die FCpro Funktionen sofort getestet bzw. kann der Code als Basis für die Integration eigener Anwendungen herangezogen werden.

PDF bzw. PDF/A Konvertierung – alle wichtigen Dateiformate – MS-Office, Image, E-Mail, HTML usw. werden automatisch nach PDF bzw. PDF/A konvertiert. Standardmäßig werden keine weiteren Komponenten bzw. MS-Office benötigt. Die Konvertierung erfolgt direkt ohne zusätzliche Anwendungen oder Druckertreiber. Optional kann jedoch auch falls vorhanden bzw. falls eine „High Fidelity“ Konvertierung für Office Formate gefordert ist auch MS-Office 2010/2013 als Konverter Komponente verwendet werden. Image und PDF Dokumente können über die integrierte iOCR durchsuchbar gemacht werden. Optional über eine Zusatzlizenz kann auch die Abbyy OCR Engine verwendet werde.

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, RTF, TXT,
  • XLS, XLSX,
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)

Funktionen – Allgemein:

  • MS-Windows Service Anwendung mit SOAP / REST Web-Service Schnittstelle zur Dokumentenkonvertierung von Office, PDF, Image, HTML, ZIP, MSG und E-Mail nach PDF bzw. PDF/A. Die Kommunikation erfolgt verschlüsselt über HTTPS.
  • Verarbeitungsprofile – alle Einstellungen können vorkonfiguriert und über Profile abgerufen und verwendet werden.
  • Direkte Konvertierung ohne Verwendung zusätzlich erforderlicher Original Anwendungen.
  • Für die „high fidelity“ Konvertierung von MS-Office Dokumenten kann auch MS-Office 2010 / 2013 installiert und verwendet werden.
  • Auflösen und Konvertieren von  Containerdateien – ZIP, 7Zip, RAR, MSG, EML, PMTX – um Gesamtdateien zu erzeugen. Strukturen werden als Bookmarks abgebildet, für nicht konvertierbare Dokumente werden Platzhalterseiten eingefügt.
  • Images und Scans (TIF, JPEG, PNG, BMP, GIF, PDF) lassen sich über die integrierte iOCR in durchsuchbare PDF´s konvertieren – Abbyy OCR Engine als Option.
  • Parallele Verarbeitung mit konfigurierbarer Anzahl an Prozessen und Prioritäten  – erlaubt die optimale Ausnutzung der Hardware und garantiert die schnelle Abarbeitung.

Besondere Funktionen:

  • Bei ZIP/RAR/7Z Containern werden alle enthaltenen und unterstützen Dokumente automatisch extrahiert, konvertiert und zu einem einzigen PDF-Gesamtdokument zusammengefügt. Die im Container enthaltene Ordnerstruktur wird im PDF Ausgabedokument über die Bookmark Struktur abgebildet.
  • MSG / EML – E-Mails können beliebige auch verschachtelte Anhänge enthalten. Auch diese Dokumente werden extrahiert, für nicht konvertierbare Formate werden Platzhalterseiten eingefügt und die Struktur wird über die PDF-Bookmarks abgebildet.
  • PDF/A Konvertierung – Der FCpro ist auch ein PDF nach PDF/A Converter. Die konvertierten Dokumente können als PDF/A-1b oder aber auch mit eingebetteten Originaldateien im ISO normierten PDF/A-3b Format erzeugt werden. Damit eignet sich der FCpro Service ideal für die Langzeitarchivierung von Dokumenten und E-Mails.
  • PMTX – ist ein XML Datenformat von PDFMerge welches Struktur- und Verarbeitungsinformation als auch die Dokumente selbst enthält. FCpro  erzeugt daraus eine einzige Gesamt PDF Datei die aus den konvertierten und zusammengefügten Einzeldateien besteht. Die PDFMerge Struktur wird über die PDF-Bookmarks abgebildet.
  • FDF, XFDF – PDF Formulardaten – können mit dem PDF Formularen verschmolzen und in „normale“ PDF konvertiert werden.
  • Stempel, Wasserzeichen, Briefpapier – können konfiguriert und aufgebracht werden.
  • Intelligentes OCR von PDF – PDF Dokumente werden seitenweise analysiert ob OCR erforderlich ist oder nicht – Seiten die bereits Text enthalten werden nicht nochmals OCR verarbeitet, Bookmarks und Links bleiben erhalten. Das spart Zeit und Ressourcen und steigert die Qualität.

Funktionen – PDF-Export Einstellungen –Teil der Verarbeitungsprofile

  • Ausfüllen der PDF Profilfelder mit fixen Werten bzw. Variablen (Ursprungswerte, Profilname, Datum, Zeit, Rechnername, User, Dateiname, Anwendung, Seiten, PDF-Level, User Variablen)
  • Web-Optimierung  (Ja / Nein)
  • Bestehende Bookmarks erhalten (Ja / Nein)
  • Einstellungen für das Öffnen des PDF´s
  • Sicherheitseinstellungen – Passwort- Öffnen, System, Beschränkungen
  • Seiten-Nummerierung: Position, Start, Offset, Text (aktuelle Seite, Seiten), Schrift, Farbe, Bereich darunter abdecken
  • Briefpapier / PDF Wasserzeichen – Hinterlegen / Überlagern, Dateiauswahl, Deckkraft(%), Position
  • Textstempel – Ein oder mehrere Stempel, Text bzw. Variablen (wie Profilfelder inkl. Bookmarks), Start, Offset, Schrift, Stil (inkl. Outline), Größe, Farbe, Deckkraft (%), Drehwinkel

FCpro Userinterface:

UI1_FCpro - Config of web-service endpoints UI2_FCpro - Conversion profiles UI3_FCpro - Advanced settings UI4_FCpro - Advanced settings - web-service user config and rights UI5_FCpro - Advanced settings - service account config UI6_FCpro - Advanced settings - MIME types config UI7_FCpro - Icon tray functions

FCpro – Konvertier Profile:

CO1_FCpro - Conversion profile config - office documents CO2_FCpro - Conversion profile config - image documentsCO3_FCpro - Conversion profile config - HTML documents CO4_FCpro - Conversion profile config - XML CO5_FCpro - Conversion profile config - PDFA and PDFExport settings CO6_FCpro - Conversion profile config - FDF XFDF forms CO7_FCpro - Conversion profile config - OCR settings

FCpro – Konvertier Profile – OCR:

OC1_FCpro - Conversion profile config - iOCR settings #1 OC2_FCpro - Conversion profile config - iOCR settings #2 - image processing OC3_FCpro - Conversion profile config - iOCR settings #3 - language selection OC4_FCpro - Conversion profile config - iOCR settings #4 - language selection OC5_FCpro - Conversion profile config - Abbyy OCR settings - predefined profiles OC6_FCpro - Conversion profile config - Abbyy OCR settings - general settings OC7_FCpro - Conversion profile config - Abbyy OCR settings - recognition - image processing OC8_FCpro - Conversion profile config - Abbyy OCR settings - recognition - page analysis OC9_FCpro - Conversion profile config - Abbyy OCR settings - recognition - page synthesis OC10_FCpro - Conversion profile config - Abbyy OCR settings - PDF export parameter

Verfügbare FCpro Anwendungen / Clients:

Der FCpro Server stellt seine Funktionen über eine SOAP / REST – Web Service Schnittstelle anderen Anwendungen zur Verfügung. Folgende Anwendungen und Integrationen sind für den FCpro verfügbar bzw. nutzen seine Funktionen:

1.)    FileConverterPro – WCF Service Beispiel  – diese Clientanwendung wird mit dem FCpro Setup mit installiert. Damit können alle per Web-Service verfügbaren Funktionen probiert und getestet werden. Neben dem EXE ist diese Anwendung auch als C# Source Code verfügbar um einfach und schnell FCpro Funktonen aus eigenen Anwendungen heraus nutzen zu können.

2.)    DropConvert – Dokumente per Drag & Drop bzw. Orderüberwachung nach PDF(/A) konvertieren. DropConvert ist eine Windows Client Anwendung die mit dem FCpro Service kommuniziert um Dokumente die per Drag & Drop über eine immer „on top“ angezeigten „DropZone“ oder in einen überwachten Ordner gezogen werden nach PDF oder PDF/A zu konvertieren. Die Ergebnisdateien werden an den Client zurück übertragen und in einem konfigurierbaren Ausgabeordner abgelegt. Der FCpro Server wird https verschlüsselt über das lokale Netz oder auch extern über das Internet  angesprochen.

3.)    EMail Archiver – Der EMail Archiver ist ein Microsoft Outlook 2010 /2013 Plug-In mit dem direkt aus MS-Outlook heraus einzelne oder mehrere markierte E-Mails oder auch ganze E-Mail Ordner und Unterordner mit allen darin enthaltenen E-Mail Nachrichten nach PDF bzw. PDF/A konvertiert werden können. Die Verarbeitung und Konvertierung der E-Mail erfolgt über den FCpro Server der verschlüsselt über https entweder lokal im Netzwerk oder extern über das Internet angesprochen wird. Die Ergebnis PDF(/A) werden über einen festgelegten Start-Ordner und Pfad mit aus den E-Mails entnommenen variablen Informationen im Dateisystem abgelegt.

PDF und speziell PDF/A-3 sind besonders gut für die Archivierung bzw. ISO normierte Langzeitarchivierung von E-Mails geeignet. Bei PDF/A-3 werden die Original MSG / EML Nachrichten  mit in den PDF Container eingebettet.

4.)    Alfresco / ifresco – Transformer – Die Installation der „ifresco Transformer“  AMP´s für Alfresco erlaubt die PDF(/A) Konvertierung bzw. die OCR Verarbeitung über den FileConverterPro Server. Ist nur OCR gefordert so kann stattdessen auch der AutoOCR Server verwendet werden. Die Verarbeitung der unterstützten Dokumentenformate nach PDF, PDF/A bzw. mit OCR steht dann über Java, JavaScript, REST, die „Transform“ Aktion über Ordner sowie in Alfresco Share als „Transform“ Dokumenten Aktion zur Verfügung.

FCpro – Versionen, Lizenzierung, Umfang

Der FileConverterPro ist in einer Basisversion sowie in einer erweiterten Version inkl. PDF/A und OCR verfügbar. Bei der erweiterten Version kann optional zusätzlich zur iOCR Engine  auch noch die Abbyy OCR Engine lizenziert werden. Abbyy Lizenzen sind Seiten- (Monatliches- oder Gesamt-Volumen) sowie Prozessorabhängig verfügbar. Die FCpro Standard Lizenz ist pro Server, es sind jedoch auch „Enterprise“ für eine beliebige Anzahl an Servern pro Unternehmen, sowie „OEM“ Lizenzen zur Integration durch Entwickler in deren eigene Software verfügbar.

Mit im Umfang  des FCpro Servers enthalten ist die – WCF Service Beispiel Anwendung inkl. Source Code  sowie die MS-Windows Anwendung „DropConvert“- Diese kann ohne Einschränkungen auf beliebigen Arbeitsplätzen installiert und verwendet werden.

Download – FileConverterPro (FCpro) ~250MB >>>

DropOCR – Version 1.2.1 verfügbar

Neuerungen DropOCR Version 1.2.1 :

  • Userinterface Sprache Deutsch / Englisch umschaltbar
  • HTTP und HTTPS Support
  • Logging der Konvertiervorgänge, Löschen der Log Datei.
  • AutoStart Funktion um die Anwendung beim Hochfahren des Rechners gleich zu starten.
  • Doppelclick auf die Drop Zone öffnet den Zielfolder
  • AutoOCR Testserver vorkonfiguriert

Unser AutoOCR Testserver ist über folgende URL erreichbar und kann für Testzwecke verwendet werden:

  • URL: https://autoocr.may.co.at:8001/AutoOCRService2/
  • User: admin
  • Passwort: autoocr

DropOCR Konfiguration DropOCR - Context Menü - DropZone

Download – DropOCR >>>

AutoOCR 1.10.10 – Scripting jetzt auch für die REST / SOAP Verarbeitung

Mit der Version 1.10.10 steht die Scriptingmöglichkeit jetzt auch über die OCR-Profile für die Web-Service Schnittstelle (REST / SOAP) zur Verfügung. Siehe auch C# / VB.NET Scripting .

Web-Service OCR-Profile - Scripting - Action Web-Service OCR-Profile - Scripting - Action Einstellungen Web-Service OCR-Profile - Scripting - Action Code

Um die Script Aktion zu konfiguriern und um den zusätzlichen “Aktion” Tab anzuzeigen muss das AutoOCR Userinterface mit der Commandline Option /ShowAction gestartet werden:

  • “C:\Program Files\AutoOCR\AutoOCR.exe” /ShowAction – für 32bit
  • “C:\Program Files (x86)\AutoOCR\AutoOCR.exe” /ShowAction – für 64bit

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>
Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR 1.10.3 – iOCR – neue unlimitierte Standard OCR Engine enthalten

iOCR – unlimitierte Standard OCR Engine für AutoOCR

Eine neue unlimitierte iOCR Standard OCR Engine wurde implementiert. Diese zeichnet sich durch eine hohe Verarbeitungsgeschwindigkeit aus, kann als Input neben den üblichen Imagedateien auch PDF´s verarbeiten um daraus durchsuchbare PDF´s zu erzeugen. Diese Engine ist speziell für Anwendungen ideal bei welchen Volltextindizes für große Dokumentenmengen in kurzer Zeit aufgebaut werden müssen. z.b. bei der Integration mit Alfresco über den ifresco TXT Transformer.

Highlights iOCR für AutoOCR:

  • Hohe Performance durch 64bit und parallele Verarbeitung mehrerer Dokumente (CPU / Core / Speicherabhänging)
  • keine Limitierung hinsichtlich der zu verarbeitenden Seiten, bzw. keine CPU / Core Beschränkungen
  • 37 unterstützte Sprachen: Arabisch, Bulgarisch, Catalan, Tschechisch, Chinesisch (vereinfacht), Chinesisch (traditionell), Kroatisch, Dänisch, Holländisch, Deutsch, Griechisch, Englisch, Finnisch, Französisch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch (Latein), Slowakisch, Slowenisch, Schwedisch, Tagalog (Pilippinisch), Thai, Türkisch, Ukrainisch, Vietnamesisch
  • PDF, TIFF, JPEG, PNG – als Input / PDF-OCR sowie TXT als Output
  • JBIG-2 erzeugt noch kleinere Schwarz & Weiss PDF Dokumente als durch die TIFF Gr. 4 Komprimierung
  • zuschaltbare intelligente PDF Verarbeitung – es werden nur PDF-Image Dokumente einer OCR Verarbeitung unterzogen, PDF´s die bereits Text enthalten werden nicht nochmals verarbeitet – das erhöht den Druchsatz und steigert die Qualität.

Bemerkung: für uns ist weiterhin die Abbyy FineReader Engine die beste verfügbare OCR Engine – mit den meisten Funktionen und Features sowie mit der besten Erkennungsrate. Es gibt jedoch Anwendungsbereiche und Gründe eine alternative OCR Engine einzusetzen. Das ist auch ein wichtiges Feature von AutoOCR – es wird nicht nur eine einzige OCR Engine unterstützt,  sondern je nach Anforderung können auch mehrere parallel aktiv sein bzw. können OCR Engines nachgerüstet werden.

Neuerungen – AutoOCR Version 1.10.3:

  • iOCR als Standard OCR Engine bereits im Lieferumfang / Setup enthalten
  • „Intelligente“ OCR Verarbeitung von PDF Dokumenten – PDF Dokumente werden vor der OCR Verarbeitung überprüft ob diese bereits Text enthält – falls ja so wird das PDF nicht per OCR verarbeitet sondern das PDF bzw. der daraus extrahierte Text wird zurückgeliefert. Speziell für die Alfresco Transformer Integration ist dies erforderlich da von Seiten Alfresco bei der PDF Transformation PDF>PDF bzw. PDF>TXT nicht zwischen „normalen“ PDF und Image PDF unterschieden werden kann und daher jedes PDF durch den Transformer geschickt wird. Durch diese Option wird unnötige OCR Verarbeitung und damit werden Verarbeitungszeit und Abbyy OCR-Seiten-Lizenzen gespart.
  • Web-Service – Job Liste – Neue Funktion – alle Jobs löschen
  • Web-Service – Job Liste – Datum und Uhrzeit der Job Erstellung wird mit angezeigt
  • Web-Service – parallele Verarbeitung  beim Upload bzw. Job Handling wurde optimiert und verbessert.
  • Web-Service .NET Beispiel Client – wurde erweitert – Mehrfach Upload von Dateien, Parallel Upload, Anzeiger der aktuell laufenden Parallel Uploads, Unterstützung der Funktionen im Client für Parallelverarbeitung (Upload, Job Handling…)

1_AutoOCR_neue_iOCR_engine 2_AutoOCR_iOCR_Sprachauswahl_1 3_AutoOCR_iOCR_Sprachauswahl_2 4_AutoOCR_iOCR_color_compression 5_AutoOCR_iOCR_b&w_compression 7_AutoOCR_Abbyy_intelligent_PDF_processing

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>
Download – AutoOCR – Web-Service Beispiel-Client  inkl. C# Source >>>

Download – Schritt für Schritt Installation AutoOCR & ifresco Transformer >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

Demolizenzkey für FineReader OCR Engine anfordern

ifresco AutoOCR – OCR Verarbeitung im Alfresco ECM / DMS integriert

AutoOCR ist ein OCR Service/Server der auf der momentan wohl besten OCR Engine von Abbyy aufbaut und über eine REST/SOAP Schnittstelle verfügt. AutoOCR ist in der Lage Image- und PDF-Dateien in durchsuchbare PDF zu konvertieren. Zusätzlich lassen sich aber auch TXT, DOC(X), XLS(X), PPT(X), XML, RTF und HTML erzeugen.

Die Konfiguration ist denkbar einfach und erfolgt über OCR Profile welche alle möglichen Einstellungen zusammenfassen. Über ein AMP Install-Modul erfolgt die direkte Integration von AutoOCR mit Alfresco. OCR Funktionen stehen damit in Alfresco als dynamisch konfigurierbare Transformer zur Verfügung. Entsprechende Bindings erlauben die Verwendung der der OCR Dienste auch aus JavaScript und Java heraus. Ab Alfresco 4.0 erfolgt die Konfiguration und Überwachung direkt über das UI der Share Administrator Konsole.

Darüber hinaus haben wir die Alfresco Share Dokumenten-Aktionen um die Alfresco Transformer Integration erweitert. Transformer Funktionen stehen damit beim jedem Dokument über die Share Oberfläche zur Verfügung und erlaubt die Konvertierung von Dokumenten in unterschiedliche Formate.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Alfresco Share – “Transform” Dokumentenaktion

Durch die Implementierung der “Transform” Dokumentenaktion in das Alfresco Share UI stehen neben der AutoOCR Verarbeitung auch alle anderen Alfresco Dokumententransformer zur Verfügung. Die Share “Transform” Funktion wurde allgemein und nicht nur auf die OCR Verarbeitung bezogen implementiert.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammengefasst.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code. Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.
  • Dokumentenaktion “Transform” erweitert Alfresco Share nicht nur um OCR sondern um alle von Alfresco unterstützen Transformationen.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter Microsoft-Windows als Dienst
  • ABBYY FineReader Engine 10 (Lizenz ab 10.000 Seiten pro Monat)

20-autoocr-admin-status 22-autoocr-admin-transformerconfig2 23-autoocr-admin-jobs 01-autoocr-action-menu 02-autoocr-shareaction-dialog 03-autoocr-shareaction-transform-waiting 04-autoocr-shareaction-results 05-autoocr-shareaction-transformed-docs

Test und Demo Version ist verfügbar – Bitte kontaktieren Sie uns  >>>

Preis-Informationen finden Sie hier >>>

AutoOCR 1.9.10 – Abbyy FineReader 10 Rel 4 sowie wesentliche Performancesteigerung

Zusammen mit der AutoOCR Version 1.9.10 steht auch die aktuellste Version der Abbyy FineReader 10 Release 4  – OCR Engine zur Verfügung. Wir konnten die Verarbeitungsperformance von AutoOCR wesentlich steigern und sind jetzt in der Lage Dokumente parallel zu verarbeiten sowie die OCR Erkennung mehrseitige Dokumente auf mehrere Prozessorkerne aufzuteilen. Steht die richtige Hardware zur Verfügung so kann damit die Performance im Vergleich zu einer nicht parallelen Verarbeitung mehr als verdoppelt werden.

Neuerungen der AutoOCR Version 1.9.10:

  • Unterstützung der aktuellsten Abbyy FineReader OCR Engine Version 10 – Release 4
  • Optimale Ausnutzung der Hardware Ressourcen für beste Performance:  Parallel & Multi-Processing / Multi-Threading – für Folder Verarbeitung sowie Web-Service  – individuell konfigurierbar. Wir können damit abhängig von der Hardware eine Beschleunigung der Verarbeitungsgeschwindigkeit um 100% und mehr erreichen. Eine typische Rechnung gescannt mit 4 Seiten – TIFF Gr. 4 – 300dpi kann damit auf unserem Testserver in nur 9 Sekunden in ein durchsuchbares PDF Dokument konvertiert werden.
  • Konfiguration der Kodierung der über die Abbyy OCR erzeugten TXT Datei.: Simple, UTF-8(default), UTF-16, Auto
  • Einfachere und klarere Konfigurationsmöglichkeit der Web-Service / REST Schnittstelle: Hostname, https und http Port, Check ob nicht die gleichen Portnummern vergeben wurden, Automatische Erzeugung der URL für die Service Endpunkte.
  • Neue Abbyy FineReader Option – Original Auflösung beibehalten (Ja / Nein). Damit wird nicht explizit eine bestimmte Auflösung (z.b.: 300dpi) vorgegeben, sondern die Auflösung der Images in der Ausgabedatei richtet sich flexibel nach der Auflösung in der Ursprungsdatei.
  • Über die Web-Service Schnittstelle (REST / SOAP) ist es jetzt auch möglich durchsuchbare PDF/A Dokumente zu erzeugen.
  • REST Web-Service Interface wurde um die Funktion zum „Löschen von Jobs“ erweitert.
  • Der .NET C# – Beispiel-Client wurde aktualisiert und an die neuen Funktionen angepasst.

Bitte beachten Sie: die AutoOCR Version 1.9.10 benötigt die Abbyy FineReader Version 10 Release 4 und umgekehrt.

Parallele Verarbeitung Neue REST & Web-Service Konfiguration Web-Service OCR Profile mit PDFA Option

Download – AutoOCR – Web-Service Beispiel-Client  inkl. C# Source >>>
Download – AutoOCR REST Web-Service Signature >>>
Download – AutoOCR REST Admin Web-Service Signature >>>

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR 1.9.9 – Web-Service Funktionen wesentlich erweitert

Mit der AutoOCR Version 1.9.9 wurden umfangreiche Erweiterungen in der Web-Service Funktionalität vorgenommen.

Ein getrenntes Setup installiert eine Web-Service Beispielanwendung inkl. .NET C# Source Code um die  einzelnen Web-Service Features zu veranschaulichen und testen zu können.

1_AutoOCR_Web-Service Beispielanwendung

Web-Service allgemeine Funktionen:

  • HTTP und abgesicherte HTTPS Kommunikation über Port 8001 und 8002 (konfigurierbar)
  • SOAP sowie REST Endpunkte für die Konvertier- sowie Administrator Funktionen.
  • HTTP-, HTTPS-Verarbeitungs- sowie Administrator Web-Service kann einzeln aktiviert und deaktiviert werden.
  • Authentifikation über HTTPS mit eigner Benutzerverwaltung über Username und Passwort
  • Neben den Dateierweiterungen kann auch mit dem MIME Typ der Ein- und Ausgabe-Dateien gearbeitet werden.
  • Versionsinfo des Servers sowie der verwendete Lizenz Hash Wert kann abgefragt werden.
  • Erzeugung zusätzlicher Dokumentenformate: mit oder ohne PDF sowie DOC, DOCX, RTF, XLS, XLSX, TXT, HTM, HTML, XML, PPT (Abbyy Engine)
  • UTF-8 Encoding als Default für die Textausgabe.
  • Statistik Funktion: Noch Verfügbare Seiten – falls die OCR Server Lizenz eine Beschänkung auf Seiten oder Monatskapazität aufweist, Anzahl der Seiten bzw. Dokumente die in der Warteschlange zur Verarbeitung  anstehen, Durchschnittliche Verarbeitungszeit in Sek. pro Seite – ermittelt aus den vorherigen Verarbeitungen.

2_AutoOCR_Web-Service Statistik Funktion

Web-Service OCR-Profil Funktion:

  • OCR Profile können als Datei (*.ocrprf) – herunter bzw. hinaufgeladen, aktualisiert und gelöscht werden.
  • Abfragemöglichkeit für OCR Profile: Unterstützte Eingangs- & Ausgangs-Dateierweiterungen sowie E/A-MIME Typen.

6_AutoOCR_Web-Service Administrator Funktionen

Web-Service Jobverwaltung:

  • Jobs können solange die Verarbeitung noch nicht gestartet wurde “abgebrochen” werden.
  • Jeder Job ist über eine eindeutige GUID identifiziert. Dieser  kann zusätzlich auch mit einem Text/Display Label versehen werden um den Job leichter erkenn- und lesbar zu machen.
  • Abfrage der Joblisten – Eigene bzw. Jobliste aller User mit Jobstatus und Fehlermeldungen.
  • Ausführliche Fehler Information zu Jobs mit Errorstatus.
  • Jobstatusinfo für: Alle, Erzeugten, Hochgeladenen, in Konverierung befindlichen, bereits Konvertierte, Heruntergeladene, Jobs mit Fehler, Abgelaufen, Abgebrochen – Jobs
  • “Max. Pages” Restriktion – die Job-Verarbeitung wird nur dann gestartet wenn die Anzahl der Seiten der aktuelle hochgeladenen Datei kleiner oder gleich sind  dem eingestellten “Max Pages” Parameter. Bei Größer geht der Job Status auf Error und die Datei wird nicht verarbeitet. Ist “Max. Pages” = 0 so wird der Check nicht durchgeführt und jede Datei wird verarbeitet.

5_AutoOCR_Web-Service - Job-Status Informaiton

Web-Service Benutzerverwaltung:

  • Default “Admin” User mit Standard Passwort wird bei der Installation angelegt, dieser User verfügt über alle Rechte und kann nicht gelöscht werden. Das Passwort des Users “Admin” kann nicht per Web-Service sondern nur direkt am AutoOCR Server verändert werden.
  • Benutzer können neu angelegt, bearbeitet und gelöscht werden.
  • Benutzer verfügen über ein Passwort und Berechtigungen
  • Benutzerrechte: Verbinden & Konvertieren, Eigene Jobliste abrufen, Jobliste aller User abrufen, Verarbeitung starten / anhalten, Benutzer verwalten, OCR Profile verwalten.

6_AutoOCR_Web-Service Administrator Funktionen 7_AutoOCR_Web-Service User Verwaltung 8_AutoOCR_Web-Service Authentifizierung über User und Passwort

Der AutoOCR Server verfügt jetzt auch über eine eigene Lizenzoption um die Web-Service Schnittstelle freizuschalten. Entwickler können ihre Anwendungen an die Lizenz des AutoOCR Server über einen Hash-Code der aus der Lizenznummer des Servers gebildet wird binden und damit schützen.

3_AutoOCR_Web-service Abruf der Serverinformation und Lizenznummer

Download – AutoOCR – Web-Service Beispiel-Client  inkl. C# Source >>>
Download – AutoOCR REST Web-Service Signature >>>
Download – AutoOCR REST Admin Web-Service Signature >>>

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Alfresco Transformer Modul / JavaScript / Java Client

Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über  Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen  – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code.  Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter MS-Windows

1_AutoOCR - alfresco transformer - status 2_AutoOCR - alfresco transformer connection configuration 3_AutoOCR - alfresco transformer configuration 4_AutoOCR - alfresco transformer job status

AutoOCR 1.9.6 – HTTPS / SSL Verschlüsselung und Authentifizierung

Mit der Version 1.9.6. von AutoOCR kann der Web-Service jetzt auch mit einer HTTPS / SSL Verschlüsselung arbeiten. Ebenso wird die MS-Windows Authentifizierung über Benutzernamen und Password unterstützt.  Das mitgelieferte C# Beispielprogramm zeigt wie diese Erweiterung funktioniert.

AutoOCR_HTTPS_Authentifizierung mit Username und Passwort AutoOCR - WebService Testanwendung

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern