Archiv für ‘PDF/A’

AutoOCR – Version 1.9.11

2012-04-30 Von: Wolfgang May Kategorie(n): ABBYY FineReader, AutoPrint, OCR, OCR Server, PDF/A, Update Keine Kommentare →

Bei der Version 1.9.11 wurden Optimierungen und Fehlerbehebungen im Bereich der mit der Version 1.9.10 neu hinzugekommenen Funktion der OCR Parallelverarbeitung vorgenommen.

Achtung :

Der Speicherort der Konfigurationdatei AutoOCR.XML wurde geändert. Falls Sie eine bestehende Installation mit dieser Version aktualisieren kopieren Sie bitte die alte AutoOCR.XML Datei in den neuen Pfad unter “C:\ProgramData\AutoOCR”

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

ifresco AutoOCR Transformer – OCR processing integrated with Alfresco Share

2012-04-30 Von: Wolfgang May Kategorie(n): ABBYY FineReader, Alfresco, AutoOCR, Dies & Das, OCR, OCR Server, PDF/A, Web-Service, ifresco Keine Kommentare →

The AutoOCR Server is integrated via REST as a dynamic configurable Alfresco document transformer. AutoOCR creates searchable PDF´s or other document formats like TXT, DOC(X), XLS(X), PPT(X), XML, RTF and HTML from image of PDF files. The OCR functions can be used via Java, JavaScript or as a document transformer. Config is done from the Share UI which also has a new document action “Transform” and gives access to all Alfresco transformers.

AutoOCR is an OCR server / service which is based on the obviously best OCR engine from Abbyy. The AutoOCR server has a REST web-serverice interface which was used to integrate it with Alfresco. AutoOCR is able to convert image- or PDF- files to searchable PDF´s. In addition to PDF other document formats like TXT, DOC(X), XLS(X), PPT(X), XML, RTF and HTML can also be created.

The configuration is simple and uses OCR profiles to summarize all possible settings. With an AMP install module  the direct integration of AutoOCR to Alfresco is realized. OCR functions are available in   Alfresco as a dynamically configurable transformer. Appropriate bindings allow the use of the OCR out services also from JavaScript and Java. From Alfresco 4.0, the configuration and monitoring will be done directly on the UI of the Share Administrator console.

In addition, we have extended the  Alfresco share document actions with the Alfresco Transformer integration. Transformer functions are available on  any document via the share interface and allow the conversion of documents into different formats.

AutoOCR as Alfresco Transformer:

The OCR function can be bound to a folder as an action. So if e.g. a scanned document will be placed in this folder, the processing starts automatically started and the document will be passed to the AutoOCR server. The result is a searchable PDF or other document format that can be immediately sought and found on the Alfresco full-text index.

AutoOCR JavaScript binding for Alfresco:

The JavaScript API allows direct access to the AutoOCR service from Alfresco scripts. From Repository JavaScripts (Webscript controller script, scripted actions) all the features of AutoOCR API can be adressed. This API is completely independent from the integration of AutoOCR services as Alfresco Transformer.

Alfresco Share – “Transform” document action

By implementing the additional “transform” document action to the Share UI you can use all your Alfresco transformes and not only the AutoOCR transformers. The “transform” action is implemented general and not only OCR specific.

Highlights / features:

  • Direct AutoOCR integration as Alfresco transformer with REST web service interface.
  • Separate AutoOCR service / server which does not strain the Alfresco server
  • Based on ABBYY – the leading OCR engine
  • Easy configuration by selecting OCR profiles – all available ABBYY OCR engine settings are combined.
  • In addition to PDF other output formats can be generated (TXT, RTF, DOC, etc.)
  • Dynamic transformer configuration at runtime using the Alfresco Share Admin interface.
  • JavaScript client for the AutoOCR service, available in Alfresco repository scripts (WebScripts, actions, etc.)
  • Java client for the AutoOCR service, for use in Java code.
  • The Java client itself has no dependencies for Alfresco.
  • New Share document action “Transform” enhances Share not only with OCR but with all supported transformers.

Requirements:

  • Alfresco 4.x – dynamic configuration via Share Userinterface
  • Alfresco 3.x – manual configuration w/o Share UI
  • AutoOCR from Version 1.9.8 on Microsoft Windows as a service
  • ABBYY FineReader Engine 10 (starting with 10.000 pages per month)

20-autoocr-admin-status 22-autoocr-admin-transformerconfig2 23-autoocr-admin-jobs 01-autoocr-action-menu 02-autoocr-shareaction-dialog 03-autoocr-shareaction-transform-waiting 04-autoocr-shareaction-results 05-autoocr-shareaction-transformed-docs

Test and Demo version is available – please contact us for details >>>

Price information you can find here >>>

ifresco AutoOCR Transformer – OCR Verarbeitung im Alfresco ECM / DMS integriert

2012-04-27 Von: Wolfgang May Kategorie(n): ABBYY FineReader, Alfresco, AutoOCR, OCR, OCR Server, PDF/A, Web-Service, ifresco Keine Kommentare →

AutoOCR ist ein OCR Service/Server der auf der momentan wohl besten OCR Engine von Abbyy aufbaut und über eine REST/SOAP Schnittstelle verfügt. AutoOCR ist in der Lage Image- und PDF-Dateien in durchsuchbare PDF zu konvertieren. Zusätzlich lassen sich aber auch TXT, DOC(X), XLS(X), PPT(X), XML, RTF und HTML erzeugen.

Die Konfiguration ist denkbar einfach und erfolgt über OCR Profile welche alle möglichen Einstellungen zusammenfassen. Über ein AMP Install-Modul erfolgt die direkte Integration von AutoOCR mit Alfresco. OCR Funktionen stehen damit in Alfresco als dynamisch konfigurierbare Transformer zur Verfügung. Entsprechende Bindings erlauben die Verwendung der der OCR Dienste auch aus JavaScript und Java heraus. Ab Alfresco 4.0 erfolgt die Konfiguration und Überwachung direkt über das UI der Share Administrator Konsole.

Darüber hinaus haben wir die Alfresco Share Dokumenten-Aktionen um die Alfresco Transformer Integration erweitert. Transformer Funktionen stehen damit beim jedem Dokument über die Share Oberfläche zur Verfügung und erlaubt die Konvertierung von Dokumenten in unterschiedliche Formate.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Alfresco Share – “Transform” Dokumentenaktion

Durch die Implementierung der “Transform” Dokumentenaktion in das Alfresco Share UI stehen neben der AutoOCR Verarbeitung auch alle anderen Alfresco Dokumententransformer zur Verfügung. Die Share “Transform” Funktion wurde allgemein und nicht nur auf die OCR Verarbeitung bezogen implementiert.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammengefasst.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code. Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.
  • Dokumentenaktion “Transform” erweitert Alfresco Share nicht nur um OCR sondern um alle von Alfresco unterstützen Transformationen.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter Microsoft-Windows als Dienst
  • ABBYY FineReader Engine 10 (Lizenz ab 10.000 Seiten pro Monat)

20-autoocr-admin-status 22-autoocr-admin-transformerconfig2 23-autoocr-admin-jobs 01-autoocr-action-menu 02-autoocr-shareaction-dialog 03-autoocr-shareaction-transform-waiting 04-autoocr-shareaction-results 05-autoocr-shareaction-transformed-docs

AutoOCR 1.9.10 – Abbyy FineReader 10 Rel 4 sowie wesentliche Performancesteigerung

2012-03-28 Von: Wolfgang May Kategorie(n): ABBYY FineReader, AutoOCR, OCR, OCR Server, PDF/A, Update, Web-Service Keine Kommentare →

Zusammen mit der AutoOCR Version 1.9.10 steht auch die aktuellste Version der Abbyy FineReader 10 Release 4  – OCR Engine zur Verfügung. Wir konnten die Verarbeitungsperformance von AutoOCR wesentlich steigern und sind jetzt in der Lage Dokumente parallel zu verarbeiten sowie die OCR Erkennung mehrseitige Dokumente auf mehrere Prozessorkerne aufzuteilen. Steht die richtige Hardware zur Verfügung so kann damit die Performance im Vergleich zu einer nicht parallelen Verarbeitung mehr als verdoppelt werden.

Neuerungen der AutoOCR Version 1.9.10:

  • Unterstützung der aktuellsten Abbyy FineReader OCR Engine Version 10 – Release 4
  • Optimale Ausnutzung der Hardware Ressourcen für beste Performance:  Parallel & Multi-Processing / Multi-Threading – für Folder Verarbeitung sowie Web-Service  – individuell konfigurierbar. Wir können damit abhängig von der Hardware eine Beschleunigung der Verarbeitungsgeschwindigkeit um 100% und mehr erreichen. Eine typische Rechnung gescannt mit 4 Seiten – TIFF Gr. 4 – 300dpi kann damit auf unserem Testserver in nur 9 Sekunden in ein durchsuchbares PDF Dokument konvertiert werden.
  • Konfiguration der Kodierung der über die Abbyy OCR erzeugten TXT Datei.: Simple, UTF-8(default), UTF-16, Auto
  • Einfachere und klarere Konfigurationsmöglichkeit der Web-Service / REST Schnittstelle: Hostname, https und http Port, Check ob nicht die gleichen Portnummern vergeben wurden, Automatische Erzeugung der URL für die Service Endpunkte.
  • Neue Abbyy FineReader Option – Original Auflösung beibehalten (Ja / Nein). Damit wird nicht explizit eine bestimmte Auflösung (z.b.: 300dpi) vorgegeben, sondern die Auflösung der Images in der Ausgabedatei richtet sich flexibel nach der Auflösung in der Ursprungsdatei.
  • Über die Web-Service Schnittstelle (REST / SOAP) ist es jetzt auch möglich durchsuchbare PDF/A Dokumente zu erzeugen.
  • REST Web-Service Interface wurde um die Funktion zum „Löschen von Jobs“ erweitert.
  • Der .NET C# – Beispiel-Client wurde aktualisiert und an die neuen Funktionen angepasst.

Bitte beachten Sie: die AutoOCR Version 1.9.10 benötigt die Abbyy FineReader Version 10 Release 4 und umgekehrt.

Parallele Verarbeitung Neue REST & Web-Service Konfiguration Web-Service OCR Profile mit PDFA Option

Download – AutoOCR – Web-Service Beispiel-Client  inkl. C# Source >>>
Download – AutoOCR REST Web-Service Signature >>>
Download – AutoOCR REST Admin Web-Service Signature >>>

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – Alfresco Transformer Modul / JavaScript / Java Client

2012-01-20 Von: Wolfgang May Kategorie(n): ABBYY FineReader, Alfresco, AutoOCR, Java, JavaScript, OCR, OCR Server, PDF/A, Scripting, Web-Service, iOCR.NET Keine Kommentare →

Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über  Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen  – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code.  Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter MS-Windows

1_AutoOCR - alfresco transformer - status 2_AutoOCR - alfresco transformer connection configuration 3_AutoOCR - alfresco transformer configuration 4_AutoOCR - alfresco transformer job status

eDocPrintPro – Web-Seite jetzt auch auf Italienisch

2011-08-17 Von: Wolfgang May Kategorie(n): PDF/A, eDocPrintPro Keine Kommentare →

Auf Grund der Bedeutung von PDF/A in Italien und der damit verbundenen verstärkten Anfragen haben wir die eDocPrintPro Web-Seite www.pdfprinter.at jetzt auch komplett in italienischer Sprache verfügbar.

eDocPrintPro PDF/A
Poter conservare documenti elettronici per un periodo più lungo è un’esigenza sempre più frequente per far fronte alla quale è importantissimo utilizzare un formato standard riconosciuto a livello internazionale leggibile e utilizzabile anche a distanza di anni.
Il PDF/A è stato definito come standard ISO per l’archiviazione di lungo periodo di documenti e, per questa ragione, acquisterà in futuro sempre maggior importanza per aziende e organizzazioni.
In qualità di uno dei primi driver per stampante PDF, eDocPrintPro PDF/A è anche in grado di creare documenti compatibili per PDF/A stampandoli virtualmente su ogni postazione e a partire da qualsiasi applicazione.
eDocPrintPro PDF/A vanta delle stesse caratteristiche di eDocPrintPro e, in più, consente di creare documenti PDF/A-1b e presenta EasyMerge integrato.
EasyMerge (integrato) è stato creato per unire nel modo più facile possibile singoli documenti PDF in un unico PDF/A.
Un elemento chiave per la riproducibilità dei documenti PDF/A è che tutte le informazioni essenziali siano contenute nel documento stesso. Ciò riguarda il contenuto visibile come testi, grafiche vettoriali, grafiche raster, tipi di caratteri, elementi colorati e tante altre cose.

iOCR.NET – Testanwendung mit C# Source Code verfügbar

2011-07-05 Von: Wolfgang May Kategorie(n): .NET, Konvertierung, OCR, PDF/A, Software-Entwicklung, iOCR.NET Keine Kommentare →

Für iOCR.NET gibt es jetzt auch ein Demo Setup das sowohl eine fertig kompilierte Beispielanwendung als auch den C# Source Code installiert. Damit kann jeder für 30 Tage die Funktionen und Resultate der iOCR.NET Verarbeitung ohne Einschränkungen mit eigenen Dokumenten austesten. Softwareentwickler können an Hand des mitgelieferten C# Beispielprogramms die Integration der OCR Engine in eigene Anwendungen austesten.

iOCR.NET_1 iOCR.NET_2

iOCR.NET_3 iOCR.NET_4

iOCR.NET_5 iOCR.NET_6

Download – iOCR.NET – OCR Engine für .NET >>>

iOCR.NET – OCR Engine ohne Limits

2011-06-22 Von: Wolfgang May Kategorie(n): .NET, Konvertierung, OCR, PDF/A, Software-Entwicklung, iOCR.NET Keine Kommentare →

Wir haben auf Basis der OpenSource OCR Engie von CuneiForm eine .NET Implemetierung realisiert und zusammen mit unseren PDF Routinen eine .NET Komponente für die OCR Verarbeitung zur Erzeugung durchsuchbarer PDF und PDF/A Dokumente entwickelt. Damit sind wir in der Lage alle unser Softwareprodukte standardmäßig mit OCR Funktionen auszustatten. iOCR.NET ist aber auch für andere Softwarehersteller und Integratoren ideal geeignet um deren Produkte um OCR Funktionen ohne Seiten oder Mengenlimitationen zu erweitern und das zu einer preislich sehr günstigen Einmallizenz inkl. Wartung.

Highlights:

  • .NET OCR Komponente inkl. C# Bespielprogramm
  • keine Seiten oder Mengenbeschränkungen hinsichtlich der zu verarbeitenden Images
  • sehr performate und schnelle Verarbeitung – gut geeignet für interaktive Bereichs OCR Erkennung sowie direkten PDF-OCR Export
  • preislich günstige Einmallizenz für die Integration in eigene Anwendungen
  • Verarbeitet – Farb / Graustufen und SchwarzWeiss Single- sowie Multipage Images – TIFF, JPEG, PNG, BMP
  • Ausgabe: durchsuchbare Single- bzw. Multipage PDF, PDF/A – mit Image über Text, TXT, XML
  • PDF Image Komprimierung : TIFF Gr. 4, JPEG,TIFF-LZW
  • PDF Image – Auflösung: wie Original, 96, 200, 300dpi bzw. individuell einstellbar.
  • PDF-JPEG: Qualitätseinstellung (0 – 100)
  • Unterstützte Sprachen: Englisch, Deutsch, Französisch, Russisch, Schwedisch, Spanisch, Italienisch, Russisch/Englisch, Ukrainisch, Serbisch, Kroatisch, Polnisch, Dänisch, Portugiesisch, Holländisch, Tschechisch, Rumänisch, Ungarisch, Bulgarisch, Slovenisch, Litauisch, Estonisch, Türkisch

Folgende unsere Produkte haben bereits bzw. werde in Kürze standardmäßig ohne Aufpreis die iOCR.NET Funktionen implementiert haben: DirectScan, GenOCR, SpliRen, AutoOCR, Office2PDFA, MakePDFA.NET

iOCR.NET_#1 iOCR.NET_#2

MakePDFA.NET – Version 1.0.22 verfügbar

2011-03-29 Von: Wolfgang May Kategorie(n): .NET, 64bit, Konvertierung, MakePDFA.NET, PDF/A, Software-Entwicklung, Update Keine Kommentare →

Die neue Version 1.0.22 von MakePDFA.NET unterstützt jetzt auch die Installation und Konvertierung von Dokumenten auf 64bit Betriebssystemen sowie Microsoft Office 2010 sowohl in der 32 als auch 64bit Version.

Download – MakePDFA.NET >>>

Für die Konvertierung auf 64bit Betriebsystemen ist die Installation der 64bit Version unseres eDocPrintPro PDF(/A) Druckertreibers erforderlich.

Download eDocPrintPro:

Download – eDocPrintPro 32bit (~5MB) >>>
Download – eDocPrintPro PDF/A 32bit (~9MB) >>>

Download – eDocPrintPro 64bit (~5MB) >>>
Download – eDocPrintPro PDF/A 64bit (~9MB) >>>

DirectScan – SDK / API mit VB & C# .NET Beispielprogrammen

2010-12-22 Von: Wolfgang May Kategorie(n): .NET, Commandline, DirectScan, OCR, PDF/A, Scannen, Software-Entwicklung Keine Kommentare →

Über das DirectScan SDK können Softwareentwickler einfach, schnell und kostengünstig die Scan- und OCR-Funktionen von DirectScan auch in eigene Anwendungen integrieren ohne sich mit der Komplexität von Imageformaten, PDF, PDF/A, OCR und der Ansteuerung von Scannern auseinandersetzen zu müssen.

Die Integration kann entweder per Commandline Aufruf oder über die direkte Integration per ActiveX (VB) bzw .NET (C#) erfolgen.

Zwei Beispielprogramme inkl. SourceCode zeigen wie die DirectScan Funktionen aus VB bzw .NET C# heraus verwendet werden können um Dokumente scannen, OCR verarbeiten sowie als PDF, TIFF, JPEG usw abspeichern zu können.

DirectScan - SDK - VB ActiveX Sample DirectScan - SDK - C# .NET Sample