Archiv für ‘PDF/A’

AutoOCR – Alfresco Transformer Modul / JavaScript / Java Client

2012-01-20 Von: Wolfgang May Kategorie(n): ABBYY FineReader, Alfresco, AutoOCR, Java, JavaScript, OCR, OCR Server, PDF/A, Scripting, Web-Service, iOCR.NET Keine Kommentare →

Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über  Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen  – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code.  Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter MS-Windows

1_AutoOCR - alfresco transformer - status 2_AutoOCR - alfresco transformer connection configuration 3_AutoOCR - alfresco transformer configuration 4_AutoOCR - alfresco transformer job status

eDocPrintPro – Web-Seite jetzt auch auf Italienisch

2011-08-17 Von: Wolfgang May Kategorie(n): PDF/A, eDocPrintPro Keine Kommentare →

Auf Grund der Bedeutung von PDF/A in Italien und der damit verbundenen verstärkten Anfragen haben wir die eDocPrintPro Web-Seite www.pdfprinter.at jetzt auch komplett in italienischer Sprache verfügbar.

eDocPrintPro PDF/A
Poter conservare documenti elettronici per un periodo più lungo è un’esigenza sempre più frequente per far fronte alla quale è importantissimo utilizzare un formato standard riconosciuto a livello internazionale leggibile e utilizzabile anche a distanza di anni.
Il PDF/A è stato definito come standard ISO per l’archiviazione di lungo periodo di documenti e, per questa ragione, acquisterà in futuro sempre maggior importanza per aziende e organizzazioni.
In qualità di uno dei primi driver per stampante PDF, eDocPrintPro PDF/A è anche in grado di creare documenti compatibili per PDF/A stampandoli virtualmente su ogni postazione e a partire da qualsiasi applicazione.
eDocPrintPro PDF/A vanta delle stesse caratteristiche di eDocPrintPro e, in più, consente di creare documenti PDF/A-1b e presenta EasyMerge integrato.
EasyMerge (integrato) è stato creato per unire nel modo più facile possibile singoli documenti PDF in un unico PDF/A.
Un elemento chiave per la riproducibilità dei documenti PDF/A è che tutte le informazioni essenziali siano contenute nel documento stesso. Ciò riguarda il contenuto visibile come testi, grafiche vettoriali, grafiche raster, tipi di caratteri, elementi colorati e tante altre cose.

iOCR.NET – Testanwendung mit C# Source Code verfügbar

2011-07-05 Von: Wolfgang May Kategorie(n): .NET, Konvertierung, OCR, PDF/A, Software-Entwicklung, iOCR.NET Keine Kommentare →

Für iOCR.NET gibt es jetzt auch ein Demo Setup das sowohl eine fertig kompilierte Beispielanwendung als auch den C# Source Code installiert. Damit kann jeder für 30 Tage die Funktionen und Resultate der iOCR.NET Verarbeitung ohne Einschränkungen mit eigenen Dokumenten austesten. Softwareentwickler können an Hand des mitgelieferten C# Beispielprogramms die Integration der OCR Engine in eigene Anwendungen austesten.

iOCR.NET_1 iOCR.NET_2

iOCR.NET_3 iOCR.NET_4

iOCR.NET_5 iOCR.NET_6

Download – iOCR.NET – OCR Engine für .NET >>>

iOCR.NET – OCR Engine ohne Limits

2011-06-22 Von: Wolfgang May Kategorie(n): .NET, Konvertierung, OCR, PDF/A, Software-Entwicklung, iOCR.NET Keine Kommentare →

Wir haben auf Basis der OpenSource OCR Engie von CuneiForm eine .NET Implemetierung realisiert und zusammen mit unseren PDF Routinen eine .NET Komponente für die OCR Verarbeitung zur Erzeugung durchsuchbarer PDF und PDF/A Dokumente entwickelt. Damit sind wir in der Lage alle unser Softwareprodukte standardmäßig mit OCR Funktionen auszustatten. iOCR.NET ist aber auch für andere Softwarehersteller und Integratoren ideal geeignet um deren Produkte um OCR Funktionen ohne Seiten oder Mengenlimitationen zu erweitern und das zu einer preislich sehr günstigen Einmallizenz inkl. Wartung.

Highlights:

  • .NET OCR Komponente inkl. C# Bespielprogramm
  • keine Seiten oder Mengenbeschränkungen hinsichtlich der zu verarbeitenden Images
  • sehr performate und schnelle Verarbeitung – gut geeignet für interaktive Bereichs OCR Erkennung sowie direkten PDF-OCR Export
  • preislich günstige Einmallizenz für die Integration in eigene Anwendungen
  • Verarbeitet – Farb / Graustufen und SchwarzWeiss Single- sowie Multipage Images – TIFF, JPEG, PNG, BMP
  • Ausgabe: durchsuchbare Single- bzw. Multipage PDF, PDF/A – mit Image über Text, TXT, XML
  • PDF Image Komprimierung : TIFF Gr. 4, JPEG,TIFF-LZW
  • PDF Image – Auflösung: wie Original, 96, 200, 300dpi bzw. individuell einstellbar.
  • PDF-JPEG: Qualitätseinstellung (0 – 100)
  • Unterstützte Sprachen: Englisch, Deutsch, Französisch, Russisch, Schwedisch, Spanisch, Italienisch, Russisch/Englisch, Ukrainisch, Serbisch, Kroatisch, Polnisch, Dänisch, Portugiesisch, Holländisch, Tschechisch, Rumänisch, Ungarisch, Bulgarisch, Slovenisch, Litauisch, Estonisch, Türkisch

Folgende unsere Produkte haben bereits bzw. werde in Kürze standardmäßig ohne Aufpreis die iOCR.NET Funktionen implementiert haben: DirectScan, GenOCR, SpliRen, AutoOCR, Office2PDFA, MakePDFA.NET

iOCR.NET_#1 iOCR.NET_#2

MakePDFA.NET – Version 1.0.22 verfügbar

2011-03-29 Von: Wolfgang May Kategorie(n): .NET, 64bit, Konvertierung, MakePDFA.NET, PDF/A, Software-Entwicklung, Update Keine Kommentare →

Die neue Version 1.0.22 von MakePDFA.NET unterstützt jetzt auch die Installation und Konvertierung von Dokumenten auf 64bit Betriebssystemen sowie Microsoft Office 2010 sowohl in der 32 als auch 64bit Version.

Download – MakePDFA.NET >>>

Für die Konvertierung auf 64bit Betriebsystemen ist die Installation der 64bit Version unseres eDocPrintPro PDF(/A) Druckertreibers erforderlich.

Download eDocPrintPro:

Download – eDocPrintPro 32bit (~5MB) >>>
Download – eDocPrintPro PDF/A 32bit (~9MB) >>>

Download – eDocPrintPro 64bit (~5MB) >>>
Download – eDocPrintPro PDF/A 64bit (~9MB) >>>

DirectScan – SDK / API mit VB & C# .NET Beispielprogrammen

2010-12-22 Von: Wolfgang May Kategorie(n): .NET, Commandline, DirectScan, OCR, PDF/A, Scannen, Software-Entwicklung Keine Kommentare →

Über das DirectScan SDK können Softwareentwickler einfach, schnell und kostengünstig die Scan- und OCR-Funktionen von DirectScan auch in eigene Anwendungen integrieren ohne sich mit der Komplexität von Imageformaten, PDF, PDF/A, OCR und der Ansteuerung von Scannern auseinandersetzen zu müssen.

Die Integration kann entweder per Commandline Aufruf oder über die direkte Integration per ActiveX (VB) bzw .NET (C#) erfolgen.

Zwei Beispielprogramme inkl. SourceCode zeigen wie die DirectScan Funktionen aus VB bzw .NET C# heraus verwendet werden können um Dokumente scannen, OCR verarbeiten sowie als PDF, TIFF, JPEG usw abspeichern zu können.

DirectScan - SDK - VB ActiveX Sample DirectScan - SDK - C# .NET Sample

DirectScan 1.3.8 – OCR integriert

2010-12-22 Von: Wolfgang May Kategorie(n): DirectScan, OCR, PDF/A, Scannen Keine Kommentare →

Ab der Version 1.3.8. verfügt DirectScan jetzt auch über die Möglichkeit das gescannte Dokument direkt einer OCR Verarbeitung zu unterziehen. Dabei können entweder durchsuchbare PDF Dokumente mit der Bilddatei im Vordergrund und mit dem Text im Hintergrund oder zur Imagedatei zusätzlich eine TXT und/oder XML Datei mit der Volltextinformation erzeugt werden.

Neuerungen:

  • PDF/A 1b Ausgabe
  • Integrierte OCR Engine erzeugt durchsuchbare PDF oder PDF/A sowie zusätzliche TXT und XML Datei.
  • Sehr schnelle OCR Verarbeitung - direkt nach dem Scanvorgang
  • OCR-XML Ausgabe mit Zeichen, Wort, Zeilen und Absatzinformation des erkannten Textes
  • 24  unterstützte OCR Sprachen: Englisch, Deutsch, Französisch, Russisch, Schwedisch, Spanisch, Italienisch, Russisch/English, Ukrainisch, Serbisch, Kroatisch, Portugiesisch, Holländisch, Usbekisch, Polnisch, Dänisch, Tschechisch, Rumänisch, Ungarisch, Bulgarisch, Slowenisch, Litauisch, Estnisch, Türkisch, Kasachisch, Kasachisch/Englisch
  • Belegen der PDF Profilfelder/Metadaten über fixen Text oder Variablen
  • DirectScan SDK/API mit VB & .NET C# Beispielprogrammen inkl. SourceCode.

DirectScan - Output settings DirectScan - PDF settings XML OCR Ausgabe

Download – DirectScan 32bit >>> – 30 Tage Testversion

eDocPrintPro Version 3.16.0 verfügbar

2010-10-28 Von: Wolfgang May Kategorie(n): 64bit, PDF/A, Update, eDocPrintPro Keine Kommentare →

Neuerungen:

  • Verwendet die aktuelle Ghostscript GPL Version 9.0
  • Die TIFF Color Komprimierung wurden neu inplmentiert. Unterstützt werden jetzt die TIFF JPEG, TIFF LZW und die TIFF Packbits Komprimierung. Das SDK sowie die dazugehörigen Beispiele wurden entsprechend angepaßt und aktualisiert.
  • TIFF – Einfügen / Anfügen von Seiten zu bestehenden Dateien

TIFF Color Komprimierung

Download eDocPrintPro:

Download – eDocPrintPro 32bit (~5MB) >>>
Download – eDocPrintPro PDF/A 32bit (~9MB) >>>

Download – eDocPrintPro 64bit (~5MB) >>>
Download – eDocPrintPro PDF/A 64bit (~9MB) >>>

Falls bei der Installation keine Internetverbindung vorhanden ist und um das Nachladen des GhostScript Setup´s per FTP zu verhindern -  kann GhostScript auch bereits vor der Installation von eDocPrintPro heruntergeladen und installiert werden. Bitte beachten Sie dass ab der Version 3.16.0 die GS Version 9.0 erforderlich ist.

GhostScript 9.0 Setup erforderlich für eDocPrintPro ab 3.16.0:

Download – GhostScript 9.0 eDocPrintPro – 32bit >>>
Download – GhostScript 9.0 für eDocPrintPro – 64bit >>>

eDocPrintPro PDF/A Version 3.15.6 verfügbar

2010-07-08 Von: Wolfgang May Kategorie(n): 64bit, PDF/A, Update, eDocPrintPro Keine Kommentare →

Fehlerkorrekturen wurden im Bereich der Farbprofile vorgenommen.

Download – eDocPrintPro PDF/A 32bit (~9MB) >>>
Download – eDocPrintPro PDF/A 64bit (~9MB) >>>

eDocPrintPro Version 3.15.5 verfügbar

2010-07-01 Von: Wolfgang May Kategorie(n): 64bit, PDF/A, Update, eDocPrintPro Keine Kommentare →

Neuerungen:

  • Aktuelle GhostScript 8.71 GPL Version wird unterstützt – bei Updates ist zu beachten dass eine bereits installierte GhostScript Version vorher deinstalliert werden sollte. GhostScript erscheint als eigener Eintrag unter den installierten Programmen (gs_x86 oder gs_x64).  Das aktuelle eDoc Setup lädt dann das aktuelle GhostScript Setup automatisch von unserem Server und installiert es. Dies kann jedoch auch vorher händisch erfolgen – siehe weiter unten.
  • Bei PDF/A wurde die Funktion – “Einfügen” und “Anhängen” an eine bestehende Datei deaktiviert und geblockt da es hier zu Fehlfunktionen mit 0-Byte Dateien gekommen ist. Zum Zusammenführen von PDF/A Einzeldateien zu einer PDF/A Gesamtdatei sollte das mitgelieferte Tool “EasyMerge” verwendet werden. Bei der Ausgabe von “normalen PDF Dateien” steht diese Funktion jedoch weiter zur Verfügung.
  • Mit Verwendung der GhostScript Version 8.71 ist jetzt auch wieder die Option vorhanden um alle Schriften einzubetten – dieses Feature war in der letzten Version auf Grund von Problemen der GhostScript Version 8.64  deaktiviert.

eDoc PDF Optionen Schriften

  • Mit der aktuellen eDoc Version 3.15.5 werden die PDF Dateien jedenfalls kleiner – wir nutzen jetzt eine Option um die eingebetteten Schriften zu komprimieren. Je nach Inhalt und verwendete Schrift werden die erzeugten PDF Dateien jetzt um ca. 30 bis 40% kleiner als vorher.
  • Fehlerbehebung beim nachgelagerten Aufruf des  PDF Readers, sowie Commandline Aufruf der erstellten PDF/A Dateien mit einer konfigurierten Anwendung.

Download eDocPrintPro:

Download – eDocPrintPro 32bit (~5MB) >>>
Download – eDocPrintPro PDF/A 32bit (~9MB) >>>

Download – eDocPrintPro 64bit (~5MB) >>>
Download – eDocPrintPro PDF/A 64bit (~9MB) >>>

Download – eDocPrintPro 32bit – benötigt keine .NET runtime (~5MB) >>>

Falls bei der Installation keine Internetverbindung vorhanden ist und um das Nachladen des GhostScript Setup´s per FTP zu verhindern -  kann GhostScript auch bereits vor der Installation von eDocPrintPro heruntergeladen und installiert werden. Bitte beachten Sie dass ab der Version 3.15.5 die GS Version 8.71 erforderlich ist und für ältere Versionen GS 8.64.

GhostScript 8.71 Setup erforderlich für eDocPrintPro ab 3.15.5:

HTTP – GhostScript 8.71 eDocPrintPro – 32bit >>>
HTTP – GhostScript 8.71 für eDocPrintPro – 64bit >>>

FTP – GhostScript 8.71 für eDocPrintPro – 32bit >>>
FTP – GhostScript 8.71 für eDocPrintPro – 64bit >>>