2012-01-23
Von: Wolfgang May
Kategorie(n): Plugin, Text Extraktion, XML, eDocPrintPro
Mit der Version 2.0.2. des eDocPrintPro – XML Plugin ist es jetzt auch möglich neben einer XML Datei auch eine ASCII Text Datei mit den Texten aus dem PDF zu erzeugen. Dabei wird in der TXT Datei der Beginn und das Ende der einzelnen Seiten mit entsprechenden Schlüsselworten gekennzeichnet.
- $$Start 1$$ – Kennzeichnet den Beginn der ersten Seite und
- $$End 1$$ – das Ende der ersten Seite usw.

Download – eDocPrintPro – XML Plugin für 32bit OS >>>
Download – eDocPrintPro – XML Plugin für 64bit OS >>>
Keine Kommentare →
2012-01-20
Von: Wolfgang May
Kategorie(n): ABBYY FineReader, Alfresco, AutoOCR, Java, JavaScript, OCR, OCR Server, PDF/A, Scripting, Web-Service, iOCR.NET
Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.
AutoOCR als Alfresco Transformer:
Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.
AutoOCR JavaScript Binding für Alfresco:
Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.
Highlights / Funktionen:
- Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
- Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
- Basierend auf ABBYY – der führenden OCR Engine
- Einfache Konfiguration über Auswahl von OCR Profilen – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
- Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
- Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
- JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
- Java-Client für den AutoOCR Service, zur Verwendung in Java Code. Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.
Voraussetzung:
- Alfresco 4.x – dynamische Konfiguration über Share Userinterface
- Alfresco 3.x – manuelle Konfiguration ohne Share UI
- AutoOCR ab Version 1.9.8 unter MS-Windows

Keine Kommentare →
2012-01-20
Von: Wolfgang May
Kategorie(n): Plugin, Text Extraktion, XML, eDocPrintPro
Mit dem neuen eDocPrintPro XML Plugin kann die in der erzeugten PDF Datei enthaltenen Textinformation als strukturierte XML Datei ausgegeben werden.
Die XML Datei enthält folgende Information:
- Name und Ablagepfad der PDF Datei
- Einheit der Positions- und Größeninformaiton (mm / inch / Punkt)
- Seitennummer / Seitengröße
- Textstring
- Umschreibende Box für den Textstring – Startposition / Höhe / Breite in mm/inch/Punkt
Auf Basis dieser strukturierten Information können weitere Auswertungen bzw. Verarbeitungsschritte angestoßen und ausgeführt werden.
Die XML Information kann verwendet werden um z.B.:
- E-Mail Adressen oder Fax-Nummern auszulesen,
- an Hand der Information zu erkennen um welchen Dokumententyp es sich handelt,
- die Info bestimmter Bereiche als Metadaten für die Archivierung zu verwenden,
- festzustellen bei welchen Seiten ein mehrseitiges Dokument in Einzeldokumente getrennt werden soll.

Download – eDocPrintPro – XML Plugin für 32bit OS >>>
Download – eDocPrintPro – XML Plugin für 64bit OS >>>
Keine Kommentare →
2011-12-15
Von: Wolfgang May
Kategorie(n): 64bit, E-Mail, Plugin, Update, eDocPrintPro
Die Version 4.0.1 unseres kostenlosen eDocPrintPro e-mail Plugin´s steht zur Verfügung. Fehlerkorrekturen wurden vorgenommen – Funktionell wurde nichts geändert.
Download – eDocPrintPro – E-Mail Plugin für 32bit OS >>>
Download – eDocPrintPro – E-Mail Plugin für 64bit OS >>>
Keine Kommentare →
2011-11-29
Von: Wolfgang May
Kategorie(n): ABBYY FineReader, AutoOCR, OCR, OCR Server, Web-Service
Mit der Version 1.9.6. von AutoOCR kann der Web-Service jetzt auch mit einer HTTPS / SSL Verschlüsselung arbeiten. Ebenso wird die MS-Windows Authentifizierung über Benutzernamen und Password unterstützt. Das mitgelieferte C# Beispielprogramm zeigt wie diese Erweiterung funktioniert.

Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>
Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern
Demolizenzkey für FineReader OCR Engine anfordern
Keine Kommentare →
2011-11-24
Von: Wolfgang May
Kategorie(n): Dies & Das
MakePDFA.NET steht ab sofort in der aktuellen Version 1.0.25 zur Verfügung.
Folgende Erweiterungen wurden implementiert:
- Integration der neuen Abbyy OCR Engine – FineReader 10 >>>
- Neue iOCR.NET OCR Engine für OCR Verarbeitung ohne Seitenlimit >>>
- zusätzliche Active-X / COM Schnittstelle inkl. VB Beispielanwendung
- PDF Security Funktionen um Passworte zu setzen und die PDF Funktionen einzuschränken
- MSI (MSM) – Include Packages verfügbar um MakePDFA.NET einfach in eigene Setup´s einbinden zu können.

Download – MakePDFA.NET >>>
Für die Konvertierung auf 64bit Betriebsystemen ist die Installation der 64bit Version unseres eDocPrintPro PDF(/A) Druckertreibers erforderlich.
Download eDocPrintPro:
Download – eDocPrintPro 32bit (~5MB) >>>
Download – eDocPrintPro PDF/A 32bit (~9MB) >>>
Download – eDocPrintPro 64bit (~5MB) >>>
Download – eDocPrintPro PDF/A 64bit (~9MB) >>>
Keine Kommentare →
2011-11-14
Von: Wolfgang May
Kategorie(n): ABBYY FineReader, AutoOCR, OCR, OCR Server, PHP
Die jetzt verfügbare AutoOCR PHP Library ermöglicht es die REST-Service basiernde OCR Verarbeitung von AutoOCR in eigene PHP Web-Anwendungen einzubinden. Ein erstes Beispiel einer solchen Integration ist der ifresco Client für das DMS / ECM System von Alfresco. Durch diese Integration mit ifresco ist es jetzt möglich sowohl beim Upload von Dokumenten bzw. bei Dokumenten die sich bereits im ifresco / Alfresco Repository befinden eine OCR Verarbeitung anzustoßen und durchsuchbare PDF Dokumente zu erzeugen.
Download – AutoOCR PHP Library für REST Kommunikation >>>
Voraussetzung: PEAR muss installiert sein mit “http/request” und “net/socket”
Keine Kommentare →
2011-10-18
Von: Wolfgang May
Kategorie(n): ABBYY FineReader, AutoOCR, Konvertierung, OCR, OCR Server, Web-Service
Mit der AutoOCR Version 1.9.5. gibt es jetzt auch eine Funktion um die für den AutoOCR Web-Service notwendige WSDL Information abrufen zu können.
AutoOCR verfügt über den Web-Service Endpoint:
z.B.: http://localhost:8001/AutoOCRService2/
Über eine URL kann die WSDL Information abgerufen werden:
z.B.: http://localhost:8001/AutoOCRService2/?wsdl
Entwickler (z.b. Java) benötigen die WSDL Info um den AutoOCR Web-Service verwenden und die verwendete Entwicklungsumgebung (IDE) importieren zu können.
AutoOCR – WSDL – XML >>>

Weiters ist es jetzt auch möglich eine Konfiguration der Endpoint Adressen sowie des verwendeten Netzwerks Ports (Default = 8001) durchzuführen.

AutoOCR – ReadMe >>>
Download – AutoOCR – OCR Server >>>
Download- Abbyy FineReader 10.x OCR Engine Setup (ca. 440MB) >>>
Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern
Demolizenzkey für FineReader OCR Engine anfordern
Keine Kommentare →
2011-10-17
Von: Wolfgang May
Kategorie(n): 64bit, E-Mail, Plugin, Update, eDocPrintPro
Mit der Version 3.3.4 unseres kostenlosen eDocPrintPro e-mail Plugin´s ist jetzt auch ein Setup für 64bit Betriebsysteme verfügbar. MS-Office2010 wird von uns jedoch nur in der 32bit und nicht in der 64bit Version unterstützt.
Download – eDocPrintPro – E-Mail Plugin für 32bit OS >>>
Download – eDocPrintPro – E-Mail Plugin für 64bit OS >>>
Keine Kommentare →
2011-10-10
Von: Wolfgang May
Kategorie(n): E-Mail, Plugin, Update, eDocPrintPro
Der freie E-Mail Plugin für den eDocPrintPro Druckertreiber wurde aktualisiert und steht jetzt in der Version 3.3.3 zur Verfügung. Die Setup´s wurden in eine 32bit und 64bit Version aufgeteilt. Ein Check wurde ins Setup integriert damit es zu keinen Verwechslungen bei der Installation kommen kann. Die Funktionen zum Extrahieren der Texte aus dem PDF wurde überarbeitet und verbessert. Mit den vorhergehenden Versionen hat es Probleme bei der Verarbeitung von PDF´s die aus bestimmten Anwendungen z.b. Notepad heraus erstellt wurden, gegeben.
Download – eDocPrintPro – E-Mail 32bit Plugin >>>
Keine Kommentare →