ifresco Tools – RepoWorker Scripts – Alfresco Dokumente automatisiert in durchsuchbare PDF bzw. PDF/A konvertieren

Das Modul ifresco Tools stellt die folgenden Funktionen für das Alfresco ECM / DMS zur Verfügung:

  • ifresco-RepoWorker – ermöglicht die zeitgesteuerte Ausführung eines Repository-JavaScript auf einer definierbaren Menge von Dokumenten.
  • ifresco-ScriptAction – ermöglicht die Definition von Share-Actions, die Repository-JavaScript auf Dokumenten ausführen.

RepoWorker – Scripts integrieren AutoOCR und FileConverterPro:

Mit dem RepoWorker haben wir eine Erweiterung für den ifresco Transformer auf Basis von Scripts geschaffen. Dabei werden alle bestehenden bzw. alle neu hinzukommenden Dokumente bestimmter Content- bzw. MIME-Typen eines Alfresco Servers in durchsuchbare PDF bzw. PDF/A Dokumente konvertiert. Der Benutzer muss sich nicht darum kümmern, die Konvertierung erfolgt automatisch am Server, egal über welchen Weg die Dokumente ins Alfresco ECM / DMS kommen.

Funktionen:

  • zeitgesteuerte Ausführung von JavaScripts auf einer definierbaren Menge von Dokumenten
  • bestehende Dokumente bestimmter Content- und MIME-Typen werden über AutoOCR bzw. FileConverterPro in durchsuchbare PDF bzw. PDF/A konvertiert und ersetzen die Urspungs-Dokumente.
  • Verarbeitete Dokumente werden mit dem “Transform” Aspekt markiert um eine nochmalige Verarbeitung zu verhindern.
  • einmalige bzw. in einstellbaren Zeitintervallen wiederholende Script-Ausführung. z.b. alle 5 min.
  • Scripte sind schnell und einfach an neue Gegebenheiten und Anforderungen anpassbar.
  • Einfache Installation und Konfiguration

Beschreibung – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

GitHub – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

Voraussetzungen:

  • Alfresco 4.x,
  • AutoOCR oder FileConverterPro ,
  • ifresco Transformer (AMP).
  • ifresco Tools (AMP)

Eine Demoinstallation befindet sich auch auf unserem ifresco / Alfresco Testserver (admin / admin)

1_TIFF Datei in einen Alfresco Folder kopiert    2_TIFF Datei wird gefunden in ein durchsuchbares PDF konvertiert und ersetzt die Ursprungsdatei

PDFMerge Client für FileConverterPro (FCpro) – erweitert den PDF(/A) Konvertier-Service um neue Funktionen

Basierend auf PDFMerge haben wir einen PDFMerge Client für den FileConverterPro (FCpro) Server herausgebracht. Damit können Dokumenten-Konvertierungen und Zusammenstellungen als PDF bzw. PDF/A von jedem beliebigen Arbeitsplatz aus erzeugt werden. Die PDF-Konvertierung und Verarbeitung der Dokumente erfolgt dabei über einen zentralen im lokalen Netzwerk oder über Internet zugänglichen FileConverterPro Server-Dienst der per SOAP / REST über HTTP(S) angesprochen wird. Damit können Ressourcen besser gemeinsam genutzt werden: Die lokalen Rechner werden entlastet, zentral installierte Anwendungen (MS-Office, DWG/DXF Konverter bzw. eine Abbyy OCR Engine) werden zentral installiert und gemeinsam genutzt und müssen nicht auf den lokalen Arbeitsplätzen vorhanden sein.

Unterschiede zu einer lokalen PDFMerge Installation:

  • Die PDF bzw. PDF/A Konvertierung erfolgt nicht lokal sondern per HTTP(S) Kommunikation über einen zentralen FCpro Service.
  • Keine lokale Installation von MS-Office, DWG/DXF Konverter und Abbyy OCR Engine erforderlich – da der zentrale FCpro Dienst / Service verwendet wird.
  • Keine Konfiguration eigener lokaler Konvertier-Profile erforderlich – Auswahl von zentral vordefinierten FCpro Profilen.
  • Dokumenten-Voransicht nur für Image- und PDF-Dokumente möglich.
  • Kompakteres Setup – 65MB zu 240-500 MB – da der PDF-Konverter und die OCR Engine nicht lokal installiert wird
  • Vereinfachte Bedienung da weniger Konfigurations-Möglichkeiten vorhanden sind.
  • Kostengünstige Möglichkeit PMT / PMTX Dateien auf jedem Arbeitsplatz zu erzeugen um diese über einen FCpro Server oder PDFMerge zu verarbeiten.

1_PDFMerge für FCpro - Auswahl der FileConverterPro Verarbeitungsprofile  2_Context Menü für die eingefügten Dokumente  3_Kommunikations Einstellungen und Default Profilauswahl für den FileConverterPro Server

Neue Features für den FileConverter Pro durch den PDFMergeClient _ FCpro

Der PDFMerge Client für den FCpro ermöglicht nicht nur reine PDF und PDF/A Konvertierungen sondern bietet zusätzliche Funktionen:

  • Erzeugt über Bookmarks strukturierte Gesamt-PDF und -PDF/A Dokumente aus Einzeldokumenten
  • Setzen der PDF Infofelder, PDF-Öffnen Parametern und PDF-Berechtigungen und Öffnen Passwort.
  • Seiten-Nummerierung und Text-Stempel mit einer Vielzahl an Variablen und Konfigurationsmöglichkeiten
  • Hinterlegen bzw. Überlagern von PDF Briefpapier
  • TOC – Inhaltsverzeichnis automatisch aus den Bookmarks generiert (geplant).

Nach der Installation des PDFMerge Client für den FileConverterPro (FCpro) Server kann die Verarbeitung sofort über unseren im Internet frei zugänglichen FCpro Testserver getestet werden, da die erforderlichen Verbindungsdaten im Setup bereits voreingestellt sind. Die Commandline Parameter von PDFMerge gelten ebenfalls, wobei sich die Profile auf die FileConverterPro Profile des konfigurierten FCpro Servers beziehen.

Download – PDFMerge Client für FileConverterPro (FCpro) – ca. 60MB >>>

FileConverter – Version 1.0.40 verfügbar – Neuer zusätzlicher HTML Konverter

Neuerungen & Verbesserungen – FileConverter 1.0.40:

  • Bei der Verarbeitung von E-Mails (EML, MSG) können jetzt auch E-Mails die selbst wieder MSG oder EML Anhänge enthalten konvertiert werden.
  • Fehler bei der Verarbeitung vom MS-Exchange E-Mail Boxen über die Web-Service Schnittstelle wurde behoben – der Fehler hat die Verarbeitung zeitweise blockiert wodurch der Dienst neu gestartet werden musste.
  • Die zugrunde liegende Konverter Komponente wurde aktualisiert und an den aktuellen Stand des FileConverterPro angepasst.
  • Speziell für die HTML Konvertierung (E-Mail Body) wurde eine neue Konverter Engine (ASP-direkt) implementiert. Es gibt jetzt 3 zur Auswahl
  • HiQ-direkt = bisherige „Direkte Konvertierung“
  • ASP-direkt = Neuer HTML Konverter
  • MS-Office – wie bisher

Wir empfehlen ASP-direkt  standardmäßig zu verwenden da bei diesem Konverter die Schriften größer dargestellt und damit die erzeugten PDF´s besser lesbar werden.

Download – FileConverter – Dokumente & E-Mails nach PDF, PDF/A und TIFF >>>

FileConverterPro & AutoOCR – Test Web-Seite verfügbar

Um die Funktionen von FileConverterPro sowie AutoOCR testen und um eigene Konvertierungen durchführen zu können ohne sich selbst die Software installieren zu müssen haben wir frei und kostenlos im Internet zugänglich einen Server mit FileConverterPro und AutoOCR verfügbar gemacht.

Unter MS-Windows können die Anwendungen DropConvert (für FileConverterPro) bzw. DropOCR (für AutoOCR) installiert werden um Verarbeitungen durchzuführen und Tests mit diesen Programmen machen zu können.

Diese Dienste können jetzt auch ohne Installation einer Client Software bzw. von allen Plattformen aus nur über den Browser genutzt werden. Dafür haben wir eigene Test-Web-Seiten eingerichtet um Dokumente hochzuladen und nach PDF bzw. PDF/A zu konvertieren bzw. eine PDF-OCR Konvertierung durchzuführen.

FileConverterPro – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/fcpro

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, DOCM, RTF, TXT, ODT
  • XLS, XLSX, XLSM
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)
  • DWG, DXF, DWF
  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

Bei allen Profilen werden Platzhalter Seiten bei Konvertier-Fehlern und nicht konvertierbaren Datei Formaten eingefügt.

  • Default – Direkte Konvertierung ohne MS-Office 2010, keine OCR Verarbeitung
  • Direct + iOCR German – Direkte Konvertierung ohne MS-Office 2010, iOCR Deutsch
  • Direct – no OCR – PDFA – Direkte Konvertierung ohne MS-Office 2010, PDF/A, keine OCR Verarbeitung
  • Direct – no OCR – with draft stamp and overlay – Direkte Konvertierung ohne MS-Office 2010, Stempeln Oben Links mit Dateiname / Datum / Uhrzeit,  Wasserzeichen (Stempel)  “Draft / Entwurf”,  Beispiel Briefpapier wird hinterlegt, keine OCR Verarbeitung
  • MS-Office + Abbyy + PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, Abbyy OCR- Deutsch & Englisch
  • MS-Office + Abbyy – Konvertierung der Office Dokumente mit MS-Office 2010, Abbyy OCR- Deutsch & Englisch
  • MS-Office – no OCR – PDFA – Konvertierung der Office Dokumente mit MS-Office 2010, PDF/A-1b Ausgabe, keine OCR Verarbeitung

 

AutoOCR – Test Web-Seite:

URL: http://autoocr.may.co.at:3000/autoocr

Unterstützte Eingangs-Dokumentenformate:

  • Abbyy: PDF, TIF, TIFF, PNG, JPG, JPEG, BMP, GIF, PCX, DCX, JP2, JPC, DJV, DJVU, WDP
  • iOCR:  PDF, TIFF, JPEG, PNG

Verarbeitungsprofile:

  • Abbyy PDFA – German & English – PDF/A Ausgabe, Sprachen – Englisch & Deutsch
  • AbbyyFR10 – English & German – kein PDF/A, Sprachen – Englisch & Deutsch
  • iOCR – English – PDFA – PDF/A – Ausgabe, Sprache – Englisch
  • iOCR – English – kein PDF/A, Sprache – Englisch
  • iOCR – German kein PDF/A, Sprache – Deutsch

Auf den Test-Seiten kann direkt zwischen der FileConverterPro und der AutoOCR Test Seite hin und hergeschaltet werden.

 

Node.js als Basis für die Test Web-Seiten:

Zur Implementierung der Test Web-Seiten für den FileConverterPro und AutoOCR haben wir die momentan modernsten Tools der Web-Software-Entwicklung verwendet. Die Programmierung wurde sowohl Client- als auch Server-seitig rein über JavaScript realisiert.

Folgende Komponenten kommen hier zum Einsatz:

  1.  Node.js – JavaScript für den Server – http://nodejs.org/
  2. Node.js  FileConverterPro / AutoOCR Libraryhttps://github.com/XKEYGmbH/node-fcpro
  3. Bootstraphttp://getbootstrap.com/
  4. AngularJShttps://angularjs.org/

1_FileConverterPro - Test Site - Dokumente hochladen und nach PDF bzw. PDFA konvertieren3_Die eingefügten Dateien werden in der Liste angezeigt - die Auswahl des Verarbeitungsprofils ist pro Datei möglich   4_Mit Start der Konvertierung - werden die Dateien auf den Testserver hochgeladen und gleich konvertiert  5_Nach der Konvertierung können die erzeugten PDFs über den Download Link abgerufen werden  2_AutoOCR Test Site - Scans, Images und PDF hochladen und in durchsuchbare PDF bzw.PDFA konvertieren

DropOCR – Version 1.2.5 verfügbar

Neuerungen DropOCR Version 1.2.5:

  • Direkt Auswahl des AutoOCR Verarbeitungsprofils über das Context Menü der Icon Tray Anwendung
  • Funktion “Alle Jobs abbrechen” – damit können laufende Übertragungen und Verarbeitungen umgehend beendet werden.
  • Die “AutoStart” Option ist jetzt standardmäßig aktiviert.
  • Max. Seitenzahl ist per Default auf 1000 voreingestellt
  • Die Verbindungsdaten des AutoOCR Testservers sind durch die Installation bereits vorbelegt.

DropOCR - Context Menu - Icon Tray Anwendung  DropOCR - Konfigurationseinstellungen 1.2.5

Download – DropOCR >>>