FileConverterPro – MS-Office Konvertierung und PDF/A

Für die Konvertierung von MS-Office Formaten (Word, Excel, PowerPoint, Visio…) nach PDF/A bietet der FCpro entweder die “direkte” Konvertierung oder die Konvertierung basierend auf einer auf dem FCpro Rechner installierten MS-Office Version.

Wir empfehlen falls PDF/A als Ausgabeformat gefordert ist entweder die “direkte” oder die  Konvertierung über MS-Office 2013 / 2016 in der 32 oder 64bit Version zu verwenden. Wir haben in Test festgestellt dass bestimmte MS-Word Dokumente über MS-Office 2010 sich nicht in valide PDF/A Dokumente konvertieren lassen.

SmartTransformer – FileConverterPro integriert mit dem Alfresco ECM

SmartTransformer ist eine Integration des FileConverterPro (FCpro) mit Alfresco ECM / DMS. Der SmartTransformer besteht aus einer Alfresco-Erweiterung, einem eigenen, schlanken Server, der den Kontext der Alfresco-Dokumente kennt und der sich um die Abarbeitung und Aktualisierung kümmert sowie dem FileConverterPro.

Hochwertige Previews und bessere Alfresco-Performance:

Warum beeinträchtigt das Anzeigen von Previews die Alfresco Leistung? Alfresco erzeugt von Office-Dokumenten automatisch Dokumenten-Thumbnails und Previews. Dieser Mechanismus führt gerade auch in größeren Umgebungen regelmäßig zu Klagen bei den Anwendern. Einerseits wird Alfresco instabil und langsam, weil es mit Konvertierungen beschäftigt ist oder gar auf hängen gebliebene Konvertierungsjobs wartet. Auf der anderen Seite sind die Anwender unzufrieden mit der Qualität der Previews – die Darstellung entspricht meist nicht dem in MS-Office oder dessen Ausdruck.

Der SmartTransformer packt das Problem an der Wurzel und lagert jegliche Office-Konvertierung an einen eigenständigen, robusten und skalierbaren Transformations-Service aus, der u. a. Office-Dokumente mit MS-Office-Bibliotheken konvertiert. Die Previews sind so, als hätte der Anwender das Dokument in Microsoft Office als PDF gespeichert.

Es findet eine Vermeidung von Mehrfachkonviertierungen statt, durch intelligentes Caching im SmartTransformer. Im gleichen Zug ist er außerdem eine echte Entlastung des Alfresco-Servers (Repository) durch Auslagerung aller Transformations-Aufgaben (Text-Extraktion, Preview-, Thumbnail-Generierung) an einen eigenständigen Service / Server.  Es wird keine CPU am Alfresco-Server belastet. Somit ist er zuverlässig und robust: Konvertierungsjobs werden vom SmartTransformer einer Datenbank verwaltet

Der SmartTransformer löst Flaschenhälse in der Alfresco-Architektur:

  • Transformationsaufgaben, die von FCPro durchgeführt werden können, werden in Alfresco durch Platzhalter-Dokumente simuliert und statt dessen als “Auftrag” in einer persistenten Job-Queue eingetragen und an den FCPro übergeben. Sobald FCPro die Transformation fertig gestellt hat, wird der Platzhalter durch die echte Transformation ersetzt. Aus Sicht von Alfresco entsteht keinerlei Last mehr durch die Transformation, da umgehend das Ergebnis durch den Platzhalter zurück geliefert wird. Die Job-Queue übersteht auch einen Neustart und es können mögliche Problemdokumente leicht identifiziert werden. Im Alfresco-Standard werden Transformationen durch Java-Threads umgesetzt, was regelmäßig zu Skalierungsproblemen führen kann.
  • Mehrfach-Transformationen des selben Binär-Objektes wie beim Alfresco-Transformer werden vermieden, da diese vom SmartTransformer erkannt werden. Ebenso werden bei schnellen Updates auf einem Alfresco-Dokument automatisch Jobs gelöscht, wenn diese noch nicht angefangen sind, bzw. die Jobs werden durch neue ersetzt.
  • Im Gegensatz zur Alfresco-Standardimplementierung erfolgt die Transformation bereits proaktiv beim Erzeugen oder Ändern eines Dokuments – nicht erst beim Zugriff über Alfresco-Share. Hierbei werden gleich konfigurierbare Sets mit nur einer Transformation erzeugt (Thumbnail, Preview, Gallery-View, …), sodass das Office-Dokument nur einmal geöffnet werden muss.

In Alfresco steht für den SmartTransformer auch eine JavaScript-Api zur Verfügung.

Der SmartTransformer wurde von unserem Alfresco Entwicklungspartner ECM4u entwickelt.

Anfragen zum Produkt richten sie bitte direkt an:

ecm4u GmbH
Heiko Robert [heiko.robert@ecm4u.de]
http://www.ecm4u.de
Hölderlinplatz 2b
70193 Stuttgart

t: +49 (711) 912775-72
m: +49 (176) 347475-72
f: +49 (711) 912775-80

FileConverterPro (FCpro) – Version 1.0.63 verfügbar

Neuerungen FCpro Version 1.0.63:

  • Die Konvertierung nach PDF/A wurde verbessert und komplett neu implementiert.
  • Falls ein Dokument im ersten Schritt nicht direkt nach PDF/A konvertiert werden kann gibt es auch die Möglichkeit das Dokument zu “rendern” und ein Abbild der Seiten zu erzeugen. Der Text wird aus der Ursprungsseite ausgelesen und ohne weiteren OCR Vorgang im Zieldokument wieder eingefügt. Damit kann auch aus normalerweise nicht nach PDF/A konvertierbaren Dokumenten ein valides PDF/A Dokument erzeugt werden. Dieses entspricht hinsichtlich seiner visuellen Erscheinung dem Original, enthält aber auch den Text für die Suche. Normalerweise müssten solche Dokumente ausgedruckt und neu eingescannt werden.

  • Die Software ist jetzt in der Lage herauszufinden auf welcher Seite ein nicht korrigierbare Fehler bei der PDF/A Konvertierung auftritt. Damit werden nur jene Seiten “gerendert” wo ein Konvertier-Fehler auftritt und nicht das ganze Dokument.
  • Wird die PDF/A Ausgabe ausgewählt so ist das “Rendering” jetzt standardmäßig mit 200dpi aktiviert.

Download – FileConverterPro (FCpro) ~150MB >>>

FileConverterPro (FCpro) – Version 1.0.59 verfügbar

Neuerungen FCpro Version 1.0.59:

  • PDF Konvertierung von OpenOffice Formaten durch Integration von LibreOffice – Alternativ zur Konvertierung der OpenOffice Dokumentenformate über die “direkte” Konvertierung gibt es jetzt auch die Möglichkeit die beste Kompatibilität und Qualität bei der PDF Konvertierung dieser Formate durch die Verwendung der Original LibreOffice Anwendung zu erreichen.

LibreOffice Dateiformate und Datei-Endungen

Stehen genügend CPU´s und Cores zur Verfügung so ist es auch möglich mehrere LibreOffice Instanzen parallel laufen zu lassen um damit den Konvertier-Durchsatz einfach zu vervielfachen.

Konfiguration:

  • Wichtig: Bevor sie diese Konfiguration durchführen – Stoppen sie den FileConverterPro Dienst!
  • Laden sie die LibreOffice Portable Version herunter.
  • Erzeugen sie einen Root Folder für alle LibreOffice Instanzen z.B.: C:\LibreOfficePortableRoot
  • Installieren sie die erste Instanz in einem Folder darunter – z.B.: C:\LibreOficePortableRoot\LibreOfficePortable1
  • Ändern sie die INI Datei unter C:\LibreOficePortableRoot\LibreOfficePortable1\App\AppInfo\Launcher\LibreOfficePortable.ini und fügen sie die Zeile SingleAppInstance=false im ersten Abschnitt ein.

Eintrag dieser Zeile in der INI Datei von LibreOffice Portable

  • Kopieren sie den kompletten Inhalt des Ordners LibreOfficePortable1 und erzeugen sie die gewünschte Anzahl an LibreOffice Instanzen z.B.:

C:\LibreOficePortableRoot\LibreOfficePortable2
C:\LibreOficePortableRoot\LibreOfficePortable3
C:\LibreOficePortableRoot\LibreOfficePortable4

Je nach dem wie viele Instanzen hier vorhanden sind werden diese für die parallele Abarbeitung verwendet. Erzeugen sie hier also so viele Instanzen wie sie haben wollen bzw. wie viele der Rechner vertragen kann. Es macht wenig Sinn hier mehr Instanzen anzulegen als der Rechner an CPU / Core Ressourcen zur Verfügung hat da jeder Prozess eine CPU / Core für die Verarbeitung benötigt.

  • In der FileConverterPro Konfigurations-Oberfläche finden sie unter “Optionen” einen Feld um den Start-Ordner für die LibreOffice Instanzen angeben zu können. Geben sie hier lt. unserem Beispiel folgenden Wert ein: C:\LibreOficePortableRoot

Konfiguration LibreOffice Root mit 4 Instanzen

  • Nun können sie bei den FCpro Verarbeitungsprofilen unter dem “ODF” Tab auswählen dass LibreOffice für die Konvertierung der OpenOffice Dokumentenformate verwendet werden soll.

Die LibreOffice Konvertierung kann im Verarbeitungsprofil aktiviert werden

  • Starten sie den FileConverterPro Dienst wieder.

Download – LibreOffice Portable – LibreOffice Site >> >
Download – LibreOffice Portable Version 5.3.1 ~120MB >>>
Download – FileConverterPro (FCpro) ~150MB >>>

FileConverterPro (FCpro) – Version 1.0.57 verfügbar

Neuerungen FCpro Version 1.0.57:

Da unsere Anwendungen die gleichen Basiskomponenten verwenden stehen die mit AutoOCR 1.15.3 implementierten OCR Verbesserungen jetzt auch in der aktuellen Version des FileConverterPro zur Verfügung:

  • Neue iOCR Engine – Verbesserungen bei der Erkennungsqualität. Kleinere Dateien werden erzeugt und die OCR Verarbeitung erfolgt durch die neue Multicore / Multithread Verarbeitung wesentlich schneller. Dabei werden die zur Verfügung stehenden Rechnerressourcen optimal ausgenutzt.
  • Neue Standard Einstellungen für Abbyy OCR – Ausgetestete und optimierte Standardeinstellungen bringen beste Erkennungsgenauigkeit bei optimaler Performance.
  • Schwarzen Rand entfernen – Ein durch Scan- und Kopiervorgänge entstandener schwarzer Rand wird erkannt und kann vor der OCR Verarbeitung entfernt werden.
  • Leere Seiten entfernen – Über einen definierten Schwellwert können Leerseiten vor der OCR Verarbeitung erkannt und aus einem Dokument entfernt werden.

FCpro Image Processing Funktion - Leere Seiten entfernen

  • FCpro Profil Manager – Die Funktionen wurden erweitert und verbessert.

1_FCPro - Profil Manager 2_FCPro - Profil Manager - Server hinzufügen  3_FCPro - Profil Manager ermöglicht den Import & Export von Verarbeituings und PDFExport Profilen der konfigurierten FCPro Server  4_FCPro - Profil Manager - Server Informaiton abrufen  5_FCPro - Profil Manager - Server Statistik und verfügbare OCR Seiten abrufen  6_FCPro - Profil Manager - Profile zwischen dem Hauptserver und den anderen Servern synchronisieren  7_FFCPro - Profil Manager - Synchronisieren - Eine Replikation zwischen den FCpro Servern ist nur bei gleichem Versionsstand möglich  8_FCPro - Profil Manager - Prüfen der Server Versionen ob sich diese auf dem gleichen Stand befinden

Download – FileConverterPro (FCpro) ~150MB >>>

iOCR / vsOCR Setup geteilt in Standard- und zusätzliche Sprachen

Das iOCR / vsOCR Setup das die Sprach- und Wörterbuchdaten unserer Standard-OCR Engine enthält ist insgesamt über 270MB groß. Um die Downloads und die Setup´s kleiner zu machen haben wir uns entschieden das iOCR / vsOCR in ein “Basis” und ein “zusätzliches Setup” zu teilen. Das Basis-Setup das über unsere Anwendungen z.b. AutoOCR, FileConverterPro oder PDFmdx installiert wird enthält jetzt nur mehr eine Auswahl an wichtigen europäischen Sprachen und wurde damit auf  127MB reduziert.

Sollen alle verfügbaren Sprachen installiert werden so ist das jederzeit möglich. Die zusätzlich verfügbaren “exotischen Sprachen” lassen sich über ein eigenes Setup nachinstallieren.

iOCR Basis-Sprachen:

Dänisch, Deutsch, Englisch, Finnisch, Französisch, Italienisch, Katalanisch, Neu Griechisch, Holländisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Schwedisch, Slowakisch, Slowenisch, Spanisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch

iOCR Erweiterte Sprachen:

Afrikaanis, Albanisch, Arabisch, Aserbaidschanisch, Bahasa Indonesisch, Bengali, Bulgarisch, Cherokee, Chinesisch – traditionell, Chinesisch – vereinfacht, Estnisch, Fränkisch, Gallisch, Hebräisch, Hindi, Isländisch, Japanisch, Koreanisch, Kroatisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Serbisch, Swahili, Tagalog, Tamil, Telugu, Thailändisch, Vietnamese, Weißrussisch

Download – iOCR (vsOCR) Setup – Basis Sprachen (ca. 127MB) >>>

Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 200MB) >>>

 

FileConverterPro (FCpro) – Installationsvoraussetzungen ab Version 1.0.54

Bei der FCpro Installation ab der Version 1.0.54 werden geänderte Installationsvoraussetzungen geprüft – sind sie erfüllt so werden diese Installationsschritte vom Setup übersprungen und nicht ausgeführt.

Folgende Komponenten werden geprüft und gegebenenfalls nachinstalliert:

Sind diese Komponenten bereits installiert so werden sie nicht nachgeladen und nur FCpro wird installiert. Sind alle oder einzelne Komponenten nicht oder nicht in der passenden Version vorhanden so versucht das FCpro Setup diese von unserem FTP Server nachzuladen und zu installieren. D.h. falls eine Installation ohne Internet Verbindung gemacht werden soll so sollten die Setup´s dieser Komponenten vorher heruntergeladen und in dieser Reihenfolge installiert werden.

Die FCpro Einstellungen und die Lizenz bleiben bei der Deinstallation / Update auf die neue Version erhalten.

Download – FileConverterPro (FCpro) ~190MB >>>

FileConverterPro (FCpro) – Version 1.0.54 verfügbar

Neuerungen FCpro Version 1.0.54:

HiQ – HTML nach PDF Konvertierung – Browser Größe konfigurierbar:

  • Für die HiQ-HTML nach PDF Konvertierung wir intern für das Rendering der HTML Seiten ein “virtueller Browser” verwendet. Je nach Fenstergröße des Browsers werden HTML Seiten hinsichtlich Format / Umbruch / Ränder usw. anders dargestellt. Deswegen hat die Fenstergröße des Browsers Auswirkungen auf das bei der Konvertierung erzeugte PDF.  Aus diesem Grund gibt es jetzt dafür einen Parameter um sowohl die optimale Fenstergröße automatisch ermitteln zu lassen bzw. auch um eine fixe Browser-Fensterbreite in Pixel vorzugeben. Der interne Standardwert beträgt 800 Pixel.

FCpro - Neue Option - HTML Konvertierung - Browser Größe & Breite setzen

iOCR – PDF Rendering Auflösung konfigurierbar:

  • Da nur Bild/Imagedokumente per OCR verarbeitet werden können, werden PDF Dokumente vor der OCR-Verarbeitung jedenfalls immer einer Konvertierung in ein Image (Rendering) unterzogen. Das PDF-Rendering erfolgt mit einer vorgegebenen Auflösung – bisher 300dpi für SW und 150dpi für Farbe. Der Standardwert von 150dpi ist jedoch nicht ausreichend um immer eine gute OCR Erkennungsrate zu erreichen. Deswegen gibt es jetzt die Möglichkeit die Rendering-Auflösung für SW und Farbe zu konfigurieren, wobei der Standardwert für Farbe jetzt  300dpi beträgt.

iOCR - Option - PDF Rendering resolution for b&w and color

Unterstützung zusätzlicher MS-Office Formate:

  • z.b. DOTX: Mit der neuen Version werden jetzt auch alle MS-Office Vorlagenformate z.b. DOTX über deren Dateierweiterungen bzw. über die MIME Typen unterstützt.

FCpro - Supported File Extensions & MIME Types #1 FCpro - Supported File Extensions & MIME Types #2 FCpro - Supported File Extensions & MIME Types #3 FCpro - Supported File Extensions & MIME Types #4 FCpro - Supported File Extensions & MIME Types #5 FCpro - Supported File Extensions & MIME Types #6 FCpro - Supported File Extensions & MIME Types #7

Download – FileConverterPro (FCpro) ~190MB >>>

FileConverterPro (FCpro) – Version 1.0.50 verfügbar

Neuerungen FCpro Version 1.0.50:

FCpro – Profilmanager:

Beim FCpro werden die Konvertierungsparameter über Profile verwaltet. Werden mehrere FCpro Server betrieben so ist es sinnvoll und notwendig die Verarbeitungs-Profile aller FCpro Systeme synchron zu halten. Bisher war das nur über einen manuellen Export / Transfer und Import der Profildateien möglich. Mit der Version 1.50.0 gibt es jetzt einen eigenen FCpro Profilmanager der den Abgleich zwischen den Servern wesentlich vereinfacht.

FCpro - Profil Manager - Remote Profil Verwaltung und Synchronisation  FCpro Profiverwaltung - Export und Import der Verarbeitungs und PDFExport Profile

Funktionen:

  • Verbindung zu den FCpro Servern anlegen (Beschreibung, URL, Username, Passwort, Versionsinfo, Hauptserver – Ja/Nein, Test der Verbindung)
  • Ein FCpro Server wird als Master / Hauptserver festgelegt von dem aus alle Profile auf die anderen Server repliziert werden.
  • Die Kommunikation mit den FCpro Servern erfolgt über SOAP Web-Services (http/https)
  • Abrufen der FCpro Server Info und Server Statistik
  • Remote Verwaltung der Verarbeitungs- und PDF-Export-Profile (Export, Import – Selektiv oder Alle)
  • Synchronisation vom Haupt Server ausgehend auf alle angelegten FCpro Server. (Verarbeitungs- und PDF-Export Profile)

Aktualisierung aller Basis-Komponenten auf den neuesten Stand

Update der .NET Runtime von Version 3.5 auf Version 4.0:

  • Bessere Performance als .NET 2.0 bzw. 3.5
  • Geringerer Installationsumfang. Es werden nur mehr – 40MB statt 250MB bei Version 3.5 heruntergeladen und installiert.
  • .NET 4.0 ist auf den neueren Microsoft OS Versionen (Windows 8.1, Windows 10, Server 2012,) bereits vorinstalliert/aktiviert und muss daher nicht wie die Version 3.5 manuell über das Control Panel aktiviert werden. Die Minimalvoraussetzung ist jedoch Windows 7 SP1. Windows XP und Server 2003 werden von .NET 4.0 nicht mehr unterstützt.
  • Das FCpro Setup überprüft bei der Installation ob .NET 4.0 auf dem Rechner vorhanden ist. Falls nicht wird .NET 4.0 über das Internet heruntergeladen und installiert.

Download – FileConverterPro (FCpro) ~190MB >>>

FileConverterPro (FCpro) – Version 1.0.47 verfügbar

Mit der FCpro Version 1.0.47 wurde die für die interne Job-Verwaltung verwendete Microsoft SQL Compact  Version 3.5 auf Version 4.0 aktualisiert. Die MS-SQL Compact Software wird jetzt nicht mehr separat installiert und erscheint daher nicht mehr unter den installierten Programmen sondern ist jetzt direkt in der FCpro Anwendung integriert. Damit kann es zu keinen Kollisionen mit anderen Anwendungen kommen die ebenfalls MS-SQL Compact installieren und verwenden. An den FCpro Installationsvoraussetzungen hat sich nichts geändert.

Download – FileConverterPro (FCpro) ~190MB >>>