Kategorie: Alfresco

SmartTransformer – FileConverterPro integriert mit dem Alfresco ECM

SmartTransformer ist eine Integration des FileConverterPro (FCpro) mit Alfresco ECM / DMS. Der SmartTransformer besteht aus einer Alfresco-Erweiterung, einem eigenen, schlanken Server, der den Kontext der Alfresco-Dokumente kennt und der sich um die Abarbeitung und Aktualisierung kümmert sowie dem FileConverterPro.

Hochwertige Previews und bessere Alfresco-Performance:

Warum beeinträchtigt das Anzeigen von Previews die Alfresco Leistung? Alfresco erzeugt von Office-Dokumenten automatisch Dokumenten-Thumbnails und Previews. Dieser Mechanismus führt gerade auch in größeren Umgebungen regelmäßig zu Klagen bei den Anwendern. Einerseits wird Alfresco instabil und langsam, weil es mit Konvertierungen beschäftigt ist oder gar auf hängen gebliebene Konvertierungsjobs wartet. Auf der anderen Seite sind die Anwender unzufrieden mit der Qualität der Previews – die Darstellung entspricht meist nicht dem in MS-Office oder dessen Ausdruck.

Der SmartTransformer packt das Problem an der Wurzel und lagert jegliche Office-Konvertierung an einen eigenständigen, robusten und skalierbaren Transformations-Service aus, der u. a. Office-Dokumente mit MS-Office-Bibliotheken konvertiert. Die Previews sind so, als hätte der Anwender das Dokument in Microsoft Office als PDF gespeichert.

Es findet eine Vermeidung von Mehrfachkonviertierungen statt, durch intelligentes Caching im SmartTransformer. Im gleichen Zug ist er außerdem eine echte Entlastung des Alfresco-Servers (Repository) durch Auslagerung aller Transformations-Aufgaben (Text-Extraktion, Preview-, Thumbnail-Generierung) an einen eigenständigen Service / Server.  Es wird keine CPU am Alfresco-Server belastet. Somit ist er zuverlässig und robust: Konvertierungsjobs werden vom SmartTransformer einer Datenbank verwaltet

Der SmartTransformer löst Flaschenhälse in der Alfresco-Architektur:

  • Transformationsaufgaben, die von FCPro durchgeführt werden können, werden in Alfresco durch Platzhalter-Dokumente simuliert und statt dessen als „Auftrag“ in einer persistenten Job-Queue eingetragen und an den FCPro übergeben. Sobald FCPro die Transformation fertig gestellt hat, wird der Platzhalter durch die echte Transformation ersetzt. Aus Sicht von Alfresco entsteht keinerlei Last mehr durch die Transformation, da umgehend das Ergebnis durch den Platzhalter zurück geliefert wird. Die Job-Queue übersteht auch einen Neustart und es können mögliche Problemdokumente leicht identifiziert werden. Im Alfresco-Standard werden Transformationen durch Java-Threads umgesetzt, was regelmäßig zu Skalierungsproblemen führen kann.
  • Mehrfach-Transformationen des selben Binär-Objektes wie beim Alfresco-Transformer werden vermieden, da diese vom SmartTransformer erkannt werden. Ebenso werden bei schnellen Updates auf einem Alfresco-Dokument automatisch Jobs gelöscht, wenn diese noch nicht angefangen sind, bzw. die Jobs werden durch neue ersetzt.
  • Im Gegensatz zur Alfresco-Standardimplementierung erfolgt die Transformation bereits proaktiv beim Erzeugen oder Ändern eines Dokuments – nicht erst beim Zugriff über Alfresco-Share. Hierbei werden gleich konfigurierbare Sets mit nur einer Transformation erzeugt (Thumbnail, Preview, Gallery-View, …), sodass das Office-Dokument nur einmal geöffnet werden muss.

In Alfresco steht für den SmartTransformer auch eine JavaScript-Api zur Verfügung.

Der SmartTransformer wurde von unserem Alfresco Entwicklungspartner ECM4u entwickelt.

Anfragen zum Produkt richten sie bitte direkt an:

ecm4u GmbH
Heiko Robert [heiko.robert@ecm4u.de]
http://www.ecm4u.de
Hölderlinplatz 2b
70193 Stuttgart

t: +49 (711) 912775-72
m: +49 (176) 347475-72
f: +49 (711) 912775-80

ifresco Tools – RepoWorker Scripts – Alfresco Dokumente automatisiert in durchsuchbare PDF bzw. PDF/A konvertieren

Das Modul ifresco Tools stellt die folgenden Funktionen für das Alfresco ECM / DMS zur Verfügung:

  • ifresco-RepoWorker – ermöglicht die zeitgesteuerte Ausführung eines Repository-JavaScript auf einer definierbaren Menge von Dokumenten.
  • ifresco-ScriptAction – ermöglicht die Definition von Share-Actions, die Repository-JavaScript auf Dokumenten ausführen.

RepoWorker – Scripts integrieren AutoOCR und FileConverterPro:

Mit dem RepoWorker haben wir eine Erweiterung für den ifresco Transformer auf Basis von Scripts geschaffen. Dabei werden alle bestehenden bzw. alle neu hinzukommenden Dokumente bestimmter Content- bzw. MIME-Typen eines Alfresco Servers in durchsuchbare PDF bzw. PDF/A Dokumente konvertiert. Der Benutzer muss sich nicht darum kümmern, die Konvertierung erfolgt automatisch am Server, egal über welchen Weg die Dokumente ins Alfresco ECM / DMS kommen.

Funktionen:

  • zeitgesteuerte Ausführung von JavaScripts auf einer definierbaren Menge von Dokumenten
  • bestehende Dokumente bestimmter Content- und MIME-Typen werden über AutoOCR bzw. FileConverterPro in durchsuchbare PDF bzw. PDF/A konvertiert und ersetzen die Urspungs-Dokumente.
  • Verarbeitete Dokumente werden mit dem „Transform“ Aspekt markiert um eine nochmalige Verarbeitung zu verhindern.
  • einmalige bzw. in einstellbaren Zeitintervallen wiederholende Script-Ausführung. z.b. alle 5 min.
  • Scripte sind schnell und einfach an neue Gegebenheiten und Anforderungen anpassbar.
  • Einfache Installation und Konfiguration

Beschreibung – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

GitHub – RepoWorker Scripts für AutoOCR / FileConverterPro >>>

Voraussetzungen:

  • Alfresco 4.x,
  • AutoOCR oder FileConverterPro ,
  • ifresco Transformer (AMP).
  • ifresco Tools (AMP)

Eine Demoinstallation befindet sich auch auf unserem ifresco / Alfresco Testserver (admin / admin)

1_TIFF Datei in einen Alfresco Folder kopiert    2_TIFF Datei wird gefunden in ein durchsuchbares PDF konvertiert und ersetzt die Ursprungsdatei

ifresco Client für Alfresco DMS/ECM – Neue Version in Arbeit

Wir arbeiten an einer neuen Version des ifresco Clients für die Alfresco DMS/ECM OpenSource Software und es gibt bereits erste Screen Shots der neuen Version.

Einige der kommenden Neuerungen:

  • Für die JavaScript Programmierung basiert nur mehr auf ExtJS. Bisher wurde daneben auch jQuery verwendet.
  • Die neue Version verwendet die aktuellste Version des PHP Frameworks – Symfony
  • Für die Suche und für die Dokumenten- und Baumanzeige werden eigene serverseitige JavaScripts im Alfresco Repository verwendet
  • Wesentlich verbessertes und überarbeitetes Userinterface für die Administration und Konfiguration.
  • Suche und Anzeige von Dokumentenbibliotheken der Alfresco Sites wird unterstützt.
  • Direkte Suche nach Ordnern um bei umfangreichen Ordnerstrukturen schnell den Ordner auswählen zu können.
  • Tag Manager – Erstellen und Verwalten der Alfresco Tags.

Template Manager  Template Manager - Suchprofile  Suche nach Ordnern   Suche nach Sites  Site Dokumente  Tag Verwaltung

ifresco Profiler – Alfresco Standard Plugin verfügbar

Es gibt jetzt für den ifresco Profiler einen kostenlos verfügbaren Alfresco Standard Plug-In.

Der Standard Plug-In ermöglicht den Upload von Dokumenten über den ifresco Profiler in ein beliebiges Alfresco / ifresco Repository. Dabei werden nur die Standardfelder und der Standard Content Typ für Dokumente von Alfresco verwendet. Damit ist es nicht erforderlich ein zusätzliches Content Modell zu installieren. Der Standard Plug-In ist kostenlos verfügbar und somit „out of the box“ mit jedem Alfresco Server verwendbar. Damit können die ifresco Profiler Funktionen zusammen mit Alfresco ohne zusätzlichen Aufwand getestet werden.

ifresco Profiler Standard Plugin - Erfassungsmaske

Unterstützte Felder / Funktionen:

  • Dateiname / Titel (muss) – Der Dokumentenname im Alfresco entspricht dem Titel wobei nicht erlaubte Felder durch „_“ ersetzt werden.
  • Beschreibung (optional) Langtextbeschreibung zum Dokumenteninhalt
  • Alfresco Ziel-Ordner (muss) – Auswahl des Alfresco Ziel Folders in dem das Dokument abgelegt werden soll.
  • Tags (optional) – Tags sind Schlüsselworte um ein Dokument zu klassifizieren und um später alle damit gekennzeichneten Dokumente direkt aufzulisten. Bestehende Tags können ausgewählt und Neue hinzugefügt werden.

Titel – Regeln: Der Standard Plug-In installiert auch die XML Datei „titlerules_StandardPlugin.xml“. In diese Datei werden dynamisch erzeugbare Felder definiert sowie die Regeln um daraus automatisch den Dokumententitel zu generieren. Die Auswahl der Regel erfolgt über „Dokumenten-Typen / Subtypen“. Eine Maske mit Feldern – mit den Typen: Text, Datum, Version, Jahr wird daraus generiert und bei der Profilierung angezeigt.

ifresco Profiler - Titel Regeln über XML

Type-ahead Suche nach Alfresco Ordnern – Über das Suchfeld können bestehende Ordner durch die Eingabe eines oder mehrere Suchbegriffe schnell gefunden werden. Es wird eine Teilstringsuche der mit UND verknüpften Begriffe durchgeführt und die Such-Ergebnisse als Liste zur Auswahl angeboten. Der Suchbegriff für den Ordner muss mindestens 3 Zeichen umfassen.

ifresco Profiler - Standard Plugin - type ahead Suche nach Ordnern  ifresco Profiler - Standard Plugin - Suche nach Ordnern

Tags : Tags sind Schlüsselworte um Dokumente zu klassifizieren und um später alle damit gekennzeichneten Dokumente direkt aufzulisten. Bestehende Tags können per type ahead Suche ausgewählt und Neue hinzugefügt werden.

ifresco Profiler - Standard Plugin Tags

Text Stempel:  Beim Upload können auf das PDF Informationen in Form von Textstempel aufgebracht werden. Die Option kann über die Checkbox „Stempel Tab anzeigen“ aktiviert und konfiguriert werden. Die Position, Farbe, Größe und Schriftstil des Stempels wird hier konfiguriert. Der Text kann aus fixen Teilen oder Variablen aufgebaut werden.

ifresco Profiler Standard plugin - Text-Stempel  ifresco profiler - standard plugin text stempel

Eine Übersicht über die allgemeinen Funktionen der ifresco Profiler Basisversion finden Sie hier >>>

Download – Detail Beschreibung – ifresco Profiler inkl. Standard Plugin >>>
Download – ifresco Profiler Basisversion >>>
Download – ifresco Profiler Alfresco Standard Plugin >>>
Download – ifresco Profiler Standard Plugin Beispieldateien >>>

ifresco AutoOCR – Version 1.18 verfügbar

Mit der Version 1.18 von ifresco AutoOCR – der OCR Server Integration für Alfresco gibt es neue Funktionen und Erweiterungen:

  • Implementierung der neuen Paging API für die Jobs-Liste des AutoOCR Servers – Seitenblättern (vorwärts/rückwärts), Löschen aller Jobs, Löschen älter als x Tage, Sortieren der Jobs, Selektion der Jobs nach Datum.
  • Frei konfigurierbare Run-time Transformer. Sowohl Datei- als auch Pipe-IO basierende Commandline Tools können verwendet werden um zusätzliche Transformatoren zu konfigurieren.
  • Gleich wie die Commandline basierenden Run-Time Transformatoren können jetzt auch Transformer über JavaScripts verwendet werden.
  • AutoOCR Content Model Erweiterung für den OCR Status (Aspect) wird installiert um den OCR Status einer Datei bzw. die auftretenden Fehler als Metadaten hinterlegen und abfragen zu können.
  • Das optionale ifresco Tools AMP – ermöglicht die Hintergrund OCR Verarbeitung in festgelegten Intervallen zur Erstverarbeitung bestehender Dokumentenbestände bzw. zum nachfolgenden Aufarbeiten der neu hinzugekommenen Dokumente. Die Ermittlung der zu verarbeitenden Dokumente sowie die Verarbeitung erfolgt über JavaScripts welche Batchorientiert und Zeitgesteuert im Hintergrund am Server ausgeführt werden. Damit können auch zusätzliche Alfresco Share – Dokumenten Aktionen über JavaScripts konfiguriert und ausgeführt werden z.b. um die ausgewählte(n) PDF und Image Dokumente über den AutoOCR Server in durchsuchbare PDF´s bzw. PDF/A Dateien zu konvertieren und die Ausgangsdatei automatisch durch diese zu ersetzen. Durch die ifresco Tools stehen über JavaScripts somit die AutoOCR Funktionen unabhängig von den konfigurierten Alfresco Transformern sowohl für die Massen-Batch- sowie die für interaktive Einzelverarbeitung zur Verfügung.

AMP der Version 1.18 sind für folgende Alfresco Versionen verfügbar: 4.0.1 EE, 4.0.2 EE, 4.0d CE, 4.1.1 EE, 4.1.2 EE, 4.1.3 EE, 4.1.4 EE, 4.2b CE, 4.2c CE
AMP der ifresco Tools 1.1 für: 4.2c CE, 4.2d CE

ifresco AutoOCR - New Job functions  ifresco AutoOCR - Runmtime transformer  ifresco AutoOCR - Transformer configuration Content Model for ifresco-AutoOCR

Download – ifresco AutoOCR – Runtime Transformer Beschreibung >>>
Download – ifresco AutoOCR – Transformer über JavaScript Beschreibung >>>
Download – ifresco AutoOCR – Beispiel JavaScript Transformer >>>

ifresco AutoOCR – JavaScript Binding für Alfresco

Alfresco und AutoOCR sind durch die Installation der AMP´s über eine REST Web-Service Schnittstelle integriert. Server-basierendes JavaScript bietet eine einfache, flexible und schnell umsetzbare Möglichkeit Alfresco Funktionen zu erweitern und anzupassen.

JavaScripts können als Batchprozesse zeitgesteuert angestoßen werden um z.B. eine größere Zahl an Dokumenten im Hintergrund bearbeiten. Sie können aber auch über den Client z.b. Alfresco Share als Dokumenten-Aktion für einzelne oder mehre ausgewählte Dokumente aufgerufen werden.

Das JavaScript Binding  der AutoOCR Funktionen ermöglicht den direkten Zugriff auf den AutoOCR Service aus Alfresco Scripts heraus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer. Es ermöglicht OCR Funktionen aus JavaScripts heraus zu nutzen, die im Alfresco hinterlegt dann direkt am Server ausgeführt werden.

Download – Dokumentation JavaScript Binding für Alfresco >>>
Download – Umfangreicher Demo Script >>>

ifresco Client & Alfresco 4.2 CE – Testsystem online

Um den aktuellen ifresco Client online ohne eigene Installation bzw. auch den ifresco Profiler testen zu können steht ein Testsystem mit den aktuellen Versionen jetzt online zur Verfügung.

ifresco OpenSource Client für Alfresco als fertig installierte VM Appliance verfügbar

Um mit möglichst wenig Aufwand und ohne die erforderliche Installation und Konfiguration unseren ifresco Client für Alfresco verwenden zu können gibt es jetzt eine fertig installierte VMWare Appliance.

Nach der Installation muss nur mehr die IP und der Port des Alfresco Server eingegeben werden und schon kann der ifresco Client zusammen mit dem Alfresco Server verwendet werden. Über eine optionalen Update Vereinbarung bekommen Sie Zugriff auf die laufend aktualisierten Versionen direkt aus unserem SVN Repository. Bei dieser Variante wird der Alfresco Server getrennt von ifresco verwendet. Alternativ bieten wir auch eine kombinierte Alfresco Community Edition + ifresco Client Appliance an – Beiden Systeme fertig installiert, konfiguriert und optimiert auf einem Ubuntu 64bit LINUX VM Server.

Vorinstallierte ifresco Client VMWare Appliance

  • Debian LINUX 32bit
  • PHP 5
  • Apache 2.2
  • MySQL 5
  • Installierte PHP Extensions – PDO, MB-String, XML, SOAP, Iconv
  • Alle erforderlichen PHP Einstellungen durchgeführt

Voraussetzungen: VMWare Workstation, Player, etc. – min. 2GB RAM, 10GB HD

Optional: SVN Update für Anwender mit SW-Wartung

Konfigurationsabfrage beim erstmaligen Start: Alfresco Server IP, Port. Danach wird die IP Adresse angezeigt unter der der ifresco Client über einen Browser (optimal: Google Chrome) erreichbar ist.

Preisinformationen dazu in unserem Web-Shop >>>

ifresco Profiler – Teilen von Dokumenten – manuell, per Seite, Bereichs-OCR, per Barcode

Der ifresco Profiler verfügt über einfach zu handhabende Funktionen um Dokumentenstapel sehr schnell auf verschiedene Arten zu teilen. Dabei stehen folgende Funktionen zur Verfügung:

  • Manueller Split – Die Seite / Thumbnail an der das Dokument geteilt werden soll wird selektiert – und durch drücken einer Tastenkombination wird das Dokument an der aktuellen Seiten aufgeteilt, automatisch benannt und danach das neue Dokument für weitere Splitvorgänge selektiert.
  • Split nach Seitennummern – Dabei kann das Gesamtdokument an Hand einer Seitenzahl in Einzeldokumente mit gleicher Seitenzahl geteilt werden.
  • Split über Bereichs-OCR – ein Bereich in der Voransicht wird ausgewählt und über Bereichs-OCR wird der Text erkannt – das Dokument wird an dieser Seite geteilt und der erkannte Text wird als Namen vergeben.
  • Split nach Barcode – 1D Barcodes werden erkannt und können zum Teilen der Dokumente sowie als Dateinamen verwendet werden. 18 verschiedene Barcodes werden unterstützt, Orientierung bzw. Position auf der Seite ist beliebig. Barcode Seiten können gelöscht werden, Unterstützt werden auch Filter über Strings, Listen und Wertebereichen.

Webshop