Kategorie: Alfresco

ifresco Profiler – Demo Plugin – Erfassen von Eingangsrechnungen über Barcode und OCR

Es gibt jetzt einen Demo Plugin für den ifresco Profiler um zu zeigen wie einfach und schnell Eingangsrechnungen im Alfresco ECM/DMS erfasst werden können. So erfasste Eingangsrechnungen  können z.B. im Alfresco über die Alfresco-SAP Integration von IT-Novum weiterverarbeitet werden. Wir haben diese Lösung zuletzt in einem Alfresco-Webinar (nächster Termin 8.10.2013) gemeinsam mit IT-Novum  und Alfresco präsentiert.

Funktionen Demo Plugin – Eingangsrechnugserfassung:

  • Erfassen von Eingangsrechnungen über Scan, PDF-Druckertreiber, Folder, Drag&Drop (TIFF, PDF)
  • Manuelles Teilen von Dokumentenstapel bzw.
  • Barcode Erkennung mit Teilen von Dokumenten sowie Barcode Filterfunktion und Löschen von Barcode Seiten
  • Erfassen von Metadaten über Profilmaske – Beleg-ID (=Barcode), Lieferant, Straße, PLZ, Ort, Belegnummer, Belegdatum, Rechnungsbetrag – Suche nach Lieferantennummer und Name über externe XLS Tabelle mit Auslesen der damit verknüpften Information – Straße, PLZ, Ort
  • Bereichs-OCR um Werte aus dem angezeigten Dokument in ein Feld zu übernehmen.
  • Tags abrufen und erfassen
  • Batch – Hintergrundverarbeitung für PDF-OCR und Alfresco Upload
  • AutoOCR Integration um durchsuchbare PDF Dokumente im Alfresco abzulegen
  • Automatische Namensvergabe bzw. Aufbau der Folderstruktur aus den erfassten Metadaten – Nummer, Firma, Belegtyp, Jahr, Belegnummer, Belegdatum

ifresco Demo plugin - Eingangsrechnungserfassung

Der Demo Plugin ist als Beispiel anzusehen und kann jederzeit funktionell als auch von Datenmodell an die individuellen Anforderungen angepasst und erweitert werden.

Beschreibung der Installation, Zugangsdaten für den Demoserver sowie Ablauf der Arbeitsschritte >>>

Download – ifresco profiler Basissoftware >>>
Download – ifresco Demo plugin >>>
Download – ifresco Demo plugin Add on >>>

ifresco Profiler – Scannen, Bearbeiten, OCR, Barcode, Erfassen von Metadaten, Alfresco Integration

Der ifresco Profiler stellt auf jedem Arbeitsplatz wichtige, einfach zu bedienende seitenorientierte Dokumentenbearbeitungsfunktionen übergreifend für PDF und Imagedokumente  zur Verfügung. Es ermöglicht Dokumente mit Metadaten schnell und effizienten mit individuellen und spezifisch angepassten Profilierungsmasken als durchsuchbare PDF´s im Alfresco abzulegen. Bereichs OCR über eine integrierte OCR Engine, Erzeugung durchsuchbarer PDF´s beim Export über die integrierte OCR bzw. externen AutoOCR Server, Barcode Erkennung für Dateiname und Dokumentensplit, Export in Folder, als E-Mail Anhang bzw. über installierbare individuelle Plugin´s zusammen mit Metadaten nach Alfresco, sind einige wesentliche Merkmale der Software.

Die Anwendung besteht aus 2 Komponenten – der Profiler Basissoftware welche alle allgemeinen Funktionen beinhaltet, sowie aus einem oder mehreren installierbaren Plugins. Diese Plugins stellen die Schnittstelle zu Alfresco dar und ermöglichen es individuell an die Anforderungen und Einsatzbereich angepasste Profilierungsmasken zu verwenden. Die komplette Logik für die Metadaten, die Ablagestruktur und die Namensgebung ist in einem Plugin abgebildet.

ifresco Profiler Basis:

  • Verarbeitet PDF und Imagedateien – Schwarz & Weiß, Graustufen, Farbe, – ohne auf Unterschiede bei Dateiformat und Farbe achten zu müssen – alle Funktionen sind übergreifend implementiert.
  • Integrierte Scanfunktion um Dokumente über lokal angeschlossene Scanner einscannen zu können. Scan Einstellungen können direkt über voreinstellbare Scan-Profile ausgewählt werden.
  • Erfassen von Dokumenten aus Foldern – Anzeige als Dokumentenliste z.b. für Multifunktionsgeräte, Netzwerkscanner mit Scan to Folder Funktion oder per Druckertreiber erzeugte, sowie um per E-Mail empfangene Dokumente verarbeiten zu können.
  • Schnelländerung der Dokumentennamen – mit automatischer Selektion der nächsten Datei in der Liste nach Abschluss der Änderung.
  • Bereichs OCR über lokal integrierte OCR Engine um Dateinamen zu vergeben.
  • Bereiche löschen / zuschneiden
  • Seitenvoransicht – Zoom, Blättern, Seitenauswahl, Drehen – sowie Thumbnail Miniaturen des gesamten Dokuments
  • Seitenorientierte Dokumentenbearbeitung – Seiten drehen links, rechts, Seiten löschen, Seiten per Drag&Drop in der Thumbnail Ansicht verschieben.
  • Gesamtdokument teilen – an der markierten Seite, nach x Seiten, nach Barcode.
  • Einzeldokumente zu einem Gesamtdokument zusammenfügen – Reihenfolge festlegen, automatisches Löschen der Einzeldateien.
  • Exportieren – in einen Folder, als E-Mail Anhang versenden, oder über Profilierung mit Metadaten im Alfresco ablegen – im nativen Format, als PDF Image oder als PDF-OCR
  • Beim Export – Erzeugung durchsuchbarer PDF-OCR Dokumente über lokal integrierte iOCR Engine oder über den per Web-Service integrierten AutoOCR Server mit Abbyy OCR
  • Intelligente OCR Verarbeitung – nur Image Seiten werden OCR verarbeitet – normale PDF Seiten werden unverändert übernommen.

ifresco Profiler plugins:

Die Profilmaske und die Logik der Profilierung für die Ablage der Dokumente im Alfresco wird beim ifresco Profiler über Plugins realisiert. Da jedes Unternehmen ein eigenes Datenmodell und Ablagelogik verfügt werden die Plugins individuell nach Spezifikation entwickelt und implementiert. Hier kann auf eine Basis von bereits realisierten Plugins zurückgegriffen werden. Für Tests sowie zur Veranschaulichung der Möglichkeiten steht ein Standardplugin sowie zur bereits realisierte Plugins Verfügung.

  • Installierbare Plugins – für Profilierung und Erfassung von Metadaten zur Ablage von Dokumente in Alfresco.
  • Ein oder mehrere Plugins können installiert, ausgewählt und damit auch auf andere Alfresco Server umgeschaltet werden – jeder Plugin beinhaltet seine eigene individuelle Logik für die Profilierung als eigenständig installierte .NET / C# Anwendung die sich in das ifresco Profiler Basisframework einfügt und deren Funktionen nutzt.
  • Gleichzeitige Darstellung der Profilmaske und der Dokumentenvoransicht bei der Erfassung der Metadaten.
  • Frei programmierbare Logik und Funktionen auf der Profilierungsmaske mit z.b. externe XML Templateregeln mit dynamischen Feldern um den Namen / Titel immer gleich aufzubauen, Zugriff auf externe Datenquellen – MS-XLS, SQL, Web-Service (z.b. SugarCRM), verknüpfte Tabellen und Vorbelegung von Feldern mit Werten aus der Tabelle, Type ahead Teilstring Suche über einzelne oder kombinierte Felder, Verwendung von Alfresco Kategorien als Lookup´s, Zuordnung bestehender Alfresco Tags, Automatische Neuanlage von Tags, Automatisches Erzeugen der Alfresco Folderstruktur sowie der Dateinamen aus Profilfeldwerten, Suche nach Foldern im Alfresco, Counter über Web-Service, Stempelung des Dokuments vor dem Upload mit Infos aus den Metadaten, Suche nach im Alfresco vorhandenen Dokumenten und Übernahme von Profilwerten usw.
  • Interaktive Verarbeitung – mit OCR und Upload oder alternativ
  • Hintergrund / Batchverarbeitung – für PDF-OCR Konvertierung und Alfresco Upload – der User kann bereits weiterarbeiten während im Hintergrund die OCR Verarbeitung und der Alfresco Upload stattfindet.
  • Bestehende Profilwerte erhalten / Maske löschen
  • Automatisch Laden des nächsten Dokuments aus der Liste – verarbeitetes Dokument wird nach dem Upload gelöscht oder in einen Archivbereich verschoben.

Download ifresco Profiler >>>

ifresco AutoOCR – Version 1.14

  • FEATURE: Kombatibilität für Alfresco 4.2.bCE mit Java7
  • FEATURE: “Über AutoOCR” Reiter in der Admin Konsole mit Angaben zur installierten Version
  • FIX: Replace target Dokument switch bei gleichem Mimetype wie das orginal wurde nicht ausgewertet.

Der ifresco AutoOCR Transformer – ist somit für folgende Alfresco Versionen als installierbares AMP verfügbar:

  • Alfresco CE 4.0d, 4.2b
  • Alfresco EE 4.0.0, 4.0.1, 4.0.2, 4.1.1

Neue Features ifresco Transformer für Alfresco – mit AutoOCR Version 1.10.3

Wegen der neuen AutoOCR Version 1.10.3 sind neue features für den ifresco AutoOCR Transformer verfügbar:

  • iOCR – neue standard OCR Engine, zusätzlich zu Abbyy
  • Intelligente Verarbeitung von PDF Dokumenten
  • Alfresco Integration – OCR Server bereit zum testen, ohne Installation – Sie können unseren, vom Internet zugänlichen AutoOCR Test Server verwenden.
  • New Step by Step installation and setup documentation.

iOCR – zusätzliche OCR Engine verfügbar

Beginnend mit der AutoOCR Version 1.10.3 installiert das Setup iOCR als standard OCR Engine, welche alleine oder zusätzlich zur Abbyy OCR Engine verwendet werden kann. iOCR hat keine Seiten Lizenz Limits und kann als Input PDF, TIFF oder JPEG verarbeiten und durchsuchbare PDF’s und TXT Dateien erstellen.

Unterschiede zwischen iOCR und Abbyy

  • iOCR unterstützt nicht so viele Sprachen wie Abbyy
  • keine gemischte Spracherkennung – es kann nur eine Hauptsprache gewählt werden
  • nicht das gleiche Level an Genauigkeit und Erkennungsqualität wie Abbyy
  • keine Bild-Vorbearbeitungs Funktionen
  • keine Seitenausrichtungserkennung (Auto-Drehen)
  • Nicht so viele konfigurierbare Funktionen und Features und In-/Output Formate.

Aber iOCR ist eine gute Lösung für kostengünstige und umfangreiche OCR Erkennung z.B. um Text-Informationen von PDF’s und Bildern zu extrahieren, um einen Volltext Index aufzubauen (z.B. Alfresco Transformer > TXT) und durchsuchbare PDF’s von Scans mit guter Qualität zu erstellen.

Am besten ist es Tests mit eigenen Dokumenten durchzuführen, um zu sehen welche OCR Engine am besten Ihren Bedürfnissen entspricht. Beide Engines Abbyy und iOCR können parallel installiert und verwendet werden – Sie müssen nur verschiedene OCR Profile für die unterschiedlichen Einstellungen und OCR Engines erstellen. Auch beide OCR Engines können auf unserem zur Verwendung fertigen AutoOCR Test Server getestet werden (autoocr.may.co.at)

Intelligente PDF Verarbeitung:

Ein PDF Dokument kann nur Bilder von einem Scanner enthalten oder erstellt werden z.B. von einem Druckertreiber oder durch direkten PDF Export. Ein Bild-PDF enthält keinen Text und muss OCR verarbeitet werden. Die anderen “normalen” PDF’s enthalten Text und müssen nicht mehr OCR verarbeitet werden. Der Alfresco Transformer erkennt das und entscheidet ob ein PDF verarbeitet werden muss oder nicht. OCR Verarbeitung kostet Zeit und Ressourcen und deshalb haben wir, beginnend mit der AutoOCR Version 1.10.3, “intellegente PDF-OCR Verarbeitung” eingebaut. Wenn diese Option ausgewählt ist wird jedes PDF, welches zum AutoOCR Server geschickt wird überprüft und wenn es bereits Text enthält, nicht verarbeitet. In diesem Fall wird das PDF oder der extrahierte Text ohne Verarbeitung zurück gesendet. Um dieses Feature zu aktivieren muss der Server für “Intelligente OCR Verarbeitung von PDF Dateien” konfiguriert sein.

PDF - intelligent OCR processing - Abbyy PDF - intelligent OCR processing - iOCR

AutoOCR Test server – fertig zur Verwendung 

Mit der Installation von 2 AMP’s kann der AutoOCR Server mit Alfresco integriert werden. Die Integration arbeitet wie der standard Alfresco Transformer oder kann auch durch Scripting oder Java verwendet werden. Die Kommunikation zwischen AutoOCR und Alfresco findet durch HTTP(S) – REST statt. Um das testen von AutoOCR und der Alfresco Integration noch einfacher zu machen, können Sie unseren AutoOCR Test Server verwenden (autoocr.may.co.at), welcher über das Internet erreichbar ist und beide OCR Engines (Abbyy und iOCR) installiert hat.

Step by Step – Installation und Setup Dokumentation

Mit diesem Dokument wird jeder Schritt für die Installation der Abbyy Engine, von AutoOCR, der Lizensierung, der Verwendung unseres Test Servers und der Integration mit Alfresco mit Screenshots genau erklärt.

Download – Installation und Setup Dokumentation – ifresco AutoOCR transformer for Alfresco >>>

Test und Demo Version ist verfügbar – bitte kontaktieren Sie uns >>>

AutoOCR 1.10.3 – iOCR – neue unlimitierte Standard OCR Engine enthalten

iOCR – unlimitierte Standard OCR Engine für AutoOCR

Eine neue unlimitierte iOCR Standard OCR Engine wurde implementiert. Diese zeichnet sich durch eine hohe Verarbeitungsgeschwindigkeit aus, kann als Input neben den üblichen Imagedateien auch PDF´s verarbeiten um daraus durchsuchbare PDF´s zu erzeugen. Diese Engine ist speziell für Anwendungen ideal bei welchen Volltextindizes für große Dokumentenmengen in kurzer Zeit aufgebaut werden müssen. z.b. bei der Integration mit Alfresco über den ifresco TXT Transformer.

Highlights iOCR für AutoOCR:

  • Hohe Performance durch 64bit und parallele Verarbeitung mehrerer Dokumente (CPU / Core / Speicherabhänging)
  • keine Limitierung hinsichtlich der zu verarbeitenden Seiten, bzw. keine CPU / Core Beschränkungen
  • 37 unterstützte Sprachen: Arabisch, Bulgarisch, Catalan, Tschechisch, Chinesisch (vereinfacht), Chinesisch (traditionell), Kroatisch, Dänisch, Holländisch, Deutsch, Griechisch, Englisch, Finnisch, Französisch, Hebräisch, Hindi, Ungarisch, Indonesisch, Italienisch, Japanisch, Koreanisch, Lettisch, Litauisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Serbisch (Latein), Slowakisch, Slowenisch, Schwedisch, Tagalog (Pilippinisch), Thai, Türkisch, Ukrainisch, Vietnamesisch
  • PDF, TIFF, JPEG, PNG – als Input / PDF-OCR sowie TXT als Output
  • JBIG-2 erzeugt noch kleinere Schwarz & Weiss PDF Dokumente als durch die TIFF Gr. 4 Komprimierung
  • zuschaltbare intelligente PDF Verarbeitung – es werden nur PDF-Image Dokumente einer OCR Verarbeitung unterzogen, PDF´s die bereits Text enthalten werden nicht nochmals verarbeitet – das erhöht den Druchsatz und steigert die Qualität.

Bemerkung: für uns ist weiterhin die Abbyy FineReader Engine die beste verfügbare OCR Engine – mit den meisten Funktionen und Features sowie mit der besten Erkennungsrate. Es gibt jedoch Anwendungsbereiche und Gründe eine alternative OCR Engine einzusetzen. Das ist auch ein wichtiges Feature von AutoOCR – es wird nicht nur eine einzige OCR Engine unterstützt,  sondern je nach Anforderung können auch mehrere parallel aktiv sein bzw. können OCR Engines nachgerüstet werden.

Neuerungen – AutoOCR Version 1.10.3:

  • iOCR als Standard OCR Engine bereits im Lieferumfang / Setup enthalten
  • „Intelligente“ OCR Verarbeitung von PDF Dokumenten – PDF Dokumente werden vor der OCR Verarbeitung überprüft ob diese bereits Text enthält – falls ja so wird das PDF nicht per OCR verarbeitet sondern das PDF bzw. der daraus extrahierte Text wird zurückgeliefert. Speziell für die Alfresco Transformer Integration ist dies erforderlich da von Seiten Alfresco bei der PDF Transformation PDF>PDF bzw. PDF>TXT nicht zwischen „normalen“ PDF und Image PDF unterschieden werden kann und daher jedes PDF durch den Transformer geschickt wird. Durch diese Option wird unnötige OCR Verarbeitung und damit werden Verarbeitungszeit und Abbyy OCR-Seiten-Lizenzen gespart.
  • Web-Service – Job Liste – Neue Funktion – alle Jobs löschen
  • Web-Service – Job Liste – Datum und Uhrzeit der Job Erstellung wird mit angezeigt
  • Web-Service – parallele Verarbeitung  beim Upload bzw. Job Handling wurde optimiert und verbessert.
  • Web-Service .NET Beispiel Client – wurde erweitert – Mehrfach Upload von Dateien, Parallel Upload, Anzeiger der aktuell laufenden Parallel Uploads, Unterstützung der Funktionen im Client für Parallelverarbeitung (Upload, Job Handling…)

1_AutoOCR_neue_iOCR_engine 2_AutoOCR_iOCR_Sprachauswahl_1 3_AutoOCR_iOCR_Sprachauswahl_2 4_AutoOCR_iOCR_color_compression 5_AutoOCR_iOCR_b&w_compression 7_AutoOCR_Abbyy_intelligent_PDF_processing

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>
Download – AutoOCR – Web-Service Beispiel-Client  inkl. C# Source >>>

Download – Schritt für Schritt Installation AutoOCR & ifresco Transformer >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>

Demolizenzkey für FineReader OCR Engine anfordern

ifresco AutoOCR – OCR Verarbeitung im Alfresco ECM / DMS integriert

AutoOCR ist ein OCR Service/Server der auf der momentan wohl besten OCR Engine von Abbyy aufbaut und über eine REST/SOAP Schnittstelle verfügt. AutoOCR ist in der Lage Image- und PDF-Dateien in durchsuchbare PDF zu konvertieren. Zusätzlich lassen sich aber auch TXT, DOC(X), XLS(X), PPT(X), XML, RTF und HTML erzeugen.

Die Konfiguration ist denkbar einfach und erfolgt über OCR Profile welche alle möglichen Einstellungen zusammenfassen. Über ein AMP Install-Modul erfolgt die direkte Integration von AutoOCR mit Alfresco. OCR Funktionen stehen damit in Alfresco als dynamisch konfigurierbare Transformer zur Verfügung. Entsprechende Bindings erlauben die Verwendung der der OCR Dienste auch aus JavaScript und Java heraus. Ab Alfresco 4.0 erfolgt die Konfiguration und Überwachung direkt über das UI der Share Administrator Konsole.

Darüber hinaus haben wir die Alfresco Share Dokumenten-Aktionen um die Alfresco Transformer Integration erweitert. Transformer Funktionen stehen damit beim jedem Dokument über die Share Oberfläche zur Verfügung und erlaubt die Konvertierung von Dokumenten in unterschiedliche Formate.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Alfresco Share – “Transform” Dokumentenaktion

Durch die Implementierung der “Transform” Dokumentenaktion in das Alfresco Share UI stehen neben der AutoOCR Verarbeitung auch alle anderen Alfresco Dokumententransformer zur Verfügung. Die Share “Transform” Funktion wurde allgemein und nicht nur auf die OCR Verarbeitung bezogen implementiert.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammengefasst.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code. Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.
  • Dokumentenaktion “Transform” erweitert Alfresco Share nicht nur um OCR sondern um alle von Alfresco unterstützen Transformationen.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter Microsoft-Windows als Dienst
  • ABBYY FineReader Engine 10 (Lizenz ab 10.000 Seiten pro Monat)

20-autoocr-admin-status 22-autoocr-admin-transformerconfig2 23-autoocr-admin-jobs 01-autoocr-action-menu 02-autoocr-shareaction-dialog 03-autoocr-shareaction-transform-waiting 04-autoocr-shareaction-results 05-autoocr-shareaction-transformed-docs

Test und Demo Version ist verfügbar – Bitte kontaktieren Sie uns  >>>

Preis-Informationen finden Sie hier >>>

ifresco AutoOCR im ecm Market – Der Marktplatz für Alfresco Lösungen

Es gibt jetzt mit dem ecm Market unter www.ecm-market.de eine neue Plattform für Alfresco Lösungen und Add-On Module. Der ecm Market ist eine B2B-Plattform für kostenlose und kommerzielle Lösungen, sowohl für Alfresco Enterprise wie auch für Alfresco Community. Auf dieser Plattform bieten Softwarehäuser und Entwickler ihre Alfresco-basierten Lösungen für Unternehmen an. Auch wir bieten im ecm Market unsere Alfresco Lösungen an. Die erste dort verfügbare Lösung ist unsere Integration von Alfresco mit AutoOCR zur Erzeugung durchsuchbarer PDF´s.

ifresco AutoOCR Transformer im ecm Market >>>

SplitRen – Dokumente – Erfassen, Teilen, Benennen – schnell und einfach

SplitRen – „Split“ für Teilen und „Ren“ für Rename/Umbenennen – wurde entwickelt um sehr einfach und effizient Dokumente zu scannen, diese falls erforderlich in Einzeldokumente aufzuteilen und danach zu benennen. Dabei wurde versucht das Produkt für diesen Zweck von der Bedienung her einfach und effizient zu gestalten. Das wirkt sich positiv bei der schnellen Einsetz- und Erlernbarkeit der Software, sowie bei der zeitsparenden und schnellen Erfassung aus.
Die Dokumente werden als TIFF, PDF-Image oder PDF-OCR in einen Zielfolder exportiert, per E-Mail verschickt oder in einem Alfresco DMS/ECM Repository abgelegt.

1_SplitRen - Erfassen, Teilen und Benennen von Imagedokumenten 11_Funktionen - Dokumentenliste 12_Funktionen - Thumbnail Voransicht 13_Funktionen - Dokumentenvoransicht 14_Image Bereich markieren - Bereichs OCR, Löschen, Beschneiden

SplitRen Funktionen im Überblick:

  • TWAIN Scanfunktion – mit oder ohne TWAIN Dialog, Auswahl der TWAIN Quelle
  • Scannen von Dokumenten – SchwarzWeiss – 300dpi, TIFF Gr. 4
  • Einfügen von Image Dokumenten per Drag&Drop – Verschieben / Kopieren
  • Regelmäßiges automatisches Aktualisieren des Eingangsfolders für neu hinzugekommene Dokumente aktivierbar.
  • Dokumentenliste mit Anzeige der Namen
  • Dokumentenvoransicht: Zoom In/Out, Anpassen – Breite / Höhe / Optimal, Drehen Links/Rechts – 90°
  • Blättern: Anfang, Ende, Seite vor/zurück, Seite per Nummer auswählen.
  • Thumbnail Dokumenten-Voransicht:  Anzahl der anzuzeigenden Seiten – 1/2/5/10/20/50/100, Blättern – Anfang /Ende, Vor/Zurück.
  • Profilfunktion – Speichert alle Voreinstellungen und Konfigurationen unter einem Namen. Profile können – Neu erstellt, Kopiert, Umbenannt und gelöscht werden.
  • Admin – Konfigurationsmenü kann per Tastenkombination  eingeblendet werden – Der Admin ist damit in der Lage Profile zu erstellen und zu bearbeiten. Der normale Anwender wählt dann nur vorkonfigurierte Profile aus.
  • Dokument teilen – fix nach Seitenzahl, Teilen an der aktuell ausgewählten Seite  über selektiertes Thumbnail. Automatische Namensvergabe für die damit neu erzeugten Dokumente.
  • Markierte Thumbnails = Seiten – Löschen / Drehen Links 90° / Drehen Rechts 90°
  • Drag&Drop der Thumbnails zum Verschieben von Seiten innerhalb eines Dokuments um diese neu zu ordnen.
  • Drehen alle Seiten eines Dokuments – 90° nach Rechts / 90° nach Links
  • Ein oder mehrere Bereiche im Dokument markieren – Bereiche Löschen, auf Bereich zuschneiden, OCR über die Bereiche ausführen und als Dokumentennamen vorschlagen.
  • Umbenennen direkt in der Dokumentenliste – danach automatische Auswahl des nächsten Dokuments in der Liste. Verwendung von Bereichs-OCR sowie frei definierbare Tastenkürzel.
  • Zusammenführen mehrerer selektierter Dokumente aus der Liste zu einem Gesamtdokument – Die Reihenfolge kann vor dem Zusammenführen noch geändert werden.
  • Export: Einzelne, markierte oder alle Dokumente aus der Liste – als native TIFF Image, als PDF-Image oder als durchsuchbares PDF-OCR – in einen Zielfolder exportieren, als E-Mail versenden , nach ifresco / Alfresco über ein Dokumentenprofil hochladen.
  • Integrierte iOCR.NET OCR Engine für Bereichs OCR und Export als durchsuchbares PDF
  • AutoOCR Web-Service Integration für High Quality Abbyy FineReader OCR z.b. für Hintergrundverarbeitung beim Alfresco Batch Upload.
  • Hintergrund / Batchverarbeitung – für PDF-OCR Konvertierung und ifresco / Alfresco Upload – Die fertig erfassten Dokumente werden in eine eigene getrennte Dokumentenlist verschoben und von dort weiterverarbeitet – damit kann der User im Vordergrund sofort weitere Dokumente profilieren und bearbeiten während im Hintergrund die zeitintensiven Prozesse der OCR-Verarbeitung und des Dokumentenuploads stattfinden. Der Hintergrund Prozess kann automatisch gestartet aber auch angehalten werden – noch nicht fertig verarbeitet Dokumente können wieder in die Arbeitsliste zurückgeschoben werden.

SplitRen – ifresco / Alfresco – Upload:

Beim Upload in das Alfresco DMS/ECM Repository bekommt der User eine auf seinen Einsatz und Dokumententyp abgestimmte Maske zum Erfassen der Metadaten. Auf Basis der erfaßten Daten wird die komplette Ablage des Dokuments im Repository automatisch gesteuert. Der User muss sich keine Gedanken mehr über den Ablageort, Namen usw. machen. Auf der Maske stehen verschiedene Feldtypen zur Verfügung: Muss/Kannfelder, Lookup Felder mit Einfach- oder Mehrfachauswahl, Datums-, Numerische-, Text-Felder. Die Befüllung und Wartung  der Lookups kann über den Alfresco Kategoriebaum erfolgen. Die Erfassungsmaske, die dahinterliegende Logik und Datenverknüpfungen werden je nach Anwendungsfall individuell erstellt und angepaßt.

Beispielhaft die Profilmaske für die Erfassung eines Presseartikels:

15_Alfresco-Ifresco Dokumentenprofil 16_Alfresco-ifresco - Dokumentenprofile mit Einfach bzw,. Mehrfach Lookupauswahl 18_Alfresco Lookup Konfiguration für Dokumentenprofil

SplitRen Profile – Allgemeine Einstellungen:

  • Eingangsordner – legt den Arbeitsordner für die zu verarbeitenden Dokumente fest
  • Erweiterungen die verarbeitet und angezeigt werden sollen – TIF, TIFF, JPG, JPEG
  • Zielordner für den Exportvorgang
  • Archivordner – falls die Dokumente aus dem Eingangsordner erhalten bleiben sollen, Variable für User und Datum können verwendet werden.
  • Ordner für die ifresco Batch/Hintergrundverarbeitung
  • Definition von Tastenkürzel – es können Buchstaben oder Strings definiert werden die bei der Erfassung des Namens dann automatisch durch einen  hinterlegten Text ersetzt werden – das soll helfen immer wiederkehrende Texte effizient zu erfassen – z.b.: „r“ wird durch den Begriff „Rechnung“ ersetzt. Als Variable stehen zusätzlich Datum und Zeit zur Verfügung.
  • Hintergrund – Verarbeitung automatisch starten: Dabei können sowohl die OCR Verarbeitung als auch der ifresco/Alfresco Upload im Hintergrund erfolgen – die Option legt fest ob die Hintergrund Verarbeitung bei Programmstart auch gleich mitgestartet wird oder ob der User diese manuell startet.

2_Profile speichern alle Einstellungen unter einem gemeinsamen Namen 3_Tastenkürzel für die schnelle Erfassung von Textstrings

SplitRen Profile – Ausgabe Einstellungen:

  • Aktion nach der Verarbeitung: Löschen,  In Archiv Ordner, Behalten, Aktion abfragen. Legt fest was mit der Datei aus dem Eingangsordner nach der Verarbeitung passieren soll.
  • Aktion was passieren soll falls eine Datei im Zielfolder bereits vorhanden ist – soll diese „ersetzt“ , „übersprungen“, oder soll „ein Zähler“ an den Namen angehängt werden.
  • Zielformat für die  Aktionen – „Export“, „ifresco/Alfresco“ und „E-Mail“ – voreinstellbar – PDF-Image, PDF-OCR, oder „Native“ (TIFF).

4_Einstellungen für den Export

SplitRen Profile – OCR Einstellungen:

  • Auswahl der Verwendung der integrierten iOCR.NET Engine oder einer per Web-Service eingebundenen externen AutoOCR Verarbeitung
  • iOCR.NET – Einstellungen: Sprachauswahl, Farb-Komprimierung, JPEG-Qualität, Auflösung
  • AutoOCR – Web-Service URL, Username / Passwort, OCR-Profilauswahl.

5_OCR Einstellungen für die integrierten OCR funktionen sowie AutoOCR Web-Service

SplitRen Profile – Dokumentenupload nach ifresco / Alfresco:

6_Konfiguration der Alfresco-ifresco Integration

SplitRen Profile – E-Mail Konfiguration:

  • Vordefinierte E-Mail Empfängerlisten für „an:“, „cc:“ und „bcc:“
  • Zugriff auf MS-Outlook Kontakte
  • Durchsuchen des Dokuments nach E-Mail Adressen (nur für PDF-OCR)
  • „Betreff“ Template aus Text und Variablen definierbar
  • Templates für den E-Mail Body (ASCII oder HTML) hinterlegbar
  • Festlegung von zusätzlichen Anhängen (normal oder als ZIP)
  • „Interaktiver“ oder „Stiller“ Versand per MS-Outlook, MAPI, Lotus Notes oder SMTP

7_E-Mail Konfiguration zum Versand der Dokumente als Image oder PDF 8_E-Mail Vorbelegung für Nachricht 9_E-Mail Einstellungen für Anhänge 10_E-Mail Konfiguration - Schnittstelle E-Mail System

AutoOCR – Alfresco Transformer Modul / JavaScript / Java Client

Alfresco ist eines der leistungsfähigsten und innovativsten DMS/ECM Systeme. Dokumente werden über  Metadaten sowie Volltext verwaltet und können sehr schnell wiedergefunden werden. AutoOCR basiert auf Abbyy der wohl Besten verfügbaren OCR Engine. Wir haben diese beiden Produkte jetzt integriert und stellen damit die AutoOCR Funktionen in Alfresco zur Verfügung.

AutoOCR als Alfresco Transformer:

Die OCR Funktion wird dabei als Aktion direkt auf Ordner gebunden. Wird z.b. ein gescanntes Dokument in einen solchen Alfresco Ordner abgelegt so wird die Verarbeitung automatisch angestoßen und das Dokument an den AutoOCR Service übergeben. Das Ergebnis ist eine durchsuchbare PDF Datei die unmittelbar danach über den Alfresco Volltextindex gesucht und gefunden werden kann.

AutoOCR JavaScript Binding für Alfresco:

Das JavaScript API ermöglicht den direkten Zugriff auf den AutoOCR Service von Alfresco Scripts aus. In Repository JavaScripts (WebScript-Controller Scripts, Scripted Actions) können alle Funktionen des AutoOCR APIs aufgerufen werden. Dieses API ist vollständig unabhängig von der Einbindung der AutoOCR-Services als Alfresco-Transformer.

Highlights / Funktionen:

  • Direkte AutoOCR Einbindung als Alfresco Transformer über REST Web-Service Schnittstelle.
  • Getrennter AutoOCR Service / Server welcher den Alfresco Server nicht belastet
  • Basierend auf ABBYY – der führenden OCR Engine
  • Einfache Konfiguration über Auswahl von OCR Profilen  – alle verfügbaren Abbyy OCR Engine Einstellungen werden damit zusammenfassen.
  • Neben PDF können parallel dazu weitere Ausgabeformate erzeugt werden (TXT, RTF, DOC, etc.)
  • Dynamische Transformer Konfiguration zur Laufzeit über die Alfresco Share-Admin Oberfläche.
  • JavaScript-Client für den AutoOCR Service, nutzbar in Alfresco Repository-Scripts (WebScripts, Actions, usw.)
  • Java-Client für den AutoOCR Service, zur Verwendung in Java Code.  Der Java Client selbst hat keine Abhängigkeiten gegen Alfresco.

Voraussetzung:

  • Alfresco 4.x – dynamische Konfiguration über Share Userinterface
  • Alfresco 3.x – manuelle Konfiguration ohne Share UI
  • AutoOCR ab Version 1.9.8 unter MS-Windows

1_AutoOCR - alfresco transformer - status 2_AutoOCR - alfresco transformer connection configuration 3_AutoOCR - alfresco transformer configuration 4_AutoOCR - alfresco transformer job status