FileConverter – Dokumente und E-Mails aus Foldern bzw. E-Mail Boxen automatisiert nach PDF, PDF/A und TIFF konvertieren

Der FileConverter ist eine als Service unter MS-Windows (32 und 64bit) installierbare Anwendung um Folder und E-Mail Boxen zu überwachen um die darin befindlichen Dokumente automatisiert in das PDF, PDF/A oder TIFF Dokumentenformat zu konvertieren.  Dabei können parallel mehrere Folder bzw. auch mehrere MS-Exchange bzw. POP3 Mailboxen konfiguriert und überwacht werden.

Folgende Eingangs-Dokumentenformate werden unterstützt:

  • DOC, DOCX, RTF, TXT,
  • XLS, XLSX,
  • PPT, PPTX,
  • XFDF, FDF,
  • PNG, BMP, TIF, TIFF, JPG, JPEG
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMT, PMTX

Dateiformat – Besonderheiten:

  • Bei ZIP/RAR/7Z Containern werden alle enthaltenen und unterstützen Dokumente automatisch extrahiert und konvertiert. Die im Container enthaltene Foldersturktur wird im Ausgabeverzeichnis aufgebaut.
  • PMT und PMTX – sind PDFMerge XML Datenformate – welche eine hierarchische Strukturinformation als auch die Links auf die Dokumente bzw. die Dokumente selbst enthalten. Der FileConverter erzeugt daraus genauso wie der PDFMerge Server eine einzige Gesamt PDF Datei die aus den nach PDF konvertierten Einzeldateien besteht welche zu einer PDF Gesamtdatei zusammengefügt wurden. Die im XML definierte Struktur wird über die PDF-Bookmarks abgebildet.

Konvertierung:

  • Die PDF/TIFF Konvertierung erfolgt direkt ohne Verwendung der Ursprungsanwendung. Für die Verarbeitung ist also keine Installation von MS-Office oder Adobe Acrobat erforderlich. Optional können die PDF´s auch im ISO normierten PDF/A-1b Format ausgegeben werden.
  • Im Standardumfang enthalten ist auch die iOCR Engine um aus PDF oder Imagedokumenten durchsuchbare PDF(/A) zu erzeugen. Optional installiert – kann auch Abbyy die momentan leistungsfähigste OCR Engine installiert werden. Bei der OCR Verarbeitung werden PDF Dokumente seitenweise analysiert und nur jene Seiten der OCR Verarbeitung unterzogen die noch keine Textinformation enthalten (intelligente OCR Verarbeitung) – das spart Ressourcen, verbessert die Qualität und erhöht die Verarbeitungsgeschwindigkeit.

Funktionen – Allgemein:

  • MS-Windows Service Anwendung zu Dokumentenkonvertierung von MS-Office, PDF, Image, HTML, ZIP, MSG und E-Mail nach PDF, PDF/A bzw. TIFF
  • Parallel können mehrere Folder sowie MS-Exchange und POP3 E-Mailboxen überwacht und verarbeitet werden.
  • Direkte Konvertierung ohne Verwendung zusätzlich erforderlicher Original Anwendungen (MS-Office, Adobe Acrobat)  bzw. Druckertreiber.
  • Verflachen von ausgefüllten PDF Formularen: PDF Formulare (XFDF,FDF) können in normale PDF Dokumente konvertiert werden. Die Formulare können entweder fix hinterlegt oder jedes Mal neu geladen werden.
  • Parallele Verarbeitung mit konfigurierbarer Anzahl an Prozessen – erlaubt die optimale Ausnutzung der Hardware und garantiert die schnelle Abarbeitung.
  • Logging aller Konvertierungsvorgänge, Weiterleiten fehlgeschlagener E-Mail Konvertierungen bzw. Versand von Fehler – E-Mails per SMTP

In / Out Folderverarbeitung:

  • Verarbeitung von Dateien und Foldern aus konfigurierten In / Out-Ordnern über Zeitablauf bzw. über “Ready” Datei, inkl. Subfolder Verarbeitung (eine Ebene)
  • Erstellen einer Index-Text-Datei über alle bei einem Verarbeitungsvorgang erzeugten Dateien.
  • Nach der Verarbeitung: Löschen, Verschieben in Archivordner, Umbenennen – der Dateien bzw. Folder (.con / .err)
  • Konfiguration der nicht zu konvertierenden Dateierweiterungen – diese werden ignoriert und nicht verarbeitet. E-Mails mit Anhängen und nicht definierten Erweiterungen (weder konvertierbar noch nicht konvertierbar) werden als Fehler gehandhabt und an eine Error E-Mail Adresse weitergeleitet.
  • Einzelseitenausgabe mit konfigurierbarer Anzahl an Stellen für den Seitenindex
  • Konfiguration der TIFF Konvertierung – Komprimierung / Farbtiefe / Auflösung / JPEG-Qualität
  • Umfangreiche Parameter für die OCR Verarbeitung – iOCR bzw. Abbyy – der FileConverter enthält über die gleichen OCR Funktionen wie AutoOCR
  • Parameter für die HTML Konvertierung – Seitengröße und Ränder – HTML Dokument und E-Mails werden automatisch skaliert.

Verarbeitung von E-Mail Boxen:

  • Abarbeiten von von POP3 / MS-Exchange E-Mail Boxen – Weiterleiten bzw. Löschen bei erfolgreicher bzw. fehlerhafter Verarbeitung bzw. Verschieben in einen Archiv / Error Folder unter MS-Exchange. Direkter Zugriff auf MS-Exchange 2007/2010/2013 über die SOAP-Web-Service Schnittstelle.
  • EML und MSG – Body und Anhänge werden konvertiert – Generierung der E-Mail Header Information im Body Dokument – Von, Datum, An, Betreff
  • Ausgabe einer XML Datei zu den verarbeiteten E-Mails mit den Metadaten und Dateilinks – konfigurierbar: von, an, cc, bcc, erhalten, Betreff, Body, Anlagen
  • Ausgabe pro E-Mail in getrennte Unterordner oder “flach” im Zielordner.

 

1_FileConverter - Allgemeine Einstellungen - Email & Folder Verarbeitung 2_FileConverter - Verarbeitungsoptionen  3_FileConverter - Service Konfiguration  4_Fileconverter - SMTP Server Konfiguration  5_FileConverter - Konfiguration Folder Verarbeitung  6_FileConverter - Konfiguration E-Mail Box Verarbeitung  7_FileConverter - MS-Exchange Konfiguration  8_FileConverter - POP3 Konfiguration  9_FileConverter - TIFF Konvertier Settings  10_FileConverter - OCR Settings  11_FileConverter - HTML Konvertier Settings  12_FileConverter - Log Anzeige

  Download – FileConverter – Dokumente & E-Mails nach PDF, PDF/A und TIFF >>>

FineOCR – kostenloser Commandline Client für den AutoOCR Server

Mit dem kostenlosen AutoOCR Commandline Client “FineOCR” gibt es jetzt eine weitere Möglichkeit die OCR Funktionen unseres AutoOCR Servers von Clients aus nutzen zu können. Über einen einfachen Commandline Aufruf können PDF und Imagedokumente per Web-Service Schnittstelle von jedem Arbeitsplatz aus über einen zentralen AutoOCR Server – im lokalen Netz bzw. Internet – in durchsuchbare PDF´s oder PDF/A konvertiert werden. Es ist aber auch möglich nur den erkannten Text als Datei geliefert zu bekommen. Durch die Verwendung von OCR-Serverprofilen kann die OCR Engine (Abbyy oder iOCR), Verarbeitungsparameter, bzw. Sprachauswahl gesteuert und ausgewählt werden.

Nach der FineOCR Installation sind bereits die Parameter für unseren gehosteten AutoOCR Testserver voreingestellt so dass OCR Tests sofort ohne weitere Konfiguration durchgeführt werden können.

FineOCR config  AutoOCR Server - available OCR profiles & default profile selection

FineOCR - Commandline Parameter

Voraussetzung:

  • AutoOCR Server mit Web-Service Option,
  • MS-Windows – 32 oder 64bit OS

Download – FineOCR – Commandline Client für den AutoOCR Server >>>

ifresco Profiler – Teilen von Dokumenten – manuell, per Seite, Bereichs-OCR, per Barcode

Der ifresco Profiler verfügt über einfach zu handhabende Funktionen um Dokumentenstapel sehr schnell auf verschiedene Arten zu teilen. Dabei stehen folgende Funktionen zur Verfügung:

  • Manueller Split – Die Seite / Thumbnail an der das Dokument geteilt werden soll wird selektiert – und durch drücken einer Tastenkombination wird das Dokument an der aktuellen Seiten aufgeteilt, automatisch benannt und danach das neue Dokument für weitere Splitvorgänge selektiert.
  • Split nach Seitennummern – Dabei kann das Gesamtdokument an Hand einer Seitenzahl in Einzeldokumente mit gleicher Seitenzahl geteilt werden.
  • Split über Bereichs-OCR – ein Bereich in der Voransicht wird ausgewählt und über Bereichs-OCR wird der Text erkannt – das Dokument wird an dieser Seite geteilt und der erkannte Text wird als Namen vergeben.
  • Split nach Barcode – 1D Barcodes werden erkannt und können zum Teilen der Dokumente sowie als Dateinamen verwendet werden. 18 verschiedene Barcodes werden unterstützt, Orientierung bzw. Position auf der Seite ist beliebig. Barcode Seiten können gelöscht werden, Unterstützt werden auch Filter über Strings, Listen und Wertebereichen.

eDocPrintPro – Plugin – BarcodeSplit – Teilen und Benennen von Dokumenten nach erkannten Barcodes

Der eDocPrintPro PDF Druckertreiber kann über installierbare Plugins flexibel um nachgelagerte Verarbeitungsschritte erweitert werden. Barcodes werden immer häufiger dazu verwendet um Dokumente eindeutig zu kennzeichnen und automatisiert weiterverarbeiten zu können. Wir haben einen Plugin entwickelt mit dem es möglich ist Barcodes die im Dokument enthalten sind automatisch bereits beim Druckvorgang zu erkennen. Damit können Dokumentenstapel automatisch an Hand der erkannten Barcodes geteilt und die dadurch erzeugten Einzeldokumente benannt werden.

Die Barcodes werden unabhängig von der Anwendung aus der der Druckvorgang erfolgt erkannt – z.b. Druck von Belegen aus einem ERP-System, aus MS-Word, über den Web-Browser oder über den Adobe Reader. Egal aus welcher Anwendung gedruckt wird die Barcodes werden erkannt, damit wird die Barcoderkennung aus jeder Anwendung heraus möglich.

Ist die eDocPrintPro “DropZone” Software zusätzlich installiert so lassen sich auch bestehenden PDF Dokumente sehr leicht verarbeiten – einfach die PDF-Datei per Drag&Drop auf die DropZone ziehen, der Rest erfolgt automatisch.

Features – eDocPrintPro Plugin  BarcodeSplit:

  • Barcode Erkennung beim Druckvorgang aus jeder Anwendung heraus
  • erkennt einen oder mehrere der 19 auswählbaren 1D-Barcode Typen
  • automatisches Teilen des gedruckten Gesamtdokuments in Einzeldokumente auf Basis der gefundenen Barcodes
  • Benennung der Einzeldokumente über den ausgelesenen Barcode-Wert
  • installierbarer eDocPrintPro Plugin für 32 und 64bit
  • Verwendbar auch für bestehende PDF´s über die eDocPrintPro Zusatzsoftware “DropZone”

eDocPrintPro Plugin Konfiguration - BarcodeSplit  eDocPrintPro BarCodeSplit - Konfiguration  eDocPrintPro DropZone - BarcodeSplit

Download – eDocPrintPro – Plugin – BarcodeSplit für 32bit >>>
Download – eDocPrintPro – Plugin – BarcodeSplit für 64bit >>>

Nicht vergessen: nach der Installation des Plugins muss dieser über die eDocPrintPro Drucker-Einstellungen noch aktiviert und konfiguriert werden.

DropOCR – kostenloser Windows-Client für den AutoOCR Server

Der AutoOCR Server ist ein sehr leistungsfähiger OCR Server der zentral installiert zur Verarbeitung aller Image- und PDF-Dokumente im Unternehmen zur Verfügung gestellt werden kann. Er verfügt am Server sowohl über Hot-Folder Funktionen sowie über eine SOAP/REST-Schnittstelle.

Um die OCR Verarbeitung von jedem Windows Arbeitsplatz – egal von wo im Netzwerk / Internet aus nutzen zu können – ohne sich einen Share auf den AutoOCR Server mappen zu müssen stellen wir allen AutoOCR Kunden jetzt mit DropOCR eine kostenlose Client Anwendung zur Verfügung. DropOCR wird als Icon Tray Anwendung installiert und verfügt über eine einblendbare “Drop-Zone” sowie über einen lokalen Hot-Folder.

Images oder PDF´s die in durchsuchbare PDF oder PDF/A-Dokumente konvertiert werden sollen können einfach in den lokalen In-Folder kopiert bzw. auf die “Drop-Zone” per Drag&Drop gezogen werden. Das Dokument wird per Web-Service an den gemeinsamen AutoOCR Server übertragen, dort verarbeitet und danach wird die Ergebnis PDF(/A) Datei wieder auf den Client zurück übertragen und steht anschließend im konfigurierten lokalen Out-Folder zur Verfügung.

DropOCR Funktionen:

  • Kostenloser Windows Client für AutoOCR Server
  • Kommunikation mit dem zentralen OCR Server über SOAP / REST Web-Service Interface
  • Lokaler Hot-Folder sowie Drop-Zone
  • Konvertiert ein oder mehrere  lokale Image / PDF Dokumente über den Remote OCR-Server in durchsuchbaren PDF(/A) Dokumenten .
  • Auswahl unterschiedlicher OCR-Settings über am Server hinterlegte OCR Profile

DropOCR - Config  DropOCR - icon tray applicaiton

Download – DropOCR >>>

ifresco Profiler – Demo Plugin – Erfassen von Eingangsrechnungen über Barcode und OCR

Es gibt jetzt einen Demo Plugin für den ifresco Profiler um zu zeigen wie einfach und schnell Eingangsrechnungen im Alfresco ECM/DMS erfasst werden können. So erfasste Eingangsrechnungen  können z.B. im Alfresco über die Alfresco-SAP Integration von IT-Novum weiterverarbeitet werden. Wir haben diese Lösung zuletzt in einem Alfresco-Webinar (nächster Termin 8.10.2013) gemeinsam mit IT-Novum  und Alfresco präsentiert.

Funktionen Demo Plugin – Eingangsrechnugserfassung:

  • Erfassen von Eingangsrechnungen über Scan, PDF-Druckertreiber, Folder, Drag&Drop (TIFF, PDF)
  • Manuelles Teilen von Dokumentenstapel bzw.
  • Barcode Erkennung mit Teilen von Dokumenten sowie Barcode Filterfunktion und Löschen von Barcode Seiten
  • Erfassen von Metadaten über Profilmaske – Beleg-ID (=Barcode), Lieferant, Straße, PLZ, Ort, Belegnummer, Belegdatum, Rechnungsbetrag – Suche nach Lieferantennummer und Name über externe XLS Tabelle mit Auslesen der damit verknüpften Information – Straße, PLZ, Ort
  • Bereichs-OCR um Werte aus dem angezeigten Dokument in ein Feld zu übernehmen.
  • Tags abrufen und erfassen
  • Batch – Hintergrundverarbeitung für PDF-OCR und Alfresco Upload
  • AutoOCR Integration um durchsuchbare PDF Dokumente im Alfresco abzulegen
  • Automatische Namensvergabe bzw. Aufbau der Folderstruktur aus den erfassten Metadaten – Nummer, Firma, Belegtyp, Jahr, Belegnummer, Belegdatum

ifresco Demo plugin - Eingangsrechnungserfassung

Der Demo Plugin ist als Beispiel anzusehen und kann jederzeit funktionell als auch von Datenmodell an die individuellen Anforderungen angepasst und erweitert werden.

Beschreibung der Installation, Zugangsdaten für den Demoserver sowie Ablauf der Arbeitsschritte >>>

Download – ifresco profiler Basissoftware >>>
Download – ifresco Demo plugin >>>
Download – ifresco Demo plugin Add on >>>