Kategorie: FileConverter

iOCR / vsOCR Setup geteilt in Standard- und zusätzliche Sprachen

Das iOCR / vsOCR Setup das die Sprach- und Wörterbuchdaten unserer Standard-OCR Engine enthält ist insgesamt über 270MB groß. Um die Downloads und die Setup´s kleiner zu machen haben wir uns entschieden das iOCR / vsOCR in ein „Basis“ und ein „zusätzliches Setup“ zu teilen. Das Basis-Setup das über unsere Anwendungen z.b. AutoOCR, FileConverterPro oder PDFmdx installiert wird enthält jetzt nur mehr eine Auswahl an wichtigen europäischen Sprachen und wurde damit auf  127MB reduziert.

Sollen alle verfügbaren Sprachen installiert werden so ist das jederzeit möglich. Die zusätzlich verfügbaren „exotischen Sprachen“ lassen sich über ein eigenes Setup nachinstallieren.

iOCR Basis-Sprachen:

Dänisch, Deutsch, Englisch, Finnisch, Französisch, Italienisch, Katalanisch, Neu Griechisch, Holländisch, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Schwedisch, Slowakisch, Slowenisch, Spanisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch

iOCR Erweiterte Sprachen:

Afrikaanis, Albanisch, Arabisch, Aserbaidschanisch, Bahasa Indonesisch, Bengali, Bulgarisch, Cherokee, Chinesisch – traditionell, Chinesisch – vereinfacht, Estnisch, Fränkisch, Gallisch, Hebräisch, Hindi, Isländisch, Japanisch, Koreanisch, Kroatisch, Lettisch, Litauisch, Mazedonisch, Malaiisch, Serbisch, Swahili, Tagalog, Tamil, Telugu, Thailändisch, Vietnamese, Weißrussisch

Download – iOCR (vsOCR) Setup – Basis Sprachen (ca. 127MB) >>>

Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 200MB) >>>

 

FileConverter – Verarbeitung von Ordnern und Unterordnern – Konfiguration und Features

Der FileConverter (FC) verfügt über einige Optionen um die Verarbeitung über Ordner und Unterordner zu steuern.

Das Erste was wichtig ist zu Wissen ist dass die Verarbeitung „Transaktionsorientiert“ erfolgt. d.h. der FC muss wissen wann die Verarbeitung der Dateien aus dem In-Folder und der ev. darin enthaltenen Unterordner starten kann – denn es können ja laufend neue Dateien hinzukommen.

FileConverter Verarbeitungsoptionen für Unterordner

Trigger um die Verarbeitung zu starten – dafür gibt es 2 Möglichkeiten:

  • Es wird die Zeit des letzten Schreibvorgangs der Dateien verwendet plus eine einstellbaren Verzögerung. Kommen in dem Zeitraum keine neuen Dateien dazu so werden alle Dateien des In-Folders als eine Transaktion erkannt und die Verarbeitung beginnt.

Achtung: Wird ein ganzer Folder oder eine ganze Folderstruktur in den In-Folder kopiert so bleibt der „alte“ Erstellungszeitpunkt der Einzeldateien erhalten. Dieser wird nur dann neu gesetzt wenn die Dateien und nicht der Folder als Ganzes kopiert werden. In dem Fall müssen „Ready“ Dateien verwendet werden oder nachdem die Folder kopiert wurde kann durch „Stop“ und  neuem „Start“ des FC-Services die Verarbeitung auch initiiert werden.

  • Es wird eine „Ready“ Datei (ready.rd) verwendet. Sobald die Datei auftaucht wird der zu diesem Zeitpunkt vorhandene Inhalt des In-Folders als Transaktion erkannt und verarbeitet. Der Inhalt der Ready Datei ist egal – diese kann auch leer sein. Der Namen ist konfigurierbar. Wird eine Ready Datei verwendet so  muss diese in jedem Folder der verarbeitet werden soll vorliegen – also auch in den Unterordnern falls die Unterordnerverarbeitung aktiviert wurde.

Verarbeite Unterordner – Ja / Nein:

  • Ist diese Option nicht aktiv so werden nur Dateien aus den Root-In-Folder verarbeitet. Eventuell darunter liegende Unterordner werden ignoriert. Im Out-Folder wird für jede Transaktion ein eindeutiger Ausgabe-Ordner mit Datum und Uhrzeit als Namen erzeugt. Alle aus der Transaktion erzeugten Dateien werden in diesem Ordner abgelegt.
  • Ist diese Option aktiv und die Option „Unterordner Verarbeitung ab Level“ inaktiv – so werden die im In-Folder enthaltenen Unterordner auch verarbeitet. Dabei wird für jeden Ordner / Unterordner aus dem In-Folder, egal in welcher Ebene sich dieser befunden hat ein Ordner gleichen Namens im Out-Folder in der Root Ebene erzeugt. In diesem Fall wird eine ev. vorhandene Ordner Struktur aus dem In-Folder nicht auch im Out-Folder erzeugt. Das erfolgt nur dann falls die Option „Unterordner Verarbeitung ab Level“ aktiviert wurde.

Verarbeite alle Dateien – Ja / Nein:

  • Mit dieser Option kann kontrolliert werden was passiert falls eine Datei aus einer Transaktion nicht konvertiert werden kann bzw. einen  Fehler erzeugt. Ist diese Option aktiv so werden alle Dateien verarbeitet – tritt ein Fehler auf so wird die betreffende Datei markiert (umbenannt mit .err oder in einen  Error Folder verschoben). Alle anderen Dateien aus der Transaktion werden aber verarbeitet.
  • Ist diese Option nicht aktiv – dann wird beim auftreten des ersten Fehler die ganze Transaktion abgebrochen und „fehlerhaft“, es werden keine weiteren Dateien verarbeitet.

Unterordner Verarbeitung ab Level:

Mit dieser Option kann gesteuert werden ab welcher Ebene die Unterordner-verarbeitung starten soll. Wird z.b. 1 konfiguriert so werden alle Ordner und darunterliegenden Ebenen die sich im In-Folder befinden verarbeitet. Die Dateien die sich direkt im Eingangs-Ordner befinden werden hingegen nicht verarbeitet.

  • Ist diese Option aktiv – so wird im Out-Folder die gleiche Ordnerstruktur (ab der festgelegten Ebene) aufgebaut wie im In-Folder.
  • Ist diese Option nicht aktiv – wird die In-Folder Struktur im Out-Folder nicht abgebildet – für jeden Ordner (egal aus welcher Ebenen) im In-Folder wird ein Ordner mit gleichem Namen im Root des Out-Folders angelegt. Alle In-Folder werden somit in einer Ebene im Out-Folder angelegt.

Download – FileConverter – Dokumente & E-Mails nach PDF, PDF/A und TIFF >>>

FileConverter – Version 1.0.40 verfügbar – Neuer zusätzlicher HTML Konverter

Neuerungen & Verbesserungen – FileConverter 1.0.40:

  • Bei der Verarbeitung von E-Mails (EML, MSG) können jetzt auch E-Mails die selbst wieder MSG oder EML Anhänge enthalten konvertiert werden.
  • Fehler bei der Verarbeitung vom MS-Exchange E-Mail Boxen über die Web-Service Schnittstelle wurde behoben – der Fehler hat die Verarbeitung zeitweise blockiert wodurch der Dienst neu gestartet werden musste.
  • Die zugrunde liegende Konverter Komponente wurde aktualisiert und an den aktuellen Stand des FileConverterPro angepasst.
  • Speziell für die HTML Konvertierung (E-Mail Body) wurde eine neue Konverter Engine (ASP-direkt) implementiert. Es gibt jetzt 3 zur Auswahl
  • HiQ-direkt = bisherige „Direkte Konvertierung“
  • ASP-direkt = Neuer HTML Konverter
  • MS-Office – wie bisher

Wir empfehlen ASP-direkt  standardmäßig zu verwenden da bei diesem Konverter die Schriften größer dargestellt und damit die erzeugten PDF´s besser lesbar werden.

Download – FileConverter – Dokumente & E-Mails nach PDF, PDF/A und TIFF >>>

FileConverter / FileConverter Pro – ohne Benutzereigabe – „Silent“ deinstallieren

„msiexec“ /qn /uninstall {<Produktcode>}

Achtung: Ein „Siltent – Uninstall“ ist nur als „Administrator“ möglich d.h. der Befehl muss entweder über „CMD“ der als „Administrator“ gestartet oder über eine *.BAT Datei als „Administrator“ ausgeführt werden.

Produktcode FileConverter:

  • Englische Installation: {E30FC554-4891-4EF0-A30C-F19CA574A39E}
  • Deutsche Installation: {44D4015B-0570-42F7-92EF-8E4A0DD89ED9}

Produktcode FileConverter Pro:

  • Englische Installation: {096365FF-8127-4678-B9E3-7ACB50BAA597}
  • Deutsche Installation: {11B8A908-9014-4700-81AF-0205D8848D6A}

FileConverter – Version 1.0.27 – unterstützt MS-Office 2010 als Konverter

Mit der neuen Version 1.0.27 des FileConverter Dienstes wird jetzt auch MS-Office 2010 als Konverter für die Konvertierung von MS-Word, MS-Excel und MS-PowerPoint Dateien nach PDF, PDF/A und TIFF unterstützt. MS-Office kann parallel zu der bestehenden, direkten Konvertierung verwendet und auch gemischt, nach Folder bzw. E-Mail Box konfiguriert und genutzt werden. Die Konvertierung erfolgt wie bei der direkten Konvertierung Silent im Hintergrund über den FileConverter Windows Dienst. Voraussetzung ist die Installation der 32bit Version von MS-Office 2010 auf dem Rechner und dass die MS-Office Anwendungen unter dem für den Dienst angemeldeten User bereits einmal aufgerufen wurden.

Durch die Verwendung von MS-Office als Konverter Engine kann 100%ige Qualität und die Unterstützung aller MS-Office Features gewährleistet werden welche nur über die Verwendung der Original Anwendung erreicht werden kann.

Um die vorhandenen Rechner – Ressourcen auszunutzen bzw. um einen optimalen Durchsatz zu gewährleisten werden die Konvertierungen je nach Konfiguration ebenfalls parallel  durchgeführt. Der eingestellte Standard sind 5 parallele Prozesse.

FileConverter - MS-Office als Konverter

Download – FileConverter – Dokumente & E-Mails nach PDF, PDF/A und TIFF >>>

FileConverter – Dokumente und E-Mails aus Foldern bzw. E-Mail Boxen automatisiert nach PDF, PDF/A und TIFF konvertieren

Der FileConverter ist eine als Service unter MS-Windows (32 und 64bit) installierbare Anwendung um Folder und E-Mail Boxen zu überwachen um die darin befindlichen Dokumente automatisiert in das PDF, PDF/A oder TIFF Dokumentenformat zu konvertieren.  Dabei können parallel mehrere Folder bzw. auch mehrere MS-Exchange bzw. POP3 Mailboxen konfiguriert und überwacht werden.

Folgende Eingangs-Dokumentenformate werden unterstützt:

  • DOC, DOCX, RTF, TXT,
  • XLS, XLSX,
  • PPT, PPTX,
  • XFDF, FDF,
  • PNG, BMP, TIF, TIFF, JPG, JPEG
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMT, PMTX

Dateiformat – Besonderheiten:

  • Bei ZIP/RAR/7Z Containern werden alle enthaltenen und unterstützen Dokumente automatisch extrahiert und konvertiert. Die im Container enthaltene Foldersturktur wird im Ausgabeverzeichnis aufgebaut.
  • PMT und PMTX – sind PDFMerge XML Datenformate – welche eine hierarchische Strukturinformation als auch die Links auf die Dokumente bzw. die Dokumente selbst enthalten. Der FileConverter erzeugt daraus genauso wie der PDFMerge Server eine einzige Gesamt PDF Datei die aus den nach PDF konvertierten Einzeldateien besteht welche zu einer PDF Gesamtdatei zusammengefügt wurden. Die im XML definierte Struktur wird über die PDF-Bookmarks abgebildet.

Konvertierung:

  • Die PDF/TIFF Konvertierung erfolgt direkt ohne Verwendung der Ursprungsanwendung. Für die Verarbeitung ist also keine Installation von MS-Office oder Adobe Acrobat erforderlich. Optional können die PDF´s auch im ISO normierten PDF/A-1b Format ausgegeben werden.
  • Im Standardumfang enthalten ist auch die iOCR Engine um aus PDF oder Imagedokumenten durchsuchbare PDF(/A) zu erzeugen. Optional installiert – kann auch Abbyy die momentan leistungsfähigste OCR Engine installiert werden. Bei der OCR Verarbeitung werden PDF Dokumente seitenweise analysiert und nur jene Seiten der OCR Verarbeitung unterzogen die noch keine Textinformation enthalten (intelligente OCR Verarbeitung) – das spart Ressourcen, verbessert die Qualität und erhöht die Verarbeitungsgeschwindigkeit.

Funktionen – Allgemein:

  • MS-Windows Service Anwendung zu Dokumentenkonvertierung von MS-Office, PDF, Image, HTML, ZIP, MSG und E-Mail nach PDF, PDF/A bzw. TIFF
  • Parallel können mehrere Folder sowie MS-Exchange und POP3 E-Mailboxen überwacht und verarbeitet werden.
  • Direkte Konvertierung ohne Verwendung zusätzlich erforderlicher Original Anwendungen (MS-Office, Adobe Acrobat)  bzw. Druckertreiber.
  • Verflachen von ausgefüllten PDF Formularen: PDF Formulare (XFDF,FDF) können in normale PDF Dokumente konvertiert werden. Die Formulare können entweder fix hinterlegt oder jedes Mal neu geladen werden.
  • Parallele Verarbeitung mit konfigurierbarer Anzahl an Prozessen – erlaubt die optimale Ausnutzung der Hardware und garantiert die schnelle Abarbeitung.
  • Logging aller Konvertierungsvorgänge, Weiterleiten fehlgeschlagener E-Mail Konvertierungen bzw. Versand von Fehler – E-Mails per SMTP

In / Out Folderverarbeitung:

  • Verarbeitung von Dateien und Foldern aus konfigurierten In / Out-Ordnern über Zeitablauf bzw. über „Ready“ Datei, inkl. Subfolder Verarbeitung (eine Ebene)
  • Erstellen einer Index-Text-Datei über alle bei einem Verarbeitungsvorgang erzeugten Dateien.
  • Nach der Verarbeitung: Löschen, Verschieben in Archivordner, Umbenennen – der Dateien bzw. Folder (.con / .err)
  • Konfiguration der nicht zu konvertierenden Dateierweiterungen – diese werden ignoriert und nicht verarbeitet. E-Mails mit Anhängen und nicht definierten Erweiterungen (weder konvertierbar noch nicht konvertierbar) werden als Fehler gehandhabt und an eine Error E-Mail Adresse weitergeleitet.
  • Einzelseitenausgabe mit konfigurierbarer Anzahl an Stellen für den Seitenindex
  • Konfiguration der TIFF Konvertierung – Komprimierung / Farbtiefe / Auflösung / JPEG-Qualität
  • Umfangreiche Parameter für die OCR Verarbeitung – iOCR bzw. Abbyy – der FileConverter enthält über die gleichen OCR Funktionen wie AutoOCR
  • Parameter für die HTML Konvertierung – Seitengröße und Ränder – HTML Dokument und E-Mails werden automatisch skaliert.

Verarbeitung von E-Mail Boxen:

  • Abarbeiten von von POP3 / MS-Exchange E-Mail Boxen – Weiterleiten bzw. Löschen bei erfolgreicher bzw. fehlerhafter Verarbeitung bzw. Verschieben in einen Archiv / Error Folder unter MS-Exchange. Direkter Zugriff auf MS-Exchange 2007/2010/2013 über die SOAP-Web-Service Schnittstelle.
  • EML und MSG – Body und Anhänge werden konvertiert – Generierung der E-Mail Header Information im Body Dokument – Von, Datum, An, Betreff
  • Ausgabe einer XML Datei zu den verarbeiteten E-Mails mit den Metadaten und Dateilinks – konfigurierbar: von, an, cc, bcc, erhalten, Betreff, Body, Anlagen
  • Ausgabe pro E-Mail in getrennte Unterordner oder „flach“ im Zielordner.

 

1_FileConverter - Allgemeine Einstellungen - Email & Folder Verarbeitung 2_FileConverter - Verarbeitungsoptionen  3_FileConverter - Service Konfiguration  4_Fileconverter - SMTP Server Konfiguration  5_FileConverter - Konfiguration Folder Verarbeitung  6_FileConverter - Konfiguration E-Mail Box Verarbeitung  7_FileConverter - MS-Exchange Konfiguration  8_FileConverter - POP3 Konfiguration  9_FileConverter - TIFF Konvertier Settings  10_FileConverter - OCR Settings  11_FileConverter - HTML Konvertier Settings  12_FileConverter - Log Anzeige

  Download – FileConverter – Dokumente & E-Mails nach PDF, PDF/A und TIFF >>>

Windows Dienst – Zugriff auf Netzwerkressourcen – was ist zu beachten ?

Unsere Anwendungen zur Dokumentenkonvertierung – FileConverter, AutoOCR bzw. FileConverterPro – dienen dazu einen oder mehrere Eingangsordner zu überwachen und für neu hinzukommende Dokumente die Verarbeitung automatisch zu starten. Das kann entweder über lokale Laufwerke aber auch über Netzwerk Ressourcen erfolgen.

Besonders bei der Installation der Anwendungen als Dienst und bei Verwendung von Netzwerk Ressource sind einige Dinge hinsichtlich der richtigen Konfiguration zu beachten:

  • Der Dienst der auf Netzwerk Ressourcen Zugriff haben soll muss unter einem User Account laufen und nicht als System Account.
  • Der User unter dem der Dienst läuft muss über die entsprechenden Rechte (Lesen / Schreiben / Löschen) auf die Netzwerkressource verfügen.
  • Für den Zugriff auf die Netzwerk-Ressourcen (In- / Out- / Error- / Archiv- / Log-Folder) darf kein gemapptes Laufwerk verwendet werden sondern es muss der direkte Netzwerk Share (UNC Pfad) verwendet werden.
  • Die Verarbeitungsoption für das Folder-Monitoring muss von „File System Events“ auf „Read File Blocks“ umgestellt werden.

Die Netzwerk Verbindung auf einen Laufwerks Buchstaben wird über das „Network Connection Service“ verwaltet – Mappt man ein Laufwerk so gibt es einige Dinge die man wissen sollte

  • Option – Reconnect beim Logon – Dient dazu um das Laufwerk Mapping beim nächsten Login automatisch wieder herzustellen.
  • Das Mapping der Laufwerke wird über User realisiert – ist der User nicht eingeloggt so sind die gemappten Laufwerke nicht verfügbar.
  • Über einen Dienst – unabhängig davon ob dieser mit dem gleichen Account wie der aktuell eingeloggte User läuft ist oder nicht – sind gemappte Laufwerke nicht verfügbar – da ein Service nur unter den „User Credentials“ läuft, selbst aber nicht eingeloggt ist.

Generell – auch falls die Anwendungen nicht als Service installiert und betrieben wird – empfiehlt es sich Netzwerk Shares (UNC Pfade) an Stelle von gemappten Laufwerken zu verwenden. Ein Netzwerk Share – der direkter Zugang zur Netzwerk Ressource – ist sowohl für den Dienst (unter einem User Account) als auch für normale Anwendungen immer verfügbar und wird vom Remote Server definiert. Das gilt jedoch nicht für den lokalen System Account – dieser hat keinen Zugriff auf Netzwerk Ressourcen und kann daher nicht für einen Dienst verwendet werden der auf Netzwerk Ressourcen Zugriff haben muss.

Webshop