FileConverterPro (FCpro) – PDF(/A) Konvertier Dienst mit SOAP / REST – Web-Service

Der FileConverterPro wird als Windows Dienst installiert und bietet Funktionen zur Konvertierung der wichtigsten Dokumentenformate nach PDF, PDF/A inkl. OCR über eine Web-Service Schnittstelle (SOAP oder REST).

Bei FCpro werden die gleichen Basiskomponenten wie für den FileConverter, PDFMerge sowie AutoOCR verwendet. Anpassungen und Erweiterungen stehen damit sofort in allen diesen Programmen in gleicher Weise zur Verfügung.

Das Web-Service Interface von FCpro ist kompatibel zum Web-Service Interface von AutoOCR womit Anwendungen ohne Anpassungen mit beiden Diensten lauffähig sind. So kann z.B. unsere Alfresco / ifresco Transformer Integration ohne Änderung sowohl mit AutoOCR – für reine OCR Verarbeitung bzw. mit dem FCpro – um alle Dokumentenformate inkl. OCR zu verarbeiten – betrieben werden.

Genauso wie für AutoOCR steht auch für den FCpro Service eine fertige .NET / C# Beispielanwendung mit EXE und Source Code zur Verfügung. Damit können die FCpro Funktionen sofort getestet bzw. kann der Code als Basis für die Integration eigener Anwendungen herangezogen werden.

PDF bzw. PDF/A Konvertierung – alle wichtigen Dateiformate – MS-Office, Image, E-Mail, HTML usw. werden automatisch nach PDF bzw. PDF/A konvertiert. Standardmäßig werden keine weiteren Komponenten bzw. MS-Office benötigt. Die Konvertierung erfolgt direkt ohne zusätzliche Anwendungen oder Druckertreiber. Optional kann jedoch auch falls vorhanden bzw. falls eine „High Fidelity“ Konvertierung für Office Formate gefordert ist auch MS-Office 2010/2013 als Konverter Komponente verwendet werden. Image und PDF Dokumente können über die integrierte iOCR durchsuchbar gemacht werden. Optional über eine Zusatzlizenz kann auch die Abbyy OCR Engine verwendet werde.

Unterstützte Eingangs-Dokumentenformate:

  • DOC, DOCX, RTF, TXT,
  • XLS, XLSX,
  • PPT, PPTX, PPS, PPSX,
  • FDF, XFDF (Adobe Formulare),
  • XML
  • PNG, BMP, TIF, TIFF, JPG, JPEG, GIF
  • ZIP, RAR, 7Z,
  • MSG, EML,
  • PDF,
  • HTM, HTML, MHTML,
  • PMTX (PDFMerge)

Funktionen – Allgemein:

  • MS-Windows Service Anwendung mit SOAP / REST Web-Service Schnittstelle zur Dokumentenkonvertierung von Office, PDF, Image, HTML, ZIP, MSG und E-Mail nach PDF bzw. PDF/A. Die Kommunikation erfolgt verschlüsselt über HTTPS.
  • Verarbeitungsprofile – alle Einstellungen können vorkonfiguriert und über Profile abgerufen und verwendet werden.
  • Direkte Konvertierung ohne Verwendung zusätzlich erforderlicher Original Anwendungen.
  • Für die „high fidelity“ Konvertierung von MS-Office Dokumenten kann auch MS-Office 2010 / 2013 installiert und verwendet werden.
  • Auflösen und Konvertieren von  Containerdateien – ZIP, 7Zip, RAR, MSG, EML, PMTX – um Gesamtdateien zu erzeugen. Strukturen werden als Bookmarks abgebildet, für nicht konvertierbare Dokumente werden Platzhalterseiten eingefügt.
  • Images und Scans (TIF, JPEG, PNG, BMP, GIF, PDF) lassen sich über die integrierte iOCR in durchsuchbare PDF´s konvertieren – Abbyy OCR Engine als Option.
  • Parallele Verarbeitung mit konfigurierbarer Anzahl an Prozessen und Prioritäten  – erlaubt die optimale Ausnutzung der Hardware und garantiert die schnelle Abarbeitung.

Besondere Funktionen:

  • Bei ZIP/RAR/7Z Containern werden alle enthaltenen und unterstützen Dokumente automatisch extrahiert, konvertiert und zu einem einzigen PDF-Gesamtdokument zusammengefügt. Die im Container enthaltene Ordnerstruktur wird im PDF Ausgabedokument über die Bookmark Struktur abgebildet.
  • MSG / EML – E-Mails können beliebige auch verschachtelte Anhänge enthalten. Auch diese Dokumente werden extrahiert, für nicht konvertierbare Formate werden Platzhalterseiten eingefügt und die Struktur wird über die PDF-Bookmarks abgebildet.
  • PDF/A Konvertierung – Der FCpro ist auch ein PDF nach PDF/A Converter. Die konvertierten Dokumente können als PDF/A-1b oder aber auch mit eingebetteten Originaldateien im ISO normierten PDF/A-3b Format erzeugt werden. Damit eignet sich der FCpro Service ideal für die Langzeitarchivierung von Dokumenten und E-Mails.
  • PMTX – ist ein XML Datenformat von PDFMerge welches Struktur- und Verarbeitungsinformation als auch die Dokumente selbst enthält. FCpro  erzeugt daraus eine einzige Gesamt PDF Datei die aus den konvertierten und zusammengefügten Einzeldateien besteht. Die PDFMerge Struktur wird über die PDF-Bookmarks abgebildet.
  • FDF, XFDF – PDF Formulardaten – können mit dem PDF Formularen verschmolzen und in „normale“ PDF konvertiert werden.
  • Stempel, Wasserzeichen, Briefpapier – können konfiguriert und aufgebracht werden.
  • Intelligentes OCR von PDF – PDF Dokumente werden seitenweise analysiert ob OCR erforderlich ist oder nicht – Seiten die bereits Text enthalten werden nicht nochmals OCR verarbeitet, Bookmarks und Links bleiben erhalten. Das spart Zeit und Ressourcen und steigert die Qualität.

Funktionen – PDF-Export Einstellungen –Teil der Verarbeitungsprofile

  • Ausfüllen der PDF Profilfelder mit fixen Werten bzw. Variablen (Ursprungswerte, Profilname, Datum, Zeit, Rechnername, User, Dateiname, Anwendung, Seiten, PDF-Level, User Variablen)
  • Web-Optimierung  (Ja / Nein)
  • Bestehende Bookmarks erhalten (Ja / Nein)
  • Einstellungen für das Öffnen des PDF´s
  • Sicherheitseinstellungen – Passwort- Öffnen, System, Beschränkungen
  • Seiten-Nummerierung: Position, Start, Offset, Text (aktuelle Seite, Seiten), Schrift, Farbe, Bereich darunter abdecken
  • Briefpapier / PDF Wasserzeichen – Hinterlegen / Überlagern, Dateiauswahl, Deckkraft(%), Position
  • Textstempel – Ein oder mehrere Stempel, Text bzw. Variablen (wie Profilfelder inkl. Bookmarks), Start, Offset, Schrift, Stil (inkl. Outline), Größe, Farbe, Deckkraft (%), Drehwinkel

FCpro Userinterface:

UI1_FCpro - Config of web-service endpoints UI2_FCpro - Conversion profiles UI3_FCpro - Advanced settings UI4_FCpro - Advanced settings - web-service user config and rights UI5_FCpro - Advanced settings - service account config UI6_FCpro - Advanced settings - MIME types config UI7_FCpro - Icon tray functions

FCpro – Konvertier Profile:

CO1_FCpro - Conversion profile config - office documents CO2_FCpro - Conversion profile config - image documentsCO3_FCpro - Conversion profile config - HTML documents CO4_FCpro - Conversion profile config - XML CO5_FCpro - Conversion profile config - PDFA and PDFExport settings CO6_FCpro - Conversion profile config - FDF XFDF forms CO7_FCpro - Conversion profile config - OCR settings

FCpro – Konvertier Profile – OCR:

OC1_FCpro - Conversion profile config - iOCR settings #1 OC2_FCpro - Conversion profile config - iOCR settings #2 - image processing OC3_FCpro - Conversion profile config - iOCR settings #3 - language selection OC4_FCpro - Conversion profile config - iOCR settings #4 - language selection OC5_FCpro - Conversion profile config - Abbyy OCR settings - predefined profiles OC6_FCpro - Conversion profile config - Abbyy OCR settings - general settings OC7_FCpro - Conversion profile config - Abbyy OCR settings - recognition - image processing OC8_FCpro - Conversion profile config - Abbyy OCR settings - recognition - page analysis OC9_FCpro - Conversion profile config - Abbyy OCR settings - recognition - page synthesis OC10_FCpro - Conversion profile config - Abbyy OCR settings - PDF export parameter

Verfügbare FCpro Anwendungen / Clients:

Der FCpro Server stellt seine Funktionen über eine SOAP / REST – Web Service Schnittstelle anderen Anwendungen zur Verfügung. Folgende Anwendungen und Integrationen sind für den FCpro verfügbar bzw. nutzen seine Funktionen:

1.)    FileConverterPro – WCF Service Beispiel  – diese Clientanwendung wird mit dem FCpro Setup mit installiert. Damit können alle per Web-Service verfügbaren Funktionen probiert und getestet werden. Neben dem EXE ist diese Anwendung auch als C# Source Code verfügbar um einfach und schnell FCpro Funktonen aus eigenen Anwendungen heraus nutzen zu können.

2.)    DropConvert – Dokumente per Drag & Drop bzw. Orderüberwachung nach PDF(/A) konvertieren. DropConvert ist eine Windows Client Anwendung die mit dem FCpro Service kommuniziert um Dokumente die per Drag & Drop über eine immer „on top“ angezeigten „DropZone“ oder in einen überwachten Ordner gezogen werden nach PDF oder PDF/A zu konvertieren. Die Ergebnisdateien werden an den Client zurück übertragen und in einem konfigurierbaren Ausgabeordner abgelegt. Der FCpro Server wird https verschlüsselt über das lokale Netz oder auch extern über das Internet  angesprochen.

3.)    EMail Archiver – Der EMail Archiver ist ein Microsoft Outlook 2010 /2013 Plug-In mit dem direkt aus MS-Outlook heraus einzelne oder mehrere markierte E-Mails oder auch ganze E-Mail Ordner und Unterordner mit allen darin enthaltenen E-Mail Nachrichten nach PDF bzw. PDF/A konvertiert werden können. Die Verarbeitung und Konvertierung der E-Mail erfolgt über den FCpro Server der verschlüsselt über https entweder lokal im Netzwerk oder extern über das Internet angesprochen wird. Die Ergebnis PDF(/A) werden über einen festgelegten Start-Ordner und Pfad mit aus den E-Mails entnommenen variablen Informationen im Dateisystem abgelegt.

PDF und speziell PDF/A-3 sind besonders gut für die Archivierung bzw. ISO normierte Langzeitarchivierung von E-Mails geeignet. Bei PDF/A-3 werden die Original MSG / EML Nachrichten  mit in den PDF Container eingebettet.

4.)    Alfresco / ifresco – Transformer – Die Installation der „ifresco Transformer“  AMP´s für Alfresco erlaubt die PDF(/A) Konvertierung bzw. die OCR Verarbeitung über den FileConverterPro Server. Ist nur OCR gefordert so kann stattdessen auch der AutoOCR Server verwendet werden. Die Verarbeitung der unterstützten Dokumentenformate nach PDF, PDF/A bzw. mit OCR steht dann über Java, JavaScript, REST, die „Transform“ Aktion über Ordner sowie in Alfresco Share als „Transform“ Dokumenten Aktion zur Verfügung.

FCpro – Versionen, Lizenzierung, Umfang

Der FileConverterPro ist in einer Basisversion sowie in einer erweiterten Version inkl. PDF/A und OCR verfügbar. Bei der erweiterten Version kann optional zusätzlich zur iOCR Engine  auch noch die Abbyy OCR Engine lizenziert werden. Abbyy Lizenzen sind Seiten- (Monatliches- oder Gesamt-Volumen) sowie Prozessorabhängig verfügbar. Die FCpro Standard Lizenz ist pro Server, es sind jedoch auch „Enterprise“ für eine beliebige Anzahl an Servern pro Unternehmen, sowie „OEM“ Lizenzen zur Integration durch Entwickler in deren eigene Software verfügbar.

Mit im Umfang  des FCpro Servers enthalten ist die – WCF Service Beispiel Anwendung inkl. Source Code  sowie die MS-Windows Anwendung „DropConvert“- Diese kann ohne Einschränkungen auf beliebigen Arbeitsplätzen installiert und verwendet werden.

Download – FileConverterPro (FCpro) ~250MB >>>

DropOCR – kostenloser Windows-Client für den AutoOCR Server

Der AutoOCR Server ist ein sehr leistungsfähiger OCR Server der zentral installiert zur Verarbeitung aller Image- und PDF-Dokumente im Unternehmen zur Verfügung gestellt werden kann. Er verfügt am Server sowohl über Hot-Folder Funktionen sowie über eine SOAP/REST-Schnittstelle.

Um die OCR Verarbeitung von jedem Windows Arbeitsplatz – egal von wo im Netzwerk / Internet aus nutzen zu können – ohne sich einen Share auf den AutoOCR Server mappen zu müssen stellen wir allen AutoOCR Kunden jetzt mit DropOCR eine kostenlose Client Anwendung zur Verfügung. DropOCR wird als Icon Tray Anwendung installiert und verfügt über eine einblendbare “Drop-Zone” sowie über einen lokalen Hot-Folder.

Images oder PDF´s die in durchsuchbare PDF oder PDF/A-Dokumente konvertiert werden sollen können einfach in den lokalen In-Folder kopiert bzw. auf die “Drop-Zone” per Drag&Drop gezogen werden. Das Dokument wird per Web-Service an den gemeinsamen AutoOCR Server übertragen, dort verarbeitet und danach wird die Ergebnis PDF(/A) Datei wieder auf den Client zurück übertragen und steht anschließend im konfigurierten lokalen Out-Folder zur Verfügung.

DropOCR Funktionen:

  • Kostenloser Windows Client für AutoOCR Server
  • Kommunikation mit dem zentralen OCR Server über SOAP / REST Web-Service Interface
  • Lokaler Hot-Folder sowie Drop-Zone
  • Konvertiert ein oder mehrere  lokale Image / PDF Dokumente über den Remote OCR-Server in durchsuchbaren PDF(/A) Dokumenten .
  • Auswahl unterschiedlicher OCR-Settings über am Server hinterlegte OCR Profile

DropOCR - Config  DropOCR - icon tray applicaiton

Download – DropOCR >>>

AutoOCR 1.10.10 – Scripting jetzt auch für die REST / SOAP Verarbeitung

Mit der Version 1.10.10 steht die Scriptingmöglichkeit jetzt auch über die OCR-Profile für die Web-Service Schnittstelle (REST / SOAP) zur Verfügung. Siehe auch C# / VB.NET Scripting .

Web-Service OCR-Profile - Scripting - Action Web-Service OCR-Profile - Scripting - Action Einstellungen Web-Service OCR-Profile - Scripting - Action Code

Um die Script Aktion zu konfiguriern und um den zusätzlichen “Aktion” Tab anzuzeigen muss das AutoOCR Userinterface mit der Commandline Option /ShowAction gestartet werden:

  • “C:\Program Files\AutoOCR\AutoOCR.exe” /ShowAction – für 32bit
  • “C:\Program Files (x86)\AutoOCR\AutoOCR.exe” /ShowAction – für 64bit

Download – AutoOCR – OCR Server inkl. iOCR Engine (ca. 150MB) >>>

Für die Abbyy OCR Engine Version 10 stehen Demolizenzen für 30 Tage bzw. 500 Seiten zur Verfügung – diese können Sie gerne bei uns anfordern

Download- Abbyy FineReader 10.x Rel 4 OCR Engine Setup (ca. 460MB) >>>
Demolizenzkey für FineReader OCR Engine anfordern

AutoOCR – REST Schnittstelle – Jobs abfragen & löschen erweitert

Die REST Schnittstelle zur Job Abfrage wurde um 3 Felder mit dem ISO Datumsformat erweitert.

EnumJobs Parameters:

the url template would be:
/EnumJobs?pageSize={pageSize}&label={label}&userName={userName}&status={status}&createdFromTo={createdFromTo}&convertedFromTo={convertedFromTo}&sortColumns={sortColumns}

  • pageSize=the size of the page(because of paging)
  • label=the label filter, can contain wildcards *
  • userName=the username filter, can contain wildcards
  • status=the status of the jobs which should be returned, or 100 for all status
  • createdFromTo=”yyyy/MM/dd HH:mm:ss-yyyy/MM/dd HH:mm:ss”
  • convertedFromTo=”yyyy/MM/dd HH:mm:ss-yyyy/MM/dd HH:mm:ss”
  • sortColumns=”ColumName1 ASC,ColumnName DESC,…”

The createdFromTo, convertedFromTo and sortColumns can be empty strings. The available sort columns are the following:

  • DateCreated
  • DateConverted
  • StatusCode
  • UserName
  • JobLabel

Now there are some new fields in the JSON JobResult structure:

  • CreationDateISO
  • FinishedDateISO
  • ConversionStartedDateISO

REST Funktion – Jobs löschen

Es gibt eine Funktion um alle Web-Service Jobs aus der Datenbank zu löschen /DeleteAllJobs. Damit werden alle Datenbank Einträger und auch alle am AutoOCR Server hinterlegten Ergebnisdateien auf einmal gelöscht. Neu hinzugekommen ist jetzt auch die Funktion um Jobs älter als X Tage zu löschen /DeleteJobs(int days)

  • https://autoocr.may.co.at:8001/AutoOCRService/DeleteAllJobs
  • https://autoocr.may.co.at:8001/AutoOCRService/DeleteJobs?days=1