FileConverterPro (FCpro) als eigenständige C# / .NET Komponente

Bisher haben wir den FileConverterPro (FCpro) nur als Windows Service mit REST/SOAP Web-Service Schnittstelle verwendet. Jetzt haben wir daraus auch eine eigenständige C# / .NET Komponente gemacht. Damit können wir alle im FileConverterPro (FCpro) zur Verfügung stehenden Funktionen zur Dokumentenkonvertierung auch direkt in andere Anwendungen implementieren. Darauf aufbauend werden wir in Kürze den FCpro Konverter als eigenständige Anwendung mit Kommandozeile sowie als Windows Dienst mit Verzeichnisüberwachung (Hotfolder) erstellen. Ebenso werden wir diese Konverter Komponente direkt in PDFMerge / EasyMerge bzw. im EMailArchiver und in weiteren Anwendungen integrieren.

Diese FCpro C# / .NET Komponente wird von uns nicht als eigenständiges Produkt angeboten und wird nur im Rahmen unserer Anwendungen sowie bei individuellen Softwareprojekten verwendet. Für die FCpro Konverter Komponente steht eine Beispiel & Testanwendung zur Verfügung mit der interaktiv alle FCpro Konvertierfunktionen ausprobiert werden können.

Funktionen der FCpro Komponenten Testanwendung:

  • Eigenständige Testanwendung um interaktiv die FCpro PDF & PDF/A Konvertierfunktionen testen zu können
  • Erzeugt – PDF, PDF/A, Text, Bild-Voransicht, Miniaturen Ansicht aus den verschiedensten Datei- und Containerformaten (ZIP, EML, MSG…)
  • FCpro Konvertier Profil-Funktionen:  Erstellen, Kopieren, Bearbeiten, Profil exportieren / importieren
  • Konfiguration der Anzahl der parallelen Prozesse für die Konvertierung
  • Ein oder mehrere Dateien können zur Konvertierung in den gelb markierten per Drag & Drop Bereich gezogen werden.  Die Ergebnisdateien (PDF, TXT, JPEG, PNG) werden im Ordner der Ausgangsdatei abgelegt.

Download – FileConverterPro (FCpro) Komponenten Testanwendung ~600MB >>>
Download – OmniPage OCR Engine als Option für FCpro (ca. 235MB) >>>

Beispielprojekt Aufruf der PDF2PDFA-CL Kommandozeilenanwendung aus .NET / C#

Wir haben ein C# / .NET Beispielprojekt erstellt um zu zeigen wie die PDF2PDFA-CL Kommandozeilen Anwendung aus einem .NET / C# Programm heraus aufgerufen werden kann.

Funktionen:

  • PDF nach PDF/A Konvertierung mit Hilfe unserer PDF2PDFA-CL Anwendung
  • .NET / C# Beispielprojekt im Source Code inkl. ausführbarer Anwendung
  • Auswahl – Konvertierprofildatei (*.ppa) von PDF2PDFA-CL
  • Auswahl – Ausgabeordner
  • Auswahl – Pfad zur PDF2PDFA-CL EXE
  • Start der Verarbeitung durch Drag & Drop einer oder mehrere PDF Dateien in den markierten Drop-Bereich.

Download – PDF2PDFA-CL_C# Beispielprojekt >>>

FileConverterPro (FCpro) 1.0.118

Neuerungen der FCpro Version 1.0.118:

  • Erweiterungen für Platzhalterseiten bei der Verarbeitung von Container (ZIP, MSG, EML..) Dateien – Bisher konnte bei Container Dateien, bei der eine der enthaltenen Dateien nicht konvertiert bzw. nicht weiter verarbeitet werden konnte, nur ausgewählt werden ob eine Platzhalterseite eingefügt wird oder nicht. Der Status des Jobs ist dabei nie auf einen Fehler gelaufen und es wurde immer eine PDF Ergebnisdatei erzeugt. Bei der Jobabfrage gab es bisher auch keine zusätzliche Info darüber ob einzelne Teile nicht konvertiert, bzw. ob Platzhalterseiten eingefügt wurden.

Im FCpro Konvertierprofil kann jetzt konfiguriert werden:

    • Ob Platzhalterseiten eingefügt werden sollen oder nicht.
    • Ob immer eine PDF Ergebnisdatei (mit oder ohne Platzhalterseiten), oder ob kein PDF erzeugt werden soll. Dabei bekommt, falls eine Komponente des Containers nicht konvertierbar bzw. nicht verarbeitbar ist, der Job den Status „Error“,
    • Neben nicht konvertierbaren Dateien werden für Container auch PDF Dateien erkannt, die nicht weiter verarbeitbar sind. z.b. falls sie eine PDF Restriktion / Passwort Schutz aufweisen und dadurch nicht zu einer PDF Gesamtdatei zusammengefügt werden können.
    • Am Server kann ein eigenes Platzhalterseiten-Log aktiviert werden in der die Verwendung von Platzhalterseiten protokolliert wird.
    • Jede Anwendung einer Platzhalterseite kann auch über eine SMTP EMail protokolliert werden.
    • Falls eine Platzhalterseite bei einem Job eingefügt wurde, bekommt man diese Info über die Web-Service Jobabfrage.

   

  • Web-Service – REST – Verbesserungen / Erweiterungen:

REST Endpunkt UploadJobEx6 – Bisher wurden einige Parameter immer vom FCpro Service überschrieben wenn diese nicht konfiguriert wurden. Das wurde jetzt geändert so dass nur jene Parameter die über den REST Endpunkt UploadJobEx6 übergeben und gesetzt werden die Job Parameter überschreiben.

GetJob function(jobGuid) Aufruf liefert mehr Informationen:

Es gibt einige neue Zeilen in der Job Information

    • PlaceholderUsed (true/false)
    • ProcessId
    • ProcessName
    • SettingsName (Name des verwendeten FCpro Konverter Profils)

ProcessName liefert die Info über welchen Konverter die PDF Konvertierung durchgeführt wurde. Entweder „FileConverterPro“ (intern) oder durch eine „externe“ Komponente (z.b. MS-Office)

Beispiel-Antwort auf einen GetJob function(jobGuid) Aufruf:

{
„GetJobResult“: {
„ConversionStartedDate“: „/Date(1637056353767+0200)/“,
„ConversionStartedDateISO“: „2021-11-16T11:52:33+02:00“,
„CreationDate“: „/Date(1637056352797+0200)/“,
„CreationDateISO“: „2021-11-16T11:52:32+02:00“,
„Errors“: „“,
„FinishedDate“: „/Date(1637056366843+0200)/“,
„FinishedDateISO“: „2021-11-16T11:52:46+02:00“,
„JobGuid“: „84726eef-0383-4094-b15f-de7ce122dce7“,
„JobID“: 255,
„JobLabel“: „C:\\Users\\Admin\\AppData\\Local\\DropConverterProE\\Downloads\\211116-115230\\20211116115232058.pdf“,
„PageCount“: 1,
„PdfData“: null,
„PlaceholderUsed“: false,
„ProcessId“: -1,
„ProcessName“: „FileConverterPro“,
„SettingsName“: „default“,
„Status“: 5,
„UserName“: „admin“
}
}

 

  • MS-Office automatisch beenden – Manchmal kommt es vor dass der FCpro Dienst auf einem Arbeitsplatz auf dem ein Anwender arbeitet, installiert wird. Bei der FCPro Verarbeitung werden MS-Office Anwendungen in regelmäßigen Abständen „bereinigt“ und dabei automatisch beendet. Bisher auch falls MS-Office nicht als Konverter konfiguriert und verwendet wurde. Das wurde jetzt geändert. Die Bereinigung von MS-Office Prozessen findet nur statt, falls MS-Office auch als Konverter konfiguriert und verwendet wird.
  • Gemeinsame PDF2PDFA Komponente – Der FCpro PDF nach PDF/A Konverter wurde durch unserer PDF2PDFA Standardkomponente ersetzt um in allen unseren Anwendungen den gleichen einheitlichen Konverter zu verwenden. Damit ist FCpro jetzt auch in der Lage ZUGFeRD 2.1.1 konforme Dateien mit XRechnung Profilen zu erstellen.
  • FCPro Versionsnummer kann als Variable für das Ersteller / Erzeugerfeld verwendet werden um im PDF hinterlegen zu können mit welcher FCpro Version das Dokument erzeugt wurde.
  • SWF – Flash Datei Erzeugung wurde entfernt – Da das Flash SWF Format aus Sicherheitsgründen in der IT nicht mehr unterstützt wird haben wird die Erzeugung diese zusätzlichen Dateiformats aus allen FCpro Funktionen entfernt.
  • iOCR – Defekten Text in bestehenden PDF´s erkennen und korrigieren – Infos dazu siehe AutoOCR >>>
  • Beenden von zu lange laufenden OCR Prozessen durch Zeitablauf – Falls bei einem Job der OCR Prozess zu lange dauert und der vorgegebene Zeitablauf-Wert erreicht wird so wird der Job abgebrochen und alle damit zusammenhängenden Sub-Prozesse automatisch beendet.

Korrekturen und Fehlerbehebungen:

  • Bei der parallelen Verarbeitung von ZIP Containern, mit TIFF Dateien und parallelen Prozessen ist es zu Zugriffsproblemen gekommen. – Fehler „Can not access the file“
  • Der PDF (Passwort) Schutz wurde für die PDFExport Einstellungen und beim PDFSign nicht ausgeführt.
  • Die Container Sortierung (ZIP, MSG, EML…) nach dem Dateinamen / Ordner hat nicht funktioniert.
  • Die konfigurierbaren JPEG Qualitätseinstellungen für die zusätzlich zu erzeugenden Bilder für Voransicht und Miniaturen wurden nicht angewendet.
  • Setup – Bei der Installation ohne Internetverbindung wurde die iOCR Engine nicht automatisch installiert.

Download – FileConverterPro (FCpro) ~600MB >>>
Download – OmniPage OCR Engine als Option für FCpro (ca. 235MB) >>>

PDFmdx Version 3.18.0

Neuerungen / Verbesserungen PDFmdx Version 3.18.0:

  • Verbesserte Textextraktion – Durch die verbesserte Testextraktion konnten wir an Hand uns von Kunden zur Verfügung gestellten problematischen PDF´s die Textextraktion verbessern. Damit wurden auch bestimmte „problematische“ PDF verarbeitbar- Z.B.: bei sehr kleinem Text wurden Phantom Leerstellen eingefügt, bei Beträgen wurde der „.“ oder „,“ verschoben ausgegeben, bzw. horizontale Trennlinien erzeugt durch aneinandergereihte „_“ verhinderten das Auslesen in diesen Zeilen.
  • Ausgefüllte PDF Formulare verarbeiten – Formulare werden jetzt „gerendert“. Das PDF wird „verflacht“ in ein normales nicht mehr veränderbares PDF umgewandelt. Somit können die Felder wie bei jedem anderen PDF ausgelesen und von PDFmdx verarbeitet werden.
  • Neue Zähler Variablen für die Metadaten-Ausgabe – %COUNTER_GLOBAL% – Ein „globaler“ Zähler für den ein Startwert vorgegeben werden kann. Dieser wird jedes mal bei Ausgabe eines Datensatzes erhöht. %COUNTER_LOCAL% – der „lokale“ Zähler, wird nur für die Datensätze der aktuellen Verarbeitung erhöht und beginnt mit jedem Verarbeitungsjob wieder bei 1.

  • Performance-Optimierung bei Verwendung des Dateinamens um das Layout direkt über den Namen und nicht über Bedingungen auszuwählen.
  • PDFmdx Editor – Split Test Funktion – basiert jetzt auf der gleichen Routine wie die echte Verarbeitung. Fehlermeldungen werden direkt angezeigt und entsprechen den Fehlermeldungen die auch bei der Verarbeitung ausgegeben werden.
  • PDFmdx Editor – Felder / gleitende Gruppen auf anderen Seiten anzeigen – Normalerweise werden Felder auf einer bestimmten Seite des Musterdokuments positioniert. Felder können jedoch z.B. beim Auslesen von Positionsdaten über gleitenden Gruppen/Untergruppen auch auf anderen oder mehreren Seiten auszulesen sein. Um überprüfen zu können wie / wo die Felder auf anderen Seiten positioniert sind, bzw. welche Werte bei „gleitenden Feldern“ ausgelesen werden, gibt es jetzt eine Funktion um die positionierten Felder auch auf anderen Seiten einzublenden. Diese Anzeige wird beim Wechsel auf eine andere Seite wieder automatisch deaktiviert. Durch <CTRL>+<Pfeiltaste hinauf  / hinunter> lassen sich die Felder auch vertikal verschieben. Zusammen mit der <Shift> Taste mit größerer Schrittweite. Klickt man in ein angezeigtes Feld so wird in der Statuszeile der Feldname und der ausgelesene Text angezeigt.

  • Konfiguration des Ausgabenamens – Wird im Feld für den PDF Ausgabe Dateinamen ein nicht erlaubtes Zeichen z.b. einen „\“ verwendet, so werden bei der Verarbeitung nicht erlaubte Zeichen automatisch durch einen „_“ ersetzt.

  • ZUGFeRD XML über Variablen – Für die Festlegung der einzubettenden ZUGFeRD XML Datei können die „über PDFmdx zur Verfügung stehenden Variablen verwendet werden.

  • Zusammenfügen von PDF Dateien – Über die neue Funktion „Zusammenfügen“ können weitere PDF Dateien mit der verarbeiteten Datei zu einem Gesamt PDF zusammengefügt werden.

Funktionen Zusammenfügen:

    • „Zusammenfügen“ ermöglicht es ein oder mehrere PDF mit der über PDFmdx erzeugten Datei zu einem Gesamt-PDF zusammenzufügen.
    • Über eine Liste kann die Reihenfolge der zusammenzufügenden Dateien festgelegt werden.
    • Über Kriterien (UND / ODER / NICHT) kann an Hand von aus dem Dokument ausgelesenen Texten entschieden werden ob ein „Zusammenfügen“ erfolgen soll oder nicht.
    • Es können mehrere verschiedene „Zusammenfüge-Listen“ erstellt werden. Eine solche Liste kann mit einem bestimmten Layout verknüpft werden. Ein Layout kann über Kriterien erkannt und ausgewählt werden.
    • In der Zusammenfüge-Liste können entweder fix ausgewählte Dateien oder Pfade / Namen verwenden, die über aus dem Dokument ausgelesen Texte dynamisch bei der Verarbeitung erzeugt werden.
  • Neuimplementierung der EMail Funktion:
    • Für den Versand und EMail Verarbeitung wurde eine neue EMail Komponente implementiert.
    • Damit werden alle aktuellen Verschlüsselungsprotokolle (SSL2, SSL3, TLS1, TLS1.1, TLS1.2) unterstützt. Zu Beginn der Kommunikation mit dem SMTP EMail Server wird automatisch das am besten geeignete und unterstützte Protokoll  ausgehandelt und festgelegt.
    • Max. Größe der EMail konfigurierbar: Beim EMail Versand gibt es eine Option um alle EMail die an die gleiche EMail Adresse verschickt werden sollen zu einer einzigen EMail Nachricht zusammenzufassen. Es gibt jetzt einen eigenen Parameter um die Größe einer einzelnen zusammengefassten Nachricht zu limitieren,  z.B.: auf 10MB, Wird der Wert für eine Nachricht überschritten, erfolgt eine Aufteilung in mehrere EMails damit die max. eingestellte Größe nicht überschritten wird.
    • Im PDFmdx Prozessor gibt es für den EMail Versand jetzt eine eigene Logging / Protokoll Funktion. Diese kann für die erfolgreich verschickten als auch für die Fehler-Mail einzeln aktiviert werden. Ebenso kann der Ablage Pfad konfiguriert werden.
    • Die protokollierten EMail werden als EML Datei in zwei konfigurierbare Ordner (Erfolgreich/Fehler) abgelegt. Für ein Fehler EMail wird zusätzlich eine XML Datei mit Metadaten und Fehlermeldung angelegt. Für die Ablage der erfolgreich verschickten EMail kann pro Tag ein eigener Unterordner angelegt werden.
    • Anzeige der verschickten / Fehler EMail im PDFmdx Prozessor als Liste, über 2 Schaltflächen aufrufbar. Funktionen: Sortierung der Liste über Datum/Zeit, An, Betreff, Fehlermeldung, Ordner öffnen, EMail Nachricht anzeigen, Dateianhang öffnen. Lösche einzelne Nachrichten, Lösche alle Nachrichten.

 

Korrekturen PDFmdx Version 3.18.0:

  • Ausgelesene Barcodes wurden nicht auf Variablen zugeordnet und damit nicht in die Metadaten-Datei geschrieben.
  • Ausgelesener Text wurde für Variablen an verschieden Stellen nicht entsprechend der Konfiguration aufbereitet.
  • Barcodes konnten bei PDF mit Seitenrotation nicht ausgelesen werden – die Anzeige-Seitenrotation wurde nicht berücksichtigt.
  • „Erhaltener Wert“ Funktion hat die Werte für die Unterdatensätze nicht erhalten.
  • MRC-PDF (Mixed Raster Content) konnten nicht verarbeitet werden. Ein defektes PDF wurde ausgegeben.
  • PDFmdx Service Prozessor – Der Start zu einem vorgegebenen / wiederholten Zeitpunkt hat nicht funktioniert.
  • PDFmdx Prozessor – Bei der parallelen Verarbeitung konnte manchmal nicht in die Metadaten XLS(X) geschrieben werden, da diese von einem anderen Prozess noch offen und damit blockiert war.
  • PDFmdx Editor – Import von Vorlagen – Abfrage nach dem Überschreiben ist immer gekommen auch wenn keine Datei überschrieben werden sollte.
  • PDFmdx Editor – Erststart ohne Vorlage & Layout, danach Import einer Vorlage – Es wurde kein automatischer Refresh ausgeführt und die importierten Vorlagen & Layouts waren nicht sichtbar.
  • PDFmdx Editor – Beim Verschieben / Kopieren eines Layouts von einer Vorlage in eine Andere ist keine Abfrage hochgekommen dass ein Layout mit dem gleichen Namen bereits vorhanden war.
  • PDFmdx Editor – Löschen eines Layouts mit mehrfach verknüpften Bedingungen. Dabei blieben die AND / OR Knoten im Editor erhalten und wurden nicht automatisch bereinigt, was Verarbeitungsprobleme verursacht hat.
  • PDFmdx Editor – Bilder im HTML Body wurden beim Zusammenfassen der EMail an den gleichen Empfänger nicht in das EMail eingefügt und fehlten in der verschickten Nachricht.
  • EMails Versand – Trat beim EMail Versand unter bestimmten Bedingungen ein Fehler auf, so wurde die Verarbeitung abgebrochen bzw. der Dienst angehalten. Aus diesem Grund wurde der EMail Versand neu implementiert und um ein Logging der erfolgreichen und der Fehler EMail erweitert. (siehe Neuerungen).

Download – PDFmdx Template Editor & Processor >>>

PDF2Printer – Version 2.0.22 – Seiten/-Bereiche drucken, Erweiterte PCF Steuerdatei

Neuerungen PDF2Printer Version 2.0.22:

Bestimmte Seiten / Seitenbereiche drucken:

  • Seitenbereiche – von / bis – durch das Minuszeichen: z.B. 6-8
  • Einzelne Seiten – mit Beistrich getrennt: z.B. 1,4,6-8
  • Alle Seiten ab einer bestimmten Seite bis zum Ende des Dokuments – durch das Dollar Zeichen: z.B. 1,4,6-8,10-$

Erweiterte PCF Steuerdatei:

Eine wesentliche Funktion von PDF2Printer ist die Möglichkeit den Druckvorgang über eine PCF- Print Control Format Datei zu steuern. Die PCF Steuerdatei wurde jetzt um die neuen Funktionen der PDFPrint .NET Komponente erweitert.

PDF2Printer kann einen Eingangsordner überwachen. PDF Dateien die darin landen werden sofort mit den konfigurierten Standardeinstellungen ausgedruckt. Im überwachten Ordner können beliebige Unterordner angelegt, in welche PDF Dateien kopiert werden. Der Ausdruck dieser PDF Dateien kann aber nur über eine *.PCF Datei ausgelöst werden.

Eine PCF Datei kann die Namen einer oder mehrere PDF Dateien enthalten die gedruckt werden sollen. Die zu druckenden PDF müssen bereits im Unterordner vorhanden sein, bevor die PCF Datei dort erzeugt oder hinein kopiert wird. Die PCF Datei kann eine oder mehrere Zeilen enthalten, pro PDF eine Zeile. Gedruckte PDF Dateien werden gelöscht. Sind alle Dateien gedruckt und ist der Unterorder leer so wird auch der Unterordner und die PCF Datei automatisch gelöscht.

Syntax der PCF Zeilen:

<PDF Dateiname>\t<Druckername>\t<Papierfach_Typ>:<Papierfach_Name>\t<Kopien>\t<Graustufen>\t<Seitenbereich>

  • \t = TAB Zeichen als Trennzeichen zwischen den Parametern.
  • <PDF Dateiname> = Name der zu druckenden PDF Datei, ohne Pfad, Das PDF muss sich im gleichen Unterordner wie die PCF Datei befinden.
  • <Druckername> und <Papierfach_Typ>:<Papierfach_Name> = Ist aus der „printers.pnames“ Datei zu entnehmen. Diese Datei wird von der PDF2Printer Anwendung beim Start des Dienstes im überwachten Ordner automatisch angelegt und enthält die Liste alle verfügbaren Drucker/Papiereinzugsschächte. Zu beachten ist dass der System Account unter dem ein Windows Dienst standardmäßig läuft keine Zugriff auf Netzwerk Drucker hat. Daher sollte ein User Account verwendet werden. Sie sollten sich mit diesem User Account anmelden, die PDF2Printer Konfiguration sowie den Test der Drucker unter diesem User Account durchführen. Dieser Benutzer sollte dann auch für die PDF2Printer Dienst verwendet werden.  Damit kann sicher gestellt werden dass der PDF2Printer Dienst die gleichen Drucker verfügbar hat wie bei der Konfiguration über die Benutzeroberfläche.
  • <Kopien> = Anzahl der Kopien für den Ausdruck
  • <Graustufen> = true / false – Ob in Farbe oder in Graustufen gedruckt werden soll.
  • <Seitenbereich> = Einzelne Seiten mit Beistrich getrennt, von/bis mit dem Minuszeichen, bzw. bis zum Dateiende mit dem $ Zeichen: z.B. 1,3-4,10-$

Download – PDF2Printer –  Dienst um PDF´s automatisiert zu drucken >>>

PDFPrint .NET Komponente Version 1.3.6 – bestimmte Seiten / Seitenbereich drucken

Mit der PDFPrint .NET Komponente Version 1.3.6 gibt es jetzt die Möglichkeit nur bestimmte Seiten (einzelne Seiten, Seitenbereiche, alle Seiten bis zum Dokumentenende) des PDF Dokuments zu drucken

Funktionen:

  • Seitenbereiche – von / bis – durch das Minuszeichen: z.B. 6-8
  • Einzelne Seiten – mit Beistrich getrennt: z.B. 1,4,6-8
  • Alle Seiten ab einer bestimmten Seite bis zum Ende des Dokuments – durch das Dollar Zeichen: z.B. 1,4,6-8,10-$

Da alle unserer PDFPrint Produkte – PDFPrint-CL, FM, CS, PDF2Printer, eDocPrintPro PDFPrint Plugin – auf der PDFPrint .NET Komponente aufbauen, steht diese neue Funktion in allen neuen Versionen unserer PDFPrint Produkte automatisch zur Verfügung.

Download – PDFPrint –  Druckt PDF´s >>>

AutoOCR & AutoOCR light Version 2.0.41

Neuerungen AutoOCR & AutoOCR light 2.0.41:

  • Ziel-Dateiname /-Ordner über Variablen: Für den Ausgabedateiname und für den Ausgabeordner können jetzt auch einige Variablen verwendet werden. Die Konfiguration erfolgt in Feld für Ausgabe Dateinamen. Durch Verwendung von „\“ kann in dem Feld auch eine Ordnerstruktur angegeben werden, die unter dem ausgewählten Ausgabe Startordner angelegt wird.

  • Ausscheiden von PDF die bereits Text enthalten:  Durch die „intelligente“ OCR Verarbeitung kann zwar erkannt werden ob ein PDF eine OCR Verarbeitung erfordert oder nicht, dabei werden aber immer alle PDF aus den überwachten Eingangsordnern verarbeitet und im Zielordner ausgegeben. Will man aber nur PDF´s ausgeben die wirklich eine OCR Verarbeitung erfordern, so war diese Unterscheidung bisher nicht möglich. Durch  diese neue Option werden nur jene PDF im Ausgabefolder ausgegeben die wirklich OCR verarbeitet wurden. Alle anderen PDF´s werden je nach Konfiguration aus dem Eingangsfolder z.B,: gleich direkt in den Archivfolder verschoben und landen daher nicht im Ausgabefolder.

  • Defekten Text im PDF erkennen und korrigieren: Es kommt vor dass PDF zwar Text enthalten, dieser jedoch „defekt“ ist. Das Problem liegt in einer fehlerhaften Erstellung des PDF. Dabei werden Texte / Schriften falsch oder unvollständig codiert. Oft tritt das Problem auch auf falls ein bestehende PDF, aus einem Anzeigeprogramm, nochmals über eine PDF Druckertreiber ausdruckt wird um daraus wieder ein PDF zu generieren.

In diesem Fall kann man zwar den Text im PDF markieren und kopieren, der extrahierte Text ist jedoch nicht brauchbar und enthält nur Sonderzeichen und Hieroglyphen. Solche PDF´s können nicht sinnvoll weiterverarbeitet werden. Es können keine Informationen aus dem PDF gewonnen werden, das PDF kann nicht durchsucht werden und über Volltextsuche oder Suchmaschinen wird das Dokument nicht gefunden. Von außen kann das nicht erkannt werden. Das PDF kann ohne Fehlermeldung geöffnet, angesehen und ausgedruckt werden.

Die einzige Möglichkeit um solche PDF wieder herzustellen und den Text richtig zu codieren besteht durch OCR. Dabei wird das PDF bzw. nur die betroffene Seite „gerendert“ und der Text über die OCR Verarbeitung neu erzeugt.

AutoOCR Version Version  2.0.41 bietet diese Möglichkeit sowohl für die iOCR als auch für die OmniPage OCR-Engine. Dabei kann für jede Seite des PDF´s herausgefunden werden ob diese „defekten“ Text enthält oder nicht. Wird eine solche Seite erkannt so wird der Text über die OCR Funktion neu erzeugt, Seiten mit korrektem Text werden keiner weiteren OCR Verarbeitung unterzogen.

 

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>
Download – AutoOCR light – Low Cost OCR Server (ca. 410MB) >>>
Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 1200MB) >>>

eDocPrintPro free, PDF/A & ZUGFeRD Version 5.3.4 verfügbar

Neuerungen Version 5.3.4:

  • Die beiden im CAD Bereich oft benötigten Papierformate – DIN A0 und DIN A1 wurde in die Liste der Standardformate aufgenommen und stehen damit nach der Installation sofort zur Verfügung.

  • Bei der ESFX Profilverwaltung werden individuell angelegte Papierformate jetzt auch korrekt gespeichert, beim Laden der Profile wieder hergestellt und gehen nicht mehr verloren.

Download – eDocPrintPro free 64bit Version

Download – eDocPrintPro 64bit PDF/A & ZUGFeRD

Download GhostScript 9.53.3 64bit Setup

Download – eDocPrintPro 32bit Version 4.0.2

Download – eDocPrintPro 4.0.2 32bit (ca. 66 MB) >>>
Download – eDocPrintPro PDF/A & ZUGFeRD 32bit (ca. 105 MB) >>>
Download – GhostScript 9.27 MSI Setup – 32bit (ca. 26MB) >>>

PDFmdx Version 3.16.6

Neuerungen PDFmdx Vorlagen Editor:

  • Vorlagen / Template Gruppen: Um die Übersichtlichkeit und die Verwaltung bei einer umfangreichen Anzahl an Vorlagen / Templates zu ermöglichen wurde eine zusätzliche „Gruppen“ Ebene implementiert. Damit lassen sich Vorlagen in Gruppen zusammenfassen. Im PDFmdx Editor bilden die Gruppen die oberste Ebene in der Baumansicht. Gruppen können – angelegt, der Name geändert, gelöscht bzw. hinauf und hinunter verschoben werden. Vorlagen einer ausgewählten Gruppe können Gesamt oder Einzeln exportiert bzw. importiert werden. Vorlagen einer Gruppe können in eine andere oder neue Gruppe verschoben werden.

 

  • E-Mail – Konfiguration über Profile: In einem Template können jetzt mehrere E-Mail Konfigurationen angelegt werden. Die E-Mail Konfigurationen werden dabei über Profile mit Namen verwaltet. E-Mail Profile können angelegt, kopiert, umbenannt und gelöscht werden. Bei den E-Mail Bedingungen kann ein bestimmtes E-Mail Profil zugeordnet werden. Damit ist nicht nur die E-Mail Funktion selbst, sondern auch das zu verwendende E-Mail Profil über Bedingungen steuerbar.

 

  • E-Mail – Verwendung von Variablen für Anhänge: Bisher konnten nur fix auswählbare und damit vorgegebene Anhänge mit dem PDFmdx Hauptdokument per E-Mail verschickt werden. Jetzt ist es auch möglich Variable für den Pfad und Dateinamen der zusätzlichen Anhänge zu verwenden. Über eine Option kann festgelegt werden ob, falls ein Anhang nicht vorhanden ist bzw. nicht gefunden werden kann, das E-Mail trotz dem verschickt, oder ob das als ein Fehler behandelt werden soll. Bei der Konfiguration wird zuerst eine Datei ausgewählt, in die Liste eingefügt, anschließend editiert und um die Variablen ergänzt.

  • E-Mail – Hauptdokument immer als erster Anhang: Beim E-Mail Versand kann neben dem über PDFmdx erzeugten Hauptdokument auch weitere zusätzliche Anhänge verschickt werden. Jetzt wird das von PDFmdx erzeugte Hauptdokument immer als erster Anhang eingefügt, die anderen zusätzlichen Anhänge werden immer danach eingefügt.
  • Gleitende Gruppe über 2 Seiten: Bei manchen Belegen kann es vorkommen dass ein Datensatz einer gleitenden Gruppen auf einer Seite beginnt und sich auf der Folgeseite fortsetzt. Gleitende Gruppen wurden bisher nur über eine Bedingung (DG) für den Beginn der Gruppe identifiziert. Der Datensatz wird zwar erkannt, kann aber nicht vollständig ausgelesen werden, da sich ein Teil davon auf der Folgeseite befindet.  Um für solche Fälle auch die Information der Folgeseite zu erfassen sind mindestens zwei „DG“ Bedingungen mit OR / ODER Verknüpfung erforderlich. Eine für den Anfang und eine für den Rest des Datensatzes auf der Folgeseite. Damit wird der ganze Datensatz erkannt und verarbeitet auch wenn sich dieser auf getrennten Seiten befindet.

  • Metadaten als XLS: Manche nachgelagerte Anwendungen können nur das alte XLS und nicht das aktuelle XLSX Format verarbeiten. Deswegen wurde jetzt auch wieder das XLS Format für die Metadaten-Ausgabe implementiert.
  • Neue PDF Voransicht Funktionen – Anzeige Text Ebene / Anzeige Text Blöcke: Eine gescanntes PDF das über OCR durchsuchbar gemacht wurde besteht sowohl aus eine Bild- als auch aus einer Text-Ebene. Die Bildebene zeigt das nur das gescannte Dokument. Aus dieser Ansicht ist nicht zu erkennen ob, wo und welcher Text dahinter liegt. Es gibt jetzt in der PDFmdx Editor Voransicht sowohl die Möglichkeit nur die Textebene anzuzeigen und die Bildebene auszublenden, als auch bei jeder dieser Darstellungen die Möglichkeit die Umgrenzung der Text Blöcke als grüne Rechtecke darzustellen. Damit kann einfach und schnell ersichtlich gemacht werden, welcher Text vorhanden ist und wo genau sich die Textblöcke befinden.

 

  • Felder / Variablen – Ersetzen von Werten über XLSX Tabelle: Bisher konnte nur eine CSV Datei verwendet werden um die Werte von Feldern/Variablen zu ersetzen. Jetzt ist es auch möglich eine XLSX Datei zu verwenden. Konfiguriert wird der Name der Spalte für den Suchschlüssel sowie die Spalte für den Ersatzwert.

  • Zähler als Stempel-Variable: Für Text- oder Barcode-Stempel gibt es jetzt auch eine Zähler Variable.  Über eine Option kann konfiguriert werden, ob der Zähler bei mehrfach Verwendung innerhalb des Dokuments oder erst mit jedem neuen Dokument erhöht werden soll. Der Startwert kann ebenfalls vorgegeben werden.

 

  • Visuelle PDF Signatur – Unterstützung transparenter Bilddateien: Mit der aktuellen Version können für die visuelle Darstellung der PDF-Signatur auch transparente Bilddateien (PNG, TIFF) verwendet werden.
  • Vorlagen als PMDX Einzeldaten exportieren: Bisher konnten mehrere oder alle Vorlagen nur als eine einzige PMDX Datei exportiert werden. bzw. falls man mehrere oder bestimmte Vorlagen als Einzeldateien exportieren wollte, musste das für jede Vorlage einzeln erfolgen. Jetzt kann über eine Option aus einer Template Gruppe heraus, jede in der Gruppen enthaltene Vorlage auch einzeln als separate PMDX Datei exportiert werden. Als Dateiname wird der Vorlagen Name verwendet.

 

Neuerungen PDFmdx Verarbeitung:

  • Erkennen und Exportieren einer im PDF enthaltenen ZUGFeRD XML Datei: Beim PDFmdx Job kann diese Option aktiviert werden. Dabei wird vorab jede zu verarbeitende PDF Datei geprüft ob diese eine ZUGFeRD XML Datei enthält. Falls eine solche XML im PDF als Anhang enthalten ist so wird die XML aus dem PDF extrahiert und in den konfigurierten Ordner unter dem PDF-Namen mit der Endung *.XML gespeichert. Wurde die Option „Verschiebe PDF“ aktiviert, so wird auch das PDF in diesen Ordner verschoben und nicht von PDFmdx verarbeitet.

  • Alle Layouts automatisch aktivieren: Fügt man einer Vorlage ein neues Layout hinzu, so muss im PDFmdx Prozessor beim Job dieses Layout auch aktiviert werden. Dies musste bisher manuell gemacht werden und wurde manchmal „vergessen“, wodurch das neu angelegte Layout nicht erkannt wird.  Für eine Vorlage als auch bei der Job Konfiguration gibt es jetzt eine Option um alle Layouts automatisch zu aktivieren. Damit werden immer alle neu hinzugekommenen Layouts automatisch aktiviert und können so nicht mehr „vergessen“ werden.

 

  • Fehler Protokoll mit Kopfzeile: Um den Inhalt der einzelnen Spalten des Fehlerprotokolls (Error.csv) einfacher interpretieren zu können wurde eine Kopfzeile mit den Namen der Spalten eingefügt um einen Rückschluss auf die Information der Felder zu bekommen.

 

PDFmdx Korrekturen:

  • E-Mail HTML Body – Dateinamen für Bilder können jetzt auch Leerstellen enthalten.
  • Ankerfeld nicht gefunden – Verknüpfte Felder bleiben jetzt leer und bekommen keine Werte zugeordnet.
  • Fuzzy Anker Suchfunktion wurde verbessert.
  • Fehlermeldung – XLSX blockiert: Im Laufe der Zeit kann eine XLSX Metadaten Datei sehr umfangreich werden. So ist es vorgekommen dass das Öffnen und Schreiben dieser XLSX länger gedauert hat und mehrere Prozesse auf diese Datei zugreifen wollten. Dadurch kam es zu Fehlermeldungen, der Zugriff war nicht möglich da die XLSX von einem andere Prozess noch gesperrt war. Dieses Problem wurde behoben. Es sollte jedoch trotz dem auch darauf geachtet werden dass solche Metadaten Dateien nicht unnötig groß werden.
  • Gleitende Gruppe – Eine Erkennung war bei PDF mit „Display Rotation“ nicht möglich.

Download – PDFmdx Template Editor & Processor >>>

iPaper Client – Version 3.0.84 – Neue Aktionen implementiert

Neuerungen – iPaper 3.0.84:

  • Briefpapier als zusätzliche Aktion

Der iPaper Client kann ein PDF Briefpapier hinterlegen oder überlagern. Diese Funktion befindet sich auf dem „Briefpapier“ Tab und stellt eine wesentliche Grundfunktion von iPaper dar. Jetzt gibt es wie bei iPaper Server auch die Möglichkeit zusätzliche „Briefpapier“ Aktionen, einfach oder auch mehrfach in die Aktionsliste einzufügen. So lassen sich bei der Verarbeitung nicht nur ein einziges, sondern auch mehrere „Briefpapiere, Wasserzeichen oder Stempel“ auf ein Dokument anwenden.

 

  • Reihenfolge der Briefpapiere in der Auswahlliste festlegbar

Damit ist es möglich die Reihenfolge in der die Briefpapiere in der Auswahlliste erscheinen zu verändern und frei festzulegen. In einer Liste können die Briefpapiere auf / absteigend sortiert nach Name / Erstellungs- bzw. Änderungs-Datum angezeigt, sowie hinauf bzw. hinunter verschoben werden. Damit kann man sich, zur schnelleren Auswahl, bei umfangreichen Auswahllisten die am meisten verwendeten Briefpapiere am Beginn der Liste zusammenfassen.

   

  • PDF/A bzw. ZUGFeRD als eigenständige Aktion

Bisher war die PDF/A / ZUFGeRD eine generelle Funktion der Anwendung und nicht als eigenständige Aktion implementiert. Damit wird die PDF/A bzw. ZUGFeRD Ausgabe wie alle anderen Aktionen über Profile verwaltbar, Aktionsprofile und damit jetzt auch die PDF/A Funktion lassen sich mit einem Briefpapier verknüpfen, bzw. kann iPaper mdx zur Auswahl eines Aktionsprofils verwenden werden.  Das die PDF/A Konvertierung nur einmal und auch nur zu einem bestimmten Zeitpunkt ausgeführt werden darf, kann die PDF/A Aktion nur einmal eingefügt und die Abfolge nicht frei festgelegt werden, sie wird immer am Ende der Liste eingefügt.  Die ZUGFeRD XML kann nach dem erfolgreichen Einbetten in das PDF durch die Aktion auch gleich gelöscht werden.

 

  • Neue Aktion – Definition von Variablen

Neu hinzugekommen ist auch eine „Variablen“ Aktion. Damit können Variablen festgelegt und einen Vorgabewert zugeordnet erhalten. Die Variablen können dann in anderen Aktionen z.b. in der „Email“ bzw. „Speichern unter“ Aktion als Parameter abgerufen und verwendet werden. Bei der Definition wird ein Name vergeben bzw. ein Vorgabewert zugeordnet. Variablen lassen sich auch durch eine externe Variablendatei (*.var,*.txt) mit Werten belegen. Damit können Werte aus anderen Anwendungen als Parameter an Paper Aktionen übergeben werden.  Eine externe Variablendatei lässt sich auch automatisch nach Ausführen der Verarbeitung löschen.

Um Variablen aus einer externen Datei zu lesen wird der Name der Variable und ein Standard-Vorgabewert in die Liste der Aktion eingefügt. In der externen *.var / *.txt Datei kann dann dieser Vorgabewert extern festgelegt und überschrieben werden. Dabei wird pro Variable eine Zeile mit <Variablenname>=<Wert> z.b. „Test=4711“ eingefügt. Damit bekommt die Variable „Test“ (%Var.Test%) den Wert „4711“.

   

  • Neue Aktion – PDF-Komprimierung und Optimierung

Über die neue Standard Aktion „Komprimieren“ ist verfügt iPaper jetzt auch über die Möglichkeit PDF´s zu komprimieren und zu optimieren, um möglichst kompakte PDF Dateien zu erzeugen. Speziell PDF Dateien die Scans oder Bilder lassen sich damit stark verkleinern. Neben der möglichen Reduktion der Auflösung der Bilder kommt dabei auch die bestmögliche PDF Komprimierungen (JPEG2000 / JBIG2) zur Anwendung.  Das Ergebnis sind kleinere, kompaktere und optimierte PDF Dateien.

 

  • Funktionen der Aktions Profile

Aktions Profile können – Neu angelegt, Kopiert, Umbenannt, Gelöscht bzw. als XML Datei exportiert bzw. wieder importiert werden. Die XML Dateien der exportierten Aktionsprofile kann auch direkt als Vorlage für die externe iPaper XML Steuerung (über externe Datei bzw. über die Druckausgabe)  verwendet werden. Damit kann eine manuelle Kodierung der XML über einen Editor entfallen. Alle Konfigurationen können interaktiv über die iPaper Benutzeroberfläche in den Aktionen erfolgen um diese dann als XML zu exportieren. Das ist wesentlich einfacher und sicherer, als die manuelle Kodierung über einen Editor mit Hilfe der iPaper XML Syntax.

 

  • API / .NET Programmierschnittstelle

Die API dient dazu um aus externen Anwendungen heraus bestimmte iPaper Funktionen abfragen und setzen zu können bzw. um die Verarbeitung einer vorhandene PDF Datei durch iPaper zu starten.  Um die iPaper API verwenden zu können muss diese zuerst im iPaper Client unter den „Allgemeinen Einstellungen“ aktiviert werden. Für die Verwendung der API aus einer externen Anwendung ist die „iPaper.Interface.dll“ sowie der installierte und gestartete iPaper Client erforderlich. Zur Demonstration der zur Verfügung stehenden Funktionen stehen zwei .NET / C# Demo & Test Anwendungen im Sourcecode sowie als ausführbare als EXE zur Verfügung.

iPaper 3.x Client Version

Download GhostScript 9.53.3 64bit Setup