Monat: Juni 2019

ZFMerge – ZUGFeRD PDF und weitere PDF´s zu einer ZUGFeRD Gesamtdatei zusammenfügen

ZUGFeRD ist ein anerkannter und immer öfter verwendeter Standard für elektronische Rechnungen.

Wird z.B. aus einem ERP System eine ZUGFeRD konforme Rechnung mit eingebettetem XML erzeugt so kann es je nach Kunde erforderlich sein weitere Belege (z.B: eine Leistungsaufstellung) die nicht über das ERP System erstellt wurden, mit anzuhängen. Es muss also ein neues ZUGFeRD konformes Gesamt-PDF erzeugt (zusammengefügt) werden das die XML der Ursprungs-Rechnung und alle anderen Dokumente enthält.

ZFMerge – Funktionen:

  • Erzeugt ZUGFeRD konforme PDF/A-3b Gesamtdateien.
  • Ausgangsdatei enthält bereits eine ZUGFeRD XML. Der ZUGFeRD Level und Profile werden übernommen.
  • Weitere PDF Dateien können ausgewählt und hinzugefügt werden, die Reihenfolge ist änderbar.
  • Pfad / Name der neuen ZUGFeRD Gesamtdatei wird ausgewählt.
  • ZUGFeRD bzw. PDF/A-3b konforme PDF wird erzeugt auch wenn die Ausgangsdateien nicht dem PDF/A Standard entsprechen.

Download – ZFMerge Testanwendung >>>

Neue OmniPage OCR Engine für AutoOCR & AutoOCRLight ab 2.0.7

Vorteile der OmniPage OCR:

  • Erkennungsgenauigkeit auf höchstem Niveau auch bei schwierigen Dokumenten
  • Schnellste OCR Verarbeitung – wesentlich schneller und performanter als alles was wir bisher getestet und implementiert haben. 1-2 Sekunden um ein durchsuchbares PDF pro Seite zu erzeugen sind möglich.
  • Kostengünstig – 25.000 Seiten Lizenz mit geringeren Lizenzkosten als die bisherige 10.000 Seiten Abbyy Lizenz
  • Einfacheres Freischalten der (Demo)Lizenz – Die OmniPage OCR Engine kann über unseren Lizenzserver inkl. 30 Tage Demoversion zusammen mit der Basisanwendung aktiviert werden.

Zu beachten ist dass die OmniPage OCR Engine aus lizenzrechtlichen Gründen nur auf Client Betriebssystemen – Windows 7 / 10  nicht jedoch auf Microsoft Server 2008, 2012, 2016 oder 2019 installiert werden kann. Das Setup lässt sich nur unter Windows 7 / 10  ausführen. Hinsichtlich Performance und Stabilität ist das kein Nachteil. OCR Prozesse sind rechenintensiv und sollten für einen optimalen Durchsatz auf einer eigenen Hardware (z.b. Intel NUC) mit möglichst vielen CPU Cores und SSD Disk ausgeführt werden.

Die OmniPage OCR Engine kann für AutoOCR bzw. AutoOCRLight ab der Version 2.0.7 als Option zusätzlich zur iOCR (Tesseract OCR) lizenziert werden und ist im AutoOCR Setup bereits enthalten. Für AutoOCRLight kann die OmniPage OCR separat heruntergeladen und installiert werden.

Download – OmniPage OCR Engine als Option für AutoOCRLight (ca. 235MB) >>>

Download – AutoOCRLight – Low Cost OCR Server (ca. 410MB) >>>

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>

eDocPrintPro PDF/A – Version 3.29.0 – unterstützt den E-Rechnungs Standard ZUGFeRD 2.0 / EN 16931 / Factur-X 1.0

Die eDocPrintPro Version 3.29.0 unterstützt jetzt auch die aktuellen E-Rechnungs Standards – ZUGFeRD 2.0 / EN 16931 und Factur-X 1.0. Diese basieren auf PDF/A-3 wobei die Rechnungsdatensätze als XML Datei in das PDF als Dateianhang eingebettet werden.

Funktionen:

  • Auswahl des E-Rechnungs Standards – ZUGFeRD 1.0 / 2.0 / EN 16931 / Factur-X 1.0
  • Auswahl eines durch den Standard unterstützen Profils (MINIMUM, BASIC WL, BASIC, EN 16931, EXTENDED)
  • Voreingestelltes (Pfad, Name) XML verwenden / XML per Dateidialog auswählen
  • XML nach dem Einbetten in das PDF automatisch löschen (Ja / Nein)

Voraussetzung:  Eine nach dem ausgewählten Standard und Profil valide XML Datei muss vor dem Druckvorgang bereits fertig vorhanden sein. Die XML Datei wird nicht aus den Druckdaten gewonnen.

Download – eDocPrintPro PDF/A & ZUGFeRD

GhostScript 9.27 Setup

PDF2PDFA und der E-Rechnungs Standard ZUGFeRD 2.0 / EN 16931 / Factur-X 1.0

ZUGFeRD 2.0 / EN 16931 / Factur-X:

Wichtige Voraussetzungen für eine Akzeptanz elektronischer Rechnungen sind vor allem die Verwendung eines standardisierten Datenformats und die rechtlichen Rahmenbedingungen, an denen sich sowohl Versender als auch Empfänger orientieren können.

Die EU hat im Juni 2017 mit der europäische Norm EN 16931 ein Standardformat für elektronische Rechnungen geschaffen. Das Ziel dieser EU-Norm: Der elektronische Rechnungsaustausch soll europaweit vereinheitlicht und rechtlich sichergestellt werden.

Der bisherige ZUGFeRD-Standard 1.0 musste auf die neue Norm angepasst werden. ZUGFeRD 2.0 (veröffentlicht am 11. März 2019), entstand im Rahmen einer deutsch-französischen Zusammenarbeit, in enger Abstimmung mit dem französischen Standard Factur-X 1.0 und ist mit diesem technisch identisch.  Mittels ZUGFeRD 2.0 lassen sich E-Rechnungen erstellen die den EU-Standard EN 16931 und die EU-Richtlinie 2014/55/EU erfüllen. Details rund um die elektronische Rechnung finden Sie auch auf den Seiten der EU-Kommission. ZUGFeRD 2.0 setzt zudem auf dem globalen Standard UN/CEFACT XML in der Ausprägung Cross Industry Invoice auf. Damit könnte sich mit ZUGFeRD 2.0 sogar eine weltweite Perspektive ergeben.

Die neue ZUGFeRD-Version 2.0 kombiniert genauso wie die Version 1.0 eine PDF/A-3-Datei der Rechnung (visuelle Darstellung der Rechnungsdaten als digitales Format anstelle der klassischen Papierrechnung) mit einer Rechnungsdatei im XML-Format, die in das PDF/A3-Dokument eingebettet ist.

ZUGFeRD 2.0 Profile:

Bei ZUGFeRD 2.0 sowie Factur-X sind mehrere Profile vorgesehen. Das Profil «EN 16931» löst das ZUGFeRD-1.0-Profil «Comfort» ab und entspricht vollständig der EU-Norm, die jedoch nur die Kernelemente einer Rechnung festlegt. Mit dem Profil «Extended» können in einer elektronischen Rechnung zusätzliche Angaben erfasst werden, etwa nach Branche oder nach gesetzlichen Vorgaben. Darüber hinaus wurden mit «Basic» und «Basic WL» zwei weitere Profile für kleinere Lieferanten festgelegt.

ZUGFeRD eignet sich für Organisationen aller Größen und erhält dank der EN-16931-Konformität eine erweiterte, internationale Bedeutung. Das Profil «EN 16931» wird von allen europäischen Verwaltungen anerkannt. Seit November 2018 sind E-Rechnungen im Business to Government (B2G) -Verkehr in der EU vorgeschrieben.

Mit der Version 1.2.0 der PDF2PDFA Konverter Komponente können aus einer PDF und der entsprechenden XML jetzt auch ZUGFeRD 2.0 und Factur-X Dokumente erzeugt werden.

Download – Demo & Testanwendung – PDF2PDFA Konverter >>>

PDFmdx – Positionsdaten über Gruppen- / Untergruppenfelder auslesen

PDFmdx kann neben Dokumentenfeldern auch Positionsdaten auslesen. Positionsdaten sind Listen oder Tabellen mit Zeilen und Spalten. Diese finden sich typischerweise auf Rechnungen um mehrere Positionen im Beleg anzuführen. Wir verwenden dafür den Begriff einer „gleitenden Gruppe/Untergruppe“. Dabei werden ein oder mehrere Spalten (=Felder) über eine oder mehrere Zeilen auf einer oder mehreren Seiten in einem vertikal festgelegten Bereich gesucht und ausgelesen.

Ab der PDFmdx Version 3.5.0 gibt es eine 2-stufige Struktur wo neben der Gruppen auch eine Untergruppen Ebene möglich ist. Es können also zu einem Gruppen-Datensatz ein oder mehrere Untergruppen-Datensätze erkannt und ausgelesen werden. Belege mit 2-stufige Positionsdaten gibt es z.B. bei Textilien oder bei Bekleidung wo es zu einem Artikel (Nummer, Beschreibung) auch eine „Unterebene“ mit Größen bzw. Farbangaben geben kann. Der Artikel selbst wird nur einfach angeführt und in der Ebene darunter finden sich dann  die Mengen / Preise zu einzelnen Ausprägungen.

Zweistufiges Auslesen von Positionsdaten:

  • „Dokumenten/Gruppen/ Untergruppen“ Felder definieren die Erkennungsebene.

  • Ein über 2 rote horizontale Begrenzungslinien festgelegter Bereich wird auf allen Seiten des Dokuments nach den Gruppen- (rote Felder) sowie Untergruppen-Datensätzen (grüne Felder) abgegescannt.

  • Über die festgelegten Bedingungen werden die Gruppen- (G) sowie die zugehörigen Untergruppen- (U) Datensätze identifiziert und ausgelesen.

  • Zusammen mit den Datensätzen der untersten Ebene stehen auch die Informationen der Gruppen- und der Dokumentenfelder zur Verfügung.

Für Tests und als Ausgangspunkt für eigene Versuche haben wir zwei Beispiel-Vorlagen mit PDF-Testdateien erstellt. Die *.pmdx Vorlagen müssen nur per Drag&Drop in den PDFmdx Editor importiert und der Ausgabepfad gegebenenfalls angepasst werde. Für die Verarbeitung ist es dann noch erforderlich im PDFmdx Prozessor ein Job mit Eingangs- und Error-Folder anzulegen und die beiden Test-Vorlagen für den Job auszuwählen.

Download – PDFmdx – Vorlagen und Beispiele für zweistufiges Auslesen von Positionsdaten >>>
Download – PDFmdx Template Editor & Processor >>>

PDFmdx Version 3.5.3 verfügbar

Neuerungen PDFmdx Version 3.5.3:

  • Feld / Bereichs OCR / Bereich invertieren / OCR immer ausführen:

Normalerweise werden für die PDFmdx Verarbeitung PDF Dateien als Input verwendet die bereits Text enthalten – entweder „normale“ PDF oder gescannte PDF die über einen vorangegangenen OCR Prozess (z.b. über AutoOCR oder FileConverterPro) eine zusätzliche Textebenen erhalten haben.

PDFmdx verfügt auch über eine integrierte OCR Funktion um den Text in den Bereichen der positionierten Feldern aus der Bildinformation ermitteln zu können.

Bei den allgemeinen PDFmdx OCR Einstellungen gibt es die Möglichkeit festzulegen wie die Texte aus dem PDF gewonnen werden sollen – „Original“, „OCR“ oder „SmartOCR“. Bei „Original“ wird der Text immer aus dem PDF genommen, bei OCR – wird der Text immer über einen PDFmdx OCR Vorgang gewonnen, auch falls bereits ein Text im PDF vorhanden ist. Bei der „SmartOCR“ Einstellung wird die PDFmdx OCR Funktion nur ausgeführt falls im PDF noch kein Text vorhanden ist, ansonsten wird der im PDF vorhandene Text genommen. Diese Einstellungen gelten generell für die ganze Vorlage und alle damit verbundenen Layouts.

In dem Zusammenhang gibt es jetzt 2 neue Funktionen die es ermöglichen weißen Text auf schwarzem Hintergrund zu erkennen.

Einzelne Bereiche mit Text in weißer Schrift auf schwarzen Hintergrund können über einen automatischen OCR Vorgang nicht erkannt werden, da vor dem OCR Vorgang der Bereich invertiert werden müsste um erkannt werden zu können. Das kann nur interaktiv erfolgen in dem der zu Bereiche manuell ausgewählt wird.

Im PDFmdx Editor gib es jetzt die Möglichkeit bei der Feldkonfiguration die Option „Bereich invertieren“ zu aktivieren. Dabei wird für die OCR Verarbeitung der Feldbereich invertiert. Dadurch entsteht schwarze Schrift auf weißem Hintergrund welche durch die OCR erkannt werden kann.

In dem Zusammenhang gibt es eine weitere neue Feldfunktion „OCR immer ausführen“ – Damit kann die generelle Einstellung „SmartOCR“ übersteuert werden. Die OCR Erkennung wird dann für dieses Feld immer ausgeführt, auch wenn bereits ein darunterliegender Text vorhanden ist.

  

  • PDFmdx Editor – Bedingung suchen, Layout aufrufen: Es gib jetzt eine Suchfunktion um in den Bedingungen nach einem (Teil)String zu Vorwärts und Rückwärts zu suchen. Damit kann eine Zeile in den Bedingungen direkt angesprungen werden. Aus der Bedingungszeile kann dann auch das verknüpfte Layout direkt aufgerufen werden. Diese Funktion erleichtert die Arbeit mit einer großen Zahl an Bedingungen.

  • Die Web-Service Funktionen wurden überarbeitet, im Web-Service Beispiel können die Metadaten jetzt auch als XML heruntergeladen werden.
  • Bei der Metadaten XML wurden die neu hinzugekommenen Variablen JobID, JobName, JobDescription und ProzessID ergänzt.

Download – PDFmdx Template Editor & Processor >>>

Webshop