eDocPrintPro – XML Plugin – PDF Textinformationen als XML exportieren

Mit dem neuen eDocPrintPro XML Plugin kann die in der erzeugten PDF Datei enthaltenen Textinformation als strukturierte XML Datei ausgegeben werden.

Die XML Datei enthält folgende Information:

  • Name und Ablagepfad der PDF Datei
  • Einheit der Positions- und Größeninformaiton (mm / inch / Punkt)
  • Seitennummer / Seitengröße
  • Textstring
  • Umschreibende Box für den Textstring – Startposition / Höhe / Breite in mm/inch/Punkt

Auf Basis dieser strukturierten Information können weitere Auswertungen bzw. Verarbeitungsschritte angestoßen und ausgeführt werden.

Die XML Information kann verwendet werden um z.B.:

  • E-Mail Adressen oder Fax-Nummern auszulesen,
  • an Hand der Information zu erkennen um welchen Dokumententyp es sich handelt,
  • die Info bestimmter Bereiche als Metadaten für die Archivierung zu verwenden,
  • festzustellen bei welchen Seiten ein mehrseitiges Dokument in Einzeldokumente getrennt werden soll.

Extract Text information as XML from PDF PDF Textinformation als XML XML aus PDF - liefert Informationen über Position und Größe der Textbox der Teststrings

Download – eDocPrintPro – XML Plugin für 32bit OS >>>
Download – eDocPrintPro – XML Plugin für 64bit OS >>>