AutoOCR – PDF News – PDF/A, GRATIS PDF Druckertreiber, Archiving, OCR, DMS, Documentmanagment, Scan to PDF, ECM, PDF Convert, Free PDF printerdriver, SDK, API, PDF softwaredevelopment

Kategorie: AutoOCR

AutoOCR 2.1.1 letzte Version vor der Änderung der PAM AppID

2023-09-26

Ab AutoOCR / AutoOCR-light Version 2.1.5 gibt es eine neue PAM AppID: AutoOCR = 4AO / AutoOCR-light = 4AL. Kunden mit aktiver Wartung können jederzeit die aktuelle Verison 2.1.5 einsetzen. Sie erhalten von uns für diese PAM AppID die Lizenz eingetragen. Kunden ohne aktiver Wartung können nur jene Version einsetzen welche beim Kauf der Software aktuell verfügbar war.

Aus diesem Grund kann es erfoderlich sein wieder auf eine vorhergende Version z.b.: Version 2.1.1 zurück gehen zu müssen – wie geht das:

AutoOCR / AutoOCR-light Dienst stoppen und AutoOCR Userinterface beenden
AutoOCR / AutoOCR-light deinstallieren
vsOCR deinstallieren – Das ist wichtig ansonsten funktioniert die Version 2.1.1 nicht falls die neue vsOCR noch auf dem Rechner vorhanden ist.
AutoOCR / AutoOCR-light Version 2.1.1 herunterladen und installieren

Einstellungen und Lizenz bleiben erhalten. Falls ein User Account für den AutoOCR / AutoOCR-light Dienst (User/Domain/Passwort) verwendet wurde muss dieser neu konfiguriert werden.

Download – AutoOCR Version 2.1.1 >>>
Download – AutoOCR-light Version 2.1.1 >>>

AutoOCR & AutoOCR-light Version 2.1.5

2023-09-07

Neuerungen AutoOCR Version 2.1.5:

Neue Version der PDF2PDFA Konverter Komponente

Neue PAM Anwendungs ID für AutoOCR = 4AO. Erfordert die Neuaktivierung einer bestehender Installation, falls auf die AutoOCR Version 2.1.5 oder eine Nachfolgeversion upgedated wird. Kunden mit bestehender Softwarewartung erhalten die dafür erfoderliche neue Lizenz automatisch eingetragen. Die neue 4AO Lizenz kann über die PAM Funktion – „Activate Application“ mittels der vorhandene Kunden-ID / Passwort abgerufen werden.

Neue PAM Anwendungs ID für AutoOCR-light = 4AL. Erfordert die Neuaktivierung einer bestehender Installation, falls auf die AutoOCR-light Version 2.1.5 oder eine Nachfolgeversion upgedated wird. Kunden mit bestehender Softwarewartung erhalten die dafür erfoderliche neue Lizenz automatisch eingetragen. Die neue 4AL Lizenz kann über die PAM Funktion – „Activate Application“ mittels der vorhandene Kunden-ID / Passwort abgerufen werden.

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 670MB) >>>
Download – AutoOCR light – Low Cost OCR Server (ca. 670MB) >>>
Download – GenOCR – OCR Testanwendung für iOCR (ca. 680MB) >>>
Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 1200MB) >>>

AutoOCR & AutoOCR-light Version 2.1.1

2023-07-04

Neuerungen AutoOCR & AutoOCR-light 2.1.1:

Anzeige der aktuell bearbeiteten Datein: In der Statuszeile werden jetzt zusätzliche Informationen über die aktuell in Bearbeitung befindlichen Dateien angezeigt.

Angezeigt wird:

- Anzahl der Dateien die auf die in der Warteschlange auf die Verarbeitung warten.
- Anzahl der seit dem Start bereits verarbeiteten Dateien.
- Anzahl der Fehler.
- Aktueller Status der Verarbeitung.
- Anzahl der parallen Verarbeitungen (Threads).
- Nummer des Prozesses der Einzeldatei in Bearbeitung.
- Name des Jobs / Folders aus dem die Einzeldatei stammt.
- Startzeit der Verarbeitung der Datei.
- Pfad / Name der in Bearbeitung befindlichen Datei.

Anhänge in PDF Dateien erhalten: PDF Dateien die OCR verarbeitet werden sollen, können auch im PDF eingebettete beliebige Dateianhänge enthalten. Mit dieser neuen Option wird vorher geprüft ob die Eingangsdatei solche Anhänge enthält und fügt diese dann nach der OCR Verarbeitung wieder ein,

ZUGFeRD Kompatibilität erhalten: ZUGFeRD PDF Dateien enthalten einer XML Datei als Anhang, sind PDF/A-3b konform und entsprechen dem ZUGFeRD Standard für elektronische Rechnungen. Mit dieser Option kann der ZUGFeRD Standard bei der Verarbeitung erhalten bleiben. Ist die Eingangsdatei bereits ZUGFeRD kompatibel, so bleibt sie es auch nach der OCR Verarbeitung.

Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>
Download – AutoOCR light – Low Cost OCR Server (ca. 410MB) >>>
Download – iOCR (vsOCR) Setup – zusätzliche Sprachen (ca. 1200MB) >>>

AutoOCR & AutoOCR-light Version 2.0.41

2021-11-22

Neuerungen AutoOCR & AutoOCR-light 2.0.41:

Ziel-Dateiname /-Ordner über Variablen: Für den Ausgabedateiname und für den Ausgabeordner können jetzt auch einige Variablen verwendet werden. Die Konfiguration erfolgt in Feld für Ausgabe Dateinamen. Durch Verwendung von „\“ kann in dem Feld auch eine Ordnerstruktur angegeben werden, die unter dem ausgewählten Ausgabe Startordner angelegt wird.

Ausscheiden von PDF die bereits Text enthalten: Durch die „intelligente“ OCR Verarbeitung kann zwar erkannt werden ob ein PDF eine OCR Verarbeitung erfordert oder nicht, dabei werden aber immer alle PDF aus den überwachten Eingangsordnern verarbeitet und im Zielordner ausgegeben. Will man aber nur PDF´s ausgeben die wirklich eine OCR Verarbeitung erfordern, so war diese Unterscheidung bisher nicht möglich. Durch diese neue Option werden nur jene PDF im Ausgabefolder ausgegeben die wirklich OCR verarbeitet wurden. Alle anderen PDF´s werden je nach Konfiguration aus dem Eingangsfolder z.B,: gleich direkt in den Archivfolder verschoben und landen daher nicht im Ausgabefolder.

Defekten Text im PDF erkennen und korrigieren: Es kommt vor dass PDF zwar Text enthalten, dieser jedoch „defekt“ ist. Das Problem liegt in einer fehlerhaften Erstellung des PDF. Dabei werden Texte / Schriften falsch oder unvollständig codiert. Oft tritt das Problem auch auf falls ein bestehende PDF, aus einem Anzeigeprogramm, nochmals über eine PDF Druckertreiber ausdruckt wird um daraus wieder ein PDF zu generieren.

In diesem Fall kann man zwar den Text im PDF markieren und kopieren, der extrahierte Text ist jedoch nicht brauchbar und enthält nur Sonderzeichen und Hieroglyphen. Solche PDF´s können nicht sinnvoll weiterverarbeitet werden. Es können keine Informationen aus dem PDF gewonnen werden, das PDF kann nicht durchsucht werden und über Volltextsuche oder Suchmaschinen wird das Dokument nicht gefunden. Von außen kann das nicht erkannt werden. Das PDF kann ohne Fehlermeldung geöffnet, angesehen und ausgedruckt werden.

Die einzige Möglichkeit um solche PDF wieder herzustellen und den Text richtig zu codieren besteht durch OCR. Dabei wird das PDF bzw. nur die betroffene Seite „gerendert“ und der Text über die OCR Verarbeitung neu erzeugt.

AutoOCR Version Version 2.0.41 bietet diese Möglichkeit sowohl für die iOCR als auch für die OmniPage OCR-Engine. Dabei kann für jede Seite des PDF´s herausgefunden werden ob diese „defekten“ Text enthält oder nicht. Wird eine solche Seite erkannt so wird der Text über die OCR Funktion neu erzeugt, Seiten mit korrektem Text werden keiner weiteren OCR Verarbeitung unterzogen.

AutoOCR & AutoOCR light Version 2.0.36

2021-03-30

Neuerungen AutoOCR & AutoOCR light 2.0.36:

iOCR – Bilder unverändert erhalten: Ist diese neue Standardoption aktiv, so wird das PDF nur intern für den OCR Vorgang gerendert. Das Ursprungs-PDF und die darin enthaltenen Bilder werden 1:1 in das zu erzeugende PDF übernommen. Durch den OCR Vorgang wird nur der erkannte Text eingefügt. Die Bilder bleiben hinsichtlich ihrer Auflösung, Farbtiefe und Komprimierung unverändert erhalten.

Das hat insofern auch Bedeutung da viele MFP-Scanner bereits in der Lage sind hoch optimierte und sehr kompakte PDF Farbscans über MRC (Mixed Raster Content) zu erzeugen. Dabei werden Farbdokumente bereits durch den Scanner in unterschiedliche Ebenen aufgeteilt. Jede Bildebene wird je nach Farbtiefe mit einer andere Auflösung und mit der bestmöglichen Komprimierung erzeugt. Werden solche MRC PDF Dateien nochmals gerendert werden so geht die MRC Datenstruktur verloren. Die Ergebnisdatei wäre größer und würde an Qualität verlieren.

Installiert und verwendet die iOCR / vsOCR – Version 1.1.6 mit dem Basisset der in Europa gebräuchlichsten Sprachen.

Über ein zusätzliches iOCR / vsOCR Setup (1,2GB groß) können alle von iOCR unterstützte Sprachen installiert werden.

Aktualisierung der AutoOCR Basiskomponente – iOCR, ImageProcessing, PDFCompressor, PDF2PDFA auf den aktuellen Stand.

Neue Voreinstellungen bei der JPEG2000 Komprimierung – für PDF-Rendering / ImageProcessing / PDFCompressor – um möglichst kleine PDF Dateien ohne große Einbußen hinsichtlich der Darstellungsqualität zu erzeugen.

- Hohe / Mittlere / Geringe – Komprimierung
- Farbe – 1:60 / 1:30 / 1:15
- Graustufen – 1:30 / 1:15 / 1:13

Je höher der Wert – desto höher ist auch die Komprimierung, womit um so kleinere Dateien, mit jedoch auch abnehmender Bildqualität erzeugt werden. Als Standardwert ist die „Mittlere“ Komprimierung voreingestellt.

DropOCR 1.5.0 – EMail Versand integriert

2020-12-10

DropOCR legt die konvertierten PDF Dokumente in einem konfigurierten Ordner ab. Jetzt ist es auch möglich eine EMail Nachricht zu erzeugen und die erzeugten PDF´s direkt als Anhang einzufügen. Je nach Konfiguration kann die EMail Nachricht auch direkt ohne Benutzerinteraktion per SMTP verschickt werden.

DropOCR EMail Funktionen:

Vorbelegen der EMail Empfänger (An, Cc, Bcc).
Dokument nach EMail Adressen durchsuchen und für den Versand verwenden.
Vorbelegen des Betreffs. Dabei kann auch der Dokumenteninhalt über Delimiter nach einem zu verwendenden Betrefftext durchsucht werden.
Vorbelegen der EMail Nachricht mittels integriertem HTML Editor.
Anhänge über Pfad & Namen mittels Delimiter im Dokument suchen und anhängen.
Weitere mit zu sendende Dateien als Anhang einfügen.
Konfiguration der EMail Transport Methode (MS-Outlook, MAPI, SMTP).
Logging der EMail Vorgänge.

Download – DropOCR Web-Service Client für AutoOCR >>>

AutoOCR-CL – Version 1.1.8 – OCR Kommandozeilen Anwendung

2020-10-28

Neuerungen AutoOCR-CL Version 1.1.8:

Mit der Version 1.1.8 wurden die Funktionen der Kommandozeilen Version auf den gleichen Funktionsumfang wie die des AutoOCR Servers gebracht. AutoOCR-CL wurde um eine vorgelagerte Bildverarbeitung, die PDF Komprimierung sowie die Erzeugung von PDF/A konformen Ausgabedateien erweitert.

Bildverarbeitung: Diese Funktion ist im Standardumfang enthalten und dient der Vorverarbeitung von gescannten Dokumenten, insbesondere für die iOCR Engine. Für die Omnipage Engine sollte vorzugsweise die bereits enthaltene Bildverarbeitung verwendet werden. Keinesfalls sollten beide Bildverarbeitungen aktiviert werden da damit die OCR Erkennungsrate reduziert wird.

PDFCompressor: Optional zu lizenzieren. Dient dazu um möglichst kompakte und kleine Ausgabedateien zu erzeugen. Um eine gute OCR Qualität zu erreichen ist eine Scanauflösung bei Farbe von 200/300dpi bzw. bei SW von 300dpi erforderlich. Für die Anzeige bzw. den Ausdruck reichen aber bei Farbe z.b. 150dpi. Der PDFCompressor ermöglicht es die Komprimierung, die Qualitätseinstellungen und die Auflösung der Bilder anzupassen und zu reduzieren. Eine Reduktion durch den PDFCompressor hat keinen Einfluss auf die OCR Erkennungsqualität.

PDF2PDFA Konverter: Optional zu lizenzieren. Erzeugt PDF/A konforme Ausgabedateien.

Download – AutoOCR-CL – Kommandozeilen Anwendung für AutoOCR >>>
Download – Readme / Help – AutoOCR-CL >>>

AutoOCR & AutoOCR light Version 2.0.30 – JPEG2000 Komprimierung erzeugt kompakte PDF Dateien

2020-10-22

Farbscans erzeugen meist recht große Dateien, Bei 300dpi, Farbe werden bei der JPEG Komprimierung ca. 300kB an Speicherplatz pro Seite benötigt. Um möglichst kleine, kompakte PDF-Ausgabedateien zu erzeugen wurde für AutoOCR / iOCR die JPEG2000 Komprimierung verbessert und um einen zusätzlichen Parameter erweitert. Durch diese JPEG2000 Komprimierung lässt sich die Größe der im PDF enthaltenen Farbbilder erheblich reduzieren womit die durchsuchbaren PDF-Dateien wesentlich kleiner werden. Die JPEG2000 Komprimierung hat keinen Einfluss auf die OCR Erkennungsrate.

Bei JPEG2000 steht die „verlustfreie“ als auch die „verlustbehaftete“ Komprimierung zur Verfügung. Normalerweise sollte man um kleine Dateien zu erzeugen die „lossy“ (verlustbehaftete) JPEG2000 Komprimierung verwenden – Dabei gibt es einen zusätzlichen Parameter (Verh.: 1 bis 999) mit dem die Komprimierungsrate und damit die Größe und visuelle Qualität gesteuert werden kann.

In der nachfolgenden Tabelle wurde ein Test mit verschiedenen Einstellungen für die JPEG / JPEG2000 Komprimierung gemacht um zu sehen welche Auswirkungen diese Parameter auf die PDF Dateigröße haben. Als Ausgangsdatei wurde ein Scan, 300dpi, 24Bit Farbe, JPEG Komprimierung, 7 Seiten mit 2082kB, verwendet.

Daran kann man erkennen dass man mit JPEG2000 je nach Parameter eine Reduktionen der Dateigröße zwischen 30 und 80% erreichen kann.

JPEG2000 / lossy / 75-100 = Hohe Qualität / größere Dateien – 32-49% Reduktion
JPEG2000 / lossy / 125-150 = Mittlere Qualität / mittlere Dateigröße – 59-65% Reduktion
JPEG2000 / lossy / 200 – 250 = Niedere Qualität / kleine Dateien- 74-79% Reduktion