Farbscans erzeugen meist recht große Dateien, Bei 300dpi, Farbe werden bei der JPEG Komprimierung ca. 300kB an Speicherplatz pro Seite benötigt. Um möglichst kleine, kompakte PDF-Ausgabedateien zu erzeugen wurde für AutoOCR / iOCR die JPEG2000 Komprimierung verbessert und um einen zusätzlichen Parameter erweitert. Durch diese JPEG2000 Komprimierung lässt sich die Größe der im PDF enthaltenen Farbbilder erheblich reduzieren womit die durchsuchbaren PDF-Dateien wesentlich kleiner werden. Die JPEG2000 Komprimierung hat keinen Einfluss auf die OCR Erkennungsrate.
Bei JPEG2000 steht die „verlustfreie“ als auch die „verlustbehaftete“ Komprimierung zur Verfügung. Normalerweise sollte man um kleine Dateien zu erzeugen die „lossy“ (verlustbehaftete) JPEG2000 Komprimierung verwenden – Dabei gibt es einen zusätzlichen Parameter (Verh.: 1 bis 999) mit dem die Komprimierungsrate und damit die Größe und visuelle Qualität gesteuert werden kann.
In der nachfolgenden Tabelle wurde ein Test mit verschiedenen Einstellungen für die JPEG / JPEG2000 Komprimierung gemacht um zu sehen welche Auswirkungen diese Parameter auf die PDF Dateigröße haben. Als Ausgangsdatei wurde ein Scan, 300dpi, 24Bit Farbe, JPEG Komprimierung, 7 Seiten mit 2082kB, verwendet.
Daran kann man erkennen dass man mit JPEG2000 je nach Parameter eine Reduktionen der Dateigröße zwischen 30 und 80% erreichen kann.
- JPEG2000 / lossy / 75-100 = Hohe Qualität / größere Dateien – 32-49% Reduktion
- JPEG2000 / lossy / 125-150 = Mittlere Qualität / mittlere Dateigröße – 59-65% Reduktion
- JPEG2000 / lossy / 200 – 250 = Niedere Qualität / kleine Dateien- 74-79% Reduktion
Download – AutoOCR – OCR Server inkl. OmniPage OCR (ca. 640MB) >>>
Download – AutoOCR light – Low Cost OCR Server (ca. 410MB) >>>