AutoOCR – Abbyy – PDF Image Qualität bei Verarbeitung von TIFF & JPEG Farbscans mit niedriger Auflösung

Mit der aktuellen Abbyy Version 10 gibt es bei der Verarbeitung von Farbscans ein Problem das zu visuell nicht optimalen PDF Ergebnissen führt.  Verwendet man TIFF oder JPEG als Format für die OCR Verarbeitung von Farbscans mit z.b. 100dpi um daraus ein durchsuchbares PDF zu erzeugen so ist zwar das OCR Ergebnis gut, jedoch ist das im PDF eingebettete Bild von wesentlich schlechter Qualität als das Ausgangsdokument. Wir erwarten hier mit der nächsten Abbyy Version 11 eine Verbesserung.

Man erhält ein visuell besseres Ergebnis falls

  • man statt TIFF und JPEG ein PDF – Image verwendet
  • man die PDF Export Einstellung von „max. Qualität“ auf „max. Geschwindigkeit“ einstellt
  • mit höherer Auflösung scannt – 300dpi statt 100dpi.

Ebenso sollte man bis zur Verfügbarkeit der Abbyy Version 11 – statt der JPEG2000 die normale JPEG Komprimierung verwenden.