PDFCompressor – PDF-MRC (Mixed Raster Content) Komprimierung – Dokumenten-Farbscans um den Faktor 8 bis 10 verkleinern

In fast jedem Unternehmen findet man heute Dokumenten-Scanner und Multifunktionsgeräte für die Erfassung, Archivierung und Weiterleitung von Dokumenten. Alle modernen Geräte sind in der Lage die Dokumente in Farbe und als PDF zu erzeugen. Die Erfassung und Verarbeitung von Dokumenten in Farbe wird also immer verbreiteter und beliebter. Der Nachteil: Die Datei eines Farbscans mit der für Farbe üblichen JPEG Komprimierung ist um ein Vielfaches größer als ein vergleichbarer SW-Scan. Die JPEG Komprimierung ist gut für Farbbilder/Fotos , für Text ist die JPEG Komprimierung jedoch auf Grund der durch die Komprimierung erzeugten Artefakte sehr schlecht geeignet. Text benötigt scharfe Kanten um gut lesbar zu sein. Bei der JPEG Komprimierung verschwimmen diese Kanten und damit werden speziell kleinere Schriften unleserlich.

Die PDF-MRC (Mixed Raster Content) Komprimierung löst das Problem – Sie erzeugt aus Farbscans sehr kleine PDF Dateien und ermöglicht eine gute Lesbarkeit von Texten.

Die MRC Komprimierung ist auch als „Hyper Komprimierung“ bekannt und verwendet die Methode der Bild Segmentierung, Sie ist für typische Geschäfts-Dokumente bestehend aus Text und Bildern, die in Farbe gescannt werden, sehr effizient und gut anwendbar.

Die PDF-MRC Komprimierung in Kürze:

Der wesentliche Punkt dabei ist, dass bei der PDF-MRC Komprimierung Seiten Bereiche des Scans in getrennte Bilder – sogenannte „Ebenen“ aufgeteilt werden. Jeder dieser Ebenen wird entsprechend angepasst und optimal komprimiert. Das PDF Format ermöglicht es, die ursprüngliche Darstellung einer Seite aus diesen getrennten Ebenen wieder als Gesamtbild darzustellen. Siehe auch Wikipedia >>>

Die 4 Ebenen der PDF-MRC Komprimierung:

  • Hintergrund Ebene (Farbbild) – enthält den Hintergrund, die Hintergrund „Verschmutzungen“ und alle anderen Grafik Elemente welche nicht als Text, Linien Grafik oder Bild identifiziert werden können.
  • Bild Ebene (Set an Farbbildern) – enthält alle Farbbilder der Seite.
  • Maskierungs Ebene (Schwarz-Weiss Bild) – enthält den Text und die Linien Grafik.
  • Vordergrund Eben (Paletten Bild) – enthält die Information über die Farben der Maskierungs-Ebene, speichert damit die Farbe des Textes und der Linien Grafik.

PDFCompressor mit PDF-MRC Komprimierung:

Die aktuelle PDFCompressor Komponente die im PDFCompressor-CL, -FM und -CS-Service, sowie auch in unseren anderen Anwendungen (z.b. AutoOCR, FileConverterPro…) zum Einsatz kommt, unterstützt jetzt auch die PDF-MRC Komprimierung. Die PDF-MRC Komprimierung ist für Farb-Dokumente/-Scans anwendbar, nicht jedoch für Schwarz-Weiß und Graustufen-Scans.

Unterstützte Dateiformate: PDF, JPEG, PNG, BMP, TIFF, JPEG2000, JBIG2, ICO, PCX, GIF, WMF, EMF – für Dateiformat mit mehreren Seiten wird automatisch ein mehrseitiges PDF erzeugt.

Vordefinierte PDF-MRC Profile: PDF-Dokumente werden vor der MRC Komprimierung mit der eingestellten Auflösung (150, 200, 300dpi) „gerendert“ also in ein Farbbild konvertiert und anschließend der MRC Komprimierung unterzogen. Um es dem Anwender zu erleichtern sind die wesentlichen MRC Komprimier-Einstellungen bereits als fertig vordefinierte Profile auswählbar. „MRC – nur Text“ bzw. „MRC – Text und Bilder“ für 150 bzw. 200dpi Auflösung.

   

Beispiel – PDF-MRC Komprimierung:

 

PDF-MRC Anwendung:

Die PDF-MRC Komprimierung ist ist speziell für die Komprimierung von Dokumenten-Farbscans gedacht und ermöglicht im Vergleich zur herkömmlichen JPEG Komprimierung eine Reduktion der Dateigröße um den Faktor 8 oder 10. „Normale“ PDF die nur aus Linien und Text bestehen können auch MRC komprimiert werden, jedoch sollte beachtet werden dass das PDF vor der MRC Komprimierung gerendert, also in eine Bilddatei umgewandelt wird, um danach als MRC-PDF ausgegeben zu werden. Der vorher im PDF enthaltene Text wird wieder in die MRC-PDF eingefügt. Normalerweise macht es also nur Sinn gescannte Farbdateien bzw. PDF Dateien die OCR verarbeitet wurden, einer MRC Komprimierung zu unterziehen.

Die Textdarstellung in einer MRC-PDF Datei ist trotz einer mit 150-200dpi geringen Auflösung auch bei kleinen Schriften klar lesbar und ohne Artefakte. Die PDF-MRC Komprimierung ist also die ideale Lösung um im Unternehmen anfallende Dokumente in Farbe zu archivieren, wobei die Dateigröße nicht wesentlich über jener von Schwarz-Weiß Scans liegt, die Texte gut lesbar bleiben und der Vorteil der Farbdarstellung besteht.

PDFCompressor Komponente Test & Beispielanwendung >>>

Webshop