Djvu: Un systeme de compression d'images pour la distribution reticulaire de documents numerises (Djvu: An image compression system for distributing scanned document on the internet)

Nous presentons une technique nouvelle de compression d'images appelee DjVu. Cette technique est specialement concue pour la compression de documents en couleurs numerises a haute resolution. Un fichier DjVu representant une page typique d'un magazine en couleurs, numerisee a 300 points par pouce (dpi), requiert entre 40 et 80 KB, ce qui est est 5 a 10 fois meilleur qu'un fichier JPEG offrant une lisibilite similaire. Le compresseur DjVu commence par classer chaque pixel de l'image numerisee comme pixel d'avant-plan (texte, dessins au trait) ou pixel d'arriere-plan (images, photos, texture du papier). Cette classification forme une image bitonale qui est compressee grâce a une technique qui tire parti des similitudes de forme entre les divers caracteres composant l'avant-plan. Les images d'avant-plan et d'arriere-plan sont ensuite compressees a l'aide d'un algorithme a base d'ondelettes a resolution reduite. Un algorithme de masquage minimise le nombre de bits utilises pour coder les pixels d'avant-plan ou d'arriere-plan qui ne sont pas visibles dans l'image finale. Un plug-in pour butineur permet de visualiser tres efficacement les images DjVu sur le Web.

[1]  George Nagy,et al.  A Means for Achieving a High Degree of Compaction on Scan-Digitized Printed Text , 1974, IEEE Transactions on Computers.

[2]  Michel Barlaud,et al.  Image coding using wavelet transform , 1992, IEEE Trans. Image Process..

[3]  Wayne Niblack,et al.  Unsupervised image segmentation using the minimum description length principle , 1992, Proceedings., 11th IAPR International Conference on Pattern Recognition. Vol.II. Conference B: Pattern Recognition Methodology and Systems.

[4]  Jerome M. Shapiro,et al.  Embedded image coding using zerotrees of wavelet coefficients , 1993, IEEE Trans. Signal Process..

[5]  Ian H. Witten,et al.  Managing Gigabytes: Compressing and Indexing Documents and Images , 1999 .

[6]  W. Sweldens The Lifting Scheme: A Custom - Design Construction of Biorthogonal Wavelets "Industrial Mathematics , 1996 .

[7]  William A. Pearlman,et al.  A new, fast, and efficient image codec based on set partitioning in hierarchical trees , 1996, IEEE Trans. Circuits Syst. Video Technol..

[8]  Paul G. Howard,et al.  Text Image Compression Using Soft Pattern Matching , 1997, Comput. J..

[9]  Yoshua Bengio,et al.  High quality document image compression with "DjVu" , 1998, J. Electronic Imaging.

[10]  Yoshua Bengio,et al.  The Z-coder adaptive binary coder , 1998, Proceedings DCC '98 Data Compression Conference (Cat. No.98TB100225).

[11]  Steven Pigeon,et al.  Lossy compression of partially masked still images , 1998, Proceedings DCC '98 Data Compression Conference (Cat. No.98TB100225).

[12]  Stuart Inglis Lossless Document Image Compression , 1999 .

[13]  David S. Taubman,et al.  High performance scalable image compression with EBCOT , 1999, Proceedings 1999 International Conference on Image Processing (Cat. 99CH36348).