GBZ 19736-2005 电子成像文件图像压缩方法选择指南.pdf
《GBZ 19736-2005 电子成像文件图像压缩方法选择指南.pdf》由会员分享,可在线阅读,更多相关《GBZ 19736-2005 电子成像文件图像压缩方法选择指南.pdf(12页珍藏版)》请在麦多课文档分享上搜索。
1、ICS 37.080一鹜tr中华人民共和国国家标准化指导性技术文件GB/Z 19736-2005/ISO/TS 12033:2001电子成像文件图像压缩方法选择指南Electronic imaging-Guidance for selection of document image compression methods(ISO/TS 12033:2001,IDT)2005-04-19发布2005-10-01实施一一率督豁臀霭贷臀鉴臀臀暴发“ GB/Z 19736-2005/ISO/TS 12033:2001山dml1胃由于压缩技术的应用迅速增多,压缩方法对所存大量数据的管理起着日益重要的因素
2、。根据源文件的不同,现有压缩方法的效能差别很大。例如,与仅仅涉及文本的应用相比,为扫描和存储连续色调影像而配置的电子影像管理(EIM)系统将有不同的图像压缩要求。分析用户对图像压缩的要求并恰当地选出图像压缩最佳方案所用的实际方法是很复杂的。为指导用户和系统开发商选择这些方法,提出本指导性技术文件显然是有用的。本指导性技术文件等同采用ISO/TS 12033:2001电子成像文件图像压缩方法选择指南(英文版)。本指导性技术文件仅供参考。有关对本指导性技术文件的建议和意见,向国务院标准化行政主管部门反映。本指导性技术文件由全国文献影像技术标准化技术委员会(SAC/TC 86)提出并归口。本指导性技
3、术文件由全国文献影像技术标准化技术委员会第五分委员会起草。本指导性技术文件主要起草人:李铭、董建伟、王坤。 GB/Z 19736-2005/ISO/TS 12033:2001电子成像文件图像压缩方法选择指南1范围本指导性技术文件为用户或电子影像管理(EIM)系统集成者提供了信息,以使他们能够对商业文件数字图像压缩方法的选择做出决策。其目的在于提供信息,用以分析文件的类型以及对于特定的文件采用何种压缩方法最适宜,以便实现文件的存储与使用的最佳化。对于用户,本指导性技术文件提供了有关硬件或软件所具备的图像压缩方法的信息,以便在该用户选择嵌有压缩方法的系统时,为其提供帮助。对于设备或软件设计者,它提
4、供了计划信息。本指导性技术文件仅适于位映射模式的静态图像。它仅考虑了基于良好测试过的数学计算的压缩算法。2规范性引用文件下列文件中的条款通过本指导性技术文件的引用而成为本指导性技术文件的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本指导性技术文件,然而,鼓励根据本指导性技术文件而达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本指导性技术文件。ISO 12651:1999电子成像词汇ITU-T建议T.4:1999文件传送用3类传真终端的标准化ITU-T建议T.6:1988 4类传真设备用传真编码方案与编码控制功能3
5、术语和定义ISO 12651:1999确立的以及下列术语和定义适用于本指导性技术文件。3. 1无损压缩lossless compression能够恢复被压缩图像的所有原始信息的压缩算法。3.2有损压缩lossy compression压缩期间会损失一些原始信息的压缩算法,因此解压缩图像仅近似于原始图像。注:如果由于细节是人眼察觉不到或几乎察觉不到的,因而可以舍弃,这时这类算法对图像压缩特别有用。这种情况下,压缩比可以大幅度提高。3.3分辨率resolution每单位长度的像素数。3.4点英寸dots per inchdpi扫描器(打印机)在水平方向上和垂直方向上的每英寸都能扫描(打印)的点数。
6、GB/Z 19736-2005八SO/TS 12033:20013.5明度brightness使观察者能够察觉亮度的视觉感受。3.6对比度contrast一幅图像的最高密度与最低密度的差异。3.7位深度bit level用以界定一个像素的位数。3.8亮度luminanceY由一个表面发出的光通量。3.9色度chrominanceCr,Cb视频信号中包括色调和饱和度但不包括明度的彩色部分。注:低色度意味着彩色画面显得苍白。3. 10ITU-T 3类与4类ITU-T Group 3 and Group 4ITU-T提出的两种标准算法。3.11联合摄影专家组Joint Photographic Ex
7、perts GroupJPEGISO/IEC 10994标准的流行名称。3.12国际电报电话咨询委员会Comite Consultatif Internantional Telegraphique et Telephonique;CCITT国际电信联盟电信标准化组(ITU-T)以前的名称。3.13压缩比compression ratio压缩前的图像文件大小与压缩后的图像文件大小之比。4总则在文件成像系统中,用户出于两个原因对存档图像的质量予以关注。首先是由于它能影响到成像系统的中期甚至长期的前景;其次是由于他们必须基于一种不断发展的技术来选择成像工具。数字化过程从性质上将载有丰富信息的影像变换
8、为非物质化的图像,因而也改变了观察者对影像(图像)的感受。观察者可能认为图像得到了改善,可更常见的情况是觉得图像质量下降了。事实上,影像在数字化过程中的不同阶段,经受了许许多多一连串的变换。在每个阶段,人们都力图将图像的可读性保持在可接受的限度内,但又要将图像的大小限制在可接受的经济限度内。在数字化的诸阶段中,有一个阶段是压缩,其特定作用是减小图像文件的大小。一些压缩方法是可逆的,即解压缩算法可以恢复原始的数字信息,这些方法是无损的,当人眼看到图像时,图像的质量没有受到损害。其他方法则是有损的,并会导致人眼所能察觉的图像质量下降。通过对参数的调整,用户能 GB/Z 19736-2005/ISO
9、/TS 12033:2001够在可接受的限度内找到一种有损压缩方法。尽管在技术文献中描述过大量的压缩方法,但依据工业标准,只有很少几种是稳定的。这几种则是基于有限的几项原则:某些图案的优势性、图案的重复性以及显著的数学性。在任何一种方法中,用户所能修改的参数数量都是很少的。压缩方法与压缩参数的选择很大程度上是由文件的特性决定的。显然,文件的图形内容在确定方法及其参数上起着关键的作用。然而,影响应用特性的其他因素也是很重要的(参见图1)0文件的图形内容本身对于数字化处理是重要的。这样,一幅照片在数字化的时候,如果是呈灰度状态,或者是基于“伪灰度”法,其数字化的方法就不可能是同样的。前者是使用JP
10、EG压缩法,后者将需要使用ITU或JBIG压缩法。因此,在讨论压缩方法之前,我们需要审视一下文件的类型以及数字化后它们又是怎样被表现的,见图1,士图1各种因素与压缩方法的相互作用5文件的类型与数字化参数5.1概述一份文件是一组意欲呈现给一个用户的经过组织的信息。文件可以是单页的,也可以是多页的,而且可以包含任意类型的内容,诸如字符内容、图形内容以及各种类型的图像内容。下述文件内容可以在各种类型的文件中看到。下面的分类有一定的随意性,但对于给定的应用来说,人们可以运用这些差异来了解应怎样处理一份给定的文件。5.2文件的类型这里仅给出最有可能用电子方法存档的文件(通常称为“文字处理文件”)。这些文
11、件包括:白色背景下的黑色文本,或者是不太常见的彩色背景下的彩色文本;黑白或彩色照片;用印刷方法复制的既含有文本又含有照片的黑白或彩色的混合文件。5.3文件的分类与数字化5.3.1概述为了确定压缩方案,可以按下述五种方式描述文件。对于每种类型的文件,都简略地描述数字化方法。GB/Z 19736-2005/ISO/TS 12033:20015.3.2黑白文件黑白印刷(主要是文本)的页面数字化后,生成二值图像,每个像素用一个比特来再现。这种再现形式也可以应用于具有彩色背景或字符的文本文件,以及线条图样。最重要的数字化参数是分辨率。分辨率必须依据视觉感受的需要来决定,且受整个成像系统的限制(例如对于文
12、字处理文件为200 dpi,对于数字化书刊为300 dpi),涉及到图像处理还有其他一些因素,这些因素随图像类型而变化。例如,我们知道待数字化的图像是文本,我们将力求生成白色背景下边缘清晰的黑色字符。于是,我们便有明度(相对于阑值来调整一个像素的颜色)和对比度(相对于周围像素的颜色来调整一个像素的颜色)这两个参数。5.3.3灰度文件这种形式的再现适合于由黑白胶片印制在相纸上的照相文件。数字化将一个原本是连续色调的文件变成一个像素的黑度编码为若干级的像素矩阵。这样,8比特编码便生成256级灰度。灰度的级数或位深度必须依据视觉感受的需要和整个成像过程的限度来确定。5.3.4伪灰度文件这类文件包括了
13、使用黑白像素可变分布来模拟灰色的图像。这可以有两种情况:(1)源文件是一个文本中的照相复制品;它原是用印刷技术生成的,本身是个伪灰度文件(屏面的形成使用了可变大小的黑色像素);(2)源文件是一张真正的照片,但为了减小存储量或在网上的传送时间而被以伪灰度的形式数字化了(“半色调”技术涉及了在一个固定大小的矩阵中分布数量不等的黑色像素)。5.3.5彩色文件这种形式的再现适合于由彩色胶片印制在相纸上的照相文件。另一个用途是对商业文件的数字化彩色捕获,在这些文件中,黄色重点区、彩色边框、铅笔道、红笔道等等,都是信息捕获整体的一部分。彩色文件意在将来恢复成彩色,但也可以以灰度来复制。彩色再现是基于人眼的
14、神经生理性能,特别是“视觉三原色”原理,即所有的颜色均可以通过三原色的组合来再现。这样,一种颜色便可以在一个基于三原色的矢量空间中通过三个坐标来再现,或者通过它们的线性组合来再现。最常用的彩色空间使用红、绿、蓝。这三种颜色由眼睛中的视网膜锥状细胞来区分。另一种彩色空间将这些变量换成为一个“亮度”变量和两个“色度”变量。这种彩色空间用于发送电视信号。在数字化的彩色图像中,每个像素都通过对应于三原色的三个分量的组合来再现。一个分量采用的位深度决定了色彩的质量;每个分量8比特的标准可以再现2563 (1 600多万)种不同的颜色。数据通信网络传送的总共8比特的再现也是相当常见的。5.3.6混合文件很
15、多准备存档的文件是由一些含有图形要素和(或)照相影像的文本页面构成的。再现这类文件的完全满意的方式是没有的:二值再现会使插图不可读;为保护插图而用灰度或彩色再现的确会提供最好的质量,但就插图的重要性而言,却会使存储量不成比例地加大(人们必须了解分辨率与灰度或彩色图像文件的位深度之间可能存在着相消关系);半色调再现会降低字符的可读性。在混合文件中,文本被认为更重要,所以会用二值再现在白色背景上绘制黑色字符。照片或者受到损失,或者不得不从文本中分出来,以做适宜的再现。大多数情况下,文本和照片可以用分割算法自动 GB/Z 19736-2005八SO/TS 12033:2001且成功地分开。有时,分割
16、会导致信息的损失(诸如照片下面有说明,或者采用了不常见的印刷布局)。6压缩方法与标准6. 1 RLE压缩(行程编码)该法为大多数图形图像格式所接受。该法考虑数据流中同一符号(在ASCII文本中则是字符)的行程。每个数据流是用重复性元素出现的次数和数据流的长度编码的。RLE算法可以在比特、字节或像素的水平上运算。基本算法是一次算一行,但也有些变型算法可以按竖的方向运算,将邻行中的重复字符考虑进去。RLE法名义上是无损的,不过为了提高效率,有些变型算法舍掉低阶位,从而造成损失。该法对于文本和复杂的照片来说,由于很少有长的序列,所以不是非常有效。而对于具有大面积均匀颜色的图像来说,该法则是最有效的。
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GBZ 19736 2005 电子 成像 文件 图像 压缩 方法 选择 指南
