GB T 16686-1996 信息技术 信息交换用数据压缩 具有嵌人字典的自适应编码 DCLZ算法.pdf
《GB T 16686-1996 信息技术 信息交换用数据压缩 具有嵌人字典的自适应编码 DCLZ算法.pdf》由会员分享,可在线阅读,更多相关《GB T 16686-1996 信息技术 信息交换用数据压缩 具有嵌人字典的自适应编码 DCLZ算法.pdf(12页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国国家标准信息技术信息交换用数据压缩具有嵌入字典的自适应编码算法发布实施国家技术监督局发布前言本标准等同采用国际标准信息技术信息交换用数据压缩具有嵌入字典的自适应编码算法为适应信息交换本标准规定了无损的压缩算法以减少用编码形式表示的数据的位数本标准无论在技术内容上还是在编排格式上均与国际标准保持一致附录附录和附录均是提示的附录本标准由中华人民共和国电子工业部提出本标准由电子工业部标准化研究所归口本标准起草单位电子工业部标准化研究所本标准主要起草人王宝艾杨霖郑洪仁前言国际标准化组织和国际电工委员会是世界性的标准化专门机构国家成员体它们都是或的成员国通过国际组织建立的各个技术委员会参与
2、制定针对特定技术范围的国际标准和的各技术委员会在共同感兴趣的领域内进行合作与和有联系的其他官方和非官方国际组织也可参与国际标准的制定工作对于信息技术和建立了一个联合技术委员会即由联合技术委员会提出的国际标准草案需分发给国家成员体进行表决发布一项国际标准至少需要的参与表决的国家成员体投标赞成国际标准是由欧洲计算机制造商协会标准编制的在特定的快速跟踪程序下被所采纳同时被和国际组织通过附录附录和附录仅供参考引言在过去的十年里颁布了许多有关磁带盒式磁带和卡式磁带以及盒式光盘的国际标准最近开发的这些媒体具有高的物理记录密度为了最佳利用最终的数据容量设计了多种压缩算法以减少用编码形式表示的用户数据的位数将
3、来这些压缩算法将由建立的国际登记机构登记登记将对每一个已登记的算法分配一数字的标识符对于记录媒体该标识符应包含在记录格式中以指明所使用的是哪种哪些压缩算法该国际标准是第一个有关压缩算法的国际标准中华人民共和国国家标准信息技术信息交换用数据压缩具有嵌入字典的自适应编码算法国家技术监督局批准实施范围本标准规定了无损的压缩算法以减小用位字节编码表达信息所要求的位数此算法称为根据和的数据压缩本标准既不规定重置字典的策略也不规定冻结字典的策略因为它们是依赖于实现的当信息必须记录在可互换的媒体上时此算法特别有用它的使用并不局限于这种应用一致性如果一个压缩算法的输出数据流满足第章的要求则认为与本标准一致引用
4、标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文本标准出版时所示版本均为有效所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性信息技术无损的数据压缩算法的登记规程定义代码值一个从到变化的整数它由压缩算法产生代码字在以二进制表达代码值的输出流中或个连续位的集合压缩比压缩算法的输入流中的位数除以压缩算法的输出流中的位数字典由项组成的一个表它用于保留输入流中选择的字节串每一项由大于的唯一代码值标识空状态字典中无数据的状态冻结状态不再有数据加入字典的状态记法和同义词本标准中的数用十进制表示记录结束算法标识符本算法在国际登记组织登记的数字标识符是压缩算法概述压缩算法应以位
5、数据字节流的形式接受信息输入并以新组织成位字节的位流形式输出代码字本算法应识别输入流中字节串的重复并应从输出流中排除这样的冗余随着由电子信息处理系统和设备产生发送或记录的信息类型的多样化数据重复度足够高以允许输出流比输入流有效地包含更少的位数但是在变态环境下输出流可能比输入流包含更多的位数实际上达到的压缩比依赖于具体的输入数据流的特征本算法的压缩是无损的即它可能使用互补的解压缩算法完全恢复数据的原始表达本算法包含一些特征这些特征帮助算法实现数据存储和检索设备在顺序方式下处理可变长度的数据记录运算原则运算的基本原则是对出现在输入流中的字节串的一个字典进行编译使用该字典检测重复串并为每个重复串产生
6、一个代码字这个代码字表达一个代码值它是对应重复串而被引用的字典项字典的编译本算法开始运算之前字典应设置成空状态见本算法应检测输入流并应查找第一个出现的唯一对或唯一串唯一对是一个还没有被分配字典项的字节串个字节的唯一串是一个还没有被分配字典项的字节串但是前面的个字节应已被分配字典项字典项能分配给串的最大长度是个字节当遇到唯一对时本算法应输出一个代码字以表达该对的第一个字节的代码值当遇到字节的唯一串时本算法应输出一个代码字以表达该串前面个字节的代码值然后如果字典未被冻结见且不超过则它应把唯一对或唯一串输进字典并分配下一个未使用的代码值给该项从当前唯一对的第二个字节或从当前唯一串的最后一个字节开始则
7、本算法应继续检测输入流并查找下一个唯一对或唯一串冻结字典当出现下列情况时应认为字典处在冻结状态所有有用的代码值都已被分配本算法的执行程序已决定不把唯一对或唯一串输入字典例如因为在字典中查找未占用空间所耗费的时间太多改掉字典冻结状态的唯一方法是重置空状态见重置字典为空状态如果已输入算法的所有字节已由代码字表达本算法允许在任何时候重置字典为空状态例如如果因为当前字典项没有充分反映输入流当前的重复特征而使当前压缩程度不够算法可以选择重置字典边界在输入流中自然边界可以存在于字节集之间例如输入流可以由记录的序列组成每个记录包含一个或多个字节这种情况下自然边界存在于记录之间本算法应提供在输出流中识别这种边
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 16686 1996 信息技术 信息 交换 数据压缩 具有 字典 自适应 编码 DCLZ 算法

链接地址:http://www.mydoc123.com/p-219526.html