GB T 17191.4-2000 信息技术 具有1.5Mbit s数据传输率的数字存储媒体运动图象及其伴音的编码 第4部分 一致性测试.pdf
《GB T 17191.4-2000 信息技术 具有1.5Mbit s数据传输率的数字存储媒体运动图象及其伴音的编码 第4部分 一致性测试.pdf》由会员分享,可在线阅读,更多相关《GB T 17191.4-2000 信息技术 具有1.5Mbit s数据传输率的数字存储媒体运动图象及其伴音的编码 第4部分 一致性测试.pdf(45页珍藏版)》请在麦多课文档分享上搜索。
1、中华人民共和国国家标准信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第 部分 一致性测试发布 实施国家质量技术监督局 发布前言本标准等同采用 信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分一致性测试在信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码总标题下 包括以下 个部分第一部分 即 系统第二部分 即 视频第三部分 即 音频第四部分 即 一致性测试本标准的附录 是标准的附录附录 是提示的附录本标准由中华人民共和国信息产业部提出本标准由中国电子技术标准化研究所归口本标准起草单位南京大学镇江江奎集团公司本标准主要起草人张福炎余崇智前言国际标准化组织
2、和 国际电工委员会 是世界性的标准化专门机构 国家成员体 它们都是 或 的成员国通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准 和 的各技术委员会在共同感兴趣的领域内进行合作 与 和 有联系的其他官方和非官方国际组织也可参与国际标准的制定工作在信息技术领域 和 建立了一个联合技术委员会 由联合技术委员会采纳的国际标准草案需分发给国家成员体进行表决 发布一项国际标准至少需要 的参与表决的国家成员体投票赞同总标题为信息技术 具有 数据传输率的数字存储媒体运动图像及其伴音的编码的国际标准 由以下部分组成第一部分系统第二部分视频第三部分音频第四部分一致性测试附录 是 的一个组成部分
3、 附录 仅提供参考信息引言本系列标准分成四个部分 第 部分系统 叙述该标准的系统编码层 它确定一个混合音频和视频数据的多路结构和实时重放同步序列所需要的时间信息的表示方法 第 部分 视频 叙述视频数据的编码表示和重构图像所需的解码处理第 部分音频 叙述音频数据的编码表示和重构声音所需的解码处理 第 部分一致性测试 叙述确定编码位流特性的步骤以及位流和解码器与第部分中规定要求的一致性测试本系列标准的第 部分规定了一个视听信息的多路结构和编码表示允许有较大的灵活性 以使得标准能适应多种不同的应用这灵活性的获得是由于在位流中包含一些确定编码位流特性的参数其例子如音频采样频率图像尺寸图像速率及位速率参
4、数本系列标准的第 部分说明如何设计测试以确认位流和解码器是否符合本系列标准第 部分规定的要求 这些测试可以用于以下各种目的例如编码器的制造者和他们的用户能用这些测试去证实编码器是否产生有效的位流解码器的制造者和他们的用户能用这些测试去证实编码器所给出的性能是否符合本系列标准第 部分规定的要求应用者可以用这些测试去证实所给出的位流特性是否符合应用的要求 例如编码图像的尺寸是否超过该应用所允许的最大值中华人民共和国国家标准信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第 部分 一致性测试国家质量技术监督局 批准 实施概述范围本标准规定如何设计一些测试方法 以检验位流和解码器是否符合
5、第 部分所提出的要求 在本标准中对编码器没有特别说明 一个编码器 如果它产生的位流与 第部分中所要求的位流语法和语义相一致 可以被称为 编码器第 部分中规定了编码位流和解码器的特性 位流的特性规定了所开发的位流标准中的一个子集 其例子如图像尺寸的应用值或范围以及位速率参数 解码器的特性规定了所采用的解码过程的性能和能力 其性能的例子如应用的算术精度 解码器能力则规定了解码器可以解码和重建的编码位流 它定义了一个可解码位流标准中的一个子集 如果一个编码位流的特性是在解码器能力规定的标准的子集之中 则该位流能被这解码器解码本标准阐述了位流和解码器与 第 部分规定的要求之间的一致性测试步骤 给出声称
6、的一组特性 它必须完全符合由 第 部分规定的要求 本标准总结了与特性相互参照的一些要求同时规定了可以被测试的一致性 给出了如何建立测试和决定它们结果的指导准则 以及一些应用于音频的实际测试引用标准下列标准所包含的条文通过在本标准中的引用而构成为本标准的条文 本标准出版时所示版本均为有效 所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频信息技术具有 数据传输率的数字存储媒体运动图像及其伴音的编码第部分音频数字音频系统建议 演播室数字电视编
7、码参数报告 单色和彩色电视系统特性建议 音频信号的录制报告 便携和移动式卫星接收器的声音信号广播 包括附录 中先进的数字系统 的综述建议 声音编程电路的预加重实现 离散余弦逆变换的规格说明技术原理定义本标准使用下列定义 方括号内注明定义所属部分系数 视频任一 系数它在一个或两个方向上的频率为非零存取单元系统对音频压缩存取单元就是音频存取单元 对视频压缩 存取单元是一幅图像的编码表示自适应分段 音频以可变时间段方式将数字音频信号分段自适应位分配音频根据心理声学模型用时间和频率可变的方式对各子带进行位分配自适应噪声分配 音频根据心理声学模型用时间和频率可变的方式将编码噪声分配到各频带混迭 音频由奈
8、奎斯特子采样所产生的镜像信号分量分析滤波器组音频在编码器中将宽带 音频信号变换成一组子采样的子带样值音频存取单元 音频对层 和层 音频存取单元定义为可由自身进行解码的编码位流的最小部分 其中解码的意思是声音的完全重建 对层 音频存取单元是位流的一部分它在利用以前获得的主要信息后可以被解码音频缓冲器音频在系统目标解码器中用以存储压缩的音频数据的缓冲器音频序列音频一个不中断的音频帧序列在其中下列参数是不变的标识符层采样频率对层 和层 位速率索引向后运动矢量视频按照显示顺序利用后继的参考图像作运动补偿的运动矢量巴克 音频临界频带速率单位巴克标度是一种非线性映射的频率标度在音频范围内它和人耳听觉的频率
9、选择性相匹配双向预测编码图像 图像视频使用相对于其前和或其后的参考图像的运动补偿预测进行编码的图像位速率压缩的位流从存储媒体传输到解码器输入端的速率位流特性一致性编码器用来产生位流的标准的一部分例如一个编码器可能提供产生位流的语法和语义约束 如参数范围的限制这些约束是 第 部分支持的性能的一个部分 在视频位流中的例子有图像尺寸的应用值或范围和位速率参数位流一致性一致性如果某位流与 第 部分中规定的位流语法和语义的要求相符合则该位流是一致性的位流要求一致性由 第 部分中规定的对位流的要求块压扩音频在某一时间区间内音频数字信号的规一化块 视频一个 行 列的正交像素块边界音频采用强度立体声编码的最低
10、子带字节对齐如果某位在编码位流中的位置 从流的第一个位算起正好是 的倍数 则该位是字节对齐的字节个位组成的序列信道存储或传输 位流的数字媒体声道或信道 音频立体声信号的左和右声道色度分量 视频按 建议 中定义的方式 用于表示与主色彩相关的二个色差信号之一的矩阵块或单个像素 表示色差信号的符号是 和编码的音频位流 音频按照 规定的音频信号的编码表示编码的视频位流 视频按照 规定的一幅或多幅图像序列的编码表示编码顺序 视频图像存储和解码的顺序该顺序未必与显示顺序一致编码表示以编码形式表示的数据元素编码参数 视频用于刻划编码视频位流的特征的一组用户可定义的参数 位流由编码参数刻划其特征 解码器由其能
11、解码的位流刻划其特征分量 视频构成图像的三个矩阵 一个亮度和两个色度 之一的矩阵 块或单个像素压缩减少表示数据项的位数恒位速率编码视频视频平均位速率为常数的压缩视频位流恒位速率压缩位流时从开始至结束位速率保持不变约束参数 视频在 中 所定义的一组编码参数值约束系统参数流 系统符合 中 所定义的约束条件的一个多路复合流循环冗余码临界带速率 音频频率的心理声学函数 对一个给定的可听声频率 它正比于低于此频率的临界频带数目 临界频率的标度单位是巴克临界带音频在频域中的心理声学测量它和人耳的频率选择性相对应 这种选择性用巴克表示数据元素编码之前和解码之后数据项的表示系数视频在两个方向上频率都为零的 系
12、数编码图 图视频仅使用自身信息编码的图像编码表示的 系数中仅有 系数系数一个给定的余弦基本函数的幅值解码流压缩位流的解码重构解码器特性 一致性在解码器中所用解码处理的性能和能力解码器一致性一致性某解码器在对其解码能力所规定的标准子集之内的位流进行解码时 如果它符合 第部分中规定的解码器要求时 则该解码器是一致性的解码器输入缓冲器视频视频缓冲检验器中的先进先出 缓冲器解码器输入速率 视频在视频缓冲检验器中指明并在编码视频位流中编码的数据速率解码器解码处理的实体解码 处理在 中定义的处理它读入输入的编码位流并产生解码的图像或音频信号样值解码器要求 一致性由 第 部分中定义的对解码器的要求解码时标
13、系统可能出现在分组头中的一个域 它用来指出系统目标解码器解码一个存取单元的时刻去加重音频对经过存储或传输的音频信号所采取的一种滤波以消除由于加重引起的线性失真逆量化 视频在位流中的量化 系数在解码之后和在 逆变换之前进行重新比例变换的过程数字存储媒体指数字存储或传输的设备和系统离散余弦变换 视频离散余弦变换或离散余弦逆变换 是一种可逆的离散正交变换 在 的附录中定义了 逆变换显示顺序视频显示解码图像的顺序 通常与输入给编码器的图像顺序相一致双声道模式音频具有独立节目内容 如两种语言 的两个音频信道被编码在一个位流中 称为双声道模式 其编码过程和立体声模式一样编辑对一个或多个压缩位流进行处理以生
14、成一个新的压缩位流的过程 编辑后的位流必须满足规定的要求基本流系统泛指编码的视频流音频流或其他编码的位流加重 音频对音频信号在存储或传输前进行滤波以改善其高频段的信噪比编码器编码处理的实体编码 处理读入输入图像或音频的样本流并产生符合 中规定的有效编码位流的处理熵编码为了减少冗余而对信号的数字表示进行可变长无损编码方法快速正放视频按显示顺序用快于真实时间的速度显示图像序列或序列一部分的过程快速傅里叶变换 实现离散傅里叶变换正交变换的一种快速算法滤波器组 音频覆盖整个音频范围的一组带通滤波器固定分段音频将数字音频信号按固定的时间长度分段禁止在定义编码位流时术语 禁止是指决不可以使用的数值 这常用
15、于避免起始码的误判强迫更新视频经常地对宏块作帧内编码处理以保证编码器和解码器在 逆变换中不会生成过多的不匹配误差向前运动矢量视频用显示顺序上在其前的图像为参考图像作运动补偿的运行矢量帧 音频音频信号的一部分它相应于音频存取单元中的音频 样值自由格式音频不同于规定位速率的任何位速率 在各层它应小于最大允许的位速率将来参考图 视频按显示顺序在当前图像之后出现的参考图像区组 层 音频由全部 个子带的三个连续子带样值组成 它作为整体考虑其量化 相当于 个 样值区组 层 音频携带有自身的辅助信息的 条频率线图组 视频支持随机存取的一幅或多幅编码图像的序列 它是 规定的编码语法中的一层汉宁窗 音频傅里叶变
16、换之前将逐个样值应用于音频样值块的时间函数哈夫曼编码熵编码的一种特定方法混合滤波器组 音频子带滤波器组与改进的离散余弦变换的串联组合音频改进的离散余弦逆变换强度立体声音频一种利用立体声节目中的立体声不相干性和冗余性的方法 它是基于在高频部分只保留左和右声道能量包络的方法隔行扫描视频常规电视图像的一个性质其中相间各行在时间上连续帧内编码视频仅使用宏块或图像自身的信息对该宏块或图像进行编码帧内编码图像 图像视频仅使用自身信息进行编码的图像解码器 一致性对 位流解码处理的实体 系统解码器是它的同义词解码器一致性对 位流解码处理的实体 视频解码器是它的同义词解码器一致性对 位流解码处理的实体 音频解码
17、器是它的同义词多路复合 流 系统按照本标准规定的方式由零或若干基本流组合而成的一个位流联合立体声编码 音频任何利用立体声不相干性和冗余性的编码方法联合立体声模式 音频一种采用联合立体声编码的音频编码算法模式层音频按 定义的音频系统的编码层次的一个层次层视频和系统本标准和 中定义的视频和系统规范中数据层次结构中的一个层次亮度 分量 视频与 建议 定义的基色相关的单色信号的表示它可以是矩阵块或单个像素 表示亮度的符号是宏块 视频四个 的亮度数据块和两个相应 的色度数据块 由图像的亮度分量中 数据块得到的 宏块有时指像素数据 有时又指像素值的编码表示以及 中定义的其他宏块层语法中的数据元素 可根据上
18、下文予以区别映射 音频应用子带滤波和或改进的离散余弦变换对音频信号进行从时间域到频率域的变换屏蔽 音频人类听觉系统的一种特性 由于屏蔽作用一个音频信号的存在可以使另一个音频信号不被感知屏蔽阈值音频它是频率和时间的函数在该值以下音频信号将不能被人的听觉系统所感知音频改进的离散余弦变换运动补偿视频使用运动矢量来提高像素值预测的有效性预测应用运动矢量以提供相对于前 后参考图像的位移量 参考图像中包含已解码的像素值 它用于形成预测误差信号运动估值 视频在编码过程中估算运动矢量的过程运动矢量视频用于运动补偿的二维矢量它给出当前图像坐标位置相对于参考图像坐标位置的一个偏移量立体声 音频一种利用立体声节目中
19、立体声不相关性和冗余性的方法它基于对左声道和右声道的和信号和差信号进行编码以替代左 右声道帧间编码视频宏块或图像在编码时既使用自身的信息也使用其他时刻出现的宏块和图像信息的一种编码方法非音调分量 音频音频信号中类似噪声的分量奈奎斯特采样以大于或等于信号带宽两倍的频率进行采样包 系统包由一个包头及随后的一个或多个分组所构成它是 所定义的系统编码语法中的一个层次分组数据系统一个分组内所含的连续数据字节 它来自某个基本流分组头系统用以给出分组数据中所含基本流数据有关信息的一个数据结构分组 系统它是本标准所定义的系统编码语法中的一个层次分组由头和其后面的某一基本数据流中的若干连续字节所组成填充 音频一
20、种调节音频帧平均时间长度的方法对应于 样值的持续时间有条件地在音频帧中加进槽过去参考图像 视频按显示顺序在当前图像之前出现的参考图像像素纵横比视频像素显示时其垂直高度与水平宽度之比像素 视频图像元素图周期视频图像速率的倒数图速率视频解码过程输出图像的标准速率图像 视频源图像数据 编码图像数据或重建图像数据 一个源图像或重建图像包含三个 位二进制数的长方矩阵 分别表示亮度和两个色度信号 图像层是 编码语法的一个层次 注意总是使用术语图像 而很少使用术语 帧 或场多相滤波器组 音频一组具有特殊相位关系的等带宽滤波器以取得滤波器组的有效实现预测 视频用预测值来估算当前正在解码的像素值或数据元素的估计
21、值预测编码图像 图视频利用过去参考图进行运动补偿预测编码的图像预测误差视频像素或数据元素的实际值与其预测值之间的差值预测值视频先前已解码的像素值或数据元素的线性组合演示时标 系统分组头中可能包含的一个域 它用来指出一个演示单元在系统目标解码器中被演示出来的时刻演示单元 系统已解码的一个音频存取单元或一幅图像心理声学模型 音频人类听觉系统屏蔽特性的数学模型量化矩阵视频由逆量化器使用的 个 位的数集合量化 系数 视频进行逆量化之前的 系数 量化 系数的可变长编码表示作为压缩视频位流的一部分而存储量化器比例因子 视频出现在位流中的一个数据元素 在解码过程中用于对逆量化定标随机存取从任意点开始读入编码
22、位流并解码的过程参考图像视频按显示顺序与当前图像最邻近的 图像或 图像顺序调整缓冲器 视频在系统目标解码器中用于存储重建的 图像或 图像的存储器重量化音频为了恢复原始的量化值 对编码的子带样值的解码保留术语保留 在定义编码位流时表示某数值可以用于 将来的扩充反向播放 视频按显示顺序相反的顺序显示图像序列的过程比例因子带 音频对层 用同一个比例因子定标的一组频谱线比例因子索引 音频比例因子的数值代码比例因子 音频在量化前 将一组数值按比例改变的因子序列头视频编码位流中的一数据块包含有若干数据元素的编码表示辅助信息位流中为控制解码器所必需的信息空白宏块视频不存储任何数据的宏块子图 视频一串宏块 是
23、 编码语法所规定的一个层次槽音频槽是位流中的基本部分 在层 它等于 字节在层 和层 为 字节源流在压缩编码之前的一个非复合的单一样本流传播函数 音频描述屏蔽频率传播的函数起始码系统和视频嵌入在编码位流中的唯一的 位代码它有多种用途 包括编码语法的某些层次的标识输入缓冲器 系统系统目标解码器输入端的一个 先进先出缓冲器它用来存储解码之前的基本流的压缩数据立体声模式音频立体声左和右的二个声道被编码在一个位流中的模式 编码过程和双声道模式一样填充位填充字节可以插入在压缩的位流中并在解码过程中被忽略不处理的码字 目的是为了提高流的位速率子带 音频音频频带的一部分子带滤波器组 音频一组覆盖整个音频频率范
24、围的带通滤波器组 在 中子带滤波器组是一多相滤波器组子带样值音频通过音频编码器中的子带滤波器对输入音频流进行滤波和降低采样率后产生的样值称为子带样值 由 个在时间上连续的输入音频样值 在 个子带中每个子带产生在时间上连续的 个子带样值同步字音频一个嵌入音频位流中的 位代码 它标志一帧的开始合成滤波器组 音频解码器中的滤波器组 它以子带样值重建 音频信号系统头系统本标准中定义的一种数据结构它载有概括 多路复合流的系统特性的信息系统目标解码器 系统用来描述 多路复合流语义的解码过程的一个假设参考模型测试步骤 一致性检验位流或解码器的一致性方法时标 系统标出事件发生时间的一个术语三重组音频指一个子带
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 17191.4 2000 信息技术 具有 1.5 Mbit 数据传输 数字 存储 媒体 运动 图象 及其 伴音 编码 部分 一致性 测试

链接地址:http://www.mydoc123.com/p-162673.html