书签分享收藏举报版权申诉 / 101

立即下载加入VIP,交流精品资源

当前位置：首页 > 标准规范 > 国家标准 > GB T 17191.2-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第2部分;视频.pdf

GB T 17191.2-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第2部分;视频.pdf

上传人：confusegate185

文档编号：162671

上传时间：2019-07-15

格式：PDF

页数：101

大小：7.74MB

《GB T 17191.2-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第2部分;视频.pdf》由会员分享，可在线阅读，更多相关《GB T 17191.2-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第2部分;视频.pdf（101页珍藏版）》请在麦多课文档分享上搜索。

1、中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频发布实施国家技术监督局发布前言本标准等同采用国际标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频在信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码总标题下目前包括以下个部分第部分系统第部分视频第部分音频第部分一致性测试本标准的附录附录附录是标准的附录附录附录附录是提示的附录本标准由中华人民共和国电子工业部提出本标准由电子工业部标准化研究所归口本标准起草单位清华大学本标准主要起草人钟玉琢智西湖前言国际标准化组织和

2、国际电工委员会是世界性的标准化专门机构国家成员体它们都是或的成员国通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准和的各技术委员会在共同感兴趣的领域内进行合作与和有联系的其他官方和非官方国际组织也可参与国际标准的制定工作对于信息技术和建立了一个联合技术委员会即由联合技术委员会提出的国际标准草案需分发给国家成员体进行表决发布一项国际标准至少需要的参与表决的国家成员体投标赞成国际标准是由信息技术联合技术委员会制定的在信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码总标题下目前包括以下个部分第部分系统第部分视

3、频第部分音频第部分一致性测试附录附录附录构成标准的一部分附录附录附录仅提供参考信息引言注对视频部分总貌感兴趣的读者应先读本引言接着读附录最后再回到第章和第章目的本标准是为了满足不断增长的对在各种存储媒体上压缩视频的一个统一的表达格式的需求而制定的如温盘和光盘驱动等本标准的规定可用于位流速率在附近的压缩视频序列的编码表示使用本标准意味着运动视频可作为计算机数据进行操作并可通过现有的和将来的网络进行传送和接收编码表示可用于线和线电视系统也为用于工作站和个人机的显示提供了灵活性本标准主要是按照能提供连续的传输速率约的存储媒体而制定的但因采用

4、的方法是一般通用的故可用于更广的范围内编码参数制定本标准的意图是定义一种具有很高灵活性的适用于多种不同应用的源编码算法为此目的位流中包含了许多定义编码位流和解码器特性的参数对此可给出一个例子算法对于图像来说适用于各种大小和长宽比以及信道和设备可工作于很大的位速率范围内因本标准可表示的位流的特性范围很大又定义了一个所谓的约束参数的这些编码参数的子集定义约束参数的目标是对一个广泛的有用参数范围提供指导满足本子集的约束并不是本标准的要求位流中一个标志位用来指明位流是否是约束参数的约束参数汇总图片宽度小于或等于像素点图片高度小于或等于线图片范围小于或等于宏块像素速率小

5、于或等于宏块秒图片速率小于或等于运动矢量范围小于像素使用半像素矢量见表输入缓冲大小在模式下小于或等于位速率小于或等于静态位速率算法概述本标准定义的编码表示可获得高的压缩比同时可保持良好的图像质量由于在编码过程中并不是保存精确的像素值所以算法不是无损的编码技术的选择是基于要求高质量的图片和高的压缩比与对编码位流的随机操作的需求之间的权衡以比较满意的位速率达到良好的图片质量需要很高的压缩比对此仅用帧内编码是无法完成的然而对随机操作的需求用纯粹的帧内编码却能获得最满意的结果这需要在帧内和帧间编码之间递归和非递归缩减时间冗余之间进行仔细的权衡为达到高压缩比采用了一系

6、列的技术其中第一个几乎与本标准无关就是为信号选择一个合适的分辨率再一个就是利用基于块的运动补偿来减少时间冗余的算法运动补偿用来根据前幅图对当前图进行因果预测根据后继图对当前图的非因果预测或者根据前序图和后继图对当前图进行插值预测运动矢量是针对每一像素线的图像区域定义的差值信号即预测差利用离散余弦变换作进一步压缩以消除空间相关性然后进行量化在量化过程中要丢掉一些不太重要的信息因而这是不可逆过程最后运动矢量与信息相结合用变长码进行编码时域处理因为对随机操作的要求和高效压缩的要求是相互冲突的因而定义了三种主要的图类型帧内编码图图编码时无需参考其他图它

7、给编码序列的解码的起始提供操作点但仅能获得中等的编码压缩比预测编码图图利用根据过去的帧内和预测编码图的运动补偿预测可作更有效的编码图还可用作进一步预测的参考双向预测编码图图能提供最大限度的压缩然而需要过去和将来的参考图作为运动补偿双向预测编码图不能用作预测的参考序列中三种类型图的组织是非常灵活的这个选择依赖于对应用的要求留给编码器去作图说明了三种不同类型图之间的关系图时域图结构示例本标准中定义的第四种图类型是图它提供一种简单而有有限质量的快放模式运动补偿宏块选择的宏块作为运动补偿单位是在使用运动信息所带来的编码效率的提高与其需要的附加存储开销之间折衷的

8、结果每一宏块可以是多种不同类型中的一种例如帧内编码向前预测编码向后预测编码以及双向预测编码宏块均允许存在于双向预测编码图中依照宏块类型运动矢量信息和其他附加信息同压缩的预测误差信号一样存储于每一宏块中运动矢量的编码同上一个已编码的运动矢量不同它使用变长码矢量可表示的最大长度可以图图为基础进行编程以满足最迫切的应用从而在一般的情况下无需折衷系统的性能计算合适的运动矢量是编码器的任务在本标准中没有规定如何去作减少空间冗余原始图像和预测差值信号都有很高的空间冗余本标准使用一种基于块的视觉加权量化和行程编码的方法作为帧内编码宏块的原始图像以及作为预测编码宏块的预测误差的

9、块先变换到域并进行比例变换然后进行量化量化后许多系数值为于是利用二维游程和变长码来对剩余的系数进行有效化编码编码本标准中设有规定编码过程它规定了位流的语法和语义以及解码器中的信号处理编码器必须在图像质量和编码效率上寻求速度和费用间的权衡上作许多选择本章简明描述了一个编码器需要完成的功能图示出了主要的功能块其中离散余弦变换离散余弦逆变换量化逆量化变长码图简化的视频编码器框图输入的视频信号必须经数字化并表示成一个亮度信号和两个色彩差值信号然后可进行预处理和格式转换以选择一合适的窗口分辨率和输入格式本标准要求色差信号和和亮度信号在垂直和水平方向上按进行子采样并在必要

10、时以非隔行扫描信号进行重格式化编码器必须为每幅图选择其类型确定图类型之后编码器需估计图中宏块的运动矢量图中每一非帧内宏块需一个矢量而图中则需一个或两个矢量如果用图编码前有必要对图序列顺序做一些调整因为图的编码用到双向运动补偿预测它只有在其后继的参考图图或图解码之后才能够解码因此编码器对图像顺序重新做了调整使得图像按解码器解码的顺序到达解码器解码器之后又重新恢复正解的顺序一幅图内编码的基本单位是宏块在每幅图中宏块按顺序编码从左到右从上到下每一宏块包含个的块个亮度块个色度块一个色度块见图注意由个亮度块覆盖的图像区域同每一色度块覆盖的区

11、域相重合这是为满足人类视觉系统的灵敏度而进行的色度信息子采样造成的图宏块结构首先对一给定宏块选择编码模式它取决于图像类型局部的运动补偿预测的有效性以及块内信号的性质其次按照编码模式形成块内容运动补偿预测要依赖过去和或将来的参考图从当前宏块的实际值减去预测值形成差值信号第三把这些差值信号分成的块个亮度块和个色度块并对每一块进行离散余弦变换对每一结果的系数块进行量化并对二维的块进行字扫描把其转化成一维量化的系数串第四对宏块的附加信息模式运动矢量等和量化的系数数据进行编码为达最高的编码效率对不同数据元素定义一些变长码表对量化系数数据使用变长编

12、码使用不同的图像类型和变长码的一个后果是总的数据速率是可变的在固定速率信道的应用中可使用一个的缓冲器来缓冲编码器对信道的输出应监视该缓冲器的状态来控制编码器产生的位数控制量化过程是控制位速率的最直接方法本标准中规定了一个缓冲系统的抽象模型视频缓冲检验器用以约束用于一幅图的位数最大变化量这样确保可用一个已知容量的缓冲器对位串流解码到此图像的编码表示已经完成编码器的最后一步是通过解码再次产生图和图以用作后续图像编码的参考图量化数据经逆量化并对每块进行逆变换产生的预测误差信号再回加到预测信号上并限制在要求的范围内以产生解码参考图解码解码是编码的逆操作它比编码要简

13、单许多因为无需进行运动估值所要的选择也很少在本标准中定义了解码过程下面是对位流的一种可能解码方法的简要概述图中示出了主要的功能块其中离散余弦逆变换逆量化多路分解可变长解码图基本视频解码器框图对于固定速率的应用信道以恒定速率对缓冲器填充位流解码器读该缓冲器并依据定义的语法对位流中的数据元素进行解码解码器读位流过程中识别编码图像起始和图像的类型它按顺序解码图像中的每一宏块如果有宏块类型和运动矢量的话则用解码器已存储的过去和将来的参考图作为基础构造当前宏块的预测系数数据经过解码和逆量化每一的系数块经逆变换见附录所述结果加到预测信号上并限制在规定的范围内当图中

14、的所有宏块经处理之后图像就重构起来了如果它是图或图则它是后继图的参考图并加以存储替代存储最久的参考图在图像被显示前它们可能需要作从编码的顺序到自然的显示顺序的调整调整顺序之后图像以数字形式作为后处理之用并以应用选定的任何方式进行显示编码视频位流的结构本标准规定了编码视频位流的语法该语法含有层每层支持一个信号处理或者一个系统功能语义层功能序列层随机存取单元上下文图像组层随机存取单元视频图像层初始编码单元片层重同步单元宏块层运动补偿单元块层单元算法所支持的特性使用数字存储媒体上压缩视频的应用程序除能进行正常的序列播放操作外还要求能进行一系列的其他操作

15、编码位流的设计支持这一系列的操作随机操作随机操作是存储媒体上视频的一个极重要的特征它要求任一图像可在有限时间内进行解码这意味着位流中存在操作点即可识别的信息段它不需参考其他段数据即可解码每秒的空间内可有两个随机操作点帧内图而不会严重损害图像质量快速搜索依赖于存储媒体有可能从编码位流中扫描操作点在具体应用目录的帮助下或不在本标准范围内的其他信息的帮助下以获得快速正放或快速倒放的效果反向播放一些应用可能要求视频信号能进行逆顺序播放这可通过先用解码器的存储器存储解码后的整个图组然后再按逆序进行播放编码器可通过缩短图组长度使这一特征的实现更简单鲁棒性绝大多数的数字存储媒体和

16、信道都是会出错的应该使用合适的信道编码方案这已超出本标准的范围了然而在本标准中定义的压缩方案对残差具有鲁棒性子图的结构使得解码器可从数据错误恢复过来并对解码重新同步因而压缩数据的错误会导致解码图像中的错误受到限制解码器可使用隐含的策略来掩藏这些误差编辑对高效编码和容易编辑的要求是有冲突的编码结构和语法的设计并没有以简化任何图像的编辑为主要目标不过编码中包含了一些特征从而能够对编码数据进行编辑中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频国家技术监督局批准实施概述范围本标准规定了数字存储媒体中视频的编码表示以及解码处理表示方法除了支

17、持一些特殊功能如随机操作快速正放快速倒放常速倒放停顿以及图像静止之外也支持常速正放本标准与标准线线电视格式是兼容的它给个人计算机工作站的显示使用提供了灵活性主要适用于支持连续传送速率约的数字存储媒体比如盘数字音频磁带以及硬磁盘等因为其采用了一般化的手段它可应用于更广的范围内存储媒体可与解码器直接相连或者通过通信方法如总线或电信链接本标准使用约线每线像素图速率在约范围的非间隔扫描视频格式引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文本标准出版时所示版本均为有效所有标准都会被修订使用本标准的各方应探讨使用下列标准最

18、新版本的可能性信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分音频信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分一致性测试此标准正在制定中建议演播室数字电视编码参数报告单色和彩色电视系统特性建议音频信号的录制报告便携和移动式卫星接收器的声音信号广播附录中的先进数字系统的综述建议声音编程电路的预增强实现离散余弦逆变换的规范数字音频系统技术要素定义采用下列定义如果仅针对某一部分则在方括号内注明系数视频在一个或两个方向上为非零的所有系数存取单元

19、系统对压缩音频存取单元是音频存取单元对压缩视频存取单元是一幅图像的编码表示自适应段音频音频信号数字表示的一分段其时间是可变的自适应位分配音频根据心理声学模型以时间和频率变化的方式对子带进行位分配自适应噪声分配音频按照心理声学模型以时间和频率变化的方式对频带赋以编码噪声混迭音频奈奎斯特子采样所产生的镜像信号分量分析滤波器组音频在编码器中把宽带音频信号变换成一组子采样的子带样值音频存取单元音频对层和音频存取单元定义为可由自身进行解码的编码位流的最小部分其中解码是指完全重构的声音对层音频存取单元是指利用以前获得的主要信息可以解码的一部分位流音频缓冲器音频系统目

20、标解码器中用于存储压缩音频数据的缓冲器音频序列音频一个不中断的音频帧序列其中以下的参数保持不变标识符层采样频率对层和位速率索引向后运动矢量视频按照显示顺序利用后继图作为运动补偿的参考图中的运动矢量巴音频临界频带速率单位巴尺度是一个从频率尺度到与人耳的频率选择性相对应的音频范围的非线性映射双向预测编码图图视频使用根据过去和或将来的参考图的运动补偿预测进行编码的图位速率压缩位流从存储媒体输入到解码器的速率块压扩音频某一时间内音频信号数字表示的归一化块视频一个行列的正交像素块边界音频利用强度立体声编码的最低子带字节对齐在编码位流中如果一位的位置从位流的第一位开始

21、是的倍数则该位就称为字节对齐的字节位的序列信道存储和传输流的数字媒体声道音频立体声信号的左右信道色度分量视频按照建议中定义的方式用于表示与主色彩相关的两色差信号之一的矩阵块或单个像素编码音频位流音频按照中规定的音频信号的编码表示编码视频位流视频按照本标准的规定一幅或多幅图像序列的编码表示编码顺序视频图像存储和解码的顺序该顺序未必与显示的顺序一样编码表示以编码形式表示的数据元素编码参数视频表现编码视频位流特征的可以由用户定义的参数的集合由编码参数表征位流由能够解码的位流表征解码器分量视频组成一幅图的个矩阵亮度和两个色度之一的矩阵块或单个像素压缩

22、缩减表示数据项的位数恒位速率编码视频视频具有恒定的平均位速率的压缩视频位流恒位速率压缩位流时从开始到结束的位速率是常数的操作约束参数视频中定义的编码参数集中的值约束系统参数流系统符合的中定义的约束的多路流循环冗余码临界带速率音频频率的心理声学函数对一给定的可听频率它正比于低于该频率的临界带的个数临界带音频与人耳的频率选择性相对应的谱域的心理声学度量数据元素编码前或解码后的数据项的表示系数视频在两个方向上频率均为零的系数编码图图视频仅用其自身信息进行编码的图在编码表示的系数中仅有系数系数一给定的余弦基函数的幅值解码流压缩位流的解码重构解码器输入缓冲器视频在视

23、频缓冲检验器中规定的先进先出缓冲器解码器输入速率视频在视频缓冲检验器中规定的且在编码视频位流中编码的数据速率解码器解码处理的实体解码处理中定义的处理即读入编码的位流并产生解码图像或音频采样值解码时标系统可在数据包头中出现的一个域它用于表明系统目标解码器解码一个存取单元的时间去矫音频对存储或传输的音频信号所采取的一种滤波以消除因加重而引起的线性失真逆量化视频量化系数在对其位流中的表示进行解码之后和作逆变换之前所进行的比例变换处理数字存储媒体数字存储或传输的器件或系统离散余弦变换视频离散余弦正变换或离散余弦逆变换是一种可逆的正交变换本标准的附录中定义了逆变换显示顺序视

24、频解码图像进行显示的顺序通常与输入编码器编码的顺序相同双声道模式音频在一个位流中编码有两个相互独立节目内容如两种语言的音频信道模式编码过程与立体声的相同编辑对一个或多个压缩位流进行操作以产生一个新的位流合格的编辑位流必须满足规定的要求基本流系统编码视频音频或其他编码位流的统称加重音频音频信号在进行存储或传输前所进行的滤波以提高高频下的信噪比编码器编码处理的实体编码处理在中没有规定的一种处理读入输入的图像或音频样值流以产生一个符合中定义的有效的位流熵编码信号数字表示的一种变长无损编码用以减少冗余快速正放视频按显示顺序以比真实时间快的速度播放一图像序列或图像序

25、列的一部分快速傅立叶变换离散傅立叶变换的快速算法一种正交变换滤波器组音频覆盖全部音频范围的一组带通滤波器固定分段音频分成固定时间段的音频信号数字表示的一段禁止定义编码位流的条款中用到的禁止表示某值决不能被使用这常用于避免起始码的误判强迫更新视频不时地对宏块进行帧内编码处理以确保编码器和解码器间的逆变换不匹配误差不至于过分积累向前运动矢量视频用于运动补偿的运动矢量它以显示顺序上在其前的图为其参考图帧音频与从音频存取单元的音频样值相对应的部分音频信号自由格式音频对每层小于最大有效位速率且与所定的位速率不同的所有位速率将来参考图视频依显示顺序在当前图之后的参考图区组

26、层音频量化前被一起考虑的个子带中连续个子带样值的集合它们对应于个样本区组层音频载有自身辅助信息的频率线图组视频支持随机操作的一幅或多幅编码图的序列汉宁窗口音频傅立叶变换之前将逐个样值应用于音频样值块的时间函数哈夫曼编码一种熵编码方法混合滤波器组音频子带滤波器组和的串行组合音频改进的离散余弦逆变换强度立体声音频基于在高频下仅保留左右声道的能量包络以缩减立体声音频节目中的立体声不相关或冗余的一种方法隔行扫描视频常规电视图像的一种性质其中相间各行在时间上连续帧内编码视频宏块或图像仅用其自身的信息进行编码帧内编码图图视频仅用其自身信息进行编码的图多路复用流系

27、统由零个或零个以上的基本流按的定义组成的组成的位流联合立体声编码音频缩减立体声不相关或立体声冗余的所有方法联合立体声模式音频使用联合立体声编码的音频编码算法的一种模式层音频中定义的音频系统编码层次的一个层次层视频和系统本标准以及中定义的视频和系统规范中数据层次中的一个层次亮度分量视频表示单色信号的矩阵块或单个像素符合建议定义的与基色差信号相联系表示亮度的符号是宏块视频从图像的亮度分量的一个区域得到的个的亮度数据块和与之相对应的个色度数据块宏块有时指像素数据有时指像素值的偏码表示以及所定义的其他宏块层语法中的数据元素从上下文可明确具体用法映射音

28、频通过子带滤波和或音频信号从时域到频域的转换屏蔽现象音频人类听觉系统的一种性质当存在另外一种音频信号时一种音频信号不能被感知屏蔽阈值音频是一个频率和时间的函数在该值以下音频信号不能被人类听觉系统所感知音频改进离散余弦变换运动补偿视频利用运动矢量来改善像素值预测的效率预测利用运动矢量提供相对过去或和将来参考图的偏移参考图中包含有用于形成预测差值信号的以前解码的像素值运动估值视频编码过程中估算运动矢量的处理过程运动矢量视频用于运动补偿的二维矢量它提供从当前图像的坐标位置到参考图像坐标的偏移立体声音频基于对和信号与差信号而不是左右声道进行编码来减小立体声音频节目中出现

29、的立体声不相关和或冗余的一种方法帧间编码视频宏块或图像的编码不仅用到其自身的信息而且还用到其他时间的宏块或图像的信息非音调成分音频音频信号中的一种类似噪声的分量奈奎斯特采样以大于或等于信号带宽的两倍的频率进行采样包系统一个包由一个包头和跟随其后的一个或多个分组组成它是中描述的系统编码语法中的一层分组数据系统分组中基本流的连续字节分组头系统包含于分组数据中的载有基础流数据信息的数据结构分组系统一个分组由一个头和其后面的一些基础数据流中的连续数据字节组成填充音频通过有条件地在音频帧中加入一槽来调整音频帧的平均时间长度使其与对应的采样值的持续期相适应过去参考图视频按显示次序出

30、现在当前图之前的参考图像素纵横比视频显示像素的标称垂直高度与标称水平宽度之比像素视频图元素图周期视频图速率的倒数图速率视频解码输出图的标称速率图视频源编码的或重构的图像数据个源图或重构图由个位的矩阵组成个矩阵分别代表一个亮度信号和两个色度信号图层是本标准中定义的编码语法的一个层注意总是用图这个词而不是场或帧多相滤波器组音频一组具有相等带宽的且相位之间有特殊关系的滤波器它使滤波器组能有效地实现预测视频利用预测值提供当前解码图像的像素值或数据元素的估计值预测编码图图视频利用从过去的参考图得到的运动补偿预测进行编码的图预测差值视频像素或数据元素的实际值同预测

31、值的差预测值视频以前解码的像素值或数据元素的线性组合演示时标系统可出现在分组头中的一个域它指示演示单元出现在系统目标解码器中的时间演示单元系统解码的音频操作单元或解码的图心理声学模型音频人类听觉系统屏蔽行为的一个数学模型量化矩阵视频逆量化器使用的一组位的个数量化系数视频逆量化之前的系数量化系数的变长编码表示作为压缩视频的一部分进行存储量化器比例因子视频位流中的一个数据元素解码过程中用其确定逆量化尺度随机操作在任一点上进行读取并对编码的数据流进行解码的处理过程参考图视频按显示顺序与当前图最邻近的图或图顺序调整缓冲器视频系统目标解码器中的缓冲器用来存储重构的

32、图或图重量化音频对编码子带样值进行解码以恢复原始量化值保留当在定义编码位流的条文中使用保留一词时表明其值可用于国家标准将来定义的扩充中反向播放视频以与正常播放顺序相反的顺序显示图像序列的过程比例因子带音频层中的一组频率线它可通过一个比例因子进行缩放比例因子索引音频比例因子的一个数值码比例因子音频量化前对一组数值进行缩放的因子序列头视频编码位流中的一种数据块包含有一些数据元素的编码表示辅助信息位流中的控制解码器所需的信息空白宏块视频没有存储数据的宏块子图视频一系列的宏块它是本标准中定义的编码语法的一层槽音频槽是位流的一个基本部分在层中一个槽为个字节在

33、层中一个槽为个字节源流压缩编码前一个单一的非多路复用的采样值流传播函数音频描述屏蔽频率传播的函数起始码系统和视频嵌入编码位流中的唯一的位码它可用于包括标识编码语法中的层在内的多种目的输入缓冲器系统系统目标解码器输入时的一种先进先出缓冲器用于存储解码前基础流的压缩数据立体声模式音频是这样一种模式形成一个立体声对左和右的两个音频信道编码在一个位流中编码过程与双通道模式相同填充位填充字节插入到压缩位流中的码字但在解码过程中被丢弃它用于增加流的位速率子带音频音频频带的一部分子带滤波器组音频覆盖全部音频频率范围的一组带滤波器中子带滤波器组是一个多相滤波器组子

34、带样值音频音频编码器中的子带滤波器组产生一输入音频流的滤波子采样表示其中滤波样值叫子带样值从输入的个时间连续的音频样值中在个子带中每个子带产生个时间连续的子带样值同步字音频音频流中嵌入的一个位码它用于标识一帧的开始合成滤波器组音频解码器中的用于从子带样值重构音频信号的滤波器组系统头系统中定义的一种数据结构它载有概括多路流系统特征的信息系统目标解码器系统解码过程的一个假设的参考模型它用于描述多路流的语义时标系统用来标明一个事件发生的时间三重组音频一个子带中的三个连续的子带样值集合个子带的三重组形成一个区组音调分量音频音频信号的一个正弦波状的分量可变位速

35、率解码压缩位流过程中位速率随时间而变化的操作变长编码一种可逆的编码过程对较常出现的事件赋予较短的码字不常出现的事件赋予较长的码字视频缓冲检验器视频概念上与编码器的输出相连接的一种假设的解码器它用于约束编码器或编辑过程中生成的数据速率的变化量视频序列视频一个或多个图组组成的序列它是本标准所定义的编码语法的一个层字扫描顺序视频系数的一种从大约最低空域频率到最高空域频率的顺序符号与缩略语用于描述本标准的数学运算符号与程序设计语言中的类似然而关于整数除法的取位和舍入又有专门的规定位运算符的定义假设整数是用补码表示的数字和计数的循环一般从零开始算术运算符加减作为二元运算符

36、或负作为一元运算符增减乘乘方整数除法结果取整例如和取整结果为和取整结果为整数除法结果四舍五入若不特殊说明小数部分的作进位处理如整数除法往负向取整即取小于正常除法运算结果的最大整数绝对值取模运算仅对正数有定义取整运算符将其实参舍入成与它最接近的整数小数部分的作进位处理正弦余弦指数平方根以为底的对数以为底的对数以为底的对数逻辑运算符逻辑或逻辑与逻辑非关系运算符大于大于或等于小于小于或等于等于不等于取参数中的最大值取参数中的最小值位运算使用按位运算时操作数均假设采用补码表示与或右移带符号扩展左移移后填赋值运算赋值运算符助记符下列助记符用于描述编码位

37、串流中的不同数据类型位串左边位开始规定位串从左开始书写位串是单引号内的或组成的串如位串当中的空白只是为了阅读方便没有其他意义通道如果值是是指立体声信号的左通道或两个独立信号中的第一个信号音频通道号等于表示单通道模式等于表示其他模式音频音频层子带采样的粒度音频层子带采样中的粒度位串流的部分包含比例因子哈夫曼编码数据以及辅助信息音频位于位串流中帧的的开始处具体位置是前帧末端的位置再加上位它由前帧的值计算出来音频中比例因子所占的位数音频余数多项式的系数最高幂在前音频子波段音频没有分配位的最低子波段的个数音频选择比例因子的信息音频使

38、用了窗口开关上的点的长块比例因子波段的个数音频使用了窗口开关上的点的短块比例因子波段的个数音频无符号整数最高位在前变长码左边位开始这里左指码的书写顺序当时实际时间槽的个数音频常量描述位流的语法规则中描述了解码器得到的位流位流中的每一数据项用黑体字印刷并描述了它们的名称位长度类型助记符以及传送顺序等在位流中由解码数据元素所引起的动作与该数据元素的值以及前面解码的数据元素有关中描述了数据元素的解码以及解码中所用的状态变量的定义以下结构用于表述数据元素何时出现以及何时为正常类型的条件注意本语法中使用了这样的代码约定一个非零的变量或表达式相当于一个为真的条件条

39、件如条件为真数据流中将出现数据元素组直到条件为假为止数据元素至少出现一次条件数据元素不停重复直到条件为假条件如果条件为真则接下来数据流中出现第一组数据元素若条件为假接下来在数据流中出现第二组数据元素是一个说明循环起始条件的表达式通常它给出计数器的初始状态是每次重复循环的测试条件当条件为假时结束循环是一个表达式每循环一次它发生一次作用通常它是计数器的增量注意以下是本结构最普通的用法数据元素组出现次数据元素组中的条件结构同循环控制变量有关第一次出现时被置第二次被加等等数据元素组中可含有嵌套的条件结构为简短起见若只有一个数据元素时可以省略是一个数据数组由上

40、下文指明数据元素的个数是数据数组中第个元素是二维数据数组中第个元素是三维数据数组中第个元素的范围从至若是用程序的方式表示语法则的解码程序是不能令人满意的尤其语法定义了一个正确无差错的输入位流实际的解码器在解码过程中必须能检出起始码以使其能正确地开始解码识别错误删除插入等至于识别这些状态的方法以及所采取的行动不必统一函数的定义如果当前位置处在字节的边界上即位流中的下一个位是一个字节的第一位则函数返回值为否则返回值为函数的定义函数允许一个位串同位流中下一个解码的位进行比较函数的定义函数除去所有零位和零字节填充位并定位下一个起始码见表表语法位数助记符该函数

41、检验当前位置是否是字节对准的若不是则加入零填充位在起始码前可加入任意个零字节因此起始码总是字节对准的在其前可有任意个数的零填充位要求编码结构和参数视频序列编码的视频序列从序列头开始后接一个或多个图组并以结束每一图组前可有一个序列头序列内图形是连续可解码的在这些重复的序列头中除了定义量化矩阵和可选择的与的数据元素之外每一个数据元素的值都必须与第一个序列头中的值相同位串流中序列头每出现一次量化矩阵都可能被重新定义因此数据元素和可选择的与可具有所有的非禁止的值序列头的重复使得初始序列头的数据元素得以重复从而使随机地对视频序列进行操作成为可能另外需要时

42、视频序列中的量化矩阵可以改变序列头视频序列头以码开始后跟一系列的数据元素图组图组是一个由一个或多个有助于对序列随机操作的编码图组成的序列存储的位流位串流中图组的第一个编码的图是图编码流中图的顺序就是在正常播放时解码器处理它们的顺序应特别指出编码流中相邻图的顺序是依据它们的显示顺序按照显示顺序图组中最末一幅编码图或者是图或者是图下面例子是一个视频序列中起始部位的图组本例中第一个图组有幅图形后面的图组包含幅图形在两幅图或一幅图和一幅图之间有两幅图图用作对图的预测和两图用作对和图的预测因此编码图形序列中图的顺序是然而解码器显示它们的顺序

43、是编码器输入编码器输出的存储位串流以及解码器输入上面的垂直竖线是图组边界的标志注意本例中第一个图组比后继图组少两幅图这是因为视频编码的开始图前没有图然而一般来说按照显示顺序在图组中首幅图前可有图即使解码第一个图组也是如此解码器的输出图组的长度随意可包含一个或多个图在要求能随机操作快速播放快速或常速逆放的应用场合可使用相对较短的图组图组亦可从景物剪裁处或其他运动补偿失效的地方启动相连的图数目是变化的图或图均可以不出现在图组中由于编辑的结果解码器读到的视频序列的图组可能与编码器输出的不同图源图或重构图由三个矩阵组成矩阵中的数是的三个矩阵是亮度矩阵

44、和两个色度矩阵和矩阵需具有偶数的行和列而和矩阵水平和垂直方向均为矩阵大小的一半和的元素同建议中描述的基色模拟的红绿和蓝信号有关这些主信号经过了灰度预校正假定的灰度系数值在本标准中没作规定但是典型地大约在至的区域内要求精确复制色彩的应用场合常更精确地表示灰度系数值然而这已超出本标准的范围图示出了亮度和色度样本的定位情况其中表示亮度样本的位置表示色度样本的位置图亮度与色度样本的位置有四种类型的编码图分别使用了不同的编码方法帧内编码图图的编码仅使用其自身的信息预测编码图图的编码使用过去的图和图的运动补偿预测双向预测编码图图的编码使用过去

45、和将来的图和图的运动补偿预测直流编码图图的编码也仅使用其自身的信息仅直流的系数出现在图组成的序列中不含有其他类型的图子图子图是由一系列的随意个数的宏块组成的宏块按照光栅扫描的顺序从图的左上角的宏块开始自左至右自顶部至底部子图的第一个和最后一个宏块不应是跳跃宏块见每一子图应至少包含一个宏块子图之间不能重叠也不能有间隙子图的位置在图与图之间可以是不同的第一个子图应由图的第一个宏块开始最末一个子图的结尾应是图的最后一个宏块宏块宏块包含像素线的亮度分量空间上同像素线的每一色度分量相对应一个宏块有个亮度块和个色度块宏块可指源或重构的数据或者经

46、缩放量化的系数宏块中块的顺序是对左上右上左下右下后面跟和图示出了这些块的安排跳跃宏块中没有任何信息见块块是一个像素线的正交的亮度或色度分量的区域块可指源或重构的数据或者指对应的编码数据元素保留位禁止位和标记位保留禁止用于描述编码位串流中若干域的值保留表明该值可作为将来扩充之用禁止表明不能使用某个值经常是为了避免与起始码相重标记位表明一位的域其值禁止为语法中有几处引入标记位以免与起始码相重图在宏块中块的排列编码视频位串流的语法规范起始码起始码是一类不会在视频流中另外出现的保留位模式所有起始码均是字节对齐的见表表名称二进制值包括到留用留用留

47、用系统开始码见注到注系统开始码在中定义除外下列语法描述定义了起始码的使用情况数字存储媒体接口使用来表明在何处检测到了不可校正的错误视频序列层见表表语法位数助记符序列头见表表语法位数助记符图组层见表表语法位数助记符表完语法位数助记符图层见表表语法位数助记符表完语法位数助记符子图层见表表语法位数助记符宏块层见表表语法位数助记符表完语法位数助记符块层见表表语法位数助记符视频位流语法的语义视频序列层是位串十六进制它结束一个视频序列序列头是位串十六进制由它标识序列头的开始码是亮度分量的可显示部分的用像素表示

48、的宽度宏块中编码亮度分量的宽度是图中可显示部分在编码图像中是左边对齐的码是亮度分量可显示部分的用像素表示的高度宏块中编码亮度分量的高是图中可显示部分在编码图像中是向顶对齐的码是一个由表定义的整数表高宽示例禁用的等线线线线留用的是一个由表定义的整数应用程序以及编码器应该注意到这样一个事实和并不准确代表标准的图速率准确的图速率可从报告求得它们在和当中这是一个说明位流的位速率的整数位速率以为单位并向上取整零值是不允许的值表示可变位速率操作是一位应置成是一个的整数它定义了序列解码所需的视频缓冲器见附录缓冲区的大小它的定义是其中是解码序列所需

49、的最小缓冲区的位数见附录是一个的标志位如果后面的数据元素满足下面的约束则被置表图片每秒禁用的留用的留用的像素像素图片秒见见如果被置位则域应该给出一个小于或等于即千字节的缓冲区若被置位则域应该给出一个小于或等于的编码数据速率值是一个的标志位若后跟有则其置若其置则在下个序列头出现之前使用下面的按光栅扫描顺序定义的默认值是一个个无符号整数的列表按中字扫描顺序排列的新值代替以上所示的默认值零值是禁止的的值总是在下一个序列头出现之前新值一直有效是的标志位若后跟有它被置若它的值是则在下个序列头出现之前使用下面定义的默认值是个无符号整数的表列存储于字形扫描见中的新值替代上面所示的默认值零值是禁止的在下一序列头出现之前新值一直在起作用是位串十六进制它标志扩展数据的开始当接收到另一个起始码时扩展数据结束这是为了正确分析扩展数据所必需的保留是位串十六进制它标志用户数据的开始当接收到另一起始码时用户数据结束用户为其特殊应用

下载提示：本站仅提供存储空间/不修改/不编辑