书签分享收藏举报版权申诉 / 146

立即下载加入VIP,交流精品资源

当前位置：首页 > 标准规范 > 国家标准 > GB T 17191.3-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第3部分;音频.pdf

GB T 17191.3-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第3部分;音频.pdf

上传人：confusegate185

文档编号：162672

上传时间：2019-07-15

格式：PDF

页数：146

大小：16.91MB

《GB T 17191.3-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第3部分;音频.pdf》由会员分享，可在线阅读，更多相关《GB T 17191.3-1997 信息技术具有1.5Mbit s 数据传输率的数字存储媒体运动图像及其伴音的编码第3部分;音频.pdf（146页珍藏版）》请在麦多课文档分享上搜索。

1、中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分音频发布实施国家技术监督局发布前言本标准等同采用国际标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分音频在信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码总标题下目前包括以下个部分第部分系统第部分视频第部分音频第部分一致性测试本标准的附录附录是标准的附录附录附录附录附录附录附录是提示的附录本标准由中华人民共和国电子工业部提出本标准由电子工业部标准化研究所归口本标准起草单位清华大学本标准主要起草人钟玉琢智西湖前言国际标

2、准化组织和国际电工委员会是世界性的标准化专门机构国家成员体它们都是或的成员国通过国际组织建立的各个技术委员会参与制定针对特定技术范围的国际标准和的各技术委员会在共同感兴趣的领域内进行合作与和有联系的其他官方和非官方国际组织也可参与国际标准的制定工作对于信息技术和建立了一个联合技术委员会即由联合技术委员会提出的国际标准草案需分发给国家成员体进行表决发布一项国际标准至少需要的参与表决的国家成员体投标赞成国际标准是由信息技术联合技术委员会制定的在信息技术具有数据传输率的数字存储媒体运动图象及其伴音的编码总标题下目前包括以下个部分第部分系统

3、第部分视频第部分音频第部分一致性测试附录附录构成标准的一部分附录附录附录附录附录附录仅提供参考信息引言注对运动图像编码标准中音频部分感兴趣的读者在阅读正文第章和第章之前应该先阅读本引言附录图和附录编码过程为了帮助读者理解存储的压缩数据流和它的译码下面依次介绍编码存储和解码编码编码器处理数字音频信号并产生存储所需的数据流编码器的算法没有标准化可以使用多种算法进行编码如音频掩蔽阈值估计量化和缩放然而编码器的输出应使说明的解码器能产生适合实际应用的音频信号图音频编码器基本结构框图图表明了音频编码器的基本结构编码过程如下输入

4、音频抽样被读入编码器映射建立输入音频数据流的经滤波的子抽样表示经映射的抽样可能是子带抽样如层和层见下面或变换子带抽样如层心理声学模型建立一组控制量化器和编码的数据这些数据随实际编码器实现的不同而不同一种可能性是利用音频掩蔽阈值估计来实现量化器的控制量化器和编码部分从已映射的输入抽样中生成一组编码符号该部分依赖于编码系统帧封装将来自其他部分的输出数据汇集成实际数据流如果需要的话再加上其他信息如误差校正有四种不同的编码模式单声道模式双声道模式两个独立的音频信号编在一个数据流内立体声模式立体声的左和右声道编在一个数据流内和联合立体声模式带有与立体声不相关

5、或冗余信息的立体声左右声道编在一个数据流内层根据应用需求可以使用不同层次的编码系统编码器的复杂性和性能随之增高本标准音频层解码器能够解出层内或低于层的所有层的数据流层这一层包括将数字音频输入信号映射成个子带固定分段以便按格式把数据分成块心理声学模型用以确定自适应位分配利用块压扩量化并格式化理论上层编码解码的最少延时约为层这一层提供位分配缩放因子和抽样的附加编码使用了不同的帧格式这层理论上的最小编码解码延时约为层这一层采用混合带通滤波器来提高频率分辨率它还增加了一个差值量化量非均匀自适应分段和量化值的熵编码这层理论上的最小编码解码延时为联合立体声编

6、码能够作为一个附加的特性加入到任何层中存储已编码的视频音频同步数据系统数据和辅助数据等各种数据流可以一并存入一种存储媒体中如果将限定编辑点和可寻址点一致音频编辑是很容易的对存储器的存取可能包括在通信系统中的远程存取假定存取被一个功能单元控制而不是被音频解码器本身控制这个控制单元接收用户命令读取并解释数据的基本结构信息从媒体中读取已存储的信息分解非音频信息以所需的速率将存储的音频数据流传送给音频解码器解码解码器按定义的语法接收压缩的音频数据流按的方法解出数据元素按的规定用这些信息产生数字音频输出图表明了音频解码器的基本结构其解码过程如下数据流输入到解码器首

7、先进行数据流扩展如果在编码器中使用了误差校验见解码器将进行误差检测数据流扩展后恢复各种信息重构单元将重构一组映射抽样的量化方案逆映射单元把这些映射抽样变换回均匀图音频解码器结构框图中华人民共和国国家标准信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分音频国家技术监督局批准实施概述范围本标准规定了为存储媒体提供高质量的音频编码表示和高质量音频信号的解码方法编码器的输入和解码器的输出与现在的标准兼容如标准的压缩光盘和数字音频磁带本标准以的数据为应用存储媒体提供连续的音频和视频数据流如和硬盘存储媒体可以直接连到解码器上也可以用其他方式如通过通信线路或

8、按定义的多数据方式与解码器相连本标准使用的采样率为和引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文本标准出版时所示版本均为有效所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分系统信息技术具有数据传输率的数字存储媒体运动图像及其伴音的编码第部分视频建议演播室数字电视编码参数报告单色和彩色电视系统特性建议音频信号的录制报告便携和移动式卫星接收器的声音信号广播附录中的先进数字系统的综述建议声音编程电路的预增强实现离散余弦逆变换的详细说明数字音频系

9、统技术要素定义采用下列定义如果仅针对某一部分则在方括号内注明系数视频在一个或两个方向上为非零的所有系数存取单元系统对压缩音频存取单元是音频存取单元对压缩视频存取单元是一幅图象的编码表示自适应段音频音频信号数字表示的一分段其时间是可变的自适应位分配音频根据心理声学模型以时间和频率变化的方式对子带进行位分配自适应噪声分配音频按照心理声学模型以时间和频率变化的方式对频带赋以编码噪声混迭音频奈奎斯特子采样所产生的镜象信号分量分析滤波器组音频在编码器中把宽带音频信号变换成一组子采样的子带样值音频存取单元音频对层和音频存取单元定义为可由自身进行解码的编码位流的最小部

10、分其中解码是指完全重构的声音对层音频存取单元是指利用以前获得的主要信息可以解码的一部分位流音频缓冲器音频系统目标解码器中用于存储压缩音频数据的缓冲器音频序列音频一个不中断的音频帧序列其中以下的参数保持不变标识符层采样频率对层和位速率索引向后运动矢量视频按照显示顺序利用后继图作为运动补偿的参考图中的运动矢量巴音频临界频带速率单位巴尺度是一个从频率尺度到与人耳的频率选择性相对应的音频范围的非线性映射双向预测编码图图视频使用根据过去和或将来的参考图的运动补偿预测进行编码的图位速率压缩位流从存储媒体输入到解码器的速率块压扩音频某一时间内音频信号数字表示的归一化块视频

11、一个行列的正交像素块边界音频利用强度立体声编码的最低子带字节对齐在编码位流中如果一位的位置从位流的第一位开始是的倍数则该位就称为字节对齐的字节位的序列信道存储和传输流的数字媒体声道音频立体声信号的左右信道色度分量视频按照建议中定义的方式用于表示与主色彩相关的两色差信号之一的矩阵块或单个像素编码音频位流音频按照本标准中规定的音频信号的编码表示编码视频位流视频按照的规定一幅或多幅图像序列的编码表示编码顺序视频图像存储和解码的顺序该顺序未必与显示的顺序一样编码表示以编码形式表示的数据元素编码参数视频表现编码视频位流特征的可以由用户定义的参数的集合由

12、编码参数表征位流由能够解码的位流表征解码器分量视频组成一幅图的个矩阵亮度和两个色度之一的矩阵块或单个像素压缩缩减表示数据项的位数恒位速率编码视频视频具有恒定的平均位速率的压缩视频位流恒位速率压缩位流时从开始到结束的位速率是常数的操作约束参数视频中定义的编码参数集中的值约束系统参数流系统符合的中定义的约束的多路流循环冗余码临界带速率音频频率的心理声学函数对一给定的可听频率它正比于低于该频率的临界带的个数临界带音频与人耳的频率选择性相对应的谱域的心理声学度量数据元素编码前或解码后的数据项的表示系数视频在两个方向上频率均为零的系数编码图图视频仅用其自身信息进行

13、编码的图在编码表示的系数中仅有系数系数一给定的余弦基函数的幅值解码流压缩位流的解码重构解码器输入缓冲器视频在视频缓冲检验器中规定的先进先出缓冲器解码器输入速率视频在视频缓冲检验器中规定的且在编码视频位流中编码的数据速率解码器解码处理的实体解码处理中定义的处理即读入编码的位流并产生解码图像或音频采样值解码时标系统可在数据包头中出现的一个域它用于表明系统目标解码器解码一个存取单元的时间去矫音频对存储或传输的音频信号所采取的一种滤波以消除因加重而引起的线性失真逆量化视频量化系数在对其位流中的表示进行解码之后和作逆变换之前所进行的比例变换处理数字存储媒体数字存储或传输的器

14、件或系统离散余弦变换视频离散余弦正变换或离散余弦逆变换是一种可逆的正交变换的附录中定义了逆变换显示顺序视频解码图像进行显示的顺序通常与输入编码器编码的顺序相同双声道模式音频在一个位流中编码有两个相互独立节目内容如两种语言的音频信道模式编码过程与立体声的相同编辑对一个或多个压缩位流进行操作以产生一个新的位流合格的编辑位流必须满足规定的要求基本流系统编码视频音频或其他编码位流的统称加重音频音频信号在进行存储或传输前所进行的滤波以提高高频下的信噪比编码器编码处理的实体编码处理在中没有规定的一种处理读入输入的图像或音频样值流以产生一个符合中定义的有效的位流熵

15、编码信号数字表示的一种变长无损编码用以减少冗余快速正放视频按显示顺序以比真实时间快的速度播放一图像序列或图像序列的一部分快速傅立叶变换离散傅立叶变换的快速算法一种正交变换滤波器组音频覆盖全部音频范围的一组带通滤波器固定分段音频分成固定时间段的音频信号数字表示的一段禁止定义编码位流的条款中用到的禁止表示某值决不能被使用这常用于避免起始码的误判强迫更新视频不时地对宏块进行帧内编码处理以确保编码器和解码器间的逆变换不匹配误差不至于过分积累向前运动矢量视频用于运动补偿的运动矢量它以显示顺序上在其前的图为其参考图帧音频与从音频存取单元的音频样值相对应的部分音频信号自由格

16、式音频对每层小于最大有效位速率且与所定的位速率不同的所有位速率将来参考图视频依显示顺序在当前图之后的参考图区组层音频量化前被一起考虑的个子带中连续个子带样值的集合它们对应于个样本区组层音频载有自身辅助信息的频率线图组视频支持随机操作的一幅或多幅编码图的序列汉宁窗口音频傅立叶变换之前将逐个样值应用于音频样值块的时间函数哈夫曼编码一种熵编码方法混合滤波器组音频子带滤波器组和的串行组合音频改进的离散余弦逆变换强度立体声音频基于在高频下仅保留左右声道的能量包络以缩减立体声音频节目中的立体声不相关或冗余的一种方法隔行扫描视频常规电视图像的一种性质其中相间各行在时间

17、上连续帧内编码视频宏块或图像仅用其自身的信息进行编码帧内编码图图视频仅用其自身信息进行编码的图多路复用流系统由零个或零个以上的基本流按的定义组成的组成的位流联合立体声编码音频缩减立体声不相关或立体声冗余的所有方法联合立体声模式音频使用联合立体声编码的音频编码算法的一种模式层音频本标准中定义的音频系统编码层次的一个层次层视频和系统以及中定义的视频和系统规范中数据层次中的一个层次亮度分量视频表示单色信号的矩阵块或单个像素符合建议定义的与基色差信号相联系表示亮度的符号是宏块视频从图像的亮度分量的一个区域得到的个的亮度数据块和与之相对应的个色度数据块

18、宏块有时指像素数据有时指像素值的编码表示以及所定义的其他宏块层语法中的数据元素从上下文可明确具体用法映射音频通过子带滤波和或音频信号从时域到频域的转换屏蔽现象音频人类听觉系统的一种性质当存在另外一种音频信号时一种音频信号不能被感知屏蔽阈值音频是一个频率和时间的函数在该值以下音频信号不能被人类听觉系统所感知音频改进离散余弦变换运动补偿视频利用运动矢量来改善像素值预测的效率预测利用运动矢量提供相对过去或和将来参考图的偏移参考图中包含有用于形成预测差值信号的以前解码的像素值运动估值视频编码过程中估算运动矢量的处理过程运动矢量视频用于运动补偿的二维矢量它提供从当

19、前图像的坐标位置到参考图像坐标的偏移立体声音频基于对和信号与差信号而不是左右声道进行编码来减小立体声音频节目中出现的立体声不相关和或冗余的一种方法帧间编码视频宏块或图像的编码不仅用到其自身的信息而且还用到其他时间的宏块或图像的信息非音调成分音频音频信号中的一种类似噪声的分量奈奎斯特采样以大于或等于信号带宽的两倍的频率进行采样包系统一个包由一个包头和跟随其后的一个或多个分组组成它是中描述的系统编码语法中的一层分组数据系统分组中基本流的连续字节分组头系统包含于分组数据中的载有基础流数据信息的数据结构分组系统一个分组由一个头和其后面的一些基础数据流中的连续数据字节组成填充音频通过

20、有条件地在音频帧中加入一槽来调整音频帧的平均时间长度使其与对应的采样值的持续期相适应过去参考图视频按显示次序出现在当前图之前的参考图像素纵横比视频显示像素的标称垂直高度与标称水平宽度之比像素视频图元素图周期视频图速率的倒数图速率视频解码输出图的标称速率图视频源编码的或重构的图像数据个源图或重构图由个的矩阵组成个矩阵分别代表一个亮度信号和两个色度信号图层是中定义的编码语法的一个层注意总是用图这个词而不是场或帧多相滤波器组音频一组具有相等带宽的且相位之间有特殊关系的滤波器它使滤波器组能有效地实现预测视频利用预测值提供当前解码图像的像素值或数据元素的估计

21、值预测编码图图视频利用从过去的参考图得到的运动补偿预测进行编码的图预测差值视频像素或数据元素的实际值同预测值的差预测值视频以前解码的像素值或数据元素的线性组合演示时标系统可出现在分组头中的一个域它指示演示单元出现在系统目标解码器中的时间演示单元系统解码的音频操作单元或解码的图心理声学模型音频人类听觉系统屏蔽行为的一个数学模型量化矩阵视频逆量化器使用的一组位的个数量化系数视频逆量化之前的系数量化系数的变长编码表示作为压缩视频的一部分进行存储量化器比例因子视频位流中的一个数据元素解码过程中用其确定逆量化尺度随机操作在任一点上进行读取并对编码的数据流进行解码的处理

22、过程参考图视频按显示顺序与当前图最邻近的图或图顺序调整缓冲器视频系统目标解码器中的缓冲器用来存储重构的图或图重量化音频对编码子带样值进行解码以恢复原始量化值保留当在定义编码位流的条文中使用保留一词时表明其值可用于国家标准将来定义的扩充中反向播放视频以与正常播放顺序相反的顺序显示图像序列的过程比例因子带音频层中的一组频率线它可通过一个比例因子进行缩放比例因子索引音频比例因子的一个数值码比例因子音频量化前对一组数值进行缩放的因子序列头视频编码位流中的一种数据块包含有一些数据元素的编码表示辅助信息位流中的控制解码器所需的信息空白宏块视频没有存储数据的宏块子图

23、视频一系列的宏块它是中定义的编码语法的一层槽音频槽是位流的一个基本部分在层中一个槽为个字节在层中一个槽为个字节源流压缩编码前一个单一的非多路复用的采样值流传播函数音频描述屏蔽频率传播的函数起始码系统和视频嵌入编码位流中的唯一的位码它可用于包括标识编码语法中的层在内的多种目的输入缓冲器系统系统目标解码器输入时的一种先进先出缓冲器用于存储解码前基础流的压缩数据立体声模式音频是这样一种模式形成一个立体声对左和右的两个音频信道编码在一个位流中编码过程与双通道模式相同填充位填充字节插入到压缩位流中的码字但在解码过程中被丢弃它用于增加流的位速率子带

24、音频音频频带的一部分子带滤波器组音频覆盖全部音频频率范围的一组带滤波器本标准中子带滤波器组是一个多相滤波器组子带样值音频音频编码器中的子带滤波器组产生一输入音频流的滤波子采样表示其中滤波样值叫子带样值从输入的个时间连续的音频样值中在个子带中每个子带产生个时间连续的子带样值同步字音频音频流中嵌入的一个位码它用于标识一帧的开始合成滤波器组音频解码器中的用于从子带样值重构音频信号的滤波器组系统头系统中定义的一种数据结构它载有概括多路流系统特征的信息系统目标解码器系统解码过程的一个假设的参考模型它用于描述多路流的语义时标系统用来标明一个事件发生的时间三重组音

25、频一个子带中的三个连续的子带样值集合个子带的三重组形成一个区组音调分量音频音频信号的一个正弦波状的分量可变位速率解码压缩位流过程中位速率随时间而变化的操作变长编码一种可逆的编码过程对较常出现的事件赋予较短的码字不常出现的事件赋予较长的码字视频缓冲检验器视频概念上与编码器的输出相连接的一种假设的解码器它用于约束编码器或编辑过程中生成的数据速率的变化量视频序列视频一个或多个图组组成的序列它是所定义的编码语法的一个层字扫描顺序视频系数的一种从大约最低空域频率到最高空域频率的顺序符号与缩略语用于描述本标准的数学运算符号与程序设计语言中的类似然而关于整数除法的取位和舍入又有

26、专门的规定位运算符的定义假设整数是用补码表示的数字和计数的循环一般从零开始算术运算符加减作为二元运算符或负作为一元运算符增减乘乘方整数除法结果取整例如和取整结果为和取整结果为整数除法结果四舍五入若不特殊说明小数部分的作进位处理如整数除法往负向取整即取小于正常除法运算结果的最大整数绝对值取模运算仅对正数有定义取整运算符将其实参舍入成与它最接近的整数小数部分的作进位处理正弦余弦指数平方根以为底的对数以为底的对数以为底的对数逻辑运算符逻辑或逻辑与逻辑非关系运算符大于大于或等于小于小于或等于等于不等于取参数中的最大值取参数中的最小值位运算使用按位运算

27、时操作数均假设采用补码表示与或右移带符号扩展左移移后填赋值运算赋值运算符助记符下列助记符用于描述编码位串流中的不同数据类型位串左边位开始规定位串从左开始书写位串是单引号内的或组成的串如位串当中的空白只是为了阅读方便没有其他意义通道如果值是是指立体声信号的左通道或两个独立信号中的第一个信号音频通道号等于表示单通道模式等于表示其他模式音频音频层子带采样的粒度音频层子带采样中的粒度位串流的部分包含比例因子哈夫曼编码数据以及辅助信息音频位于位串流中帧的的开始处具体位置是前帧末端的位置再加上位它由前帧的值计算出来音频中比例因子所占的位数音

28、频余数多项式的系数最高幂在前音频子波段音频没有分配位的最低子波段的个数音频选择比例因子的信息音频使用了窗口开关上的点的长块比例因子波段的个数音频使用了窗口开关上的点的短块比例因子波段的个数音频无符号整数最高位在前变长码左边位开始这里左指码的书写顺序当时实际时间槽的个数音频常量描述位流的语法规则中描述了解码器得到的位流位流中的每一数据项用黑体字印刷并描述了它们的名称位长度类型助记符以及传送顺序等在位流中由解码数据元素所引起的动作与该数据元素的值以及前面解码的数据元素有关中描述了数据元素的解码以及解码中所用的状态变量的定义以下结构用于表述数据元素何时出

29、现以及何时为正常类型的条件注意本语法中使用了这样的代码约定一个非零的变量或表达式相当于一个为真的条件条件如条件为真数据流中将出现数据元素组直到条件为假为止数据元素至少出现一次条件数据元素不停重复直到条件为假条件如果条件为真则接下来数据流中出现第一组数据元素若条件为假接下来在数据流中出现第二组数据元素是一个说明循环起始条件的表达式通常它给出计数器的初始状态是每次重复循环的测试条件当条件为假时结束循环是一个表达式每循环一次它发生一次作用通常它是计数器的增量注意以下是本结构最普通的用法数据元素组出现次数据元素组中的条件结构同循环控制变量有关第一次出现时被置第二次

30、被加等等数据元素组中可含有嵌套的条件结构为简短起见若只有一个数据元素时可以省略是一个数据数组由上下文指明数据元素的个数是数据数组中第个元素是二维数据数组中第个元素是三维数据数组中第个元素的范围从至若是用程序的方式表示语法则的解码程序是不能令人满意的尤其语法定义了一个正确无差错的输入位流实际的解码器在解码过程中必须能检出起始码以使其能正确地开始解码识别错误删除插入等至于识别这些状态的方法以及所采取的行动不必统一函数的定义如果当前位置处在字节的边界上即位流中的下一个位是一个字节的第一位则函数返回值为否则返回值为函数的定义函数允许一个位串同位流中下一个解

31、码的位进行比较函数的定义函数除去所有零位和零字节填充位并定位下一个起始码见表表语法位数助记符该函数检验当前位置是否是字节对准的若不是则加入零填充位在起始码前可加入任意个零字节因此起始码总是字节对准的在其前可有任意个数的零填充位要求音频位流的编码语法说明音频序列见表表语法位数助记符音频帧见表表语法位数助记符头见表表语法位数助记符错误检查见表表语法位数助记符音频数据第层见表表语法位数助记符音频数据第层见表表语法位数助记符表完语法位数助记符音频数据第层见表表语法位数助记符表完语法位数助记符主数据位流定义如下在语

32、法中的域包含来自主数据位流的字节见表然而由于在第层中使用的哈夫曼编码的可变特性见表一帧的主数据并不总是尾随在此帧的头和附加信息之后一帧的在位流中的起始位置先于此帧的头一个负偏移量此偏移量由的值给出见的定义及图表语法位数助记符表完语法位数助记符表语法位数助记符表完语法位数助记符辅助数据见表表语法位数助记符音频位流语法的语义音频序列概述第和第层位流的一部分它利用自身的信息可解码在第层中它含有个样点的信息在第层中含有个样点的信息它以一个同步字打头在下一个同步字到来前结束它由整数个槽组成在第层为字节在第层为字节第

33、层位流的一部分它利用前面得到的主信息可进行解码在第层它含有个样点的信息虽然连续的同步字起始位置间的距离是整数个槽在第层为字节但属于一帧的音频信息并不总是包含在两个相继的同步字之间音频帧位流的一部分它包含同步和状态信息位流的一部分它包含错误检测信息位流的一部分它包含有关音频样点的信息位流的一部分它可用于辅助数据头所有层的开始位字节都是头信息位串位用来指明算法的标识符等于时是音频是保留的位用来指明使用了哪一层如表所示表第层第层第层保留如要改变层次则需要重置此音频解码器位用来指明冗余信息是否加入音频位流此冗余信息使错误检查和屏蔽更易实现等于

34、时无冗余信息加入等于时加入了冗余信息指明位率全零值表示自由格式的情况此时可使用一个不必列于表中的固定的位率固定意味着根据填充位的值一帧可包含或个槽是一个表的下标此表对不同的层有不同的内容指明的是各种模式立体声联合立体声双声道单声道的总位率见表表规定的位率层层层为了提供最小可能的延迟和复杂度解码器在第或第层可以不支持连续可变的位率第层通过切换来支持可变位率的切换可用于时优化存储需求或插值任何中间数据速率这可通过在位率表中相近的两个值之间进行切换来实现然而在自由格式中需要固定位率解码器也不必在自由格式模式中支持高于的位率这三个位

35、率值分别对应于第层第层和第层对于第层并不允许总位率和模式的所有组合见表表位率允许模式自由格式全部模式全部模式全部模式表完位率允许模式全部模式全部模式全部模式立体声强度立体声双声道立体声强度立体声双声道立体声强度立体声双声道立体声强度立体声双声道指明采样频率见表表规定频率留用如要改变采样率则需要重置音频解码器如果此位等于则这帧包含一个附加的槽用来把中间位率调整到采样频率否则此位将为当采样频率为时填充是必需的在自由格式中也需要填充应用填充使得经过一定数目的音频帧后编码帧的累积长度与下面计算的值的偏离不会超过槽累积帧长当前帧第一帧帧的大小

36、位率采样频率式中帧的大小对第层对第或第层下面的方法可用来确定是否进行填充对第一音频帧对随后的每一音频帧个人使用的位以后将不使用此位根据表指明模式在第和第层中模式是在第层中它是和或表规定模式在第层除联合立体声外的所有模式其界限值等于在第层除联合立体声外的所有模式其界限值等于最低子带数在联合立体声模式中界限值由模式扩展来确定这些位用于联合立体声模式中在第和第层中它们指明哪些子带是强度立体声所有其他子带以立体声编码见表表在第层它们指明应用了哪类联合立体声编码模式使用强度立体声和模式的频率范围在算法中是默认的见表要知更多的信息见

37、表注意当模式位指明为立体声或等价地当模式位指明为联合立体声且模式扩展指明强度立体声为为时则使用的是立体声模式如果此位等于则这个位流没有版权如果等于则意味着版权保护如果这个位流是一个复制品则此位等于如果它是原始流则此位等于指明将要使用的解增强类型见表表规定增强留用错误检查一个位的奇偶校验字用于编码位流中可选的错误检测音频数据第层指明在声道的子带中用来编码样点的位数对强度立体声模式中的子带每个子带只有一个分配数据单元包含在位流中见表表位每样本禁用注意对于码字没有样点传送指明声道的子带的因子利用它可缩放该子带内的逆量化样点此六位组成一个无符

38、号整数指向表第层第层缩放因子声道的子带中的第个样点的编码表示对强度立体声模式的子带样点的编码表示对两个声道都是有效的音频数据第层包含声道的子带中的样点所用量化器的有关信息而不管该信息是关于三个相继样点已组成一个码字的还是关于用来编码这些样点的位数的此域的含义和长度依赖于子带数位率和采样频率域中的这些位组成一个无符号整数用作在表第层的位分配表中相关的表的索引此表给出了用于量化的级数对强度立体声模式中的子带位流对每个子带只提供一个分配数据单元缩放因子选择信息它给出的信息是关于传送来用子声道的子带的缩放因子数以及关于它们对此帧信号的哪一部分

39、才有效每个子带中的帧分成三个相等的部分每部分个子带样点见表表传送三个缩放因子对部分分别有效传送二个缩放因子第一个对部分有效第二个对部分有效传送一个缩放因子对三部分均有效传送二个缩放因子第一个对部分有效第二个对部分有效指明一个因子利用它可缩放声道的子带的及这帧的第部分的逆量化样点此六位组成一个无符号整数指向表第层第层缩放因子是一个函数它决定对声道的子带的样点编码时分组是否有效分组意味在声道的当前子带的当前区组中的三个相继样点一个三元组的编码和传送是使用一个公共的码字而不是三个独立的码字如果当前正在使用的位分配表见第章

40、中行和列处的值是或则为真否则就为假对强度立体声模式中的子带分组对两个声道都是有效的声道的子带中的区组中的三个相继样点的编码表示对强度立体声模式的子带样点码字的编码表示对两个声道都是有效的声道的子带中的第个样点的编码表示对强度立体声模式的子带样点的编码表示对两个声道都是有效的音频数据第层主数据开始的值是用来确定一帧的主数据的第一位的位置主数据开始值指定的位置是以音频同步字的第一个字节为基准的一个负偏移量此偏移量以字节为单位属于头和附加信息的字节数没有计算在内例如如果主数据开始等于则主数据在附加信息之后开始在图和图中给出了例子个人使用的位

41、以后将不使用这些位私有位的数目依赖于声道数目分配给私有位的位数应该等于用于附加信息的总位数在第层缩放因子选择信息的工作类似于音频的第层主要不同之处在于使用了可变的使适用于缩放因子组而不是单个的缩放因子缩放因子对粒度组的应用是由控制的见表表为每个粒度组传送缩放因子为粒度组传送的缩放因子对粒度组也有效如果切换到短窗也即粒度组中的一个则对此帧总是控制对一组缩放因子的选择信息的使用见表表缩放因子带见表此值包含了用于缩放因子和哈夫曼码数据的主数据位数因为附加信息的长度总是相同的所以此值可用来计算下一粒度组的主信息的开头或辅助信息如果有的话的位置注意单声道音

42、频帧包含字节的附加信息双声道音频帧包含字节的附加信息见音频数据第层的语法大值每一粒度组的频谱值都是用不同的哈夫曼码表来进行编码整个从零到奈魁斯特频率的频率范围被分成几个区域然后再用不同的表编码划分过程是根据最大的量化值来完成的它假设较高频率的值有较低的幅度或根本不需要编码从高频开始计算一对对量化值等于零的数目此数目记为然后个一组地计算绝对值不超过的量化值也即只有个可能的量化级别的数目此数目记为再剩下的是偶数个值最后频谱中一直到零的区域上的一对对的值的数目记为在此范围里的最大绝对值限制为下面表示了这个划分过程量化器步长信息是以附加信息变量

43、传送的它是对数量化的有关的应用见逆量化和全缩放公式中的公式根据下表选择用于传送缩放因子的位数如果是或用于缩放因子频带的缩放因子长度用于缩放因子频带的缩放因子长度如果是及是用于缩放因子频带的缩放因子长度用于缩放因子频带的缩放因子长度如果是及是用于缩放因子频带长窗缩放因子频带和短窗缩放因子频带的缩放因子长度注意缩放因子频带来自长窗缩放因子频带表缩放因子频带来自短窗缩放因子频带表这种划分的组合是相邻的并覆盖了整个频率谱用于缩放因子频带的缩放因子长度见表使用非正常型类型窗的块的信号标志如果设置了则会自动默认几个另外的变量当或

44、或及设置了当及没设置这样区域中的所有保留的值都包含在区域中如果没设置则的值是零指明粒度组的窗类型见滤波器组的描述第层见表表表完表留用开始块短窗结束块和给出的信息是有关块中的值的组合及变换见图的图解描述附录的解析描述的长度和计数的如果则指明低频多相滤波器子带是否使用正常窗类型进行编码中描述了多相滤波器组在长块不等于或设置了时的为的较低子带情况下对每个输入值产生一个值的输出输出根据加窗并且后一块的前半部分与前一块的后半部重叠结果矢量是一个频带的多相滤波器组的合成部分的输入在短块设置了时类型的块的较高子带或没设置时的类型的

45、块的所有子带情况下执行三个变换每个变换产生个输出值这三个矢量均要加窗并互相重叠在结果矢量的两端各连上个零则能得到一个长度为的矢量它的处理就象一个长变换的输出指明较低频率变换的窗类型不同于较高频率所使用的窗类型当混合块标志为零时所有块按变换当混合块标志为时对应于两个最低频率多相子带的频率线用正常窗块类型变换而剩下的个子带按变换根据最大的量化值和信号的局部统计特性选用不同的哈夫曼码表在表中给出了总共个可能的表指明一个子块对全局增益的增益偏移量化因子为只用于块类型为短窗时在解码器中子块的值必须除以见中反量化和全缩放公式频谱的进一步划分

46、被用来增强哈夫曼编码器的性能也就是再分由描述的区域此再分的目的是为了得到更好的错误顽健性和更好的编码效率共用了三个区域分别命名为区域和根据最大的量化值和局部信号统计特性每个区域分别使用不同的哈夫曼码表进行编码和用来指明区域的边界这些区域边界对应于把频谱划分成缩放因子频带域中的计数值比区域中的缩放因子频带数少在短块情况下每个缩放因子频带计次每个短窗次这样的值为时表示区域开始于缩放因子频带处如果块类型且混合块标志则在这种情况下粒度组的缩放因子频带的总数为如果块类型且混合块标志则缩放因子频带的数量为如果块类型则缩放因子频带的数量为计入的数比区域

47、中的缩放因子频带数少另外如果块类型则代表不同时间槽的缩放因子频带各自分别计数这是对量化值的附加高频放大的一种简化表示如果被设置了则一个表的值加到缩放因子上见表这相当于逆量化缩放因子乘以表的值如果块类型短块则从不使用根据缩放因子以步长或进行对数量化下表指明了用于每个步长的逆量化等式中的缩放因子倍数见表表此标志在两个可能的哈夫曼码表中选择一个这两个码表用于四个一组且幅值不超过的量化值区域见表表表表缩放因子用予量化噪声成形如果将量化噪声谱加工成合适的形状即可将其完全掩蔽不象第层和第层第层的缩放因子与量化信号的局部最大值无关在第层缩放因子用于解

48、码器中以得到各组值的除法因子在第层的情况下这些组覆盖几个频率线它们叫做缩放因子频带并且被选来尽可能地模拟临界频带表显示了缩放因子的范围为最大长度缩放因子的范围为最大长度如果强度立体声是允许的则差分右声道的的缩放因子被用来作为强度立体声位置即见模式是缩放因子频带的强度立体声位置把频谱再分成缩放因子频带这对每个块长度和采样频率都是固定的并且存于编码器和解码器的表中见表那些超过表中最高线的频率线的缩放因子为零也即意味着实际乘法因子为缩放因子是对数量化的量化步长是用设置的哈夫曼编码数据的语法显示了量化值是怎样编码的在部分绝对值小于的量化值对直接用

49、一个哈夫曼码进行编码这个码是选自表中的哈夫曼表值总是成对编码如果幅度大于或等于的量化值被编码则这些值使用哈夫曼码后的一个独立域进行编码如果一对中的一个或二个值不为零则在码字中加入一个或二个符号位部分的哈夫曼表由三个参数组成是值的哈夫曼码表的入口是值的哈夫曼长度表的入口是或被编码时的长度的语法包含下面的域和参数是的符号正为负为是的符号正为负为是的符号正为负为是的符号正为负为当的幅值大于或等于时用来对值进行编码此域仅当在中等于时才编码如果为零即当时没有位被实际编码则值定义为零同只是把改为是频率线的量化值或域仅当一个大于或等于的值需要编码时才使用这些域被看作无符号整数并加上以获得编码值当选择的表是对应于最大量化值小于的块时则和域从不使用注意值仍可用哈夫曼表编码此时为零在这种情况下因为为零所以或域实际上并不编码在部分按个一组计算其幅值小于或等于的值被编码

下载提示：本站仅提供存储空间/不修改/不编辑