GB T 20090.1-2012 信息技术.先进音视频编码.第1部分:系统.pdf
《GB T 20090.1-2012 信息技术.先进音视频编码.第1部分:系统.pdf》由会员分享,可在线阅读,更多相关《GB T 20090.1-2012 信息技术.先进音视频编码.第1部分:系统.pdf(152页珍藏版)》请在麦多课文档分享上搜索。
1、G亘ICS 35.040 L 71 共和国国家标准中华人民GB/T 20090.1-2012 先进音视频编码部分:系统信息技术第1Information technology-Advanced coding of audio and video一Part 1 : System 2013-06-01实施2012-12-31发布发布中华人民共和国国家质量监督检验检度总局中国国家标准化管理委员会/ 岛-mh饰可句句陆,黝川G/T 20090.1-2012 目次前言.皿引言.凹1 范围2 规范性引用文件-3 术语和定义24 符号和缩略语75 位流语法的描述方式96 传输流位流要求107 节目流位流的要
2、求568 节目和节目元素描述子709 对多路复用流语义的约束创刊与GB/T17975的兼容性. . . . . . . . . . . . . 88 附录A(资料性附录)系统时间信息时钟恢复模型及应用指南四附录B(资料性附录)系统符合性.附录C(资料性附录)引入抖动的网络与AVS解码器的接口99附录D(资料性附录)语法的图形表示102附录E(资料性附录)通用信息106附录F(资料性附录)拼接传输流 107 附录G(资料性附录)数据传输应用110附录H(资料性附录)数字存储媒体命令与控制(DSM-CC 111 附录1(规范性附录)CRC解码器模型 121 附录J(资料性附录)系统解复用过程122
3、附录K(资料性附录)系统复用过程125附录L(资料性附录)节目特定信息129附录M(资料性附录)私有数据138回-GB/T 20090.1-2012 前言GB/T 20090(信息技术先进音视频编码分为以下9个部分:第1部分:系统;第2部分:视频;一一第3部分:音频;一一第4部分:符合性测试;一一第5部分:参考软件;一一第6部分:数字版权管理;一一第7部分:移动视频;一一第8部分:在IP网络上传输AVS;一一一第9部分:AVS文件格式。本部分为GB/T20090的第1部分。本部分按照GB/T1. 1-2009给出的规则起草。本部分由中华人民共和国工业和信息化部提出。本部分由全国信息技术标准化技
4、术委员会(SAC/TC28)归口。本部分起草单位:中国科学院计算技术研究所、清华大学、北京算通科技发展有限公司、中国电子技术标准化研究院、北京大学、华中科技大学、北京邮电大学、联合信源数字音视频技术(北京)有限公司、展讯通信(上海)有限公司。本部分主要起草人:陈熙霖、杨士强、高鹏飞、霍龙杜、高麟鹏、丁亚强、杨志杰、林福辉、牟伦田、王啸、朱光喜、林永兵、贺玉文、喻莉、王雷、冯博、张帧睿、杨昭辉、杨洁、汪恒晶、高文、黄铁军、卢汉清。E GB/T 20090.1-2012 51 0.1 综述GB/T 20090的本部分论述了如何将一路或多路音频、视频位流或其他基本数据流合成单路或多路复用流,用于存储
5、和传送。系统编码遵循本部分指定的语法和语义规则,并提供了使解码器缓冲区能在一定范围的补偿和接收条件下进行同步解码的信息。系统编码包含两种形式:传输流和节目流,分别针对不同的应用加以优化。本部分中定义的传输流和节目流提供了编码语法,该语法对于同步解码及展现音频、视频信息是充分且必要的,同时保证了解码器中数据缓冲区不发生上溢和下溢。该语法中应至少包含以下两种信息之一:a) 有关展现编码的音频和视频数据的相对时间戳,以及有关数据流本身传送的比特率信息;b) 有关解码和展现编码的音频和视频数据的时间戳,以及有关数据流本身传送的时间戳信息。传输流和节目流都是面向分组包的多路复用流。单一音频和视频基本流的
6、多路复用过程见图1。视频和音频数据可按包括GB/T20090. 2和GB/T 20090. 3等部分进行编码,之后,压缩数据被打包以形成PES分组包。在形成PES分组包的过程中,当独立使用传输流或节目流的PES分组包时可能会加入所甫的描述信息;而PES分组包需要进一步与系统层信息结合形成传输流或节目流时,不包含这一信息。本部分覆盖了图l中竖直虚线右边所示的处理过程。图1多路复用过程简图本部分定义的节目流是由具有共同时间基准的一个或多个PES分组包合并而成的单一流。有些应用中要求包含单个节目的基本流是未多路复用的分离流。对这些应用,基本流也可作为分离的节目流编码。每一基本流含一个节目流且具有共同
7、时间基准。在这种情况下,不同流中SCR宁段的编码值应一致。所有的基本流和单一节目流都可被同步解码。节目流被设计用于相对无差错环境中,且适用于诸如交互式多媒体等应用。WH iH分组包长度可变。传输流是由一个或多个节目组成的单一流,且这屿节日可包含-个或多个不riJfH (O Sign(x) = 0 x= =0 -1 x大于= 大于或等于/le飞V刊r吧elJ口在GB/T20O90. 2二2006的表B.4、表B.5中定义,bbv _ buffer _ size携带在GB/T 20090. 22006的7.2.2.1描述的序列头中。一对于GB/T17975. 2位流,目标解码器的缓冲模型见GB/T
8、17975.1 0 大小为BSmux= 5 ms X Rmax profile, leve口的MBSn的一部分被分配为缓冲区以允许复用操作,剩下的部分用作BSoh还可能供初始化复用操作使用。注:PES开销的缓冲区空间由7.2.4定义的PES-STD在PES流中直接作出限制。利用PES流来构造传输流是可能的。d) 主缓冲区一一音频青频主缓冲区大小BS)BSn定义如下:飞圃-一-一GB/T 20090.1-2012 BSn = BSmux十BSdec+ BSoh = 3 584字节解码缓冲区BSdec的访问单元大小和PES分组包开销缓冲区BSoh受下式限制:BSdec + BSoh = 2 848
9、字节3 584字节缓冲区的一部分(736字节)被分配作为缓冲区以允许多路复用操作。余下的2 848字节由访问单元缓冲区BSdec和BSoh及附加多路复用操作共享。一一系统用于系统数据的主缓冲区B,归大小为1536字节。视频对GB/T20090. 2视频基本流,数据由地漏方式从MBn传送到EBn。泄漏方式对于基准档次:Rbxn = Rmax profile, levelJ 式中:Rmax profile , levelJ 定义见GB/T20090. 2-2006的表B.4、表B.5。. ( 5 ) 如果MBn中有PES分组包有效负载数据且缓冲区EBn不满,PES分组包有效负载数据以速率Rbx从M
10、Bn传送到EBn。若EBn满,数据不从MBn中移出。当一个数据字节从MBn传送到EBn所有紧接在该字节之前且位于MBn中的PES分组包头字节被立即移出并丢弃。当MBn中无PES有效负载数据时,数据不从MBn中移出。所有进入MBn的数据从中出来。所有PES分组包有效负载字节在离开MBn的瞬时进入EBn0 访问单元移出对于每一基本流缓冲区EBn和主缓冲区队,在缓冲区中时间最长的访问单元An(j)的所有数据在时刻tdn(j)被立即移走。当显示单元有足够的缓冲并且访问单元An(j)的所有数据都已进入EBn或民,解码器开始解码,此时刻即为最早解码时间tdn(j )。对于音频信号,所有存储在访问单元之前的
11、或嵌入在访问单元数据中的PES分组包头和访问单元同时移出。访问单元移出后立即解码为展现单元。系统数据对于系统数据,只要缓冲区B,y,中至少有一个字节的数据,数据以速率R,y,从主缓冲区B叮当中移出。R,y, = max (80 000 bi t/ s , transport_ra te (i)十500)(6 ) 式中:transport_rate( i)一一编码在transport_rate宇段中的传输率,以位每秒(bit/s)为单位来度量;一一传输率宇段的最后一个字节的索引。注:在高传输率情况下,增加R,y,的目的在于允许增加节目特定信息的数据速率。低延迟在视频序列扩展中的low_delay
12、置汀时(见GB/T17975. 2、GB/T20090.2),缓冲区EBn可能下溢。此时,当在时刻tdn(j)检查T-STD基本流缓冲区EBn时,访问单元的整个数据可能不在EBn中。当这一情况出现时,缓冲区将在每隔两个图像场周期重复检查,直到数据进入缓冲区。此时整个访问单元应瞬时从缓冲区EBn移走,缓冲区EBn将不会发生上溢。当low_delay_mode标志置汀时,EBn的下溢允许无限制地连续出现,T-STD解码器将在tdn(j)从缓冲区EBn移出访问单元。注意解码器可能不按display_ time的指示重建正确的展现时间,直到缓冲区EBn的下溢终止且在位流中找到relative_disp
13、lay_time。特技模式当含有B图像访问单元起始分组的PES分组包头中的DSM一Trick_mode标志为汀且trick_mode_control字段为001(慢动作)或010(冻结帧)或100(慢倒),B图像访问单元不从视频数据缓冲区EBn中移出直到该图像的所有场的最后一次解码和展示。场和图像的重复展现在6.3.8中的慢15 GB/T 20090.1-2012 动作、慢倒和field_id_cntrl中定义。访问单元在规时间之内及时地从EBn移出,这取决于rep_cntrl的值。当包含图像起始码的第一个字节的PES分组包头中的DSM_trick_mode标志置汀时,trick_mode 状
14、态在PES分组包中图像起始码从缓冲区EBn中移走时为真,且保持到DSM_t rick_ mode标志为0的PES分组包头被T-STD接收。特技模式状态为真时,缓冲区EBn可能下溢,而来自一般流的所有其余限制均保留。6.2.5 解码在BlBn以及EBlEBn中缓冲的基本流被解码器DlDn瞬时解码,可在T-STD输出端展现之前在重排序缓冲区。IOn中被延迟。仅当一些视频访问单元不符合播放顺序时才使用重排序缓冲区,这些访问单元在显示前应重排序。特别地,若PnCk)是一帧或多帧B图像前的一帧I图像或P图像,在展现前它应在重排序缓冲区。n中被延迟。在当前国像被存储之前展现先前存储在On中的图像。Pn(k
15、)被延迟到下一I阁像或P图像的解码时刻。当它被存储在重排序缓冲区中时,后续的B图像被解码和显示。二展现单元PnCk)在tpnCk)时展现。应注意从视频基本流的开始就需使用足够的重排序延迟以满足整个流的需求。示例.开始仅包帘I和P图像jfl后来包台归因像J!Ttt E t汁始uJr,;j包括l在-rIlJ(延迟GB/T 17975.2或GB/T200O. 2详细解择视顿图像重排序巳6.2.6 展现解码系统的功能是从压缩敢把重建展现单元J:在正确的展现时间Il:iJ播放。尽管实际音频和视频播放设备在一定程度上有着不同的延迟及可能(t1rr.处理或输出方式造成的延迟,系统目标解码器将这些延迟均假定为
16、0。在图6的TSTD中一个视频展现单)G(一个图像)在展现时间tJ ( k)瞬时播放。在T-STD中,音频展现单元在它的展现时间1)1(k)开始输出.此时解码器瞬时播出第一个样本。展现单元中的后续样本以音频采样字顺序播出。6.2.7 缓冲区管理传输流的构造应满足本节的条件。本节使用STD中定义的记号。/ TBn和TB,y,不应发生三溢,每秒至少一次为空。Bn不应上溢或下溢,Bys不应上溢。除非视频序列扩展中的低延迟标志被置为,1 (见GB/T20090. 2-2006中的7.2.2.1或GB/T 17975.2一2000中的6.2.2.3)或trick,_mode状态为真,EB不应下溢。当传送
17、方式为泄漏方式时,MBn不应上溢,且每秒至少一次为空。EBn不应上溢。除非是静止图像视频数据,通过STD缓冲区的任意数据的延迟应不大于1s。明确地说,对所有j及访问单元An(j)中字节1,有tdnCj)一tCi)l。16 对静止图像视频数据,所有j和访问单元AnCj)中的所有字节1,延迟限制为tdnCj)-tCi)60s。上溢和下溢的定义假定Fn(t)是T-STD缓冲区Bn在某个瞬间的占用程度。在t=t(1)前的瞬时,FnCt)=O。若对所有的t和日,Fn (t)BSn 则不发生上溢。若对所有的t和n,圃-GB/T 20090.1一2012。Fn(t),则不发生下槛。6.3 传输流语法语义规范
18、以下语法描述了一个字节流。传输流分组包长度为188字节。传输流语法图形表示参见附录Do6.3.1 传输流传输流见表10表1传输流语法位数助记符AVS_transport_streamC) do 、transport_packet(戈/ / whileC nextbit钊)= = sync_byte) 6.3.2 传输流分组包传输流分组包见表20表2传输流分组包i台法位数助记符transport_packet( ) sync_byte 8 bslbf transport_error _indicatot bslbf payload_unit_star(二mdicatOf、/ bslbf tran
19、sport_priority j bslbf PEIT_indicator 、/13 uimsbf transport_scrambling_control 2 bslbf adaptation_field_control 2 bslbf continuity_counter 4 uimsbf ifC adaptation_field_control = = 10 11 adaptation_field_control = = 11) adaptation_fieldsC) ifCadaptation_field_control = = 01 11 adaptation_field_contr
20、ol = = 11) for(l = 0; i 0) discontinuity _indicator bslbf 19 、.GB/T 20090.1-2012 表5(续)语法位数助记符random_access_indicator bslbf elementary _stream_priority _indicator bslbf PCR_f1ag bslbf OPCR_f1ag bslbf splicing_pointer _f1ag bslbf avs_specific_transport_data_f1ag bslbf adaptation_field_extensio_flag bs
21、lbf 山PCR_flag= = 1) prog-aEZLClock-rtfemce base 33 uimsbf reser,ved / 6 bslbf 、prograOl_c1ock_reference_extension 9 uimsbf ifWPCR f1 ag =二1H original_program_c1ock_refer;ence_b能f33 uimsbf reserved 6 bslbf original_program_clock_reference extension 9、uimsbf if( splicing_point_flag工:=l) splice_coun创ow
22、n8 tcimsbf if( avs_sp时ific_tr . 一一GB/T 20090.1-2012 在PEID值为OxOOOO的传输流分组包中携带的节目关联表的更新版本中加以描述。这些段均用到值为OxOO的table_id。在PEID值为OxOOOO的传输流分组包中只允许table_id值为OxOO的段。要使节目关联表的新版本生效,所有带新version_number及currentnext_indicator置1的段(在last_section_number中指出)应离开T-STD中定义的B,归,见6.2。当用于结束表的那个段的最后一个字节离开B,y,后,新版本的节目关联表开始生效。一旦
23、传输流中一个或多个基本流被加扰,就应传送PEID值为Ox0001且包含一个完整的条件接收表CCAT)的传输流分组包。表中包含与加扰流相关联的CA_descriptor。传输的传输流分组包共同组成一个条件接收表的完整版本。current_next_indicator置1的表的最近传送版本总是作用于传输流中的当前数据。在加扰中使现有表元效或不完整的任何变动应在条件接收表的一个更新版本中加以描述。条件接收表的段都应使用值为Ox01的table_id。在PEID值为Ox0001的传输流分组包中只允许table_id值为Ox01的段。要使CAT的新版本生效,所有带新V巳rsion_number及curr
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 20090.1 2012 信息技术 先进 视频 编码 部分 系统
