GB T 25724-2010 安全防范监控数字视音频编解码技术要求.pdf
《GB T 25724-2010 安全防范监控数字视音频编解码技术要求.pdf》由会员分享,可在线阅读,更多相关《GB T 25724-2010 安全防范监控数字视音频编解码技术要求.pdf(196页珍藏版)》请在麦多课文档分享上搜索。
1、E ICS 13.310 A 91 GB 和国国家标准-tf: /、中华人民GB/T 25724-2010 安全防范监控数字视音频编解码技术要求Technical specification of surveillance video and audio coding 2010-12-23发布2011-05-01实施她码防;19:tll.lWJIJ/ 中华人民共和国国家质量监督检验检疫总局中国国家标准化管理委员会发布-GB/T 25724一2010目次前言.田引言N1 范围2 规范性引用文件-3 术语、定义和缩略语13.1 术语和定义-3.2 缩略语104 约定114. 1 算术运算符114.
2、 2 逻辑运算符114. 3 关系运算符4. 4 位运算符4. 5 赋值运算符4. 6 数学函数124. 7 语法元素、变量和表-4.8 逻辑运算符的文字描述144. 9 过程5 视频部分5.1 编码比特流和输出数据的格式155. 2 语法和语义205. 3 解码过程.5.4 解析过程796 音频部分. 97 6.1 总体描述-6.2 编码器功能描述1006. 3 解码器功能描述1416. 4 比特分配描述1486. 5 存储、传输接口格式150附录A(规范性附录)假设参考解码器(HRD)156附录B(规范性附录)字节流的格式159附录c(规范性附录)视频档次与级别161附录D(规范性附录)视
3、频可用性信息(VUl) 166 附录E(规范性附录)补充增强信息(SEl)168附录F(规范性附录)变长码表17。附录G(规范性附录)音频档次和级别171附录H(规范性附录)异常声音事件类型定义173附录1(资料性附录)VAD检测附录J(资料性附录)噪声消除.参考文献186-GB/T 25724-2010 目。昌请注意,本标准的某些内容有可能涉及专利,本标准的发布机构不承担识别这些专利的责任。本标准的附录A附录H为规范性附录,附录I和附录J为资料性附录。本标准由中华人民共和国公安部提出。本标准由全国安全防范报警系统标准化技术委员会(SAC/TC100)归口。本标准起草单位:公安部第一研究所、北
4、京中星微电子有限公司、北京中盾安全技术开发公司、中星电子股份有限公司、清华大学、香港大学、大连理工大学、江苏东奇信息科技有限公司、中国传媒大学信息工程学院、国家多媒体软件工程技术研究中心、宁波艾利特科技发展有限公司、杭州恒生数字设备科技有限公司、公安部第三研究所、浙江大华技术股份有限公司、北京声迅电子有限公司、天津市亚安科技电子有限公司、深圳市艾立克电子有限公司、浙江大立科技股份有限公司、北京国通创安信息技术有限公司、天津天地伟业数码科技有限公司、金鹏电子信息机器有限公司、北京蛙视通信技术有限责任公司、杭州海康威视数字技术股份有限公司、中国科学院软件研究所、深圳中兴力维技术有限公司、北京汉邦高
5、科数字技术有限公司、宁波舜宇光电信息有限公司、数维科技(北京)有限公司、新太科技股份有限公司、星际控股集团有限公司、浙江警官职业学院、北京富盛星电子有限公司、杭州华三通信技术有限公司、广东志成冠军集团有限公司。本标准主要起草人:陈朝武、邓中翰、李晓峰、杨晓东、张跃、邱南、冯宇红、卢京辉、余子龙、袁丽蓉、费宝顶、高富、林冬、陈苗、钟兴业、王生进、杨磊、房子河、杨国胜、范京京、邹章彪、部晨、王耀辉、王浩、李鹏飞、王建勇、高磊、王晓、魏一、孙大瑞、闰建新、余和初、戴林、陈瑞军、于烨、黄膜麟、季鹏飞、韩大炜、刘蕾营、陈玉、周志文、向稳、新、吴参毅。阳山GB/T 25724-2010 sl 目前国内、国
6、际没有专门针对安全防范监控应用的视音频编解码标准,现有的视音频编解码标准,都是针对广播电视和大众娱乐方面的应用,在安全防范领域直接采用具有很大的不适应性。本标准专门针对安防监控领域应用的特殊性,如:视频图像的实时传输性、全天候24h监控环境的适应性、场景视音频信息的忠实还原性等要求制定。本标准主要技术特点有:a) 支持高精度视频数据编码,适应宽动态范围,保留更多的图像细节,满足忠实于场景的要求。视频支持8bit10 bit数据,并保留未来扩充到12bit16 bit的可能;b) 支持帧内4X4预测与变换量化、自适应帧一场编码(AFF)和上下文自适应二进制算术编码(CABAC)等技术,获得更好的
7、图像质量和更高的编码效率;c) 支持感兴趣区域(ROI)变质量编码,在传输网络带宽或数据存储空间有限的情况下,优先保证ROI图像质量,节省非ROI的开销,提供更符合监控需要的高质量视频编码,提高监控系统整体性能;d) 支持可伸缩性视频编码(SVC),对视频数据分层次编码,满足不同传输网络带宽和数据存储环境的需求;的支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,既保证对语音信号具有较好的编码效果,也保证环境(背景)声音的编码效果;f) 支持声音识别特征参数的编码,避免编码失真对语音识别和声纹识别的影响;g) 支持绝对时间参考信息、特殊监控事件等监控专用信息。监
8、控专用信息通过专门语法与视音频压缩编码数据一起传输和存储,便于快速检索、分类查询、视音频同步和监控数据的综合应用;h) 支持数据安全保护,规定加密和认证接口及数据格式,保证数据的安全性、完整性和非否认性。既保证格式的统一,便于互联互通,也保留足够的扩展灵活性,支持更高性能的加密和认证方式的增加和扩充。相关专利情况说明本文件的发布机构提请注意,声明符合本文件时,可能涉及与5.2. 3. 1、5.2. 3. 2、5.2. 3. 8、5.2.4.2、5.2.4.4、5.2.4.10、5.3.6.7、6.1.2、6.1.4、6.2. 6. 1. 3、6.2. 6. 1. 4. 10中有关内容相关的专利
9、的使用。本文件的发布机构对于该专利的真实性、有效性和范围无任何立场。该专利持有人已向本文件的发布机构表示,他愿意同任何申请人在合理且无歧视的条款和条件下,就专利授权许可进行谈判。该专利持有人的声明己在本文件的发布机构备案。相关信息可以通过以下联系方式获得:专利持有人名称联系地址北京中星微电子有限公司北京海淀学院路35号世宁大厦(100191)北京中盾安全技术开发公司北京海淀区首体南路1号(100048)p 中星电子股份有限公司天津经济技术开发区第四大街80号天大科技园A1座2层(300457)清华大学北京海淀区清华园(100084)数维科技(北京)有限公司北京海淀区中关村南大街2号(10008
10、6)武汉大学湖北武汉市武汉大学(430079)凹联系人:曾娟鹊通讯地址:北京海淀区学院路35号世宁大厦16层邮政编码:100191电子邮件: 电话:010-68948888-8950传真:010-68944075 联系人:马志江通讯地址:北京海淀区首体南路1号邮政编码:100048电子邮件:mzj76yahoo. com 电话:010-88513553-828传真:010-68454099 GB/T 25724-2010 请注意除上述专利外,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别这些专利的责任。V -1 范围安全防范监控数字视音频编解码技术要求GB/T 25724-2010
11、 本标准规定了安全防范领域监控应用的数字视音频编码、解码过程的技术要求。本标准适用于安全防范领域的视音频实时压缩、传输、播放和存储等业务,对于其他需要视音频编解码的领域也可参考采用。2 规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准.然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的号|用文件.典最新版本适用于本标准。GB/T 20090. 2一2006信息技术先进音视频编码第2部分:视频3 术语、定义和捕略语下列术语、定义和缩略语适用于本标准。3. 1 术语
12、和定义3. 1. 1 Z字形扫描zig-zag scan 变换系数从较低的空域频率到较高全域频率(近似)的一个明确排列顺序。Z字形扫描用于帧宏块中的变换系数3. 1. 2 B条带B slice 根据同一条带内的己解码样点利用帧内预测进行解码,或者根据先前解码的参考图像利用双向预测进行解码的条带,对每个块进行帧间预测时最多使用两个运动矢量和参考索引。3. 1. 3 I条带1 slice 根据同一条带内的己解码样点利用帧内预测进行解码的条带。3.1.4 P条带P slice 根据同一条带内的已解码样点利用帧内预测进行解码,或者根据先前解码的参考图像利用前向预测进行解码的条带,对每个块进行帧间预测时
13、最多使用一个运动矢量和参考索引。3. 1.5 NAL单元NAL unit 一个语法结构,包含后续数据的类型指示和所包含的宇节数,数据以RBSP形式出现,必要时其中还包括认证数据及散布的防伪字节。3. 1. 6 NAL单元流NAL unit stream 由NAL单元组成的序列。GB/T 25724-2010 3. 1. 7 保留reserved 某些语法元素的特定取值,供中国安全防范监控数字视音频编解码技术标准工作组将来使用。符合本标准的比特流不应使用这些值,但是这些值将来可能在本标准的扩展版本中用到。3. 1. 8 闭环基音搜索closed-loop pitch search 即自适应码书搜
14、索,从加权输入信号和长时预测滤波器状态估计基音延迟的过程。3. 1.9 比特流bitstream 编码视音频及其相关数据,构成一个或多个编码视音频序列的比特序列。比特流既可用来表示NAL单元流,也可表示字节流。3. 1. 10 变换系数transform coefficient 频率域的标量,与解码过程的反变换部分中一个特定的一维或二维频率索引相关联的系数。3. 1. 11 变换系数幅值transform coefficient level 一个与特定二维频率索引相关联的整数量值,解码过程中用于计算变换系数的值。3. 1. 12 编码场coded field 一个场的编码表示。3. 1. 13
15、 编码过程encoding process 产生符合本标准的比特流的过程,本标准对视频编码过程不做规定。3. 1. 14 编码器encoder 实现编码过程的实体,包括软件及硬件。3. 1. 15 编码视频序列coded video sequence 按照解码顺序排列的IDR图像和紧随其后的零个或多个非IDR图像组成的图像序列。3. 1. 16 编码条带NAL单元coded slice NAL unit 包含编码图像的一个条带的NAL单元。,3. 1. 17 编码图像coded picture 一幅图像的编码表示。一个编码图像可以是一个编码场,也可以是一个编码帧。3. 1. 18 编码图像缓存
16、区coded picture buffer 一个先入先出缓存区,其存储方式按解码顺序排列。3. 1. 19 编码帧coded frame 一个帧的编码表示。3. 1. 20 残差residual 样点或数据元素预测值与解码值之间的差值。2 GB/T 25724-2010 3. 1.21 参考场reference field 一个标记为参考图像的场,用于编码场中P条带和B条带的解码过程中的帧间预测。3. 1. 22 参考索引reference index 参考图像的索引。3.1.23 参考图像reference picture 对解码顺序上后续图像的解码过程进行帧间预测的样点图像。3.1.24
17、参考帧reference frame 一个标记为参考图像的帧,用于编码帧中的P条带和B条带的解码过程中的帧间预测。3. 1. 25 参数parameter 序列参数集、图像参数集或安全参数集中的一个语法元素。参数也用于量化参数一词中。3. 1. 26 层layer没有分支等级关系中的一组句法结构。高层包含低层。编码层指编码图像序列层、图像层、条带层和宏块层。对于可伸缩性视频编码图像,不同层的图像具有不同的可伸缩性(如不同的空间分辨率)。3.1.27 土蜀field 一帧中的相隔行的集合。一帧由两场组成,包括一个顶场和一个底场。3. 1. 28 场宏块field macroblock 所包含的样
18、点仅来自一个编码场的宏块。一个编码场的所有宏块均为场宏块。3. 1. 29 场扫描field scan 变换系数的排列顺序。与Z字形扫描顺序不同的是,它对列的扫描快于对行的扫描。场扫描用于场宏块中的变换系数。3.1.30 代数码书algebraic codebook 脉冲幅度和位置组成的一个集合。通过码字索引k按照一定的规则得到第k个激励码矢量的脉冲幅度和位置。3. 1. 31 档次profile 本标准中的一个特定语法子集。3. 1. 32 底场bottom field 组成帧的两个场中的一个。底场的每一行在空间位置上均位于其对应的顶场行的下面。3. 1. 33 电导频谱对immittanc
19、e spectral pair 线性预测系数的变换称为电导频谱对。将逆滤波器传输函数A(z)分解为一个偶对称和一个奇对称多项式函数,该函数在单位圆上的根,即电导频谱对。3 GB/T 25724-2010 3.1.34 顶场top field 组成帧的两个场中的一个。顶场的每一行在空间位置上均位于其对应的底场行的上面。3.1.35 短时合成滤波器short term synthesis filter 对声道脉冲响应进行建模的滤波器。激励信号通过该滤波器可得到合成信号。3.1.36 二进制位bin 二进制位串中的1bit。3. 1. 37 二进制位串bin string 一串二进制位。二进制位串为
20、二值化的语法元素值的二进制表示。3. 1. 38 二值化binarization 语法元素所有可能值与一组二进制位串之间的唯一映射。3.1.39 反变换inverse transform 解码过程的一部分,将变换系数矩阵转换为空域样点矩阵的过程。3. 1. 40 防伪字节emulation prevention byte 一个字节,其值等于Ox03,可能在NAL单元中出现。|出伪字节的出现可以保证在NAL单元的后续宇节对齐的字节流中不会含有起始码前缀。3. 1. 41 非参考图像non-reference picture 不用于对任何其他图像进行帧间编码的图像。3. 1. 42 分量compo
21、nent 图像的三个样点矩阵(一个亮度矩阵,两个色度矩阵)中的一个矩阵或矩阵中的单个样点。在音频部分,也指矢量中的元素或信号中的某些频率成分。3.1.43 感知加权滤波perceptual weighting filter 利用共振峰处的噪声掩蔽特性,在共振峰区域分配比较大的失真,来减少峰谷主观感觉噪声的滤波。3.1.44 功率谱power spectrum 信号通过傅立叶变换后得到幅度谱的平方。3.1.45 光栅扫描raster scan 矩形二维图像到一维图像的映射过程,一维图像的第一组值来自于二维图像最上边一行的从左到右扫描,然后依次是第二行、第三行等。对于图像每行(由上到下)都是从左到
22、右扫描的。3. 1. 46 宏块macroblock 一个16X 16的亮度样点块和相应的两个色度样点块。4 G/T 25724-2010 3. 1. 47 宏块索引macroblock index 编码帧中,宏块索引为帧图像的宏块光栅扫描顺序的序号,起始序号为0。编码场中,宏块索引为场图像的宏块光栅扫描顺序的序号,起始序号为0。3.1.48 -后向预测backward prediction 使用显示顺序上在后的解码图像中的样点对当前图像中的样点进行预测。3.1.49 划分partitioning 将一个集合分为子集的过程。集合中的每个元素属于且只属于某千个子集。3. 1. 50 基本层图像b
23、ase layr picture 不需要参考其他图悻层信息即rlJ以解码的图像。3. 1.51 级别level 本标准中的一个特定档次巾的参数取值的限定集合。一个档次可以包含一个或多个级别。对所有档次定义了一姐相同的级别,不同档次的每个级别大部分忏件都是通用的。对于一个独立的实现,在一定的约束条件下.可以支持多个级别。3. 1. 52 即时解码刷新(IDR)图像instantaneous decoding refresh (IDR) picture 一幅编码图像,其中所有条带为I条情。II)R罔像解码之后,解码顺序上所有后续的编码图像都可以不用根据任何在IDR图像之前解码的图像来近行帧间预测解
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GB 25724 2010 安全 防范 监控 数字 音频 解码 技术 要求
