1、ICS 35.040.40 L71 中 华 人 民 共 和 国 通 信 行 业 标 准 YD/T YD IPTV 音视频编码参数技术要求 Technical specification on audio-video codec technology for IPTV service 中 华 人 民 共 和 国 工 业 和 信 息 化 部 发 布 -实施 -发布 目 次 目 次 .2 前 言 .3 1 范围 .4 2 规范性引用文件 .4 3 术语、定义和缩略语 .5 3.1 术语及定义 .5 3.2 缩略语 .6 4 概述 .8 5 H.264 编解码要求 .8 5.1 标清 .8 5.2 高
2、清 .11 5.3 超高清 .14 6 AVS2 编解码要求 .17 6.1 超高清 .17 7 H.265 编解码要求 .21 7.1 标清 .21 7.2 高清 .24 7.3 超高清 .27 7.4 立体声音频 .30 7.5 环绕声音频 .31 前 言 本标准按照 GB/T 1.1-2009 给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责 任。 本标准由中国通信标准化协会提出并归口。 本标准起草单位 : 中国电信集团公司、华为技术有限公司、中国信息通信研究院、中国 联合网络通信集团有限公司、中兴通讯股份有限公司 本标准主要起草人 : 祝谷乔
3、、罗传飞、施唯佳、蒋力、肖晴、罗斯青、贾立鼎、聂秀英 IPTV 音视频编码参数技术要求 1 范围 本标准规定 了电视屏 IPTV 业务的音视频编解码设备应支持的编解码技术标准。 本标准适用于 宽带网络环境下 IPTV 业务的视音频编解码设备的业务功能、产品设计 、 性能测试和管理维护。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的 。 凡是注日期的引用文件 , 仅所注日期的版本 适用于本文件 。 凡是不注日期的引用文件 , 其最新版本 (包括所有的修改单 ) 适用于本文件 GB/T 33475.2-2016 高效音视频编码 第 1 部分:视频 YD/T 1696-2007 机顶盒与
4、 IPTV 业务平台接口技术要求 YD/T 1823-2008 IPTV 业务系统总体技术要求 YD/T 2016.3-2009 IPTV 运营支撑管理接口技术要求 第 3 部分:终端 ITU-T H.264: 2005 Advanced video coding for generic audiovisual services ITU-T H.265: 2013 High efficiency video coding ITU-T Y.1910-2008 IPTV functional architecture ITU-T Y.1901-2009 Requirements for the s
5、upport of IPTV services ISO/IEC 14496-10:2007 Information technology - Coding of audio-visual objects - Part 10: Advanced Video Coding ISO/IEC 23008-2:2013 Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 2: High efficiency video coding 3 术语、定义和
6、缩略语 3.1 术语 及 定义 下列术语定义适用于本文件 3.1.1 互联网协议电视 Internet Protocol Television, IPTV IP网络上提供的多媒体业务 (如电视 /视频 /音频 /文字 /图形 /数据 ),用于实现所需的 QoS/QoE、安全性、交互性和可靠性。 ITU-T Y.1901 3.1.2 终端用户 End User 产品或业务的实际用户。 ITU-T Y.1910 3.1.3 IPTV 业务 IPTV Service 通过 IP承载网络向用户提供能够支持交互能力的电视节目的直播 、 点播和时移播放等业 务的总称。通过 IPTV 业务,用户可以得到高质
7、量的数字媒体服务,可以自由地选择视频节 目,实现媒体提供者和媒体消费者的实质性互动。 YD/T 1823-2008 3.1.4 IPTV业务平台 IPTV Service Platform 包括业务管理系统 、 门户导航系统 、 媒体交付系统 、 运维支撑系统 、 安全管理系统和扩 展业务系统,机顶盒通过与这些系统的交互完成 IPTV的内容管理和业务管理、认证、计费 、 鉴权以及流媒体的服务等功能。 YD/T 1696-2007 3.1.5 IPTV终端 IPTV terminal 同时支持 IPTV网络层和 IPTV业务层接入的终端设备。 IPTV终端通过与应用功能交互,获 取 EPG、内容
8、版权许可证、密钥等业务信息;与内容分发平台交互,接受 IPTV业务,完成解 密和解码功能 ; 并负责接收终端用户的控制指令。 IPTV终端或者直接与电信网链接,或者通 过家庭网关与电信网链接。 YD/T 2016.3-2009 3.1.6 档次 Profile 根据视觉对象定义了对应码流语法的子集。 3.1.7 等级 Level 根据特定档次,定义了对应采用的限制参数集合。一个档次可包含一个或多个等级。 3.1.8 图像分辨力 Image resolution 指表征图像细节的能力,由图像格式决定,采用图像的水平和垂直方向的像素数表示。 3.1.9 图像清晰度 Image definition
9、 人眼能察觉到的视频图像细节清晰程度,采用电视线表示。 3.1.10 标准清晰度 SD resolution 图像还原显示的主观评价质量相当于模拟电视系统; 对数字图像要求图像格式为 720 576 或 720480。 3.1.11 高清晰度 HD resolution 图像清晰度在水平和垂直两个方向近似为模拟电视系统图像清晰度的 2 倍;对数字图像 要求图像格式为 19201080, 图像宽高比为 16:9 或 14401080, 图像宽高比为 4:3。 3.1.12 4K 超高清晰度 4K resolution 图像清晰度在水平和垂直两个方向近似为模拟电视系统图像清晰度的 4倍 以上 ;
10、对数字 图像要求图像格式为 38402160,图像宽高比为 16:9,帧率达到 25fps以上。 3.1.13 全 4K Full 4K 指图像清晰度在水平和垂直两个方向达到 4K超高清晰度 38402160, 帧率达到 50fps以 上,颜色空间符合 BT.2020要求,像素的比特精度达到 10bit以上,支持 HDR技术。 3.2 缩略语 下列缩略语适用于本文件 ALF 自适应环路滤波 Adaptive Loop Filter AMVP 高级运动矢量预测 Advanced Motion Vector Prediction AVS 音视频标准 Audio Video Standard AVT
11、 音视频传输服务 AV Transport BP 基本档次 Base Profile CABAC 基于上下文的自适应二进制算术编码 Context-based Adaptive Binary Arithmetic Coding CAVLC 基于上下文的自适应可变长度编码 Context-based Adaptive Variable Length Coding CBAC 基于上下文的二进制算术编码 Context-based Binary Arithmetic Coding CTU 编码树单元 Code Tree Unit DM 导出模式 Derived Mode HEVC 高效视频编码 23
12、008-2:2013 编码标准 High Efficiency Video Coding HP 高级档次 High Profile MBAFF 宏块级的帧场自适应编码 MacorBlock Adaptive Frame Field MP 主档次 Main Profile NTSC 全美电视系统委员会制式 National Television Systems Committee PAFF 图像级的帧场自适应编码 Picture Adaptive Frame Field PAL 逐行倒相制式 Phase Alternating Line PU 预测单元 Prediction Units SAO
13、采样自适应偏移 Sample Adaptive Offset SP 简单档次 Simple Profile TU 变换单元 Transform Units VBR 可变码率 Variable Bit Rate VOP 视觉对象平面 Visual Object Plane WPP 行波并行处理 Wavefront Parallel Processing 4 概述 为适应 电视屏 IPTV 业务的发展需要,本标准 对 IPTV 业务中采用 H.264 标准、 AVS2 标准 和 H.265 标准的编码和解码设备应支持的标清 、 高清 、 超高清清晰度质量等级的编码参 数和工具集做出规定。 本标准的
14、制订为应对复杂的业务传输 环境提供 IPTV 图像质量的保障 , 同时为实现不同 厂家的编码器和 IPTV 机顶盒之间编解码的互通提供技术参考。 本标准适用于指导 IPTV 音 视频内容的制作、传输和解码播放等相关技术实现。 5 H.264 编解码要求 IPTV业务采用 H.264标准进行内容编解码 , 是基于 ISO/IEC14496-10规范的相应档次和等 级的相关定义 , 并在此基础上针对电视屏业务所需支持的参数和工具集进行了一定的删减和 扩展,形成了本标准对于 IPTV音频与视频编码参数的技术要求。 5.1 标清 5.1.1 视频 根据应用场合不同 , H.264 视频编码器分实时编码
15、器和离线编码器 。 不同编码器和解码 器参数具体要求如下表 1 所示: 表 1 H.264 标清视频编码器参数要求 必选 (M)/可选 (O)/不定义 (N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 总体参数要求 CBR M M M 编码速率模式 (Coding BitRate Model) VBR(要求速率偏移低于 20 ) O M M 帧编码 M M M 图像级的帧场自适应 (PAFF) M M M 编码模式 (Coding Model) 宏块级的帧场自适应 (MBAFF) O M M PAL 制 (720, 704, 544, 480, 352) 576, 352
16、288 M M M 分辨力 (Resolution) NTSC 制 (720, 704, 544, 480 , 352) 480 M M M PAL 制 25fps M M M 帧率 (FrameRate) NTSC 制 30 fps M M M 编码速率支持 最 大 码 率 不 低 于 M M M (BitRate Support) 2.5Mbps 二次编码 (2-pass) 支持 O M N/A 预处理 (Pre-processing) 支持 M M N/A 后处理 (Post-processing) 支持 N/A N/A O H.264 规范参数 (参照 ISO/IEC 14496-10
17、) 亮度和色度空间 (Chroma Format) 4:2:0 M M M 比特流格式 (Bitstream Format) NAL unit stream M M M 对于 MPEG-2 TS 方式, 要求支持 Access_Unit _Delimiter NAL Unit 档次 (Profile) Main M M M 等级 (Level) 3.0 3.1 4.0 4.1 M M M IDR Intra 支持 O O O 同时支持组和序列的 IDR 帧类型 (Picture Type) 支持 I, P, B Picture 支持 B 帧做参考帧 M M M 场类型 (Field Type)
18、 支持 I, P, B Field 支持 B 场做参考场 M M M 分片类型 (Slice Type) 支持 I, P, B Slice M M M 哈达玛变换 (Hadamard ) 不支持 M M M 最大搜索范围 (Search Range) -256,255.75 M M M 图像隔行编码 (Pic Interlace Coding) Frame coding Field coding AFF M M M 宏块隔行编码 (MB Interlace Coding) Frame coding Field coding AFF O M M 帧内预测支持块 16x1, 4x4 M M M (
19、MB type for I slices) 16x16,16x8, 8x16, 8x8 M M M 帧间预测支持块 (MB type for P&B slices) 8x4, 4x8, 4x4 O M M 快速运动补偿 (Fast Motion Estimation) 支持 M M N/A 方 向 模 式 类 型 (DirectModeType ) 时域( Temporal) 空域( Spatial) M M M P 帧加权预测 (P-slice Weighted Prediction) Explicit M M M B 帧 加 权 双 向 预 测 (B-slice Weighted BiPr
20、ediction) Explicit, Implicit M M M 加 权 参 考 运 动 估 计 (WeightedReferenceME) 支持 O O N/A 环内滤波 (InLoop De-blocking Filter) 支持 M M M 1/4 像素运动估计 (1/4 pel ME) 支持 M M M 率失真优化 (Rate Distortion Optimisation) 支持 O O M 多参考帧 (Multi-Reference Frames) 最高支持到 5 M M M CAVLC O O M 熵编码 (Entropy coding ) CABAC M M M 开放图像组
21、支持 (Open GOP Support) 支持 O O M 动态图像组支持 (Adapative GOP Support) 支持 O O M 5.1.2 音频 对于 H.264 标清视频编码标准配套使用的音频编解码设备能力要求如下 表 2 所示: 表 2 H.264 标清音频编码器参数要求 必选 (M)/可选 (O)/不定义 (N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 MPEG-1 Layer2 M M M MPEG-1 Layer3 O O M 音频编码 codec MPEG-2 LC AAC M M M 32KHz , 44.1KHz , 48KHz M M
22、M 采样频率范围 96KHz O O O 支持音频编码速率范围 32Kbps 384Kbps M M M 单声道、多声道 支持 M M M 立体声 支持 M M M 多音轨 支持 O M M 如果存在中文 音轨 , 第一路必 须是中文音轨 编码。 5.2 高清 5.2.1 视频 根据应用场合不同 , H.264 视频编码器分实时编码器和离线编码器 。 不同编码器和解码 器参数具体要求如下表 3 所示: 表 3 H.264 高清视频编码器参数要求 必选 (M)/可选 (O)/不定义 (N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 总体参数要求 CBR M M M 编码速率
23、模式 (Coding BitRate Model) VBR(要求速率偏移低于 20 ) O M M 帧编码 M M M 图像级的帧场自适应 (PAFF) M M M 编码模式 (Coding Model) 宏块级的帧场自适应 (MBAFF) O M M 1080i 19201080 或14401080 M M M 分辨力 (Resolution) 720p 1280720 或 960720 M M M PAL 制 25fps M M M 帧率 (FrameRate) NTSC制 30 fps M M M 编码速率支持 (BitRate Support) 最 大 码 率 不 低 于 8Mbps
24、M M M 二次编码 (2-pass) 支持 O M N/A 预处理 (Pre-processing) 支持 M M N/A 后处理 (Post-processing) 支持 N/A N/A O H.264 规范参数 (参照 ISO/IEC 14496-10) 亮度和色度空间 (Chroma Format) 4:2:0 M M M 比特流格式 (Bitstream Format) NAL unit stream M M M 对于 MPEG-2 TS 方式, 要求支持 Access_Unit _Delimiter NAL Unit Main M M M 档次 (Profile) High O M
25、 M 等级 (Level) 3.0 3.1 4.0 4.1 M M M IDR Intra 支持 O O O 同时支持组和序列的 IDR 帧类型 (Picture Type) 支持 I, P, B Picture M M M 分片类型 (Slice Type) 支持 I, P, B Slice M M M 哈达玛变换 (Hadamard ) 不支持 M M M 最大搜索范围 (Search Range) -256,255.75 M M M 图像隔行编码 Frame coding, Field M M M (Pic Interlace Coding) coding, AFF 宏块隔行编码 (MB
26、 Interlace Coding) Frame coding, Field coding, AFF O M M 帧内预测支持块 (MB type for I slices) 16x16, 4x4 M M M 16x16, 16x8, 8x16, 8x8 M M M 帧间预测支持块 (MB type for P&B slices) 8x4, 4x8, 4x4 O M M 快速运动补偿 (Fast Motion Estimation) 支持 M M N/A 方 向 模 式 类 型 (DirectModeType ) 时域( Temporal) 空域( Spatial) M M M P 帧加权预测
27、 (P-slice Weighted Prediction) Explicit M M M B 帧加权双向预测 (B-slice Weighted BiPrediction) Explicit, Implicit M M M 加 权 参 考 运 动 估 计 (WeightedReferenceME) 支持 O O N/A 环内滤波 (InLoop De-blocking Filter) 支持 M M M 1/4 像素运动估计 (1/4 pel ME) 支持 M M M 率失真优化 (Rate Distortion Optimisation) 支持 O O M 多参考帧 (Multi-Refer
28、ence Frames) 最高支持到 5 M M M CAVLC O O M 熵编码 (Entropy coding ) CABAC M M M 开放图像组支持 (Open GOP Support) 支持 O O M 动态图像组支持 (Adapative GOP Support) 支持 O O M 5.2.2 音频 对于 H.264 高清视频编码标准配套使用的音频编解码设备能力要求如 表 4 所示: 表 4 H.264 高清音频编码器参数要求 必选 (M)/可选 (O)/不定义 (N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 MPEG-1 Layer2 M M M MP
29、EG-4 AAC M M M MPEG-4 AAC 5.1 声道 O O O 音频编码 codec Dolby AC-3 5.1 声道 O O M 32KHz , 44.1KHz , 48KHz M M M 采样频率范围 96KHz O O O 支持音频编码速率范围 64Kbps 2.0Mbps M M M 立体声 支持 M M M 多音轨 支持 O M M 如果存在中文音 轨,第一路必须 是中文音轨编码 。 5.3 超 高清 5.3.1 视频 根据应用场合不同 , H.264 4K超高清视频编码器分实时编码器和离线编码器 。 不同编码 器和解码器参数具体要求如表所 5示: 表 5 H.264
30、 4K 超高清视频编码器参数要求 必选 (M)/可选 (O)/不定义 (N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 总体参数要求 Main M M M 档次 (Profile) High10 O O O 等级 (Level) 5.2 以上 M M M 3840 x2160 M M M 分辨率 (Resolution) 4096x2160 O M M 24P、 25P、 30P M M M 帧率 (Frame Rate) 50P、 60P O O O 视频编码平均速率 (BitRate) 15-35Mbps M M M 最大 B 帧数 3 帧 M M N/A 建议点播采
31、用动态 B 帧方式 最大 I 帧间隔 50 帧 M M N/A 建议 直播采用 25 帧 建议 点播采用 50 帧 , 支持动态 I 帧 插入 VBR(参考值):平 均码率 25Mbps, VBR 峰值 不超平均码率的 2 倍 M M N/A 码率控制模式 CBR(参考值):码 率 35Mbps M M N/A 建议支持内容感 知的码率控制 二次编码 (2-pass) 支持 O M N/A 色彩空间 BT.709 M M M 传输特性 (transfer characteristics) 支持 BT.709 M M M 预处理 (Pre-processing) 支持 M M N/A 后处理 (
32、Post-processing) 支持 N/A N/A M H.264 规范参数 (参照 ISO/IEC 14496-10) 亮度和色度空间 (Chroma Format) 4:2:0 M M M 比特流格式 (Bitstream Format) Byte-Stream Format NAL M M M IDR Intra 支持 O O O 帧类型 (Picture Type) 支持 I, P, B Picture M M M 分片类型 (Slice Type) 支持 I, P, B Slice M M M 哈达玛变换 (Hadamard ) 支持 M M M 块变换大小 4x4, 8x8 M
33、 M M 视觉优化量化矩阵 4x4, 8x8 O O M 最大搜索范围 (Search Range) -256,255.75 M M M 帧内预测支持块 16x16, 4x4, 8x8 M M M (MB type for I slices) 16x16, 16x8, 8x16, 8x8 M M M 帧间预测支持块 (MB type for P&B slices) 8x4, 4x8, 4x4 M M M 快速运动估计 (Fast Motion Estimation) 支持 M M N/A 方 向 模 式 类 型 (DirectModeType ) 时域( Temporal) 空域( Spati
34、al) M M M P 帧加权预测 (P-slice Weighted Prediction) Explicit M M M B 帧加权双向预测 (B-slice Weighted BiPrediction) Explicit, Implicit M M M 加 权 参 考 运 动 估 计 (WeightedReferenceME) 支持 O O N/A 环内滤波 (InLoop De-blocking Filter) 支持 M M M 1/4 像素运动估计 (1/4 pel ME) 支持 M M M 率失真优化 (Rate Distortion Optimisation) 支持 O O M
35、多参考帧 (Multi-Reference Frames) 最高支持到 15 M M M 熵编码 (Entropy coding ) CABAC M M M 开放图像组支持 (Open GOP Support) 支持 M M M 动态图像组支持 (Adaptive GOP Support) 支持 M M M 量化矩阵 (Custom quantization matrices) 支持 O M M 5.3.2 环绕声音频 对于 4K 超高清视频编码标准配套使用的环绕声音频编解码设备能力要求如 表 6 所示 : 表 6 H.264 4K 超高清编码标准配套使用的环绕声音频编解码设备能力要求 必选
36、(M)/ 可选 (O)/ 不定义 (N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 Dolby EAC-3/DD+ M M M DTS digital surround O O O 音频编码 codec MPEG-4 AAC 5.1 声道 O O O 32KHz, 44.1KHz, 48KHz M M M 采样频率范围 96KHz O O O 支持音频编码速率范围 64Kbps 1.5Mbps M M M 建议采用 256Kbps 的 DD+ 声道模式 1.0/2.0/5.1/7.1/Atmos M M M 要求机顶盒支持多 声道解码和透传输 出 多音轨 支持 O M M
37、 6 AVS2 编解码要求 IPTV业务采用 AVS2标准进行 4K/全 4K超高清内容的编解码, AVS2视频码流的语法内容依 据 GB/T 33475.2-2016标准,并在此基础上针对 GB/T 33475.2-2016规定的档次和等级进行了 适当的删减和扩展,形成了本标准对于 IPTV音频与视频编码参数的技术要求。 6.1 超 高清 6.1.1 视频 根据应用场合不同 , AVS2 4K/全 4K超高清视频编码器分实时编码器和离线编码器 。 不同 编码器和解码器参数具体要求如表 7所示: 表 7 AVS2 4K/全 4K 超高清视频编码器参数要求 必选 (M)/可选 (O)/不定义 (
38、N/A) 参数项目 参数值 实时 编码器 离线 编码器 机顶盒 备注 总体参数要求 Main M M M 档次 (Profile) Main 10 M M M 全 4K 内容要求 支持 10bit 等级 (Level) 8.2.60 以上 M M M 3840 x2160 M M M 分辨率 (Resolution) 4096x2160 O M M 24P、 25P、 30P M M M 帧率 (Frame Rate) 50P、 60P M M M 视频编码平均速率 (BitRate) 10-25Mbps M M M 最大 B 帧数 7 帧 M M N/A 建议点播采用动态 B 帧方式 最大
39、I 帧间隔 50 帧 M M N/A 建议 直播采用 25 帧 建议 点播采用 50 帧 , 支持动态 I 帧 插入 VBR(参考值):平 均码率 20Mbps, VBR 峰值 不超平均码率的 2 倍 M M N/A 码率控制模式 CBR(参考值):码 率 25Mbps M M N/A 建议支持内容感 知的码率控制 二次编码 (2-pass) 支持 O M N/A 色彩空间 BT.709、 BT.2020 M M M 全 4K 内容元数 据 要 求 支 持 BT.2020 色域 传输特性 (transfer characteristics) 支持 BT.709、 SMPTE ST 2084 和 HLG M M M 全 4K 内容元数 据 要 求 支 持 SMPTE ST 2084、 HLG 预处理 (Pre-processing) 支持 M M N/A 建议参考主流编 码设备 后处理 (Post-processing) 支持 N/A N/A M 建议参考主流编 码设备 AVS2 规范参数 (参照 GB/T 33475.2-2016) 4: