1、ICS 35.240 M 60 DB32 江苏省 地 方 标 准 DB 32/T 3729 2020 融合媒体内容平台运营及托管服务音视频 文件交互 规范 Audio / video file interaction standard for converged media content platform operations and hosting services 2020- 02 - 06 发布 2020-03-01 实施 江苏省市场监督管理局 发布 DB32/T 3729-2020 I 目 次 前 言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4
2、 缩略语 . 2 5 融合媒体内容平台文件交互要求 . 2 5.1 融合媒体内容平台定位 . 2 5.2 音视频文件交互协议 . 2 5.3 音视频文件交互校验算法 . 3 6 音视频文件封装格式 . 3 7 音视频编码格式 . 3 7.1 视频编码格式 . 3 7.2 音频编码格式 . 4 8 元数据文件描述要求 . 5 8.1 元数据项组成及文件结构 . 5 8.2 消息元数据 . 5 8.3 内容元数据 . 5 9 音视频交互文件的参数要求 . 7 9.1 广播电视节目交互文件的视频参数要求 . 7 9.2 广播电视节目交互文件的音频参 数要求 . 8 9.3 网络视听交互文件的视频参数
3、要求 . 9 9.4 网络视听交互文件的音频参数要求 . 9 DB32/T 3729-2020 II 前 言 本标准按照 GB/T 1.1-2009给出的规则起草。 本标准由江苏省广播电视局 提出并 归口。 本标准起草单位:江苏省广播电视总台。 本标准主要起草人:顾建国、苏琦、王丽霞、吴阳、吴昊、马晨阳、顾惟、朱宪庭。 DB32/T 3729-2020 1 融合媒体内容平台运营及托管服务音视频文件交互 规范 1 范围 本标准规定了融合媒体内容平台运营及托管服务的音视频文件交互 要求,以及 音视频交互 文件的 封 装格式、 编码格式、 元数据描述、 音视频参数 等 要求。 本标准适用于融合媒体内
4、容平台运营及托管服务交互的音视频文件。 2 规范性引用文件 下列文件对于本标准的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本标 准。凡是不注日期的引用文件,其最新版本 (包括所有的修改单)适用于本标准。 GY/T 299.1-2016 高效音视频编码 第 1部分 : 视频 GY/T 257.1-2012 广播电视先进音视频编解码 第 1部分 : 视频 GY/T 257.2-2014 广播电视先进音视频编解码 第 2部分 : 视频符合性测试 GY/T 202.1-2004 广播电视音像资料编目规范 第 1部分 : 电视资料 GY/T 261-2012 广播 电视数字版权 管理
5、 元数据规范 GY/T 315-2018 高动态范围电视节目制作和交换图像参数值 GY/T 282-2014 数字电视节目平均响度和真峰值音频电平技术要求 3 术语和定义 下列术语和定义适用于本文件 。 3.1 融合媒体 converged media 广播、电视、报刊等与基于互联网的新兴媒体有效结合,借助于多样化的传播渠道和形式,开展 信 息 内容的广泛传播,实现资源通融、内容兼融、宣传互融的新型媒体。 3.2 内容平台 content platform 进行 资源汇聚 、 产品策划 、编辑 制作 、 内容 管理、共享发布、交换检索等一系列与内容 服务 相关 的 平台。 3.3 元数据 me
6、tadata 描述 内容 实体的 附属 数据 信息, 是对内容 实体 及其 属性、 形式 、 相关使用规则 、 义务和其他事项的 结构化描述 , 可以嵌入内容 实体文件 或与之相关联 。 DB32/T 3729-2020 2 3.4 元数据项 metadata item 组成元数据 的 数据集名称 , 包含相关 主题的数据字 段 内容。 4 缩略语 下列缩略语适用于本文件。 AAC 高级音频编码 ( Advanced Audio Coding) ASF 高级系统格式( Advanced Systems Format) AVC 高级视频编码( Advanced Video Coding) AVI
7、 声音图像交错存放格式( Audio Video Interleaved) AVS 音视频编码标准( Audio Video coding Standard) FLV flash视频( Flash Video) FTP 文件传输协议 ( File Transfer Protocol) HEVC 高效 视频编码 ( High Efficiency Video Coding) HTTP 超文本 传输协议 ( HyperText Transfer Protocol) HTTPS 超文本传输安全协议( HyperText Transfer Protocol Secure) JSON JavaScrip
8、t对象简谱 ( JavaScript Object Notation) MOV 电影数字视频技术 ( Movie digital video technology) MPEG 活动图像专家组( Moving Pictures Expert Group) MXF 素材交换格式( Material eXchange Format) PCM 脉冲编码调制 ( Pulse Code Modulation) SHA 安全 散列算法( Secure Hash Algorithm) WAV 波形音频文件格式 ( Waveform Audio File Format) XML 可扩展 标记 语言( eXten
9、sible Markup Language) 5 融合媒体内容平台文件交互 要求 5.1 融合 媒体内容平台 定位 融合 媒体 内容 平台 整合广播、电视、报刊、网络视听等媒体内容资源,开展内容生产、综合服务、 内容交换、数据分析等服务。 融 合媒体内容平台以大数据、云计算等技术为依托,提供内容相关服务的技术支撑,并对外开展内 容资源交换业务。 融合媒体内容平台运营及托管服务音视频文件交互需 遵循相应的文件交互、文件封装格式、文件编 码 格式 、元数据描述、音视频 参数 等要求。 5.2 音视频 文件交互协议 融合媒体内容平台运营及托管服务进行音视频文件的交互采用以下几种文件交互协议: SFT
10、P/FTP、 HTTP/HTTPS。文件交互宜 采用 HTTPS协议。 音视频 文件交互协议 见 表 1。 DB32/T 3729-2020 3 表 1 音视频 文件交互协议 序号 文件 传输 协议 要求 标准 1 SFTP/FTP RFC959 2 HTTP/HTTPS RFC2616、 RFC2818 5.3 音视频 文件交互 校验 算法 融合媒体内容平台运营及托管服务交互进行音视频文件校验 采用以下几种 校验算法: 国密算法 、消 息摘要算法。文件校验 宜采用 国密 算法。 音视频 文件交互 校验 算法 见 表 2。 表 2 音视频 文件交互 校验算法 序号 校验类型 具体算法 1 国密
11、算法 SM3 2 消息摘要算法 MD5、 SHA256 6 音视频文件封装格式 融合媒体内容平台运营及托管服务交互的音视频文件宜采用以下几种 封装 格式: MXF、 MOV、 AVI、 WAV、 MP4 files、 MPEG-2 Systems、 Micrsoft ASF、 F4V/FLV。 音视频文件 封装格式要求见 表 3。 表 3 音视频 文件 封装格式 要求 序号 文件封装格式 要求标准 1 MXF SMPTE 378M-2004 Material Exchange Format 2 MOV QuickTime File Format(Apple Computer Inc.),200
12、1 3 AVI Microsoft AVI, RIFF(Resource Interchange File Format)规 范 4 WAV RIFF(Resource Interchange File Format) 5 MP4 files ISO/IEC 14996 12 6 MPEG-2 Systems ISO/IEC 13818 1:2001 7 Micrsoft ASF Advanced Systems Format(ASF) Specification,Microsoft Corporation,December,2004 8 F4V/FLV Video File Format S
13、pecification Version 10( Adobe Computer Inc.) 7 音视频编码 格式 7.1 视频编码格式 融合媒体内容平台运营及托管服务交互的音视频文件宜采用以下几种视频编码格式: H.264/AVC、 H.265/HEVC、 MPEG-4、 MPEG-2、 DV、 VC-3/DNxHD、 VC-1、 Apple ProRes、 AVS2、 AVS+。 音视频文件 视频 编码格式 要求 见 表 4。 DB32/T 3729-2020 4 表 4 音视频 文件 视频编码格式 要求 序号 视频编码 要求标准 1 H.264/AVC H.265/HEVC H.264/A
14、VC Standard ISO/IEC 14496-10 ISO/IEC 23008-2 MPEG-H Part2 2 MPEG-4 ISO/IEC 14496-2 Information technology-Coding of audio-visual objects-Part2:Visual 3 MPEG-2 ISO/IEC 13818-2 Information technology-Generic coding of moving pictures and associated audio information:Video 4 DV IEC 61834 parts1,2 and 4
15、-Helical-scan digital video cassette recording system using 6,35mm magnetic tape for consumer use SMPTE 314M-Data Structure for DV-Based Audio,Data and Compressed Video 25 and 50Mb/s SMPTE 370M-Data Structure for DV-Based Audio, Data and Compressed Video at 100Mb/s 5 VC-3/DNxHD SMPTE 2019-1-2008 VC-
16、3 Picture Compression and Data Stream Format 6 VC-1 SMPTE 421M VC-1 Compressed Video Bitstream Format and Decoding Process 7 Apple ProRes Apple Computer Inc. ProRes family 8 AVS2 AVS+ GY/T 299.1-2016 GY/T 257.1-2012 GY/T 257.2-2014 7.2 音频编码格式 融合媒体内容平台运营及托管服务交互的音视频文件宜采用以下几种音频编码格式: MP3、 MPEG-2、 MPEG-2
17、 AAC、 MPEG-4、 DV、 Dolby Digital、 Dolby-E。 音视频文件 音频 编码格式 要求 见 表 5。 表 5 音视频 文件 音 频编码格式 要求 序号 音频编码 要求标准 1 MP3 ISO/IEC 13818-3 2 MPEG-2 MPEG-2 audio:ISO/IEC 13818-3:First edition 3 MPEG-2 AAC MPEG-2 ISO/IEC 13818 7:2004 4 MPEG-4 MPEG-4 ISO/IEC 14496 3:2001 5 DV IEC 61834 parts 1, 2 and 4- Helical-scan d
18、igital video cassette recording system using 6,35mm magnetic tape for consumer use SMPTE 314M-Data Structure for DV-Based Audio,Data and Compressed Video 25 and 50Mb/s SMPTE 370M-Data Structure for DV-Based Audio,Data DB32/T 3729-2020 5 and Compressed Video at 100Mb/s 6 Dolby Digital Digital Audio C
19、ompression Standard(AC-3,E-AC-3) Revision B, Document A/52B:2005 7 Dolby-E Dolby-E 8 S48 ISO/IEC 13818-3 8 元数据文件描述要求 8.1 元数据项组成 及 文件结构 融合媒体内容平台与内容提供方及其用户之间文件交互的接口元数据项总体上分为消息元数据和 内容元数据 两类 。 元数据文件结构宜 采用 JSON或 XML模式。 8.2 消息元数据 消息 元数据描述 见 表 6。 表 6 消息元数据表 序号 字段名称 数据名称 数据 类型 描述 1 info_id 唯一 标识 string 唯一 的
20、 消息 标识 2 timestamp 时间 戳 string 消息发起 的时间 标记 3 op_type 操作 类型 string 操作对应 的类型 4 provider_id 发起 方 标识 string 消息发起方 的 标识 5 receiver_id 接收方 标识 string 消息接收方 的 标识 8.3 内容元数据 内容元数据包括基本 信息 元数据 、 版权 信息 元数据 、 特性信息元数据等 。 8.3.1 基本信息元数据 基本 信息元数据描述 见 表 7。 表 7 基本信息 元数据 表 序号 字段名称 数据名称 数据 类型 描述 1 id 唯一 标识 string 唯一 的 文件
21、 标识 2 name 名称 string 文件内容名称 3 version 版本 string 文件版本 4 description 描述 string 内容 描述 5 creator 内容 提供方 string 内容 提供方名称 6 creator_id 内容 提供方标识 string 内容 提供方的唯一性 ID 7 create_time 创建 时间 string 文件 创建时间 8 type 类型 string 文件类型 9 size 大小 long 文件 大小描述 10 path 路径 string 文件 路径 DB32/T 3729-2020 6 11 format 格式 objec
22、t 用于 描述文件的 格式 等信息 12 modify_time 修改 时间 string 最后一次修改时间 13 sm3 文件 校验 值 string 文件校验值(国密 SM3算法) 14 recommended_index 推荐 指数 string 推荐指数 15 tag 标签 string 标签 16 DRM_need DRM保护 string DRM保护 17 ad_flag 广告 内容标识 string 广告 内容标识 基本信息元数据 的其他字段, 可参考 GY/T 202.1-2004。 8.3.2 版权 信息元数据 版权 信息 元数据 描述 见 表 8。 表 8 版权信息 元数据
23、 表 序号 字段名称 数据名称 数据 类型 描述 1 copyright_type 版权类型 string 文件版权类型 2 effective_time 生 效 时间 string 版权 生 效 时间 3 expire_time 失效 时间 string 版权失效 时间 4 allowed_area 有效区域 string 版权 有效区域 版权信息元数据 的其他字段, 可参考 GY/T 261-2012。 8.3.3 特性 信息元数据 特性信息包括 视频信息 、音频信息 和 广告信息 等。 视频信息 、 音频信息和 广告 信息 元数据 描述 见 表 9、表 10和 表 11。 表 9 视频信
24、息元数据表 序号 字段名称 数据名称 数据 类型 描述 1 format 格式 string 视频文件 格式 2 width 宽度 int 图像 幅 面 宽度 3 height 高度 int 图像 幅 面高 度 4 duration 时长 long 视频 时长描述 5 bitrate 数据码率 long 视频 数据码率 6 rate 幅 面比 string 视频 显示时的宽高比 视频信息元数据 的其他字段, 可参考 GY/T 202.1-2004。 表 10 音频信息元数据表 序号 字段名称 数据名称 数据 类型 描述 1 format 格式 string 音频文件 格式 2 duration
25、 时长 long 音频 时长描述 3 channel 通道 long 音频通道 数 4 sample_freq 采样率 long 音频采样率 5 bit_depth 位深度 long 音频位 深度 6 bitrate 数据码率 long 音频 数据码率 音频信息元数据 的其他字段, 可参考 GY/T 202.1-2004。 DB32/T 3729-2020 7 表 11 广告信息元 数据表 序号 字段名称 数据名称 数据 类型 描述 1 ad_id 广告代码 string 广告代码 2 duration 时长 long 广告 时长描述 3 brand_id 品牌 ID string 广告品牌
26、ID 4 brand_name 品牌名称 string 广告品牌名称 5 trade_id 行业 ID string 广告行业 ID 6 trade_code 行业 编码 string 广告行业 编码 7 release_type 发布类型 string 发布类型 8 time_limit 时段限 制 string 时段限制 9 happy_index 欢乐指数 string 欢乐指数 10 public_figure 公众人物 string 公众人物 基本 信息 元数据 、 版权 信息 元数据 、 特性信息元数据等 内容元数据可根据音视频文件交互实际业务 需求添加扩展字段。 9 音视频交互
27、文件的 参数要求 9.1 广播电视节目交互文件的视频参数要求 9.1.1 标清电视节目交互文件的主要视频参数要求 标清电视节目交互文件的主要视频 参数 要求如下: 幅 型比 : 4:3; 有效像素数 : 720 576; 像素宽高比: 1.067:1; 像素排列顺序 : 从左到右、从上到下 ; 取样 结构: 正交; 帧率 : 25Hz; 扫描模式 :隔行; 色域 : 符合 ITU-R BT.601标准。 9.1.2 高清电视节目交互文件的主要视频参数要求 高清电视节目交互文件的 主要 视频 参数 要求 如下 : 幅型比 : 16:9; 有效像素数 : 1920 1080; 像素宽高比: 1:1
28、; 像素排列顺序 : 从左到右、从上到下 ; 取样 结构: 正交; 帧率 : 25Hz; 扫描模式 :隔行; 色域: 符合 ITU-R BT.709标准。 DB32/T 3729-2020 8 9.1.3 超高清电视节目交互文件的主要视频参数 要求 超高清电视节目交互文件的 主要 视频 参数 要求 如下 : 幅型比 : 16:9; 有效像素数 : 38402 160、 76804320 ; 像素宽高比: 1:1; 像素排列顺序 : 从左到右、从上到下 ; 取样 结构: 正交; 帧率 : 120Hz、 100Hz、 50Hz; 扫描模式 : 逐行 ; 色域 : 符合标准 ITU-R BT.202
29、0; 高动态范围 :符合 HLG标准 /1000nit( GY/T 315-2018) 。 注 : 亮度和色差分量量化比特数为 10bit或 12bit。 9.2 广播电视节目交互文件的音频参数要求 9.2.1 广播电视节目交互文件的主要音频参数要求 广播电视节目交互文件的主要音频参数要求如下: 编码 格式: PCM 16bit、 PCM 24bit; 采样 频率: 44.1KHz、 48KHz; 音频格式:单声道、立体声、环绕 声 。 环绕声 节目 声道分配要求 见 表 12和 表 13。 表 12 8路 环绕声 节目声道分配 表 序号 声 轨 声道 1 声 轨 1 前左声道( L) 2 声
30、 轨 2 前右声道( R) 3 声 轨 3 中置声道( C) 4 声 轨 4 低频增强声道( LFE) 5 声 轨 5 左环绕声道( LS) 6 声 轨 6 右环绕声 道( RS) 7 声 轨 7 立体声( L) 8 声 轨 8 立体声( R) 表 13 16路环绕声节目声道分配表 序号 声轨 声道 1 声轨 1 前左声道( L) 2 声轨 2 前右声道( R) 3 声轨 3 中置声道( C) DB32/T 3729-2020 9 4 声轨 4 低频增强声道( LFE) 5 声轨 5 左环绕声道( LS) 6 声轨 6 右环绕声道( RS) 7 声轨 7 立体声( L) 8 声轨 8 立体声(
31、 R) 9 声轨 9 国际声或预留 10 声轨 10 国际声或预留 11 声轨 11 国际声或预留 12 声轨 12 国际声或预留 13 声轨 13 国际声或预留 14 声轨 14 国际声或预留 15 声轨 15 国际声或预留 16 声轨 16 国际声或预留 9.2.2 响度要求 根据 GY/T 282-2014 数字电视节目平均响度和真峰值音频电平技术要求 中对音频响度的要求, 高清电视节目文 件音频平均响度应为 -24LKFS,响度容差为 2LU。 9.3 网络视听交互文件的视频参数要求 横屏网络交互 文件的主要视频参数要求如下: 幅型比 : 16:9; 有效像素数 : 480 270、 640 368、 864 486、 1280 720、 1920 1080; 帧 速 率 : 25帧 /秒。 竖屏网络交互文件的主要视频参数要求如下: 有效像素数 : 368 640、 852 480、 554 960、 720 1280; 帧 速 率 : 25帧 /秒。 9.4 网络视听交互文件的音频参数要求 横屏 和 竖屏 网络交互文件的主要音频参数要求如下 : 音频码率 : 不低 于 48Kbps; 采样 频率: 22.05KHz、 44.1KHz、 48KHz; 音频格式:单声道、立体声。 _