GY T 281-2014 An extended file format for audio MBWF RF64《音频扩展文件格式MBWF RF64》.pdf
《GY T 281-2014 An extended file format for audio MBWF RF64《音频扩展文件格式MBWF RF64》.pdf》由会员分享,可在线阅读,更多相关《GY T 281-2014 An extended file format for audio MBWF RF64《音频扩展文件格式MBWF RF64》.pdf(18页珍藏版)》请在麦多课文档分享上搜索。
1、 GY 中华人民共和国广播电影电视行业标准 GY/T 281 2014音频扩展文件格式 MBWF/RF64 An extended file format for audio MBWF/RF64 2014 - 12 - 03发布 2014 - 12 - 03实施 国家新闻出版广电总局 发布GY/T 2812014 I 目 次 前言 II 1 范围 1 2 术语、定义和缩略语 1 3 概述 2 4 基本用户需求 2 5 RF64 文件格式定义 2 附录 A(规范性附录)RIFF/WAVE和 RF64/WAVE 结构的形式化描述 8 参考文献 14 GY/T 2812014 II 前 言 本标准按
2、照GB/T 1.1-2009给出的规则起草。 本标准依据EBU-TECH 3306:2009MBWF/RF64:音频扩展文件格式起草。 本标准由全国广播电影电视标准化技术委员会(SAC/TC 239)归口。 本标准起草单位:国家新闻出版广电总局广播电视规划院。 本标准主要起草人:张建东、邓向冬、肖辉。 GY/T 2812014 1 音频扩展文件格式MBWF/RF64 1 范围 本标准规定了专业广播领域内的一种超过4G字节大小的数字音频文件格式要求。 本标准适用于数字音频文件的录制、归档和交换。 2 术语、定义和缩略语 2.1 术语和定义 下列术语和定义适用于本标准。 2.1.1 环绕声数字音频
3、编码 audio coding generation 3;AC-3 在ETSI TS 102 366标准中定义的数字音频压缩编解码标准。 2.1.2 广播音频扩展 broadcast audio extension;bext 一种音频数据块,用于定义音频资料文件交换所需的基本参数,如创作者姓名、创作日期等。 2.1.3 MPEG-2 AAC 在ISO/IEC 13818-7标准中定义的数字音频压缩编解码标准。 2.1.4 数字影院系统 digital theater systems;DTS 一种数字音频压缩编解码系统。 2.1.5 Dolby E 一种数字音频压缩编解码系统,可用于音频信号的馈
4、送和分配环节。 2.1.6 RF64 一种基于64位的资源交换文件格式。 2.2 缩略语 下列缩略语适用于本标准。 GY/T 2812014 2 BWF 广播波形格式(Broadcast Wave Format) GUID 全球唯一标识符(Globally Unique Identifier) MBWF 多声道广播波形格式(Multichannel Broadcast Wave Format) MPEG 运动图像专家组(Moving Picture Experts Group) PCM 脉冲编码调制(Pulse Code Modulation) RIFF 资源交换文件格式(Resource I
5、nterchange File Format) WAVE 波形音频文件格式(Waveform audio file format) 3 概述 RF64 文件格式能够满足多声道声音节目在广播和归档应用中的长期需求。 RF64 文件格式在 RIFF/WAVE 文件基本规范的基础上进行了以下扩展: 文件大小超过 4G 字节; 扩展了 Wave Format Extensible 中多声道参数的定义,可承载最多至 18 个环绕声道、立体声 下混声道和非 PCM 编码数据比特流信号。 RF64 文件格式作为 RIFF/WAVE 格式和 BWF 及其补充数据块的一种可兼容扩展格式,扩展了 RIFF/WAV
6、E和 BWF 的最大文件容量,以满足多声道声音节目广播和音频归档的应用需求。 RF64 可应用于从声音采集、编辑到播出的整个节目生产过程,以及多声道文件的短期或长期归档。 本标准中将包含bext块的RF64文件定义为MBWF(Multichannel BWF)文件,术语“RF64”与“MBWF” 可视为同义。 4 基本用户需求 音频扩展文件格式应满足如下的基本用户需求: 文件格式应开放且基于已发布的规范; 保持与 BWF和 RIFF/WAVE 的兼容; 支持线性 PCM 信号的存储; 支持超过 4G字节的文件; 至少支持 8声道信号存储(5.1+双声道立体声) ; 适用于包含在单个文件中的 5
7、.1 声道和双声道立体声信号的同步播出; 支持音频码流的存储; 适用于音频信号编辑; 适用于从文件中直接导出浏览版本(文件格式元数据) ; 包含播放所需的技术元数据(如杜比元数据) ; 适用于经济易用的软件播放器; 易于软件开发者和制造商实现。 此外,根据实际系统的运行经验,节目制作和归档中通常需要在单个文件中存储和传送PCM和/或非 PCM音频数据,因此在RF64格式中增加了容纳非PCM音频流(如:AC-3和DTS)的机制。 5 RF64 文件格式定义 5.1 Wave Format Extensible声道模板 GY/T 2812014 3 Wave Format Extensible 的
8、声道模板包含的前 18 个“#define”定义,用于指定不同的扬声器位 置 (声道分配) , 还有一个 “#define” 设置为 “SPEAKER_ALL” , 表示开启所有扬声器 (声道) 。 Wave Format Extensible声道模板的扬声器位置/声道分配定义及标识见表 1。 表1 Wave Format Extensible声道模板 扬声器位置/声道分配定义 标识 #define SPEAKER_FRONT_LEFT 0x00000001 #define SPEAKER_FRONT_RIGHT 0x00000002 #define SPEAKER_FRONT_CENTER
9、0x00000004 #define SPEAKER_LOW_FREQUENCY 0x00000008 #define SPEAKER_BACK_LEFT 0x00000010 #define SPEAKER_BACK_RIGHT 0x00000020 #define SPEAKER_FRONT_LEFT_OF_CENTER 0x00000040 #define SPEAKER_FRONT_RIGHT_OF_CENTER 0x00000080 #define SPEAKER_BACK_CENTER 0x00000100 #define SPEAKER_SIDE_LEFT 0x00000200
10、#define SPEAKER_SIDE_RIGHT 0x00000400 #define SPEAKER_TOP_CENTER 0x00000800 #define SPEAKER_TOP_FRONT_LEFT 0x00001000 #define SPEAKER_TOP_FRONT_CENTER 0x00002000 #define SPEAKER_TOP_FRONT_RIGHT 0x00004000 #define SPEAKER_TOP_BACK_LEFT 0x00008000 #define SPEAKER_TOP_BACK_CENTER 0x00010000 #define SPE
11、AKER_TOP_BACK_RIGHT 0x00020000 #define SPEAKER_ALL 0x80000000 为满足第 4章列出的用户需求,RF64 需要对基本 Wave Format Extensible 的声道模板进行扩展。 声道模板的标识使用一个 32 位变量存储,因此,还可定义另外 13 个“#define”来满足新增的用户需 求。 5.2 PCM 双声道立体声下混定义扩展 Wave Format Extensible 中不包含 PCM 双声道立体声信号的定义,因此在声道模板中增加以下定 义: #define SPEAKER_STEREO_LEFT 0x20000000
12、#define SPEAKER_STEREO_RIGHT 0x40000000 使用此定义,可满足在单一文件中包含一个多声道“X.1”信号和一个双声道立体声下混信号。 5.3 控制数据定义扩展 增加了两个“#define”用于定义控制数据: #define SPEAKER_CONTROLSAMPLE_1 0x08000000 #define SPEAKER_CONTROLSAMPLE_2 0x10000000 控制数据可以存储在文件中,技术或内容元数据定位的方法预留定义。 GY/T 2812014 4 5.4 非 PCM 比特流数据定义扩展 符合IEC 61937-1、IEC 61937-3、
13、IEC 61937-5、IEC 61937-6、SMPTE 337M、SMPTE 338M、SMPTE 339M和 SMPTE 340M 标准的比特流信号包含以各种方式编码的非 PCM 多声道音频数据。 通过文件格式中的比特流存储方式,AC-3、Dolby E、DTS、MPEG-1和 MPEG-2(包括所有三个层) 、 MPEG-2 AAC 编码的音频数据,与线性 PCM 信号的存储方式类似,以数据帧的方式存储于文件中。文件 格式中比特流音频信号的嵌入结构,类似于线性 PCM RIFF/WAVE 或 BWF 文件中两个交织立体声音频声 道的结构。 RIFF 文件中仅有一个格式块,用于定义音频数
14、据块中所有交织声道的通用参数。如果同一个文件 中还存在其他 PCM 音频, 则比特流声道格式必须遵从文件中其他多声道 PCM 或双声道立体声 PCM的声道 格式。 在文件的接收端,只有通过 AES3 或 SPDIF 接口解码比特流时,方可获知非 PCM 音频编码的类型, 因此将来有必要增加一个新的块定义来指示文件中包含的比特流格式。 对 Wave Format Extensible 声道模版新增以下 4个“#define”定义,用于承载两种非 PCM 格式: #define SPEAKER_BITSTREAM_1_LEFT 0x00800000 #define SPEAKER_BITSTREA
15、M_1_RIGHT 0x01000000 #define SPEAKER_BITSTREAM_2_LEFT 0x02000000 #define SPEAKER_BITSTREAM_2_RIGHT 0x04000000 5.5 支持超过 4G字节的文件 4G 字节文件大小限制源于 RIFF/WAVE 和 BWF 格式中的 32 位寻址方式,使用 32 位的最大寻址范围 为 4294967296 字节(即4G 字节) ,为支持超过 4G字节的文件,本标准使用 64 位寻址方式。 如果仅将 BWF 中每个字段的长度改为 64 位, 显然将生成一个与标准 RIFF/WAVE 格式不兼容的文件。 标准
16、 RIFF/WAVE 文件格式见图 1,其中除 fmt 块数据和音频数据外,其余字段长度均为 32 位。 图1 标准 RIFF/WAVE 格式 因此, 本标准定义了一种新的基于64位的资源交换文件格式 (Resource Interchange File Format) , 称为 RF64。RF64 与原有的 RIFF/WAVE 格式基本相同,不同之处如下所述: 文件起始的四个字节,以“RF64”标识替代“RIFF” ; 文件中定义了一个必须包含的“ds64” (data size 64)块,该块须紧接在“RF64” 块之后。 “ds64”块包括三个必选的 64 位整型值,替代 RIFF/WA
17、VE 格式中原有的三个 32 位字段: RIFF 块大小; data 块大小; GY/T 2812014 5 fact 块中的样本计数值。 对 RIFF/WAVE 格式中上述三个 32 位字段应用以下替代规则: 如果字段的 32 位值不是“-1” (即十六进制的 0xFFFFFFFF) ,则使用该 32 位值;如果值为“-1” ,则 使用“ds64”块中的 64位值。 一种支持 64位块大小的可选 RF64 块结构体(struct 1) )定义见附录A 中的A.1和A.2。 RF64/WAVE 文件格式的完整结构示例如图 2 所示。图 2 中除预留 64 位数据、fmt 块数据和音频数据字 段
18、外,其余字段均为 32位。 图2 支持多达 16E 2) 字节文件大小的 RF64/WAVE 文件格式的完整结构示例 5.6 BWF 和RF64间归档的兼容性 即使在节目录制中采用更高采样率和多声道音频,也不是所有音频文件都会超过 4G 字节,因此,对小 于 4G 字节的音频文件仍应使用 BWF格式存储。 由于录制程序无法预知在录音结束时文件大小是否会超过 4G 字节(即是否需要使用 RF64) ,因此录制 程序需具备在所写入数据达到 4G 字节限制处将录制文件实时从 BWF 格式转换到 RF64 格式的功能,同时不 影响录制的继续进行。 该项需求可以通过在 BWF 中插入与“ds64”块同样
19、大小的“JUNK” 3) 块从而预留额外的空间来实现。预 留的空间对 BWF 格式无实际意义,但当需要转换为 RF64 格式时,使用该空间承载“ds64”块。 RIFF/WAVE 文件格式的向上兼容性结构见图 3。图 3 中除JUNK 块数据、fmt 块数据和音频数据字段外, 其余字段均为 32 位。 1) “struct”是C/C+中用于定义结构体类型和/或结构体变量的关键字。 2) E字节即exa byte(1E字节=2 60 字节)。 3) “JUNK”块是RIFF/WAVE基本规范的一部分,作用为占位,音频应用程序将忽略该块。 GY/T 2812014 6 图3 RIFF/WAVE 文
20、件格式的向上兼容性结构 支持 RF64 格式的应用程序在开始录制时,首先创建第一个块为“JUNK”块的标准 RIFF/WAVE或 BWF 格式文件,录制中,应用程序检查 RIFF 和数据大小,当发现超过 4G 字节时,将执行以下操作: 以“ds64”替代“JUNK”块标识(将原来的 JUNK 块转换为ds64 块) ; 在“ds64”块中,按块定义格式插入 RIFF 块大小,data 块大小和样本计数值; 将原 32 位的RIFF 块大小,data 块大小和样本计数值设为-1(0xFFFFFFFF) ; 以“RF64”标识替代文件的最初 4个字节 “RIFF” ; 继续录制。 5.7 标记块的
21、定义 实际应用中,发现 RIFF/WAVE 文件格式关于 cue块的定义存在如下一些问题: 现行的 cue块采用 32 位寻址方式,因此仅对 RF64 文件的前4G 字节音频数据有效; cue 块的定义描述不明确,导致一些开发者在其应用程序中以不当的方式实现标记功能; 针对数据净荷是线性音频还是压缩数据这两种情况, 软件开发者必须以不同的方式对标记进行 处理,这将影响软件开发代码的简单性和准确性; 标记中的标签(labels)并未跟其一起存储于“cue”块,而是存储在“labl”块中,使对标 记的处理更加复杂。 因此,本标准定义了一个新的 RF64 标记块(见附录 A.3 和A.4) ,该块包
22、含了标记的位置及其标签。 RF64 文件很大(通常超过 4G 字节) ,如果删除标记时无需对整个文件进行重新处理,将使 RF64 文 件更易于使用。通过在 FLAG 字段中设置/重置一个比特位,从而将某个标记置为有效或无效来实现。 在开始写入 data 块前预留一些存放标记的空间,在录音和将音频数据写入 data 块的过程中,将标 记也写入文件。 根据统计显示,大多数标记的标签只占用几个字符的长度,因此可使用一个固定长度的字段来承载 标签,相对于动辄超过 4G 字节的 RF64 音频文件而言,由此引入的空间开销很少。例如,3000 个典型 的标记占用的空间不超过 1M 字节,在一个 4G 字节
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GYT2812014ANEXTENDEDFILEFORMATFORAUDIOMBWFRF64 音频 扩展 文件格式 MBWFRF64PDF

链接地址:http://www.mydoc123.com/p-1247126.html