GY T 349-2021 感知音频质量的客观测量方法.pdf
《GY T 349-2021 感知音频质量的客观测量方法.pdf》由会员分享,可在线阅读,更多相关《GY T 349-2021 感知音频质量的客观测量方法.pdf(62页珍藏版)》请在麦多课文档分享上搜索。
1、 GY 中华人民共和国 广播电视和网络视听 行业标准 GY/T 349 2021 感知音频质量的客观测量方法 Method for objective measurements of perceived audio quality ( ITU-R BS.1387-1,MOD) 2021 -03 -29 发布 2021 -03 -29 实施 国家广播电视总局 发布 GY/T 3492021 I 目 次 前言 . II 引言 . III 1 范围 . 1 2 规范性引用文件 . 1 3 术语、定义和缩略语 . 1 3.1 术语和定义 . 1 3.2 缩略语 . 2 4 概述 . 3 5 应用 .
2、3 6 版本 . 4 7 主观领域 . 4 8 分辨率和精准度 . 5 9 要求及限制 . 5 10 模型的描述 . 5 10.1 概述 . 5 10.2 耳朵周边 模型 . 7 10.3 激励模式的预处理 . 24 10.4 模型输出变量 (MOV)的计算 . 27 10.5 平均法 . 34 10.6 感知基本音频质量的估算 . 35 10.7 实现方案的一致性 . 38 附录 A(资料性) 本 文件 与 ITU-R BS.1387-1相比的结构变化情况 . 41 附录 B(规范性) 感知音频质量的客观测量方法的原则和特点 . 42 附录 C(规范性) 应用 . 47 附 录 D(规范性)
3、 输出变量 . 51 附录 E(规范性) 模型补充说明 . 53 参考文献 . 55 GY/T 3492021 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定 起草。 本 文件 使用重新起草法修改采用 ITU-R BS.1387-1感知 音频质量的客观测量方法。 本 文件 与 ITU-R BS.1387-1 相比,在结构上有较多的调整,附录 A中列出了 本 文件 与 ITU-R BS.1387-1章条编号变化对照一览表。 本 文件与 ITU-R BS.1387-1 的技 术性差异及其原因如下: 为符合 GB/T 1.12020
4、的 要求, 增加了第 1 章“ 范围 ” 、 第 2 章“ 规范性引用文件 ”、第 3 章“术语 、 定义 和缩略语” 。 本 文件对以下内容进行了编辑性修改: 删除了附件 1“概述” 中 过去相关研究情况的叙述内容; 删除了附件 1主观领域中的对主观评价的叙述内容; 删除了附件 2第 7章 中的关于测试条目从数据库 3中选择的描述性内容 ; 删除了附件 1的附录 3 中关于 PAQM的部分论述性语句; 删除了附件 1的附录 1 中的版权部分的描述 ; 删除了附件 1的附录 4 中的介绍 与 历史部分 的 描述 ; 删除了附件 2的附录 1 验证过程 ; 删除了附件 2的附录 2 参考数据库描
5、述。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本 文件由全国广播电影电视标准化技术委员会(SAC/TC 239 )归口。 本 文件起草单位:国家广播电视总局广播电视规划院。 本 文件主要起草人:覃毅力、邓向冬、韦安明、董文辉、郏涛、汪芮 、王倩男。 GY/T 3492021 III 引 言 考虑到: a) 对 采用 低比特率编码算法,以及 采用模拟或数字信号处理 的系统,传统的客观测量方法(如信 噪比和失真的测量)不适用于感知音频质量的测量; b) 低比特率编码算法已得到 迅速 应用; c) 并非所有符合某种规范或标准的 系统 /设备 都可以保证达到规范或标
6、准所规定的最高质量; d) 通常的主观评价方法不适用于音频质量的连续监测,例如在系统运行的情况下; e) 在整个测量领域中,感知音频质量的客观测量方法将补充或替代传统的客观测量方法 ; f) 感知音频质量的客观测量方法可以有效地对主观 评价 方法 进行补充; g) 对一些应用,需要 可 实时 测量 的 方法 。 建议对于本文件所列的应用,使用本文件规定的方法进行感知音频质量的客观测量。 GY/T 3492021 1 感知音频质量的客观测量方法 1 范围 本文件规定了感知音频质量的客观测量方法。 本文件适用于在电视节目或广播节目的收录、分配、传送和监测等环节,也适用于编解码器等音频 处理设备的研
7、究、开发、测试和维护。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GY/T 298 2016 音频系统小损伤主观评价方法( ITU-R BS.1116-3,MOD) ITU-R BS.1284-1: 2003 声音质量主观 评价通用方法 ( General methods for the subjective assessment of sound quality) 3 术语、定义和缩略语 3.1 术语和定义 下列术语和定义适用
8、于本文件。 3.1.1 绝对误差值 absolute error score; AES 反映SDG置信区间大小 与 SDG和 ODG之差 的 关联 平均值 ,其计算公式 见 公 式( 1)。 AES=2(ODG-SDG)/CI) 2 N ( 1) 式中: CI 置信区间大小, 若 CI 0.25, 则 CI 0.25; N 被评价音频素材的数量 。 3.1.2 基本音频质量 basic audio quality 一个通用主观属性,该属性包含了任意及所有可检测到的参考信号及其处理版本之间的差异。 3.1.3 编码余量 coding margin 一个质量参数,表示编码损伤从不可感知到可感知的阈
9、值余量。 3.1.4 模型输出变量 model output variables; MOV 感知测量方法的中间输出值。这些变量以基本心理声学研究为基础,用于进一步描述编码损伤特性。 3.1.5 GY/T 3492021 2 主观差异等级 subjective difference grade; SDG 根据 GY/T 298 2016开展 的 音频主观评价 , 采用 5级损伤标度对隐藏参考和被测信号 的基本音频质 量进行打分 得到相应的评分等级, 由被测信号 评分等级减去 隐藏 参考信号评分等级 所得的差值 ,见 公 式 ( 2) 。 1 SDG=GUDT-GRef ( 2) 式中: GUDT
10、 被测信号 评分 等级 ; GRef 隐藏 参考信号 评分 等级 。 3.1.6 客观差异等级 objective difference grade; ODG 感知测量方法的主要输出参数,相应于 主观差异等级,为通用基本音频质量的测量参数。 2 3.1.7 离线测量 off-line measurement 一种测量程序,其测量过程不会影响正在进行节目传输的系统。 3.1.8 在线测量 on-line measurement 一种测量程序,测试过程需依赖于正在进行传输的系统或是节目传输的一部分。 3.2 缩略语 下列缩略语适用于本文件。 ADB 平均失真 块 ( Average Distort
11、ed Block) ASD 听觉频谱差异( Auditory Spectral Difference) BAQ 基本音频质量( Basic Audio Quality) CI 置信区间( Confidence Interval) DC 直流( Direct Current) DFT 离散傅里叶变换( Discrete Fourier Transform) DIX 干扰指数( Disturbance Index) EHS 谐波失真结构( Error Harmonic Structure) ERB 等效矩形带宽( Equivalent Rectangular Bandwidth) FFT 快速傅里
12、叶变换( Fast Fourier Transform) FIR 有限脉冲响应( Finite Impulse Response) IIR 无限脉冲响应( Infinite Impulse Response) ITU 国际电信联盟( International Telecommunication Union) ISO 国际标准化组织( International Standards Organization) JNLD 临界 可察觉电平差( Just Noticeable Level Difference) MFPD 最大过滤检测概率( Maximum Filtered Probability
13、 of Detection) NL 噪音响度( Noise Loudness) NMR 噪声掩蔽比( Noise-To-Mask Ratio) PAQM 感知音频质量测量( Perceptual Audio Quality Measure) PERCEVAL 感知 评价 ( Perceptual Evaluation) 1) 理想情况下,SDG 数值 范围为 0 -4。如果参考信号没有被正确识别,则 数值为 正数。 2) ODG 数值范围为 0 -4。 GY/T 3492021 3 POM 感知客观测量( Perceptual Objective Measure) Ref 参考信号( Refe
14、rence Signal) ROEX ROEX函数(Rounded Exponential ) ROV 输出值比率( Rate of Output Values) SCM 主观编码 余量 ( Subjective Coding Margin) SPL 声压级(Sound Pressure Level ) Win 窗口平均值( Windowed Average) 4 概述 在数字广播电视系统中,音频质量是一个非常关键的因素。判定音频质量的主要方法包括音频 质量 主观评价和客观测量。由于音频主观评价既费时又昂贵,而 传统音频客观指标 如信噪比或总谐波失真与 感知音频质量没有可靠的关联性,因此 需提
15、出一种客观测量方法用于音频质量测量。 本文件所规定的感知音频质量客观测量方法是在对已有测量方法如干扰指数(DIX ) 、噪声掩蔽比 ( NMR) 、感知音频质量测量 ( PAQM) 、感知 评价 ( PERCEVAL) 、感知客观测量 ( POM) 以及工具箱法( Toolbox Approach) 进行研究 的基础上 形成的,输出可靠有用的信息,用于多种应用场景。 通过 对 上述 六 种方法 的性能进行研究,提取其中最有用的工具,并将这些工具融合 形成 一个 新的 测量方法 ,即本标准规定的 测量方法 。本 文件 规定 的测量方法已经在许多测试场所 经过了 仔细验证,且已证明能够为许多应用生
16、成 既可靠又有用的信息。 不过 本 文件 中的客观测量方法 无法取代 正式听音测试。 附录B 规定 了 客观感知音频质量的测量方法的原则和特点 。 5 应用 感知音频质量客观测量的基本示意图见图 1。 图 1 客观测量的基本示意图 本文件规定的测量方法适用于大部分模拟或数字音频信号处理设备 ,可 着重 用于 音频编解码 方面的 应用。 该测量方法适用于实时 在线 测量的应用 场景 ,也适用于非实时离线测量的应用场景。在实时 在线 测 量时,被测设备适宜的最大延时宜小于等于 200ms, 最大不应大于 1s。 本文件规定的测量方法可用于以下八类应用场景,应与表 1相符合 。 表 1 应用范围 序
17、号 应用名称 简介 版本 1 系统 /设备 的评价 对音频处理设备(多数情况 指 编解码器) 的 不同实现方案 进行 评价 基础 /高级 2 感知质量的 排 序 针对 某个设备或 线路 在 投入运行 前的快速 测量过程 基础 参考信号 被测设备 被测信号 客观测试 方法 音频质量评价 GY/T 3492021 4 表 1(续) 序号 应用名称 简介 版本 3 在线监 测 对工作中的音频传输 进行连续 监 测 基础 4 设备或连接状态 对某个设备或某 个线路进行 详细 分析 高级 5 编解码器识别 识别 特定编解码器的类型 或 实现方案 高级 6 编解码器开发 对编解码器性能 特性 进行 尽可能
18、 地分析 基础 /高级 7 网络规划 对 特定 条件 下 的 传输网络在性能和成本方面进行优化 基础 /高级 8 主观 评价 辅助 作为 筛选听音测试 中 关键 素材 的工具 基础 /高级 八 类应用场景详细的说明见附录 C。 6 版本 考虑到不同的经济 成本和性能要求,本 文件规定 的客观测量方法提供了两个版本。基础版本适用于 低成本实时实现方案,高级版本侧重于最高的准确度。由于高级版本增加了额外准确度 ,它 的复杂度比 基础版本增加了约四倍。 每种应用所适用的版本应符合 附录 C的要求。 7 主观领域 主观评价与客观测量之间需要相互补充,示意图见图2。 通常 的 音频 主观 评价 ,例如基
19、于 GY/T 298 2016的 评价,是 经过 精心设计的,用以 得出 尽可能 准确表征音频质量 的可靠评价 结果 。不过 主观 评价 的结果 也不一定能 完全反映出真实的感觉。 客观测量方法 可 通过音频 质量 主观 评价 进行验证。 图 2 验证示意图 本 文件中的测量方法主要关注 那些 在主观领域中可采 用 GY/T 298 2016进行 评价 的应用。 GY/T 298 2016中 测量 方法的基本原则可以简要描述为:听音者在 A、 B、 C三个音源中 切换并评价 , 其中 音源A 为 已知的参考信号 ,音源 B和 C为 隐藏的参考信号和被测信号 的 随机 排列 。 按照连续 5级
20、损伤等级,听音者通过对比 B与 A, C与 A,对 B和 C的 损伤进行 评价 。 B和 C中的其中一个 为隐藏源,难以将其 与 A区分开, 另一个则可能会反映出一些损伤。参考源和另一个音源之间的任何感 知上的差异 均应 视为损伤。通常 来说 ,只 考虑 “ 基本音频质量 ” 这一属性 , 它 是 一个总体属性,涵盖了 参考信号与被测信号之间 可感知到 的 所有差异。 实际听感 主观评价 客观测量 GY/T 3492021 5 损伤等级标度采用 ITU-R BS.1284-1: 2003中给定的连续且 带 锚点 的 ITU-R 5级损伤等级 标度 , 应与 图 3相符合 。 图 3 ITU 五
21、级损伤标度 主观评价 结果的分析通常以主观差异等级(SDG)为基础 。 SDG值的理想范围应是 0 -4。 0表示 损伤不可察觉 , -4表示 损伤令人非常不悦。 8 分辨率和精准度 客观差异等级( ODG)是客观测量方法的输出变量,相当于主观领域中的 SDG。 ODG的 精度精确到小 数点后一 位。 当 任 意 两个 ODG之差 超过 10%时则 表明差异显著, 在测试过程需要注意,避免出现这类 情况 。 鉴于缺少独立的参数对客观测量方法的准确度进行完整 描述 ,因此在验证过程中需要考察多个 参数 。 性能参数一是SDG与ODG之间的关联性。客观测量方法的性能 可能 随 着 引入 损伤 的类
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GY 349-2021 感知音频质量的客观测量方法 349 2021 感知 音频 质量 客观 测量方法
