SJ 20923-2005 基于感知测度的军用通信设备客观音质评价方法.pdf
《SJ 20923-2005 基于感知测度的军用通信设备客观音质评价方法.pdf》由会员分享,可在线阅读,更多相关《SJ 20923-2005 基于感知测度的军用通信设备客观音质评价方法.pdf(23页珍藏版)》请在麦多课文档分享上搜索。
1、SJ 中华人民共和国电子行业军用标准FL 5895 SJ 20923-2005 基于感知测度的军用通信设备客观音质评价方法Methodofo均ectivespeech quality assessment based on a perceptual measure for military communication equipments 060913000046 2005-0311发布2005-04-01实施中华人民共和国信息产业部批准SJ 20923-2005 目次前言.II引言.皿1 范围.12 引用文件.13 术语、定义和缩略语.1M 术语和定义.13.2 缩略语.24 客观音质评价过
2、程.25 语音源材料的准备.25.1 语音材料的选取.25.2 去除停顿.25.3 测试材料的录制.25.4 参考测试语音.36 实验参数选择.37 客观音质的计算.37.1 预处理.57.2 时间到频率的映射.67.3 等响曲线预加权.67.4 频率弯折变换与滤波.67.5 局部换算.87.6 强度一响度变换.87.7 认知的模拟.98 客观音质到主观音质的变换.98.1 平均意见分.98.2 等价Q值.109 结果的统计相关分析.10附录A(规范性附录)客观音质评价最小化语音源数据库.12附录B(规范性附录)部分曲线.14附录c(规范性附录)去除信号停顿流程及强度弯折计算公式.17I SJ
3、 20923-2005 II 目IJ言本标准附录A、附录B、附录C是规范性附录。本标准由信息产业部电子第四研究所归口。本标准起草单位:中国电子科技集团公司第三十研究所。本标准主要起草人:张知易、吴江滨、王瑛。SJ 20923-2005 寻|通信设备主观语音质量的评估是通信网络设计中的一项关键技术,SJ 20771-96已经为通信设各音质的主观评估规定了一套评测方法。然而,主观评测代价甚高,费时费力,因此,语音通信技术的发展,急需制定出一种有效的客观评估方法,以便通过少量的客观测试就可预估出设备的主观音质。信号噪声比(SNR)这个客观音质评价测度广泛用来评定语音编码器及其通信设备的性能。但是,它
4、不适于预测现代网络的主观语音质量,特别是低比特率的数字语音设备。最近十来年,国内外研究出了许多性能较好的客观音质评价测度,如LPC1ftJ谱距离(LPC-CD)、信息指数(11)、相关函数(CHF)、对数谱距离(LSD)、MEL倒谱系数距离(MEL-CD)及Bark谱距离(BSD)等测度。近年来,国内用各种语音编码器,加性、乘性(MNRU)噪声和类语音仿真干扰等多种失真语音条件,对LPC-CD、MEL-CD、BSD和LSD这些客观测度预测主观音质进行了大量的实验研究,将结果与国外文献资料做了仔细比较,并用主观昕觉感知的瞬时掩蔽特性对性能相对好的BSD算法做了改进。最终结果表明,改进的BSD测度
5、(MBSD)预测的主观音质与实际评测的音质问具有更好的相关性,本标准基本建立在MBSD的基础上。本标准所述的COOLEDIT PRO软件是SyntrilliumSoftware Corporation的产品,具体购买使用内容可从其公司网站上获得。III SJ 20923-2005 基于感知测度的军用通信设备客观音质评价方法1 范围本标准规定了基于心理声学、体现人的感知特性的巴克谱距离测度算法、测试语音材料的选取、从客观测量到主观音质的预测及结果的分析计算。本标准适用于室内外语音编码技术、通信设备或系统的语音,通过MBSD客观失真距离的计算,预估出昕觉感知的主观质量,同时也适用毛主且士安详件也主
6、发研究。2 引用文件飞FO条4关内有的的误肿制文包贝不rhll,. 单改用文件,其后的任何修其最新版GBff 1 行主观性能评定3 术语、3. 1 术语和定义下列术语和定3. 1. 1 客观音质。bj由给定客观失真测度度可以是MOS分或等价Q值。3. 1.2 客观音质评价。bjective由给定客观失真测度得到的原始语音3. 1.3 临界频带critical band 在发生听觉掩蔽的情况下,其谱密度刚好掩蔽与中心频率相同的纯音所具有的噪声带宽。3.1.4 巴克谱Bark spectrum 以临界频带为基础,频率以Bark为单位的频率谱,用Q表示。3.1.5 主客观的统计相关系数statist
7、icalcorrelation coefficient between subjective qual ity and objective qual ity estimated 统计实验中,通过客观测量预测的主观音质和实测主观音质之间的归一化相关系数。3. 1. 6 前向掩蔽效应forward masking effect 是人在听觉过程中出现的一种瞬时掩蔽现象,即先出现的高能量声信号(掩蔽信号),一旦超过某个阐值,会在一定时间(大约200ms)之内抑制后到达的低能量信号(被掩蔽信号。SJ 20923-2005 3.1.7 掩蔽滤波器masking fi Iter 模拟瞬时掩蔽存在而使阙值提高
8、的特性曲线的滤波器。3.1.8 掩蔽矩阵masked matrix 它是0,1矩阵,0和1分别指示计算帧的频谱矢量中,各个频带发生掩蔽和没发生掩蔽。3.1.9 取样的音高功率密度sampled pitch power density 临界频带域中,指定频带(即音调的功率谱密度。3. 1. 10 取样压缩的晌度密度sampled compressed loudness density 分帧的临界频带内,以方表示的音高功率密度,变换到以宋表示的密度。3.2 缩略语下列缩略语适用于本标准。BSD一一巴克谱距离;MBSD-一一改进的巴克谱距离:MOS-平均意见分。4 客观音质评价过程客观音质评测的过程
9、如图1所示。被测设备产生的信号及参考信号语音设备客观测试步骤如下:采用MBSD进行音质评测图1客观音质评价过程客观质量到主观质量的变换预佑的平均主观得a) 标准语音源材料的准备:选用SJ20852-22标准中的语音材料或附录A中提供的最小化语音数据库中的材料:b) 选择体现被测设备或系统突出特性的实验条件和参数:c) 产生被测设备或系统的测试语音:d) 基于MBSD测度,用标准语音源材料和测试语音材料进行客观音质失真距离的计算:e) 由客观失真距离,预测主观音质,如果要对结果进行统计相关分析,则按SJ20771-20的规定,完成相应语音条件的主观音质的评测实验。5 语音源材料的准备5. 1 语
10、音材料的选取按照SJ20771-2o规定的每个测试条件,应从SJ20852-2002或附录A中至少三男三女的每个发音人中选取1个(可相同或不相同)测试单元,即至少6个单元。5.2 去除停顿附录A中A.2提供了己经去除停顿的最小化语音数据库的语音材料。当采用SJ20852-22规定的语音材料时,应用附录C中C.1的去除信号停顿流程完成去除语句前后及音节之间的停顿。5.3 测试材料的录制在同一个系统测试条件下,如果要完成第4章中测试步骤中e)的测试,必须在同一个录制状态,完成所选材料有停顿(用于主观测试)和无停顿(用于客观测试)测试语音的录制。录制应采用与语音源数据库相同的采样频率(8kHz)和量
11、化精度(16位线性PCM),同时采用高性能的声卡和相关音频编辑软件完成录制,生成*.WAV格式的数据文件。2 SJ 20923-2005 注:可使用COOLEDIT PRO软件。以上标准语音数据库存放在附录A.3中的光盘中。5. 4 参考测试语音a) 除被测设备或系统的语音条件外,应按ITU-TP.830和SJ20771-2000及SJ20852-2002的规定,在主观测试中,应适当包括一些参考失真语音条件。为将客观测试结果用等价Q值表示,应当测试ITU-TP.810中规定的、SJ20852-2002中提供的窄带调制噪声参考单元(MNRU)的参考条件。b) 在编码器性能客观音质评测中,应包括一
12、些标准时、频域语音编码器,以便将测试的结果和标准编码器的结果相比较。标准的编码器可从SJ20852-2002中提供的0.72632-kbi的ADPCM、24-kbit/sADPCM、16-kbit/sADPCM、0.7298-kbit/s CS-ACELP, TIA厄IAJIS-96A736 8-kbit/s和话首朱可甲咱也C适当选择。6 实验参数选择被测系统的多种音a) 设备允许b) 主观测试c) 输入输出d) 数字语e) 本标准采响,但信道用感模拟与受试者判主观感知的绝对描述了人的感知和的感觉得分。特别地,种受试者用来将输出和且且+且与且+型E试琦槐主理感知模型感知模型图2音质感知的基本原
13、理因素的影原则应符合MBSD可靠地即最终得到同样号的音质一样。一图2所示。受试者特件3 SJ 20923-2005 就MBSD而言,将构成源信号和设备输出信号的物理信号,映射到尽可能匹配语音信号内在表达(我们头脑中的表达)的一些心理学表达,这些内在表达利用了心理学上频率(临界频带频率)和晌度(压缩强度,宋)的等同。音质便根据内在表达的差别作出判断,这个差是作为频率和时间的函数,用于噪声干扰和失真计算的,平均的干扰和失真直接与设备的音质相关。从外在的物理域到内在的心理域的变换的感觉模拟分四步完成:a) 时间-频率变换:b) 频率的弯折:c) 强度的弯折(压缩); d) 前向掩蔽计算。为得到主客观
14、的高度相关,MBSD法除了感知的模拟外,还用到一些认知的模拟。MBSD算法的流程框图,如图3所示。否4 被测系统输出信号y,n 否图3客观测量流程图SJ 20923-2005 7. 1 预处理在进行MBSD算法失真距离计算之前,应当首先完成每个测试项的输入输出对的初始化:a).时间对齐或同步:b) 预加重处理:c) 系统增益补偿换算:d) 音高功率密度的校准响度设定的校准)。式中:xm一一输入信ym一一-输出信亏宫。输出ym则应乘以Ug7.1.4 音高功率密度的校?为确保客观测量精确度最佳N地须响度之间提供一个校准,假设:OdBSPI 实际语音信号电平,为最佳昕音声压级,则:a) 用心理声学实
15、验中常用的1kHz的40dBSPL (-64 dBov)正弦波完成校准,将纯音的最大音高功率表达值调到10000,则对这个纯音,用校准因子Sp:S_ = - . (3) r max( Px i j) 、,J叮,h/,、. . . . . . . 计算其信号第ir帧内频带j的功率P均/U (见7.4)。b) 设定纯音的压缩响度为1压缩宋,则对于这个纯音,应用校准因子SI计算其输入和测试信号的压缩响度。5 SJ 20923-2005 式中:Lx,一一响度密度(见附录。S , = _1. Lxi 如果第一校准正确完成,则SI=240.05。应当指出,只要实际的语音电平不是-26dB,或听音声级不是7
16、8dB,输入数据都应据此换算。7.2 时间到频率的映射7.2.1 时域开窗用Hamming窗w(n)对第i帧源信号码(n)(见式(6)和输出测试信号Yj(n)(见式(7)进行窗取。2nn w(n) = 0.54 -0.46cos(一一一),n=O , 1 , . . ., N -1 . . . . . . . . . . . . . . . . . . . . ( 5 ) N-l 式中:N一一帧长。式中:n一一一帧内的第n个信号样值。XWi (n) = w (n) Xi (n) yWi (n) = w (n) Yi (n). . (7) MBSD定义在整个信号以帧为单位计算的基础上,每帧长20
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SJ 20923 2005 基于 感知 测度 军用 通信 设备 客观 音质 评价 方法
