品质管理品质知识用于语音质量客观评价的Mel谱失真测度

Mel域语音质量客观评价测度性能研究陈华伟1,张知易2,靳蕃1(1.西南交通大学信息科学与技术学院,四川成都610031;2.中国电子科技集团公司第三十研究所,四川成都610041)摘要:为了有效进行语音质量客观评价,对以MFSC为特征参数的Mel-SD和以MFCC为特征参数的Mel-CD进行对比分析,研究了特征提取中滤波器构造变化对两种测度的影响,并对Mel-SD中压缩因子的影响加以研究。测试研究表明,Mel-SD性能好于Mel-CD,同时具有对滤波器组构造变化的鲁棒性;Mel-CD对滤波器构造变化比较敏感,在滤波器数目超过13后随着滤波器数目的增加性能下降。Mel-SD在给定的滤波器数目的情况下,有最佳的压缩因子。当在一定的范围内,压缩因子的影响并不严重。最佳压缩因子基本符合对心理声学静态测量实验结论的近似表达。将参数优化的Mel-CD和Mel-SD用于干扰条件下通信系统的语音质量的客观评价,结果表明,Mel-SD性能优于Mel-CD和PESQ,Mel-CD性能则与PESQ相当。关键词:语音质量;客观评价;美尔谱系数;Mel谱失真测度;Mel倒谱系数失真测度:TN912.3文献标识码:AAnalysisonPerformanceofObjectiveSpeechQualityMeasuresinMelDomainCHENHua-wei1,ZHANGZhi-yi2,激NFan1(1.SchoolofInformationScienceTechnology,Southwest激aotongUniversity,SichuanChengdu,610031;2.No.30InstituteofCETC,SichuanChengdu,610041)Abstract:Toevaluatespeechqualityeffectivelyandexactly,Mel-SDandMel-CDarecomparedandanalyzed,especiallyonfeatureextraction.TheeffectsofthestructureofMelfilterbankonbothmeasuresareinvestigated.TheresultshowsthatMel-SDperformancebetterthanMel-CD,whileretainingrobustonvarietyofMelfilterbank.Mel-CDissensitivetostructureofMelfilterbank,anddecreasesitsperformancewhenthesizeofbankisincreased.Basedonoptimalsizeofbank,Mel-SDwastestedbydifferentcompressionfactortofindtheoptimalfactorinassessingspeechquality.Furthermore,optimalMel-SDandMel-CDweretestedbyassessingspeechqualityofcommunicationsystem.ExperimentresultsshowthatMel-SDhasgoodperformance,andperformanceofMel-CDisequivalenttoPESQ.Keywords:SpeechQuality;ObjectiveSpeechQualityEvaluation;MelFrequencySpectralCoefficient;MelSpectralDistortionMeasure;MelCepstralDistanceMeasure在通信系统的研究、设计、发展、运营过程中,需要对设备和系统的性能进行监测,以便进行调整、改进、优化等。在涉及语音信息交流的系统中,评价系统性能优劣的一个重要指标就是系统所传输语音的质量。面对新的通信技术和通信服务的要求,研究灵活、可靠、准确的语音质量评价系统成为国内外研究者努力的目标。Mel-CD是Mel域上的语音质量客观评价方法,在研究和实践中都得到了一定的应用[1~5]。Mel-CD把美尔倒谱系数收稿日期:作者简介:陈华伟(1972-),男,江西宁都人,博士研究生。Email:chmail@163MFCC(MelFrequencyCesptralCoefficient)作为语音信号的特征描述,并用于表示客观失真距离的计算模型。MFCC考虑了人耳对频率的非线性感知特性,但MFCC本身是同态解卷积的处理,将其作为语音质量客观评价中的语音特征描述时并没有很好地符合听觉生理模型以及感知特性。针对Mel-CD存在的问题,文献[6]提出一种以美尔谱系数MFSC(MelFrequencySpectralCoefficient)为特征参数的语音质量客观评价方法-美尔谱失真测度Mel-SD(MelSpectralDistortionMeasure)。Mel域上的语音质量客观评价与Mel域滤波器的选择有密切的关系,本文将对Mel-SD、Mel-系统预处理特征参数计算预处理特征参数计算失真计算/判断模型原始语音失真语音图1基于输入-输出语音质量客观评价原理框图CD与滤波器关系加以研究,并在此基础上,对MFSC中非线性压缩函数变化对Mel-SD性能的影响进行研究。1Mel-CD和Mel-SD典型的基于输入-输出的语音质量客观评价主要由语音信号预处理、特征参数计算、失真计算/判断模型三部分组成,如图1所示。核心部分在于特征参数计算、失真计算及判断模型,不同的客观测度主要区别在于这个两个部分。音调是听觉...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?