基于短时能量的循环AMDF基音检测算法

第31卷第7期计算机仿真2014年7月文章编号:1006—9348(2014)07—0278—05基于短时能量的循环AMDF基音检测算法马莎莎,戴曙光,穆平安(上海理工大学光电与计算机工程学院,上海200093)摘要:在语音识别优化问题的研究中,基音周期是语音信号的重要特征参数,准确提取十分困难。传统自相关函数(ACF)、平均幅度差函数(AMDF)等基音检测算法在基音周期提取中容易出现估计结果减半或者加倍的情况,导致检测结果准确率降低。针对上述问题,提出了短时平均能量和循环平均幅度差函数(CAMDF)相结合的基音周期检测方法。实验结果表明,改进方法在有效分离清浊音的基础上,加强了浊音基音周期所处采样点的谷值特性,减少了估计结果的半倍频错误,提高了基音周期估计精度,性能优于传统算法。关键词:基音周期检测;短时能量;平均幅度差函数;循环平均幅度差函数中图分类号:TP391.9文献标识码:BCircularAMDFPitchDetectionAlgorithmBasedonShort-TimeEnergyMASha—sha,DAIShu-guang,MUPing-an(SchoolofOptical-ElectricalandComputerEngineering,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China)ABSTRACT:Pitchperiodisakeycharacteristicparameterofspeechsignal,butaccurateextractionoftheperiodisverydifficult.ItusuallyOCCUrsthathalvinganddoublingfrequencyerrorsappearintheestimatedresultsduringthepitchtrackingoftraditionalalgorithmliketheautocorrelationfunction(ACF)andtheaveragemagnitudedifferencefunction(AMDF).Tosolvethisproblem,adetectionmethodofcombiningtheshort-timeaverageenergywiththecircularaveragemagnitudedifferencefunction(CAMDF)forpitchperiodisproposed.Experimentalresultsindicatethat,onthebasisofeffectivelyseparatingthevoicedspeechfromtheunvoicedspeech,thismethodcanincreasethevalleyfeaturesofsamplingpointwhichindicatesthevoicedspeechpitchperiod,reducethehalving,anddoublinger-rorsandimprovetheprecisionofestimatedvalues.Theperformanceofthismethodisbetterthanthatofthetraditionalalgorithms.KEYWORDS:Pitchperioddetection;Short-timeenergy;Averagemagnitudedifferencefunction(AMDF);CircularAMDF1引言准确检测基音周期。在时域上,最具代表性的基音周期检测基音频率描述了声带的周期性振动。基音频率的检测算法有文献[1]提出的自相关函数(ACF)检测法和文献[2]在语音信号处理领域占有举足轻重的位置,可以应用在声调提出的平均幅度差函数(AMDF)检测法。ACF法是计算浊辨识、语音识别、语音合成和编码等领域中。由于语音信号音语音波形的自相关度,根据自相关函数的周期性推测语音中的静音和清音不具有像浊音一样的周期性,对基音频率的序列的周期性,自相关函数的第一个峰值位置对应基音周准确提取增加了干扰信息,在实际基音周期检测过程中必须期,这种方法虽然简单但效果较差,经常会出现半频或者倍利用有效的技术和方法将其分离,再加上语音信号本身为非频错误;AMDF法是计算语音信号的平均幅度差,根据平均平稳随机信号,采用短时处理技术处理语音信号是一种不错幅度差函数谷值估计基频,此种方法虽然摒弃了前者乘法运的处理方法,但由于基音频率变化范围较大,并且容易受一算的高复杂度的缺陷,但对信号幅度变化比较敏感,基音周些共振峰和谐波频率的影响,实际准确检测基频有一定难期轨迹估计结果仍然不够理想。由于传统基音检测算法容度,所以至今还未研究出一种最优的方法可以适应各种环境易出现半倍频错误,使得估计结果产生很大的误差,在此基础上衍生了各种改进算法,如线性预测误差LP—ACF法、w—AMDF法等。在频域上,最具代表性的是Noll提出的倒谱收稿日期:2013—03—25法,时频结合的方法有Market提出的简单逆滤波追踪法---——278---——万方数据(SIFl’)。为此,本文在实验的基础上,针对传统时域基音周期检¨州抄。测过程中对应峰值或谷值点难以检测、估计结果容易出现半倍频错误等问题,利用短时平均能量加阈值的方法区分清浊音,对后续浊音帧计算循环...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?