自训练过完备字典和稀疏表示的语音增强

自训练过完备字典和稀疏表示的语音增强摘要:提出的算法利用带噪信号进行训练以获得过完备字典,通过设定较大的字典训练阈值,训练过程只对语音信号进行,使得自训练字典与语音信号之间相关性较强。利用该字典和较小的阈值对语音信号进行稀疏表示,进而实现语音增强。仿真实验表明,增强后的信号表示系数稀疏度更强,增强效果在信噪比(SNR)和感知语音质量评估(PESQ)得分方面均有较大改进。关键词:正交匹配追踪;迭代阈值;字典训练;语音增强:TN912.3?34文献标识码:A:1004?373X(2015)13?0056?03Abstract:Intheproposedalgorithm,thedictionaryistrainedbythesignalwithnoisetoobtainover?completedictionary.Bysettingthebiggerdictionarytrainingthreshold,thecorrelationbetweenself?---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---trainingdictionaryandspeechsignalstrongerisenhanced.Thetrainingprocessaimstospeechsignalonly.Thedictionaryandthesmallerthresholdareusedtoconductsparserepresentationofspeechsignal,andthenspeechenhancementisrealized.Simulationexperimentresultsshowthattheexpressioncoefficientsparsityoftheenhancedsignalisstronger,theenhancementeffectsaregreatlyimprovedinscoringaspectofsignal?to?noiseratio(SNR)andperceptualevaluationofspeechquality(PESQ).Keywords:orthogonalmatchingtracking;iterativethreshold;dictionarytraining;speechenhancement0引言语音信号是人类交流过程中最自然、最常用的方式,语音增强能降低噪声提高信噪比,是语音信号预处理的一个重要过程。在稀疏表示中,利用过完备字典中少数原子的线性组合来表示样本信号,其优势是有更大的灵活性和噪声情况下更强的稳定性,因而成为目前研究较多的算法,在语音压缩[1]、识别[2]以及语音增强[3?4]方---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---面均得到较为广泛的应用。在基于稀疏表示的语音增强中,过完备字典的构成起着一个非常关键的作用[5],良好的字典能够使纯净语音信号的表示更加稀疏,从而与噪声的区分度更为显著。在这个过程中,为了得到更为稀疏的系数,所采用的字典从过完备离散余弦变换、过完备小波变换等固定字典到参数化字典设计,进而采用自适应字典学习算法训练字典,使字典与被处理信号之间的相关性增强[6?7]。文献[8]利用纯净信号训练字典,将语音激活检测估计的噪声作为重构阈值,对含噪语音进行稀疏分解,将系数与字典重构得到无噪的语音信号。然而,在语音增强处理的过程中目标语音是受到噪声污染的,纯净语音只能是其他语音信号。本文算法利用阈值正交匹配追踪(OMP)和K奇异值分解算法(K?svd)直接对含噪语音进行字典训练,得到的字典与语音信号有更强的相关度,因而得到的表示系数更为稀疏,在语音增强时取得更好的效果。1带噪语音信号的稀疏重构设观测到的带噪语音信号为:[y(n)=x(n)+z(n)]式中:[z(n)]是方差为[σ2]的高斯白噪声;[x(n)]表---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---示纯净语音信号;[n]表示各样值所在时刻(为表达方便,以下省去[n])。在无噪情况下,分帧后的纯净语音信号[x∈RM×N]是帧长为[M,]帧数为[N]的信号。对于一个过完备字典[D∈RM×L,][L>M]表示字典的冗余性。[x]可以在该字典下表示为:[x=D*A](1)式中:[A]是系数,它是一个[L×N]的矩阵,各列矢量[A(:,n)0?M,]其中[1≤n≤N;][0]代表0?范数。在稀疏表示中,每帧语音信号的非0系数个数远小于信号长度。对于一个适合的过完备字典[D,]语音成分在其上的系数是稀疏的,而白噪声则不具备这种特性。当已知噪声方差[σ2]的情况下,在进行原子选择时通过设定与其有关的恰当的阈值[ε,]可以控制只从带噪信号中选出与纯净语音相关的系数,而摒弃与噪声有关的系数以实现语音增强。2阈值正交匹配追踪算法在信号的稀疏表示中,由于字典的过完备性,[x]在由[D]构成的冗余基上的稀疏表示系数[A]的求解是一个非常困难的过...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?