基于BP神经网络的语音信号分类研究高茉(辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105)5摘要:语音分类是语音信号处理的重要组成部分。准确快速地对语音进行分类在语音编码、语音合成中有着重要的意义。针对语音的多样性和不确定性,使用传统分类方法在大规模的实际语音分类应用中速度慢、正确率低。为了提高语音分类的正确率和分类精度,提出一种基于神经网络的语音分类方法。首先采用倒谱系数提取语音特征,选择最优的特征信号,加快识别速度,然后利用BP神经网络模型对特征信号进行训练,建立最优分类器模型,最后10对测试语音进行分类。仿真实验表明,在噪声环境下该算法仍可准确进行语音信号分类。关键词:语音识别;BP神经网络;语音分类;学习速率中图分类号:TN912.3ResearchofspeechsignalclassifybasedonBP15GaoMo(SchoolofElectronicandInformationEngineering,LiaoningTechnicalUniversity,LiaoNingHuLuDao125105)Abstract:Speechclassificationisanimportantpartofspeechsignalprocessing.Accurateandrapidclassifyofspeechhasanimportantsignificanceinspeechcodingandspeechsynthesis.20Accordingtodiversityanduncertaintyofthespeech,traditionalclassificationmethodhaslowspeedandlowcorrectrateinlargeapplicationofactualspeechclassification.Toimprovethecorrectrateandspeechclassificationaccuracy,putforwardaspeechclassificationmethodbasedonneuralnetwork.Firstusingcepstrumcoefficienttoextractspeechfeature,chooseoptimalcharacteristicsignal,acceleraterecognitionspeed,thenusingBPneuralnetworkmodeltotrain25characteristicsignal,setupoptimalclassifiermodel,andfinallyclassifytestingspeech.Thesimulationresultsshowthatthisalgorithmcanclassifyspeechsignalaccuratelyinnoiseenvironment.Keywords:speechrecognition;BP;speechclassification;learningrate300引言语音分类是将语音按其声门激励形式的不同分为浊音和清音,浊音又分为元音和浊辅音,语音分类是语音信号处理中的重要组成部分。在语音编码中可以根据这几类信号的不同特点,采用不同的处理方式以提高效率和节省资源;语音合成中也要进行语音分类,以提高合成语音的自然度。由于这几类信号的许多特征参数的动态取值范围在各类之间通常都是交35叠的(例如,短时能量参数和过零率参数),故不可能通过提取某一特征参数将其线性分开,尤其是参数在受到噪声干扰的情况下就更难以区分。传统的方法是通过提取某些特征参数,然后进行线性的处理和预定阈值来进行判断,阈值一般是靠人工经验来确定,方法简单,容易实现,但无法保证可靠精确的判断结果。近几年随着人工智能,机器学习领域的快速发展,为开展具有自主学习能力和自动音频分类研究工作提供了很好的基础。BP人工神经网络模40拟了人类神经元活动原理,具有自学习、联想、对比、推理和概括能力,并且,具有能够逼近任意的非线性函数、并行化处理信息、容错能力强等诸多优点[1,5,6]。因此,它为解决语音分类这样的一个复杂的模式分类问题提供了新的途径。作者简介:高茉,(1984-),女,硕士研究生。主要研究方向:信号检测与估计.E-mail:gaomo95@gmail.com1BP神经网络BP神经网络是一种多层前馈神经网络,该网络的主要特点是信号前向传递,误差反向45传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入方向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。BP神经网络的拓扑结构如图1所示。50图1BP神经网络拓扑结构图Fig.1BPtopologicalstructurediagram图1中,X1,X2,…,Xn是BP神经网络的输入值,Y1,Y2,…,Ym是BP神经网络的预测值,ωij和ωjk为BP神经网络权值。从图1可以看出,BP神经网络可以看成一个非线性函数,55网络输入值和预测值分别为该函数的自变量和因变量。当输入节点数为n,输出节点数为m时,BP神经网络就表达了从n个自变量到m个因变量的函数映射关系[2,3]。BP神...