西部声学会议论文样板

采用三音节F0插值的连续语音声调评测算法沈彩凤,俞一彪(苏州大学也子倌息学院语咅处理研宄室,苏州215006)摘要:本文研究连续语咅的卢调评测算法,该算法可应用于计算机辅助语言学AJ(CALL)系统和苷通话水平测试(PSC)中的卢调评测。考虑到连续语咅发咅中前后咅之间的相互影响,采用三咅节单元建立GMM卢调模型,三咅节中辅咅部分用Spline插值法拟合卢调曲线来反映咅节间基咅频率的转移信息。实验表明,基于三咅节卢调曲线插值拟合的GMM模型评测方法可以使机器打分和人工打分的相关性从0.733提升到0.764、关键字:声调评测;连续语咅;Spline插值;基咅曲线拟合;GMM中图分类号:TN912文献标识码:A文章编号:1000-3630(2011)-02-0111-06DOI编码:10.3969/j.issn1000-3630.2011.02.001ToneevaluationofMandarincontinuousspeechbasedonTri-syllableF0interpolationSHENCai-feng,YUYi-biao{SoochowUniversity,SpeechProcessingResearchesLaboratory,Suzhou,215006,China}AbstractThispaperdiscussestoneevaluationalgorithmofMandarincontinuousspeechbasedonGMM.ThisalgorithmcanbeusedfortonepronunciationinComputerAssistedLanguageLearning(CALL)andPUTONGHUASHUIPINGCESHI(PSC).Incontinuousspeech,asyllable’stoneisrelatedtotheadjacentsyllables.Therefore,itisusefultousetri-syllableasbasicunittotrainGMM.Togetthetransitioninformationfromthepreviousvoicedregiontothecurrentoneorfromthecurrenttothenextvoicedregion,thepitchvalueofunvoicedregionisinterpolatedwithSpline.Basedontri-syllableSplineinterpolation,thecorrelationofthemachinescoreandhumanscorerisesfrom0.733to0.764.Keyword:toneevaluation;continuousspeech;Splineinterpolation;GMM;0引言汉语作为一种声调语言,每个音节都有声调,不同声调的同音字语义不同。因此,声调是判定呰通话学习好坏的重要因素之一,也是区别方言和普通话的不可或缺的标准。在计算机辅助语言学习(CALL)以及普通话水平测试(PSC)中,不仅强调对汉语音节的发音的正确性,也越来越多的关注普通话声调的错误与否。2007年,汤霖等人在分析普通话声调特点的基础上,提出了能消除语速影响和音节间相互影响的建模方法,选择反映声调特点的5个基频比依与归一化的基频共同作为声调评测参数建立高斯模型,结果客观测试同主观测试负荷率达到88.24%111。2008年,魏思等人提出了基于韵律信息的连续语流收稿日期:2011-06-06;修稿日期:2011-06-11基金项目:北京市现代信息科学与网络技术(XDXX1006)作者简介:沈彩凤(1986-),女,江苏将宿迁人,汉族,苏州大学电子信息学院硕士研宂生,研宂方向为语音信号处理。通讯作者:俞一彪,yuyb@suda.edu.cn«调型评测研宄,以韵律词力基本建模单元,建立基于多空间概率分布的HMM调型模型MSD-HMM,针对有河南与山东方言背景的非标准发音,机器评分与专家评分相关度达到0.661和0.695121。声调主要是有语音的基频轮廓决定的。普通话的标准声调有叫个调型,按照五度值描述系统可表达为••阴平(55),阳平(35),上声(214),去声(51),但是,这种标准声调值只出现在孤立字发音情况下,在连续语音发音中,巾于单字发音受上下文的影响,声调对应的基频曲线与标准情况会发牛.很大的偏离。考虑到连续语音发音屮前后音节对当前音节声调的影响,本文以三咅节为声调单元建立GMM模型,对测试语音利用后验概率给出声调的奔观评分。1声调评分算法流程声调的评分中,首先对连续语咅进行切分得到每个音节的单独发音,然后在音节内提取语音的基音频率,并以三音节为单元得到连续三音节的声调曲线,插值后作为声调特征,进行声调的高斯混合模型训练。测试语音经过相同的预处理过程得到三音节声调特征,然后根据三音节GKM模型计算声调的后验概率得分。但是这个概率得分,不是人们可以直观接受的,所以将测试打分语咅分为两部分,一部分语音用来得到映射算法,另一部分用于测试最后的打分效果。评分框图如图1所示。阁1声调评分流程框阁Fig.ltoneevaluationflowchart1.1音节切分音节是语音的一个基本单元,每个音节在具体...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?