乐音识别方法及应用

第25卷第4期2005年4月计算机应用ComputerApplicationsVol.25No.4Apr.:1001-9081(2005)04-0968-03乐音识别方法及应用徐国庆1,2,杨丹1,王彬洁3,文俊浩1(1.重庆大学软件学院,重庆400030;2.武汉化工学院计算机科学与工程学院,湖北武汉430074;3.武汉化工学院,湖北武汉430074)(xu_guoqing@hotmail.com)摘要:通过研究乐音的声音和物理特性,提出一种识别乐音信号的方法,该方法实现在频域的精确定位,在基音频率检测上优于单一小波方法,在识别效果方面优于DTW方法,并开发了乐音识别和自动作曲系统。此方法可以为乐音识别提供参考。:TP319;TP391.4文献标识码:AMethodandtheapplicationofmusicaltonerecognitionXUGuo2qing1,2,YANGDan1,WANGBin2激e3,WENJun2hao1(1.FacultyofSoftwareEngineering,ChongqingUniversity,Chongqing400030,CAbstract:Thisthesisinvestigatethemusicalandphysicalcharactersofthemusicalsound,andadvancesanewmethodtorecognizethemusicaltonefirstly.Thismethodrealizestheprecisefrequencyresolution.Itismoreadvantageousthanthepitchdetectionmethodandthesinglewaveletmethod.ItisalsomoreeffectivethanDynamicTimeWarpingmethod.Thismethodisidealforthepitchrecognitionofthemusicalsound.Itisfirstadvancedinthetechnologydomainandithasahighapplicationvalue.Keywords:musicaltonerecognition;edgedetection;DWT;FFT;melodizeautomatically其中的基音及泛音完全确定。频率成分不变(只是幅值逐渐减小)。也就是说,从频域角度来看,单一的音符是典型的平稳时不变信号。乐音识别是实现自动谱曲的基础,在音乐创作中有很重要的实用价值。但这方面的研究比较少,大多局限在乐音的音效处理、编辑等方面,如国外较著名的CakeWalk,国内的作曲大师系列等。在音符录入方面,则一般使用MIDI键盘通过简单的映射实现。乐音的识别问题涉及到乐音的声学和物理学特性,其频域成分的提取在很大程度上决定了音符的性质。本文针对乐音音符的识别进行研究,提出了一套识别方法,并成功地应用于智能作曲系统的开发。2乐音识别方法2.1端点检测对于连续乐音,首先要对其进行端点检测,以分割出单音,分割单音的目的在于使连续乐音的识别转化为单音识别,并且分割单音后可以准确计算音符的时值。在语音的端点检测方法中,比较有效的端点检测方法是FRED(Feature2basedReal2timeEndpointDetection,基于语音特征的实时端点检测算法)算法[1],该算法基于两级端点检测方案,可以更好地适应环境的干扰和变化,提高端点检测的精度。其第二步算法主要用来区分清、浊音,由于乐音中的频率构成单一,并且单音的能量在持续期内呈一致振荡衰减,所以可以只使用第一级FRED。在使用之前要将乐音进行分帧,设置帧长为m,分1乐音特性分析一段连续的乐音是由诸多的单音构成的,从物理学角度看,单音主要由基频、振幅及倍频三个要素构成。乐器发出的乐音通过人耳的听觉系统反映到听觉神经中枢,引起听者的主观感觉。这种感觉形成心理学上的乐音三要素,即音调、响度、音色,这三个特性分别和三个客观上易于确定的物理量密切相关。乐音的这种特性使其能够用物理的方法进行分析和测量。具体地讲,单音的音调(音高)是这个单音的基频给人的主观感觉。一个单音的响度,也就是常说的音强,是这个单音的空气振动到达人耳处的能流给人的主观感觉。音色的形成比较复杂,是人脑对听觉感受的单音频谱(即各谐波成分比例)的主观感觉和判断。乐音信号也是典型的时变信号,在一个音乐片段中包含多个不同频率的单音。但是乐音的频域组成具有其明显的平稳特性,就一个音符的发音来看,从开始发音直到乐音消失,δ1010abs(u-uiji(j+1))>sij=abs(uij-ui(j+1))<0>0<δuuiji(j+1)qij=uuiji(j+1)收稿日期:2004-10-19;修订日期:2005-01-06作者简介:徐国庆(1974-),男,江苏徐州人,讲师,硕士研究生,主要研究方向:乐音识别;杨丹(1962-),男,教授,博士生导师,主要研究方向:科学与工程计算、软件工程;王彬洁(1977-),女,主要研究方向:钢琴艺术;文俊浩(1969-),男,副教授,博士,主要研究方向软波分解,工程界广为采用的daubechies小波[3],其近似函数平滑性好,高频分解迅速。小...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?