基于投影特征的简谱数字识别方法

第1页共12页基于投影特征的简谱数字识别方法摘要:简谱数字识别是光学乐谱识别中的一个重要分支,传统的识别方法是模板匹配,该方法计算量大,且对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感。考虑到简谱数字识别规模较小,通过分析数字对噪声较为稳定的几何特征,提出一种改进的投影特征匹配法对简谱数字进行快速识别匹配。理论分析和实验结果表明,改进的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所提高,鲁棒性也更强。关键词:投影;数字识别;模板匹配;欧氏距离DOIDOI:10.11907/rjdk.151538:TP317.4文献标识码:A:16727800(2015)006017604作者简介作者简介:高强(1989-),男,湖北黄冈人,武汉工第2页共12页程大学计算机科学与工程学院硕士研究生,研究方向为图像处理与模式识别;余军(1992-),男,湖北天门人,武汉工程大学计算机科学与工程学院硕士研究生,研究方向为模式识别与智能系统;亢治虎(1988-),男,湖北襄阳人,武汉工程大学计算机科学与工程学院硕士研究生,研究方向为无线传感器网络。0引言光学文字识别[1](OpticalCharacterRecogniton,OCR)是模式识别学科的一个传统研究领域。在音乐界,相对应于光学文字识别,有一个重要分支――光学乐谱识别[2](OpticalMusicRecognition,OMR)。有了OMR技术,只需将纸质教材上的乐谱作一个清晰的扫描,由计算机进行演奏或者生成格式化的乐谱文件(MusicXML文件等),这无疑大大简化了录入乐谱的步骤,大幅提高了乐谱录入效率。最为经典的OMR技术莫过于模板匹配法。该方法的基本思想是通过为每个待识别字符定义一个典型的标准模板,然后采用直方图第3页共12页法[3]、轮廓矩[4,5]、欧氏距离[6]、曼哈顿距离[7]等度量方法比较待识别的样本与标准模板,根据度量方法得出的相似度来决定样本与模板是否属于同一类别[8]。由于标准模板的存在,常规模板匹配方法识别与数字模板数字字体一致时的识别率很高,但是它对噪声敏感,并且对数字的不同字体也不具有适应性,鲁棒性不强[9]――当数字的字体字形变化、识别图片的分辨率较低或噪点较多时,该方法的识别率下降。另外,由于常规模板匹配直接涉及到两个图像矩阵级别的运算,其计算量通常较大,时间开销较多[10]。考虑到简谱中的数字识别规模较小,只有0~7八个数字,可通过分析简谱数字对噪声较为稳定的几何特征和水平或垂直投影特征,避开常规模板匹配法在鲁棒性上的劣势,应用一种改进的投影特征匹配法对简谱数字进行快速识别匹配,并给出具体的算法流程,分析了算法的时间复杂度。理论分析和实验结果表明,改进的投影特征匹配法与传统的模板匹配法相比,识别精度和速度有所提高,鲁第4页共12页棒性也更强。1算法原理1.1预处理相机获取的信息多为32位真彩色信息,但乐谱只有黑白两色,人眼分辨乐谱不需要其它任何颜色信息。因此,在开始数字识别之前,可先采用加权平均值法转换三通道彩色乐谱到单通道灰度图,将彩色图像转换为8位灰度图,将图像的RGB三维信息转换为一维,可大幅度减小计算量,公式如下[11]:上式中,红绿蓝三通道的权值是根据人眼对颜色的敏感度测定的,所以,运用式(1)可以得到较为理想的灰度图像。为进一步减少计算量,还需要做二值化处理。将乐谱背景置为黑色(值为0),音符置为白色(值为255),在方便人眼观察的同时,可以为后续的图像处理技术带来操作上的便利。1.2投影特征匹配由于待识别的目标结果只有0~7八种数字,采用水平投影法和第5页共12页垂直投影法[12]将图像从二维矩阵降维到一维向量以进行快速匹配。设图像宽度和高度分别为w和h,现对其做水平投影,得到后的向量除以255w,所得到的向量下标对应图片坐标系中的纵坐标,而指定下标的值对应某一像素水平方向所有非零(白色)像素占该图片宽度的百分比。同理再对其做垂直投影,得到后的向量除以255h,则所得到的向量下标对应图片坐标系中的横坐标,而指定下标的值对应某一像素垂直方向所有非零(白色)像素占该图片高度的百分比。其它数字依此类推,所有数字的水平、垂直投影向量如图1所示。观察8个数字及其水平、垂直投影向量的特征,这一...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?