数字视频中文字分割算法的研究万罡周洞汝崔永毅傅华胜(武汉大学计算机信息学院,武汉##06(!""#)"!6"0"#6"#文献标识码?中图分类号@A#B0!"#$%&’"()*+,&-."(/&01)2"!),/)’"3".&’.’4.,."3+5.$)&63’73’,8(&’,-#9#.:&’,%.;#="-3?":%+,8-;,8);-;,,8:))M-EE):)+,’5(.:-,8&.E,)N,;)(&)+,’,-.+,-+H5GM-+(,8:);8.5M6O’;)M’5(.:-,8&,;D5-,,-+(/&):(-+(O’;)M’5(.:-,8&’+M,)N,G:)O’;)M’5(.:-,8&,’:)’+’5LP)M’+M)K’5G)M,,8)+,,8)’G,8.:;O:-+(’+)EE-H-)+,,)N,;)(&)+,’,-.+’5(.:-,8&’;E.55.Q,E-:;,,’+)M()M),)H,-.+RD:.S)H,-.+O’;)M&),8.M-;G;)M,.(),,)N,:)(-.+;,;)H.+M,,)N,:)(-.+;’:);)(&)+,)MOL,8:);8.5M6O’;)M&),8.M$@)%A&-$=:@)N,;)(&)+,’,-.+,@8:);8.5M,*D5-,,-+(/&):(-+(,TM()M),)H,-.+文字分割的本质是图像分割(%&’()*)(&)+,’,-.+)。图像分割是计算机视觉领域中极为重要的内容之一,是实现自动图像分析时首先需要完成的操作。它是根据图像的某些特征或特征集合的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列“有意义”的区域,使其后的图像分析、识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。尽管对图像分割算法的研究已有几十年的历史,依据各种理论,至今已提出了上千种类型的分割算法,但是它们大都是针对具体问题的,目前还没有通用的分割理论和算法。下面将对三种文字分割算法,包括基于阈值的二值化算法、基于分裂/合并的算法和基于纹理的算法,进行分析、实验与评价,并提出一种边缘检测——投影——局部区域二值化的文字分割算法。有关,则所得的阈值是与坐标相关的(即动态阈值,前两种阈值对应可称为固定阈值)。以上对阈值分割方法的分类思想是通用的。近年来,许多取阈值分割方法借用了神经网络、模糊数学、遗传算法、信息论等工具,但这些方法仍可归纳到以上三种方法类型中。0$0阈值的灰度图像二值化在利用单阈值方法来分割灰度图像时一般都对图像有一定的假设。最常用的模型可描述如下:假设图像由具有单峰灰度分布的目标和背景组成,且目标和背景象素在灰度值上有很大的差别。对于这类图像,它们的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合而成,可以把双峰之间的谷点作为阈值!,对图象作以下二值化处理:’(#,$)3!0若%(#,$)!!(!"若%(#,$)"!0基于阈值的二值化算法在基于阈值的灰度图像分割算法中,确定阈值是关键。阈值一般可写成如下形式:对于某些新闻视频中的标题新闻、影视片名或演员表等它们的背景一般比较简单,可以采用单阈值分割方法。但是,大多数视频中的文字都有较复杂的背景,反映在其灰度直方图上!"!1#,$,%(#,$),&(#,$)2(0)将出现多个峰谷,此时若采用单阈值的分割方法则无法将文字其中%(#,$)是在象素点(#,$)对处的灰度值,&(#,$)是该点邻域的某种局部性质。换句话说,!在一般情况下可以是(#,$),%(#,$)和&(#,$)的函数。借助式(0),可以将阈值分割方法分成如下三类:(0)如果仅根据%(#,$)来选取阈值,所得的阈值仅与各个图像象素的本身性质相关(即全局阈值);(!)如果阈值是根据%(#,$)和&(#,$)来选取的,所得的阈值就是与(局部)区域性质相关的(即局部阈值)。(#)如果阈值除根据%(#,$)和&(#,$)来选取外,还与(#,$)从背景中分离出来。为此,作者尝试采用多阈值方法将所有的峰都分离出来,如果灰度图像中的文字所占的象素的灰度值相近且与图像中其他目标的灰度值不同,则必然有一个被分离出来的峰对应于图像中的文字目标。基于局部阈值的二值化算法0$!基于局部阈值的方法通过定义考察点的领域,并由邻域计算模板来实现考察点灰度与邻域点的比较,较全局阈值方法有更广泛的应用。其中典型的局部比较方法有4’&)5678’.算法和9):+;)+算法等。与4’&)5678’.算法相比,9):+;)+算法的作者简介:万罡,男,0B=U年生,湖北荆州人,硕士研究生,主要研究方向:图形图像处理及多媒体技术。周洞汝,0B#B年生,教授,博士生导师,主要研究方向:图形图象视频压缩,V%*应用技术等。本文来源:网络收集与整理,如有侵权,请联系作者删除,谢谢!