基于图像分析的文字排技术的深入研究

基于图像分析的文字排版技术的深入研究邓连瑾尤德祥【摘要】一种利用手机等移动设备进行电子阅读的全新模式,正以前所未有的普及速度冲击着人们的阅读习惯。如何获得最佳阅读效果,同时解决盗版电子读物对电子出版业的伤害,成为我们急需解决的问题。本论文提出了基于图像分析的文字排版技术,使得在手机等移动设备上进行阅读也能达到纸本阅读的效果,同时由于其基于图像的固有特性,出版者可以在文字内容上打上版权水印,也起到了打击盗版,维护版权的目的。【关键词】电子阅读;基于图像;文字排版不仅一般图像类的媒体信息需要重新排版,由于一些文本类信息具有附加显示属性,例如word里的文字信息具有格式信息,用来突出某部分的重要性等等,如果只是将文本信息传送到移动设备上,则这些重要的附加信息将被丢失,从而极大影响读者的阅读、理解过程。如何对这些文字信息进行重排版,本文提出了全新的基于图像分析的文字排版技术,直接对包含文字的图像进行像素分析、文字分割、重新排版。在对源图像的像素进行分析,将文本块周围的空白区域去除之后,可以进行下述处理。一、源图像文字分割由于源图像需要重排版,所以必须对源图像按行进行文字分割,如下图所示,获得每行的上侧位置Linetop、下侧位置Linebottom,其过程和在对源图像的像素分析步骤中获得Wleft相类似[1],程序沿垂直方向自上而下不断扫描每行的像素,若从全白像素行进入有非白色像素行,则是一个新文字行的上侧,反之,若从有非白色像素行进入全白像素行,则是一个文字行的下侧。由此可知,只需扫描一次即可获得文本区域每行的上下位置,即下图所示中第一行上下侧位置为红色虚线,第二行上下侧位置为蓝色虚线,第三行上下侧位置为绿色虚线。1)首先用户必须按照目标移动设备的屏幕分辨率设置目标图像的宽度Wdest和高度Hdest,例如有的高分辨率手机则达到800*480,则设置Wdest=800,Hdest=480;2)然后用户选择文字排版后放置的起始位置,即根据排版要求设置变量P1;3)接下来程序将自动按源图像中各行文字,分别进行图像信息赋值[2],如果源文字一行放置下来还不到目标图像右侧,如上图“源文字1行”所示,则将该行所在区域的右上角坐标P2自动赋值为下一行文字的起始点位置;4)如果源文字一行放置下来超出目标图像右侧,则以目标图像右侧为分界线将源文字分为两部分,右侧部分将在放置在下一行,如“源文字2行”那样,出现了换行效果[3],最终同样最后一块的右上角坐标自动赋值为下一行文字的起始点位置,如上图中“第三行起始点坐标P3”;5)在放置完所有源图像文字后,即可将内存中的目标图像保存到磁盘上,完成整个重排版过程。三、实验结果分析本文将上述基于图像的处理过程编制成计算机程序,并做了相应的重排版试验,经观察发现本文所述原理对基于图像的文本重排版处理效果非常良好,下面是处理实例,如图3所示,处理前图像宽度为873,超过一般移动设备的分辨率,用户在阅读时需要不断缩放、移动图像,非常麻烦。本文提出的基于图像的文本重排版技术,除了大幅提高移动设备的阅读效果外,还可以在重排版后向图像中加入注入数字水印等版权保护措施,为电子出版商在移动设备上的数字出版提供一种可靠的防盗版技术保证。参考文献:[1]张娜.简牍图像增强与分割的研究[D]成都理工大学,2007.[2]孙晶.图像局部不变特征提取技术研究及其应用[D]大连理工大学,2009.[3]王晓峰.水平集方法及其在图像分割中的应用研究[D]中国科学技术大学,2009.-全文完-

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?