文字排版技术的初步图像分析

2014-10-15 05:05魏永生
科技传播 2014年23期
关键词:重排宽度像素

魏永生

大港油田勘探开发研究院,天津 300280

0 引言

当今世界,越来越多的年轻人已经成为“低头族”之列,即从手机或iPad等移动电子设备上获取信息或者阅读。这标志着一种全新的阅读模式正在被很多人选用,这就是电子阅读。与传统的书籍、报纸等纸质阅读相比,电子阅读具有很多突出的优点:第一,容量大。第二,携带方便。第三,阅读方便。一般书本的宽度远远大于手机等电子阅读设备的屏幕宽度,如果将书本上的每一页内容按比例直接显示到屏幕上,则会出现字体太小、不清晰,或者需要通过不停的缩放来阅读,严重影响了阅读效果。如何获得最佳阅读效果,是电子出版业的当务之急。基于图像分析的文字排版技术很好的解决的这些问题,是的电子阅读也能取得纸质阅读的效果。

1 文字图像的获取

文字图像的获取过程很简单,在计算机上打开书本的电子文档,选择所需要的文字区域的图像,可以通过截屏或快照等方式保存下来,以备后续处理适用。在理论上,阅读者在源图像选择时,可以选择出一片只包含自己所需文字内容的区域。但在实际操作过程中很难做到,总会或多或少地在文本四周留下空白区域,如图1所示。这些空白区域对文字的重新排版的最终效果影响很大。由于计算机图像分辨率高,图像宽度远远大于手机等移动阅读设备,如果不能有效清除空白区域,则可能出现页面过小或者页面某一侧文字内容显示不全的不良阅读效果。因此,必须把空白区域清除掉。除了一般的图像信息需要重排以外,还有一些文本累的附加信息也需要重排,例如PDF、word等文档里文字都具有一定的格式,有时还有附注等。如果将文本信息直接存储到阅读设备上,会造成一些重要附加信息的漏失或丢失,给客户的阅读理解造成极大的影响。因此,也需要进行文字重排。基于图像分析的文字排版技术可以很好的解决问题。

图1 源图像imagesrc

2 基于图像初步分析的文字重排版技术

基于图像初步分析的文字重排可以通过三步实现,即源图像分析、文字分割和重新排版。

2.1 源图像分析

源图像分析主要是为了获得图像的四个关键的参数值:左侧宽度Wl、右侧宽度Wr、上侧高度Ht以及下侧高度Hb。用户可以通过像素统计方法获取相关参数,即通过对除去空白的源图像进行扫描,从一个方向向另一个方向扫描每一个像素,并对垂直方向的像素值进行统计,记录像素值。最后对像素值进行处理,为文字分割和重排做好准备。

2.2 文字分割

要实现图像文字的重排,就必须对源图像文字进行合理的分割。根据扫描结果计算出每一行文字的宽度,再结合移动阅读设备的屏幕像素进行分割。处理过程:第一步,按照目标阅读设备的屏幕分辨率设置目标图像的高度H和宽度W;第二步,设置文字排版后放置的起始位置变量P1;第三步,利用自动程序将源图像中的每行文字进行图像信息赋值,并利用变量转换找到每行换行处的变量Pn,即分割点位置。分割完以后,把目标图像保存到内存磁盘中。

2.3 文字重排

将每一行的源图像文字进行分割以后,将相邻两个分割点间的文字放到同一行,进行文字重排。p1与p2之间的文字为第一行,p2与p3之间为第二行,一次类推,得到重排后的版式效果,如图3。重排后,阅读效果良好。

3 结论

正当电子阅读以极快的普及速度冲击广大阅读爱好者阅读习惯的时候,文字重新排版成了急需解决的问题。基于图像分析的文字排版技术很好的解决的这个问题,并使电子阅读也能取得纸质阅读的效果。同时,通过该技术在文字内容上打上版权水印,能够有效解决盗版问题,使得电子出版业侵权、盗版等版权现象也得到很好的缓解,起到了维护版权的目的。

[1]邓连瑾,尤德祥,李瑞.基于图像分析的文字排版技术的深入研究[J].科学时代,2013(3):5-8.

[2]邓连瑾,尤德祥.文字排版技术的初步图像分析研究[J].天津市财贸管理干部学院学报,2010,12(4):51-54.

猜你喜欢
重排宽度像素
赵运哲作品
像素前线之“幻影”2000
大学有机化学中的重排反应及其归纳教学实践
重排滤波器的实现结构*
EGFR突变和EML4-ALK重排双阳性非小细胞肺癌研究进展
高像素不是全部
红细胞分布宽度与血栓的关系
基于像素重排比对的灰度图彩色化算法研究
孩子成长中,对宽度的追求更重要
你有“马屁股的宽度”吗?