基于图像模式识别的数字图书资料修复及应用

2014-11-28 10:19柴森

河南图书馆学刊 2014年8期

关键词：图像模式识别；数字图书资料；局部二值化

摘要：图像模式识别是一种新的数字图书资料的自动修复技术，它以传统的图书资料修复方法为基础，主要运用计算机完成。文章阐述了图形模式识别技术在数字图书资料修复中的应用情况，即通过对图书资料进行扫描、二值化和图像的重建等方法对不清晰的图形进行自动修复，最终实现数字图书资料的数字化处理。

中图分类号：G250文献标识码：A文章编号：1003-1588（2014）08-0116-02

1背景

图书内容的电子化和网络化发展就是图书资料的数字化过程，图书资料实现了数字化之后，就会存储在专业的数据库服务系统中，读者只需要通过网络就可以在线阅读或者下载。网络媒介和传统的纸质媒介所表达的文献资料的内容都是相同的，数字化的图书资料经过了数字化技术处理，能够完整并真实地反映出纸质图书的所有内容，只不过两种媒介所表达的方式有所区别。在这个过程中，图书的数字化处理技术发挥了关键作用。目前，清华同方和维普资讯等学术性的文献数据库已经建立起来并得到了广泛应用。

2数字图书资料修复存在的问题

对图书资料进行数字化处理，首先要进行数据收集，即将相关的数据输入计算机；而后，会显示出一个长方形方框；对这个长方形方框进行图像预处理之后，就要对区域内的图像进行模式识别。通过这种方法能将图书资料中的文字清晰而又准确地反映出来，为图书资料的修复提供参考意见。这一系列过程完成之后，就可以实现图书和档案的数字化。

目前，二值化方法是图书数字化中使用最多的方法。因为在数字图书资料的修复过程中，需要对大量的数据进行处理，而使用二值化的方法就能满足这种需求。二值化方法具有工作效率高的特点，这也是其最大的优势。数字图书资料经过二值化的处理之后，所得到图像的对比度会高于原有图书资料中的图像，给识别和阅读提供方便的同时也会带来一些新的问题，例如：二值化处理会使原来图像中本来就不清晰的部分字符变得更加模糊，不能进行准确识别。这个问题不能解决，就会给图书资料的数字化工作带来巨大的负面影响。如果连数字化处理的基本要求都无法达到，就会迫使图书管理人员放弃对这一部分资料进行修复。此外，通过图像采集系统摄入的图像通常都会自动生成BMP格式并存放在计算机中，但计算机显示出来的却是灰度图像。在各种因素的影响下，图像会出现模糊，笔画断开、粗细不均衡等现象，而且图像中大量孤立噪声的存在，也会使提取字符的难度加大。

针对数字图书资料修复中存在的这些问题，笔者在传统二值化处理的基础上，引用了局部二值化的处理方法，主要是为了对不清晰的数字图书资料进行修复，从而实现图书资料的数字化。

3图像模式识别技术的工作原理

3.1模式识别的定义

对表征事物和现象进行数值、文字和逻辑关系等多种形式的信息进行处理和分析，以便能对事物和现象进行描述、辨认，并完成对它们的分类和解释，这样一个过程就是模式识别。模式识别的基础就是大量的信息和数据，采用的主要方法是计算机和数学推理，识别的主要对象是形状、曲线、数字、字符格式和图形等。目前，模式识别技术已经被广泛应用于社会的各行各业，包括天气的预测、卫星图片和航空图片的解释、工业产品的检测、字符识别、语音识别、指纹识别和医学影像分析等。值得一提的是，模式识别在图像处理中运用最典型的案例就是目前被广泛使用的文字识别，这种方法在图书信息的修复上有着广阔的发展前景，能够为图书资料的数字化提供相应的技术支持。

3.2局部二值化的内涵

以一张最普通的A4大小的图像为例，它上面存在上千像素点，这么大的一张图像，即便能够通过大律法进行完美的扫描，单一阀值的方法也不能得到最好的二值化结果。所以对大图像进行阀值计算时，最常见的方法就是：先对整个大图像进行分割，使之变成若干张大小相等的小图像，然后利用二值化方法对这些小图像进行阀值计算，而后将经过二值化之后的小点阵进行整合，得到最后的结果，这种方法就是局部二值化。在对数字图书资料中的图像进行二值化的过程中，需要先将图像的局部切割成小块，这样就能将大图像的二值化问题转换成为小图像的二值化问题。这样一来，即便数字图像资料中色度分布不均、局部颜色透明度不高，在二值化的过程中也不会发生因为颜色暗淡而丢失字符的问题。

3.3图像模式识别的原理

图像模式识别的工作原理主要由两部分构成，即局部二值化的原理和图像分块的确定。下面就对这两方面进行具体分析。

3.3.1局部二值化原理。所谓的局部二值化就是将一张比较大的图像分割成若干比较小的图像，然后对这些比较小的图像进行二值化，经过组合之后形成完整的二值化图像。换句话说，只需要分割、块二值化和合并三个步骤就能完成图像的二值化处理。

3.3.2图像分块的确定。在对大图像进行分割时，应该将图像的局部灰度平均值作为分割的依据，这样就可以使一些质量较差图像的局部二值化效果得到提高。从理论上讲，对大图像分割的小图像数量越多，最后二值化的效果就会越好。但是在实际的操作过程中，这样的分割方法会大大降低计算的速度。而且，图像分割得越小，经过局部的二值化之后，最后整合出来的二值化的噪音就会越多，这样就会给后面的平滑处理带来更多的问题，增加后期处理的难度。

4数字图书资料的修复方法

在进行图书资料数字化的过程中，图形经过扫描之后，还需要经过图像的预处理、提取图像中的字符信息、对图形进行局部二值化的处理等过程，其中图像的局部二值化处理是进行图书资料修复的核心步骤。下面笔者就对这三方面的工作内容进行详细说明。

4.1对图像进行预处理

柴森：基于图像模式识别的数字图书资料修复及应用柴森：基于图像模式识别的数字图书资料修复及应用一方面，受扫描系统的版本、光电转换的不同位置以及工作环境中的光电等因素的影响，会使图书或者是档案资料在进行数字化的过程中，出现图像扫描不均匀、对比度差异较大等问题，导致图像的清晰度不够，还原度和可视程度降低。另一方面，光电敏感元件中的载荷粒子会随着机器的运转产生一定的噪音，或者是受到传输通道的干扰，灰度图像在经过数字化的处理之后，都会含有一定的噪声。正是由于这两方面的原因，在对图书或者是档案图像进行二值化的处理之前，都需要对图像进行预处理。endprint

目前，在图书资料数字化的过程中，对图像进行预处理的办法主要有两种，即灰度变换和平滑滤波。其中灰度变换主要是指对图像像素的灰度值进行修正，让图像经过处理之后颜色分布更加均匀，对比度更加饱满。而平滑滤波主要就是指在图像的处理过程中，在平滑的图像中加入噪声。

4.2提取图像中的字符信息

对于亮度比较大的点，可以将它的值假设为0；对于亮度较小的点，可以假设它的值为1。像素的集合就是图像的背景区域，如果将小于或者是等于阈值N的像素设置成黑色，那么像素的值就为1，通过这样的方法就能得到只有黑白两个等级的二值化图像，图像中字符信息就会显示出来。通常情况下，数字图书资料的背景色都很浅，而字符的颜色比较深。以纸质图书为例，它的背景色通常都是白色，而字符则是黑色。

4.3二值化图像的二次处理

对图像进行局部二值化的处理之后，就能得到各个小块图像的值点。虽然这种方法能够避免部分小块颜色暗淡只是整体图像没有值点现象的产生，但会使图像中包含很多的噪音。这些噪音在进行图像的重组之前必须去除，一般情况下，可以使用图像重构的方式进行处理。采用图像重构法不仅能够得到完整的原始图像，还能够构造出BMP位图文件，打印出比原来效果更好的图书资料，达到修复图书资料的目的。

5结语

本文从四个方面对图像模式识别技术在数字图书资料修复中的应用进行了探讨，首先是数字图书资料的概述，其次是数字图书资料在修复过程中存在的问题，再次是模式识别的工作原理，最后是模式识别技术的主要方法。

参考文献：

[1]代小红.基于图像模式识别的数字图书资料修复及应用[J].图书情报工作，2009（3）：111-114.

[2]康汶，邹爱国，邹利明.数字图书馆统一身份认证及综合应用研究[J].计算机与现代化，2010（12）：79-84.

[3]贾昔玲.基于图像模式识别的数字图书资料修复及应用研究[J].数字技术与应用，2010（10）：75.

[4]李鹏.数字图书馆内容管理开源软件应用与评价研究[D].吉林大学，2012.

[5]陆颖隽.虚拟现实技术在数字图书馆的应用研究[D].武汉大学，2013.

[6]李志华.中山市劳教管理学校的数字图书管理系统设计与实现[D].电子科技大学，2012.

[7]徐宁.图书馆数字化资源管理系统的设计与实现[D].电子科技大学，2011.

[8]化明艳.高校数字图书馆信息服务能力评价模型研究[D].南京农业大学，2010.

（编校：周雪芹）endprint

4.2提取图像中的字符信息

4.3二值化图像的二次处理

5结语

参考文献：

[1]代小红.基于图像模式识别的数字图书资料修复及应用[J].图书情报工作，2009（3）：111-114.

[2]康汶，邹爱国，邹利明.数字图书馆统一身份认证及综合应用研究[J].计算机与现代化，2010（12）：79-84.

[3]贾昔玲.基于图像模式识别的数字图书资料修复及应用研究[J].数字技术与应用，2010（10）：75.

[4]李鹏.数字图书馆内容管理开源软件应用与评价研究[D].吉林大学，2012.

[5]陆颖隽.虚拟现实技术在数字图书馆的应用研究[D].武汉大学，2013.

[6]李志华.中山市劳教管理学校的数字图书管理系统设计与实现[D].电子科技大学，2012.

[7]徐宁.图书馆数字化资源管理系统的设计与实现[D].电子科技大学，2011.

[8]化明艳.高校数字图书馆信息服务能力评价模型研究[D].南京农业大学，2010.

（编校：周雪芹）endprint

4.2提取图像中的字符信息

4.3二值化图像的二次处理

5结语

参考文献：

[1]代小红.基于图像模式识别的数字图书资料修复及应用[J].图书情报工作，2009（3）：111-114.

[2]康汶，邹爱国，邹利明.数字图书馆统一身份认证及综合应用研究[J].计算机与现代化，2010（12）：79-84.

[3]贾昔玲.基于图像模式识别的数字图书资料修复及应用研究[J].数字技术与应用，2010（10）：75.

[4]李鹏.数字图书馆内容管理开源软件应用与评价研究[D].吉林大学，2012.

[5]陆颖隽.虚拟现实技术在数字图书馆的应用研究[D].武汉大学，2013.

[6]李志华.中山市劳教管理学校的数字图书管理系统设计与实现[D].电子科技大学，2012.

[7]徐宁.图书馆数字化资源管理系统的设计与实现[D].电子科技大学，2011.

[8]化明艳.高校数字图书馆信息服务能力评价模型研究[D].南京农业大学，2010.

（编校：周雪芹）endprint

河南图书馆学刊2014年8期

河南图书馆学刊的其它文章: 地市级公共图书馆古籍保护工作研究; 启动文化共享工程新引擎; 图书馆精品视频资源的自建与服务探析; 地方文史资料保护新探; 基于图书馆参与政府信息资源开发利用的调查研究; 公共图书馆知识服务创新的定位与路径