基于OpenCV的拍照图像传真信息采集处理方法研究*

2018-12-23 06:46:04徐兴丰李庆华
科技与创新 2018年1期
关键词:传真机图像处理摄像头

徐兴丰,李庆华,2,杜 军

(1.山东师范大学 物理与电子科学学院,山东 济南 250014;2.齐鲁工业大学 电气工程与自动化学院,山东 济南 250353)

基于OpenCV的拍照图像传真信息采集处理方法研究*

徐兴丰1,李庆华1,2,杜 军1

(1.山东师范大学 物理与电子科学学院,山东 济南 250014;2.齐鲁工业大学 电气工程与自动化学院,山东 济南 250353)

传统的传真扫描在封闭的环境下成像条件苛刻——单一的纸质版内容,信息采集不方便,信息表达的形式不够丰富。在OpenCV平台上,利用摄像头直接采集信息,无需进行拆卷处理,也不再局限于纸质载体。对采集到的图片信息进行灰度化、锐化和阈值分割等操作,然后编码生成传真文件进行传真,方便传真的信息采集。这种做法解决了摄像头采集信息后数据量过大、不利于传输和传真格式转换等问题。

OpenCV;传真文件;图像处理;信息采集

如今,通信技术快速发展,一些人口密集的区域都已经有Internet接入,图像、声音、视频等传输十分方便,即便是网络传真机也可以传输文字、图片的多种格式的文件,传统的传真通信受到了很大的冲击。但是,在某些特殊场合,比如保密性要求较高的军队且在只有PSTN网络的情况下,传真仍是较为理想的数据通信方式。而对于需要真迹传递的政府和企业,传真通信在其中也扮演者着不可替代的角色[1]。在信息时代的大背景下,传真通信也需要不断改进,适应不断提高的通信需求。在没有Internet分布的区域,可以连入PSTN的情况下,可以通过传真机进行数据通信。但是,老式的传真机体积比较大,信息采集也不方便。目前,要将页式传真图像用传真机传输,图像信息要经过扫描系统,在控制软件的控制下进行传输。扫描系统由光/电转换器件、精密齿轮、步进电机、控制逻辑电路和光源系统等组成。该系统的作用就是通过光电耦合器件将光信号转换为电信号,常用的光电耦合器件有CCD和CIS两种类型[2]。

扫描成像必须扫描的是纸质内容,任何信息都必须转化为可以在纸质平面上表达的信息才能被传真机传输给对方。为了优化信息采集,利用摄像头直接拍摄,采集到的信息可以是二维纸质版内容,也可以是三维事物的本身,比如办公室的人员座次分布、河流走向等。

摄像头直接成像方便信息采集,但生成的文件是jpg文件或bmp文件,包含颜色信息,数据量相对于黑白图像较大,并不适合直接通过PSTN传真。基于PSTN的传真多是黑白的TIFF文件(标签图像文件格式),有对应的传真协议规范,不能发送除了通用传真文件TIFF文件外的其他文件格式[3-4]。由于摄像头采集的图像数据量太大,不能传输等问题,需要对采集到的信息进行处理转换,生成适合传输的文件。常见的图像处理库有ImageStone、GIMP、CxImage和OpenCV等。其中,OpenCV是一个开源的机器视觉库,它包括图像处理和视觉算法,MLL统计分类器,HighGui、Gui图像和视频输入输出,CxCore基本结构和算法,Xml支持绘图函数。基于OpenCV的程序开发具有跨平台、可移植性好、独立性好、源代码公开、具备强大的图像和矩阵运算能力、运行速度快等优点[5],所以,可以使用OpenCV类库,控制摄像头采集需要的信息,并对采集到的信息进行处理。本文主要研究了在OpenCV平台之上利用OpenCV的相关函数,配合必要的硬件资源,采集并保存图像信息。对采集到的图像信息做进一步的处理压缩,使之更适合传真传输,且保证信息的相对完整性。在实际工作中,压缩文件,转换编码格式,可以生成可传真的文件。具体实现流程如图1所示。

图1 可传真文件生成流程

1 初始化硬件设备和软件

在PSTN网络上传真,在没有传真机的情况下,可以将传真Modem与PSTN网络连接,Modem的控制端连接计算机,计算机就可以控制Modem,实现传真功能。具体传真模式如图2所示。本实验采用台式机,Windows7 32位系统,装有Visual Studio 2010.Modem是D-TECHS的I-56em。计算机与Modem通过串行通讯接口相连,对其进行控制。在软件方面,需要配置OpenCV。OpenCV开发库的配置主要是设置预先编译的头文件路径和动态链接库的路径,将OpenCV的库文件和头文件添加到项目的包含目录中即可[6]。

2 图像的采集和保存

本实验使用的摄像头免驱动安装,可以自动被操作系统识别。OpenCV库有摄像头的类,VideoCapture,利用VideoCapture::open()函数打开摄像头;用Picture Control控件来显示图像,Picture Control可以动态地加载图像,可以设置大小、颜色等属性。同时,采用动态加载图像的方式,可以实时预览摄像头拍摄的信息。

定义一个矩阵mat类存储摄像头采集到的数据,mat类同时也有将矩阵数据转换成图像数据Iplimage的函数,然后可以将Iplimage保存。将保存到内存中的数据通过定时器OnTimer不断地保存,加载到Picture Control控件中显示,就可以实现预览的功能。在实际工作中,需要采集哪幅图像,只需将图像通过函数 imwrite(“文件名”,摄像头数据)保存。如此,图像的预览、适时采集和保存工作就可以完成。

图2 传真模式图

3 图像信息处理和编码文件

摄像头采集信息生成图片时可能会产生噪声,也可能会产生多余的信息,占用过多的存储空间,不宜传输。图像信息处理的目的就是突出信息的主要内容,减少对存储空间的占用,保留必要的信息。图像处理流程如图3所示。

图3 图像信息处理流程

3.1 灰度化

由于摄像头采集到的原始图像为彩色图像数据,图像中包含大量的彩色信息,在处理中会花费较多的存储开销,必将降低系统的处理速度,而且彩色图像也不能传真,所以要先对图像进行灰度化处理[7]。

灰度化常用的处理方法有最大值、平均值和加权平均值方法,OpenCV有自己的灰度化函数,自带方法和加权平均法的处理效果相当。OpenCV的灰度化处理函数,即cvCvtColor(img,img1,CV_BGR2GRAY),可以将彩色图像img转化为灰度图像img1。

3.2 文本图像纠偏

文本旋转是由于摄像头在采集图像时未能按照文本的行列水平采集所导致的现象。在实际应用中,为了方便识别,需要对文本进行几何矫正。文本图像有一个明显的特征,即每行文字之间都有一段空白间隔。文本与空白间隔在频域之间的频谱有明显的差别。当文本旋转时,频谱也跟着旋转,因此,可利用这种时频特性计算文本图像的DFT变换。DFT变换后,其低频部分在边界的四角,高频在图像的中心位置,将高频和低频互换实现中心移动,就可以看到文本图像频谱有明显的倾斜直线,然后通过霍夫变换计算出斜线的倾斜角度,利用仿射变换就可以完成文本图像的矫正[8]。

3.3 锐化处理

用摄像头拍照,由于信息采集者操作不合理和硬件设备的限制,可能伴有较强的随机干扰和系统噪声,背景比较复杂。通常情况下,需要使用图像锐化技术等图像增强技术抑制图像的背景噪声、增强图像纹理和边界细节,提升图像的某些重要信息特征[9]。图像锐化等图像增强技术能够将被处理的图像转化为对传真来说质量和效果更好的图像。

OpenCV常用的2种用来锐化的算子有sobel和laplacian的二阶离散过程,本实验用sobel算子,函数原型为Void Sobel(InputArray src,OutputArray dst,int depth,int dx,int dy,int ksize=3,double scale=1,double delta=0,int borderType=BORDER_DEAFAULT),该函数使用sobel算子计算src中的一幅图像的二阶导数。参数ddepth表示输出图像的深度,Ksize表示核的大小,希望的导数阶为dx和dy。使用scale可以建立用于计算导数的尺度因子。另外,参数vordeType表示边界类型。

3.4 阈值分割

阈值分割是对图像信息的进一步压缩,保留必要的信息,这样可以使后期生成的文件更小,更能满足传输要求。阈值化操作就是利用像素点分布规律,设定阈值进行像素点的分割,进而得到二值化图像。常用经典方法有OSTU、固定阈值、自适应阈值、双阈值半阈值操作,本实验采用自适应阈值分割的方法进行阈值分割[10]。

在实际应用中,固定阈值很难达到理想的分割效果,目标和背景区域通常是相互依存在图像块中,而自适应阈值分割通过像素邻域块的分布特征来自适应确定区域的二值化阈值。函数原型如下:VoidAdaptiveThreshold(InputArray src,OutputArray dst,double maxValue,int adaptiveMethod,int thresholdType,int blockSize,double c).在此函数中,参数src表示源图像数组;dst表示输出图像数组;maxvalue表示预设满足条件的最大值;cvAdaptiveMethod表示自适应阈值算法选择ADAPTIVE_THRESH_MEAN_CADAPTIVE_THRESH_GAUSSIAN_C;thresholdType表示阈值类型THRESH_BINAY或THRESH_BINARY_INV;blocksize表示邻域块大小,用来计算区域阈值,一般选择为3,5,7……参数c表示从均值或加权均值提取的常数。

3.5 图片尺寸调整

摄像头采集的信息传真之后,对方可以用网络传真机接收,也可以用传统传真机接收。如果对方使用的是网络传真机,接收到的传真文件可以在计算机上用图片浏览器打开,也可以进行缩小放大等尺度变换,可以选择一个方便识别的方式查看。如果对方使用的是传统传真机,接收到的传真文件需要打印之后才可查看。此时,需要在发送传真之前调整传真文件的尺寸,使文件打印之后适应A4纸的大小。

利用本文所述程序处理后的图片,水平和垂直分辨率皆是96(每英寸96个点)。A4纸的大小是8.3×11.7(英寸)。所以A4纸可以放下的像素点约为797×1 124,本实验设置的图像像素点为760×1100,实现函数如下:

IplImage*x,*y;

y=cvCreateImage(cvSize(760,1100),8,1);

x=cvLoadImage("源文件",0);

cvResize(x,y,CV_INTER_LINEAR);

Y图像可以在A4纸上正常打印。

3.6 生成传真文件

图片保存成灰度图像后,需要转化成传真的编码格式,生成可以供传真发送的文件。传真文件的编码格式根据传真机传送图像和记录方式的不同,有黑白和彩色之分。该实验采用二值传真编码。编码传真格式利用的是libtiff的dither函数,该函数利用抖动算法将灰度图像转化为二值图像,同时,可以改变图像的压缩编码格式。在本实验中,直接调用libtiff下的可执行程序,在dos下运行指令为“tiffdither-c g3‘源文件’‘目标文件’”。生成的目标文件采用CCITT T.4协议压缩,可以用传真方式发送。

4 实验结果

图4和图5为2组实验的图像对比和占用存储空间的概述,第一幅为拍摄的原图,存储空间较大,第二幅是经处理程序处理后的图片,第三幅是经过编码生成的传真TIFF文件,第四幅是传真扫描后生成的文件。从2组实验所得的结果来分析,摄像头拍摄后,最终生成的文件和扫描生成的文件效果相差不大,有些细节会更清晰,存储空间会有20%~30%的增加,但与未处理的图片比较,文件占用的存储减少50~70倍,旋转的文本得到纠正,处理效果明显,符合传真的条件。

5 结束语

本文所提出的用OpenCV控制摄像头采集传真图像是一种新的尝试,它丰富了传真内容的表达形式,方便了传真信息的采集。基于OpenCV的程序开发,是在前辈研究的基础上完成工作,让编程更加简单,减少了不必要的工作量,方便可靠、处理效果明显。

传真文件的编码调用了libtiff中的dither程序,让文件以传真的编码格式存储。在图像信息的处理方面,图像信息的处理还可以进一步优化,实现更好的处理效果,这是需要后期继续研究的。

图4 实验一结果

图5 实验二结果

[1]刘文柱.数字传真通信[M].成都:电子科技大学出版社,2000:1-17.

[2]刘立柱.传真图像和传真信号处理原理与技术[M].北京:国防工业出版社,2006:11-22.

[3]赵付强,李允俊.无纸传真协议的研究与实现[J].科技信息,2012(27):57-58.

[4]陆宗琪.C/C++图像处理编程[M].北京:清华大学出版社,2005:104-109.

[5]秦小文,温志芳,乔维维.基于OpenCV的图像处理[J].电子测试,2011(7):39-41.

[6]苏慧娟,于正林,张桂林.基于OpenCV的图像处理[J].科技资讯,2014(8):18-19.

[7]江进.基于灰度化及边缘检测算法的车牌识别技术研究[J].电脑与微电子技术,2014(1):38-41.

[8]吴军,侯德文,刘江.一种快速的文档图像倾斜角检测算法[J].电子技术与软件工程,2015(2):106-108.

[9]刘军,龚云祥,金蕾.基于FPGA实现传真图像处理算法的方法[J].微电子学与计算机,2013,30(4):79-82.

[10]朱伟,赵春光,欧庆乐,等.OpenCV图像编程实例[M].北京:电子工业出版社,2016:76-84.

本文部分参考文献因著录项目不全被删除。

TP391.41

A

10.15913/j.cnki.kjycx.2018.01.001

2095-6835(2018)01-0001-04

山东省中青年科学家基金(BS2013DX031)

徐兴丰(1993—),男,山东济宁人,硕士在读,主要研究电路系统和传真图像处理。李庆华(1977—),男,博士,副教授,主要从事机器视觉和信号与信息处理方面的研究。杜军(1973—),女,通信作者,硕士,副教授,主要研究无线传感器网络及信号处理。

〔编辑:白洁〕

猜你喜欢
传真机图像处理摄像头
浙江首试公路非现场执法新型摄像头
摄像头连接器可提供360°视角图像
传真机导致东京每天确诊不超300人?
环球时报(2020-07-23)2020-07-23 05:14:44
机器学习在图像处理中的应用
电子制作(2018年18期)2018-11-14 01:48:20
模糊图像处理,刑事侦查利器
图像处理技术的实战应用
奔驰360°摄像头系统介绍
Photo Shop通道在图像处理中的应用
河南科技(2014年1期)2014-02-27 14:04:06
没有传真机?咱就免费在线发
安装摄像头后为何无法使用耳麦?等