现代教学活动中的数字图像处理初探

2010-12-29 00:00:00尹弘震
中国信息技术教育 2010年24期


  随着数字技术的不断发展与应用,现代教学活动中的许多信息都可以用数字形式的数据进行处理和存储,数字图像就是这种以数字形式进行存储和处理的图像。利用计算机可以对它进行常规图像处理技术所不能实现的加工处理,可以多次拷贝而不失真。
  
  数字图像信息的采集及其描述
  
  要获得一个数字图像必须将图像中的像素转换成数字信息,以便在计算机上进行处理和加工。将模拟图像转换成数字图像的工作,通常可由扫描仪来完成。扫描仪测量从图片发出或反射的光,依次记录光点的数值并产生一个彩色或黑白的数字拷贝。这个图像被翻译成一系列的数字后存储在计算机的硬盘上或者其他的电子介质上。扫描的过程即由模拟原稿实现数字化的处理过程。
  实际上,图像的数字化包含两个方面的内容,它们是空间位置的离散和数字化以及亮度的离散和数字化。从不很精确的角度叙述,可将空间位置的离散称为抽样,而亮度的数字化称为量化。
  
  数字图像处理的特点
  
  1.数字图像处理的信息大多是二维信息,处理信息量很大。如一幅256×256低分辨率黑白图像,要求约64kbit的数据量;对高分辨率彩色51×512图像,则要求768kbit数据量;如果要处理3帧/秒的电视图像序列,则每秒要求500kbit~22.Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。
  2.数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右,所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。
  3.数字图像中各个像素是不独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般来说还要大些。因此,图像处理中信息压缩的潜力很大。
  4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。
  5.数字化处理后的图像一般是给人观察和评价的,因此受人的因素影响较大。由于人的视觉系统很复杂,受环境条件、视觉性能、知识状况等影响很大,作为图像质量的评价还有待进一步深入的研究。另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究。
  
  扫描后的数字化图像的处理
  
  一般来说,扫描得到的图像还存在诸如文档变形、畸变等一些问题(常见的畸变分桶形畸变和枕形畸变),在一些教学场所应用的低成本摄像头更是普遍存在光学畸变。即使对图像进行了诸如去除波纹图案、增加图像亮度对比度等一系列的处理后,也只能是一定程度的增强图像的质量,若将得到的初步处理后的数字图像直接应用于教学活动肯定还会存在一些问题,这就需要在图像处理的后期工作中加入图像的矫正处理。
  由于实时的教学环节对图像矫正速度提出较高的要求,我们必须找出一种应对图像的畸变校正的快速算法,通过大量的交流与试验,针对现代教学活动中产生的数字图像进行分析得到大背景小目标的定性检测,可以采用一种基于针对各像素的坐标插值的查表法,直接建立畸变前后图像坐标位置的近似对应关系。这种方法的特点是图像的目标区域小,对应的摄像头像素少,实时计算时矫正速度快,效果较好。
  基对应点是查找表的基本框架,首先固定摄像头,然后将标准的栅格图形的栅格按行编号(或按列编号),设x、y坐标矩阵分别为:
  摄像头拍得的畸变图像如图2所示,与未畸变图对应栅格点坐标为:
  利用标准图形坐标值,分别对X,Y,X′,Y′进行线性插值(二次插值、三次样条插值等与之相似,为简单说明问题,以线性插值为例),分别求出所有点的坐标。
  行插值:设k=[xi,j+1-xi,j](取整),k为两点间需要插值的最小点数。则坐标插值程序为:
  For i=1∶m
  For j=1∶n
  Temp=X(i,j)∶(X(i,j+1)-X(i,j))/k∶X(i,j+1
  Foru=1∶k
  Xnew(i,(j-1)*k+u)=Temp(u);
  End
  End
  End
  列插值:设t=[xi+1,j-xi,j](同样取整),t的要求同k一样。
  得到新的矩阵:
  同理可得Ynew,X′new,Y′new。即畸变后的图像各点对应的畸变前坐标。
  针对大背景小目标的定性检测,本文提出了一种低成本、小数据量的新型机器视觉成像系统以及基于坐标插值的摄像头畸变软件矫正算法。这种系统成本低、目标区域精度高而总体数据量少,它的图像矫正算法简单可行,没有复杂的计算式,提高了目标图像的质量和整体的运算速度,可以用于目标的定性识别。