杨霈
(兰州理工大学,甘肃兰州,730050)
图像处理是一种利用计算机分析图像以达到预期结果的技术。图像处理一般指数字图像处理,而数字图像指由工业相机、摄像机、扫描仪等设备捕捉到的二维数组,数组中的元素称为像素,元素的值称为灰度值[1]。
计算机图像识别技术和人识别图像在原理上没有本质区别,只是机器没有人的感觉。人类图像识别不仅仅是依赖于整个图像在脑中的映像、我们依赖于图像本身特点然后对图像进行分类,然后对每个类别图像识别的特点识别图像。当我们看到一张图片时,我们的大脑会迅速产生联想。在“看”和“想”之间有一个快速的识别过程,这与搜索的过程类似。在这个过程中,我们的大脑已经在存储记忆的分类的类别中看是否有存储的记忆或与图像具有相似的特征,从而识别图像。类似的是机器图像识别技术,它通过分类提取重要特征,排除冗余信息来识别图像。这些由机器提取出来的特征一般是十分明显的,机器识别的速度也因此提高。在计算机的视觉识别中,图像的内容往往是用图像特征来描述的[2]。
图1 图形用户界面示意图
MATLAB GUI(又称图形用户界面),它的含义是以图形化方式显示的计算机操作用户界面,是MATLAB 用户可视化交互式的工具,运用GUI 生成的操作界面用户可以不用浏览繁冗的代码而进行操作[3]。
图形用户界面(GUI)是由窗口、键、游标、菜单、文本指令和其他对象组成的用户界面。用户通过某些方法(如鼠标或键盘)选择和激活这些图形对象,使计算机产生反应,如计算、绘图、显示结果等。本文通过用户界面将展示对图像的二值化,处理边缘,水果分类最终实现水果识别并保存结果[4]。
图像的二值化处理是将图像上的点的灰度值设置为为0 或255,于是图像呈现出明显的黑白效果也就是获得黑白图像[5]。
二值图像中的一种主要处理是对所提取的目标图形进行形态分析。而形态处理中最基本的是腐蚀与膨胀。腐蚀处理的作用是将目标图形收缩。其中用得到结构元素,结构元素是指具有某种确定形状的基本结构元素,例如,一定大小的矩形,圆或者菱形等。本文先对图像进行了降噪处理和平滑边界处理再把图像灰度化再进行腐蚀处理。本文随机打开一张事先准备好的图片进行二值化处理结果如图2-4 所示。
边缘提取就是在数字图像中对图片轮廓的处理。对于边界处,灰度值变化比较剧烈的地方就称为边缘。也就是拐点(函数发生凹凸性变化的点)是二阶导数为零的点,并不是一阶导数,因为一阶导数为零,表示的是极值点。保留图像灰度变化较大的区域是边缘提取的一般方法,从数学的角度来看,最直观的方法是差分(数字图像差分)[6]。
图3 灰度图像
图4 二值化处理图像
边缘检测的基本思想是利用边缘增强算子对图像的局部边缘进行突出,然后定义像素的“边缘强度”,通过设置阈值来提取边缘点。由于噪声和模糊,监测的边界可能在某一点变宽或破裂。因此,边界检测就包括:(1)通过边缘算子提取反映灰度变化的边缘点集。(2)在边缘点集合中消除一些边界点或填充边界不连续点,并将这些点连接成一条完整的线。在边缘化处理前一般先进行图像降噪已获得合适的图像边沿,本文对图像的边缘提取如图5 所示。
图5 边缘提取图形
图像识别技术的过程一般包括信息获取、预处理、特征提取与选择、分类器设计和分类决策这几个步骤[7]。
信息获取有很多方法如把光或声信息通过传感器转化为电信息。通俗来说就是把研究对象的基本信息以某种方式转换成机器可以理解的信息。预处理主要是指对图像进行去噪、平滑、变换等操作,从而增强图像的重要特征。特征提取与选择:我们研究的图像是多种多样的,若想区分它们,就必须通过它们自身的特征来识别它们,获取这些特征就是提取特征。特征提取需要提取有用的特征一般选取明显的特征这样才能识别相应的物体,这就是特征选择。特征提取与选择是图像识别过程中的关键技术之一。分类器设计是指通过训练得到一个识别规则,通过这个规则可以得到一个特征分类,从而提高识别率。分类决策是对被识别的对象在特征空间中进行分类更好地识别所研究对象的具体类别。
在本文中在去噪的基础上先建立了HSV 色素模型(表示色相、饱和度和亮度)。计算各个水果的平均HSV 数值并求得水果的最小HSV 值,利用regionprops 函数获得各个联通区域的属性值(中心点坐标,外接椭圆的长短轴长度,面积),随后计算各个水果的似圆特征比(长轴/短轴),再获得以每个水果重心为中心点的边长为30 的正方形内的像素的rgb 值,利用以上条件通过比对获得最终分类结果。譬如:西瓜就需要面积最大,似圆性小于1.4,b 值大于1,通过for循环就可找到西瓜。
图6 图像识别结果
也就是进行了预处理,信息获取,特征提取与选择,分类器设计。
我们可以通过该算法实现的水果识别并为教导幼儿实现电子识别水果提供方便。
本文通过对水果图像进行灰度,边界,腐蚀,去噪处理并把了每个水果相应的rgb 值并转化为相应的hsv 色素模型并获得相应值,计算每个水果的规格大小(面积,似圆性,获得以每个水果重心为中心点的边长为30 的正方形内的像素的rgb 值),通过比较获得最后分类结果。
本文前景广阔不仅可以适用于水果识别还可以用于其他物体识别比如不同的杯具茶具,足球篮球等多种多样的物体。