宋兰霞,周作梅,邓世权
(1凯里学院大数据工程学院 贵州 凯里 556011)
(2凯里学院微电子与人工智能学院 贵州 凯里 556011)
计算机视觉使用计算机模拟人眼对目标进行识别、跟踪和测量[1],并对图形和图像进行识别、解释和处理,即实现计算机“看得懂”,现已成为人工智能率先取得较大突破、应用场景较为明确的关键技术之一,随着计算机技术的发展,我国用计算机视觉技术进行肉质检测和自动分级技术的研究已取得了一定进展,并在依据大理石花纹进行胴体分级方面的研究颇见成效,但他们大多采用文本文件存储数据,不能实现大规模数据的存储;在国外用计算机视觉技术对肉质检测和分级也进行了大量的理论研究[2],但通过下基层进行调研走访,发现该技术在雷山县还未见使用,也未见公开报道,因此,我们有必要研究出一套适合于雷山县的猪肉分级体系,实现雷山县猪肉的科研价值,本文以大固鲁村猪肉为例,利用计算机视觉技术从猪肉样本图像中提取出白红比这一特征,并把结果储存到数据库中,以便于以后猪肉的在线分级。该法不但实现了猪肉的科学研究价值,而且为实现猪肉在线分级打下基础。
系统使用的硬件环境为数码相机、图像采集卡、计算机、光源、黑板,系统使用的软件开发平台为Microsoft Visual Studio,使用Visual C#语言编写程序,使用Microsoft SQL Server数据库存储数据,使用数据结构进行图像处理,使用图像采集卡获取数码相机拍摄的猪肉图像。
通过到基层进行调研和走访,了解用户对系统的需求,掌握白红比特征提取系统中用户的基本功能,需要包括图像获取、图像处理[3]、滤波去噪,以及如何对图像处理后的猪肉图像进行白红比特征提取,并将提取的特征保存在特征数据库中,其中,图像处理是本系统研究的重要内容,为白红比特征提取做好准备工作。
系统包括获取图像、去除背景、中值滤波、灰度化处理、提取大理石纹、保存六大模块,系统的功能模块图如图1所示。
为了方便存储大批的数据,本文选用了Microsoft SQL Server数据库进行数据的存储,字段名称从左到右依次分别为样本编号、去除背景后的图像、大理石纹图像、去除背景后图像的总像素数量、大理石花纹像素数量、白红比(%)。
用数码相机拍摄猪肉图像如图2所示,然后输入计算机进行图像处理[4]。
双峰法比较简单,在可能情况下常常作为首选的阈值确定方法,应用比较普遍,这种方法适用于前景目标和背景物体的灰度值存在差别,并且分布相对均匀的情况,当某一图像得直方图具有两个峰时,可以取两峰所夹的谷底作为门限阈值,但是,当出现灰度直方图的波谷平坦,各区域直方图的波形重叠等情况时,用双峰法就难以确定阈值。
去除背景的算法思想是对RGB胴体图像的红色分量运用统计决策论中的知识计算最佳阈值,将彩色图像红色分量的直方图划分成两个部分,并且这个阈值使得两部分之间的距离即类间方差最大,然后用半阈值分割法把黑色背景从整块胴体图像中去除。去除背景后的图像如图3所示。
排序,是程序设计中的一种重要操作,它的功能是将一个数据元素的任意序列,重新排列成一个按关键字有序的序列。
中值滤波的算法思想是通过运用数据结构中学到的排序算法对其邻域内的像素点先进行排序然后再用中值换掉。
假设含有n个元素的有限序列为{f1,f2,……,fn},窗口长度为m(m为奇数),对此一维序列进行中值滤波,即从输入序列依次抽出m个数{fi-v,……,fi-1,fi,fi+1,……,fi+v},其中fi为窗口中心v-(m-1)/2的值,对这m个数按照关键字非递减关系进行排序,取其中值Med{fi-v,……,fi-1,fi,fi+1,……,fi+v}代替窗口中心值fi,即fi=Med{fi-v,……,fi-1,fi,fi+1,……,fi+v}。例如,图4所示的图像数据,为了求出像素10(中括号内所围的像素值)的代替值,就要对其方框内3×3领域的9个像素值按照由小到大的顺序进行排列,即2、2、3、3、4、4、4、5、10,其中间值为4。像素值为10的像素中值处理后变为4,像素值为10的像素是作为噪声故意输入进去的,通过中值处理后噪声就被消除了。如图4所示。
再如,有一个有限序列{20,10,30,15,25},从小到大排列后序列为{10,15,20,25,30},中值滤波的输出结果为20。如果像素点为30的像素是噪声点,则经中值滤波后噪声就被消除了,中值滤波的算法减少了随机干扰和脉冲干扰,克服了线性滤波器所带来的图像细节模糊问题,适合于去除扫描噪声和颗粒噪声[5]。
灰度化处理的算法思想是用加权平均值法对图像进行灰度化处理,用数学公式描述为Y=0.2989R+0.5870G+0.1140R,其中,R、G、B分别表示彩色猪肉图像的红色分量、绿色分量、蓝色分量,0.2989、0.5870、0.1140分别表示R、G、B的权值,Y表示灰色猪肉图像的亮度值即灰度级别。在加权平均值法中,灰色(亮度Y)和彩色(色度I、饱和度Q)是分离的,同一信号既可表示彩色图像也可表示灰色图像,没有I、Q分量时为灰色图像,否则为彩色图像。
提取白红比的算法思想是先用迭代法设置阈值,然后根据阈值用二值化处理的方法把脂肪从整块猪肉图像中分割出来[6]。
4.5.1 迭代法阈值的选取:
算法思想是先取图像中值T0,再按下式迭代:
4.5.2 二值化处理的算法描述:
S1:若 F(X,Y)>T,则G(X,Y)=255,否则跳转到S2;
S2:若F(X,Y)<T,则G(X,Y)=0。
其中,F(X,Y)表示灰度胴体图像像素的亮度值,G(X,Y)表示二值化后的图像像素的值,T表示黑色大理石纹和背景区域之间的边界像素的值。
4.5.3 提取大理石纹的算法描述:
S1:对胴体图像在[0,255)范围的亮度值由小到大排序,得到图像亮度的最大值和最小值;
S2:取初始阈值为图像的最大亮度值和最小亮度值的均值;
S3:把图像分割为两类像素,其中一类像素都大于等于阈值,另一类则小于阈值;
S4:分别计算两类像素的平均亮度值
S5:新的阈值为两类像素的平均亮度值的均值
S6:如果新的阈值<初始阈值则找到了最终的阈值,也就是说找到大理石纹和其他区域的分界点,否则跳转到S3;
S7:如果图像的亮度值小于阈值,则为大理石纹,用黑色表示,否则其值保持不变。
通过以上的算法描述[7],整个图像分成两部分,其中,黑色为大理石纹(见图5),用逻辑“0”表示,白色用逻辑“1”表示,从而实现大理石纹的提取。
4.5.4 提取白红比特征的算法描述
S1:将去除背景后的图像中的非白色像素点个数进行统计,比如,图3中的非白色像素点个数计为white=41231个像素点;
S2:将大理石花纹图像中的黑色像素点个数进行像素统计,比如,图5中的黑色像素点个数计为black=11 792个像素点;
S3:计算白红比:
d=black/(white-black)×100%=40.055 708 4%。
在对白红比特征提取系统进行程序设计的过程中往往离不开数据库的支持,也就是说,每一个程序的开发都是需要使用到数据库实现对数据进行保存。点击“保存数据”按钮,计算机则会自动将样本编号、去除背景后的图像、大理石纹图像、去除背景后图像的总像素数量、大理石花纹像素数量以及白红比计算的结果存入数据库。例如,样本2的数据存储结果如图6所示。
本文选取6组样本图像,用上述方法测的各组样本图像的白红比与实测等级的关系见表1。
表1 6组样本图像的白红比与实测等级的关系
为建立图像白红比与实测等级的关系,我们设等级为Y,白红比为X,用描点法画出白红比与实测等级的关系图,见图7。建立的一元线性回归方程为Y=5.195 3-0.064 5X,见图8。结果表明,白红比与图像实测等级呈显著的线性相关,相关系数为-0.99。因此,本白红比特征提取系统有着重要的科学研究价值。
本文是对计算机视觉技术应用于雷山县大固鲁村猪肉进行技术研发的一次尝试,用正确高效的算法实现了白红比无损检测。
该系统的白红比特征结果由根据计算机视觉知识研制而成的白红比特征提取系统软件测定,为雷山县大固鲁村猪肉技术研发提供科研价值,为雷山农畜产品分级带来新方法,为大数据在贵州农畜产品技术研发提供借鉴和参考价值。