陆江锋单春芳裘正军
茶叶外形特征数字化及不同等级茶叶鉴别研究*
陆江锋1单春芳2裘正军3
茶叶是世界三大饮料中最具有生命力、最受消费者欢迎的饮料。随着人们生活水平的提高、健康意识的增强和茶文化的兴起,人们对茶叶数量的需求不断增加,对质量的要求逐渐提高。进入21世纪后,我国茶叶虽然经历了几年的快速增长,但由于国内茶叶品质检测及分级技术比较落后,茶叶品质参差不齐,同时受欧盟、日本等国家和地区绿色技术壁垒的影响,我国茶叶出口难以维持快速增长势头[1-3]。因此亟须提高我国茶叶品质的检测和分级手段,促进茶叶行业的标准化,才能与国际接轨,健全茶叶质量安全体系,实施绿色品牌战略,提高企业的竞争力。
视觉图像检测技术具有快速、无损、客观等特点,在农产品品质检测中有很好的应用前景。本文主要研究采用工业摄像头采集茶叶的图像,通过图像处理技术获得茶叶的外形特征参数,并建立不同等级的茶叶预测鉴别模型,实现茶叶的快速分级。
1.1 仪器设备与软件
试验装置由联想M825E双核计算机、工业摄像头、背光源等组成。工业摄像头采用CMOS传感器,200万像素,最高分辨率为1 600×1 200 DPI,最大帧数为30 FPS,采用USB2.0接口。计算机上安装基于VC++6.0集成开发环境自主研发的外形特征提取软件,实时采集茶叶图像,再经过图像处理,提取茶叶外形特征参数[4],软件功能菜单见图1。
图1 特征参数提取软件功能菜单
1.2 实验材料
从浙江大学紫金港校区教育超市采购浙江龙井四种等级茶叶样本,分别是特级、一级、二级和三级。各等级茶叶随机选择45片共180片作为180个实验样本,再从各等级45个样本中随机抽取30个共120个作为训练集,剩下的60个样本作为预测集。
1.3 图像处理方法
1.3.1 灰度的阈值变换
灰度的阈值变换可以将一幅灰度图像转换成黑白二值图像。其变换函数表达式如下:
式中T为指定的阈值。
灰度阈值变换的操作过程是由用户指定一个阈值,如果图像中某像素的灰度值小于该阈值,则将该像素的灰度设置为0(黑),否则灰度值设置为255(白)。本文研究中设置阈值为50的灰度阈值变换前后的茶叶图像如图2所示。
图2 阈值为50的灰度阈值变换前(左)后(右)的图像
1.3.2 区域标记
图3 二值图像区域标记前(左)后(右)效果图
二值图像区域标记的目的是为了对同一幅茶叶图像中的多片茶叶进行标记,然后根据标记的不同,分别求出各片茶叶的特征参数。茶叶二值图像的区域标注非常重要,直接关系到提取茶叶特征参数的效率。如果没有区域标注,只能提取单片茶叶的特征参数,效率非常低;使用了区域标注后,就可以多片茶叶同时提取,极大地提高了提取效率。本文采用八邻域标记算法区域标记前后图像见图3,图中显示了茶叶原图(左)和区域标记后的茶叶效果图(右),其数字标号即为各片茶叶所在区域像素的灰度值。
1.3.3 边界跟踪
边界跟踪能够准确地提取茶叶图像的轮廓,便于获得茶叶的周长信息。周长有两种算法:一种直接以软件统计出来的像素个数表示,记为周长1;另一种情况考虑到边界跟踪法跟踪出来的边界难免出现对角黑像素的情况,因此,以个像素作为它们之间的距离,记为周长2。利用边界跟踪法进行轮廓跟踪前后的茶叶图像见图4。
图4 边界跟踪法进行轮廓跟踪前(左)后(右)茶叶图像
1.3.4 小区域消除
小区域消除是指在计算出一副茶叶图像中所有区域的面积的基础上,指定一个面积数值,消除图像中所有小于该面积的图像块,该方法主要用于消除明显不是茶叶的图像噪音。小区域消除前后图像见图5,原图(左)中左右各有一黑点噪音,经小区域消除后黑点噪音消除(见右图)。
图5 小区域消除前(左)后(右)图像
2.1 人工神经网络模型
人工神经网络是模仿生理学中人的大脑神经处理信息的方式,对信息进行并行处理的一种信息处理网络系统。利用神经网络系统具有的强大学习功能,可以对一些看似杂乱无章的实验数据整理出内在规律,建立分析同类事物的网络,解决分类、预测、优化等问题[5]。
2.2 基于BP神经网络的茶叶预测模型建立及预测结果
将120片训练集茶叶样本的面积、周长1、周长2、NCI比(周长除以总面积的平方根)、形状复杂性、圆形度(D)、等价圆直径、圆的形状系数、线长、椭圆长轴、椭圆短轴、椭圆形状系数、长方形度共13项特征参数经标准化变换后作为BP神经网络的输入,建立了一个3层的人工神经网络结构,各层传递函数都用S型(Sigmoid)函数。网络输入层节点数为13,隐含层节点数为13,输出层节点数为1,目标误差为0.000 1,学习速度为0.1,设定训练迭代次数为1 000次。训练结果为120个建模样本的拟合残差为1.314×10-2,建立了预测模型。
用建立的预测模型对未知的60个样本进行预测鉴别,结果如表1所示,60个预测样本中51个样本预测值经四舍五入取整处理后预测正确,有9个预测样本 (10、15、27、29、34、38、42、50、57号样本)预测错误,预测准确率达到85%。
表1 BP神经网络模型对未知样本预测结果
本研究搭建了一套机器视觉系统实现茶叶图像的实时采集,采用自主研发的软件提取了13项茶叶外形特征参数,并建立了基于BP神经网络的茶叶等级预测模型,对特级、一级、二级和三级共四个等级浙江龙井茶叶进行预测鉴别,预测准确率达到85%,误判的15%也是处于上下等级中模棱两可之间的茶叶,基本能够满足快速分级要求。因此本文研究表明利用机器视觉技术,通过建立基于BP神经网络的茶叶等级预测模型对浙江龙井茶叶进行快速分级是可行的,如能将其真正应用于茶叶生产中将有利于茶叶行业的标准化,提高企业的竞争力,打破发达国家绿色技术壁垒。
[1]刘华杰.我国茶叶出口遭受技术性贸易壁垒影响的原因分析[J].商,2014(2):293-293
[2]蓝林.浅谈我国茶叶出口应对绿色壁垒的生存之道[J].现代商业,2014(11):36
[3]陈虹菲,曹越.浅议中国茶叶出口贸易的现状问题[J].北方经济,2014(6):56-57
[4]刘洋,卫洪春,杜诚.VC++6.0在灰度数字图像增强处理中的应用[J].计算机与信息技术,2006(9):75-79
[5]葛哲学,孙志强.神经网络理论与MATLAB2007实现[M].北京:电子工业出版社,2007
作者信息:1实验师,浙江大学生物系统工程与食品科学学院,310058;2软件设计师,深圳市潮流网络技术有限公司杭州分公司,310012;3教授、博导,浙江大学生物系统工程与食品科学学院,310058:杭州
浙江省教育科研项目(Y201328805)