吴薇,王宜怀,程曦,郑慕蓉
(1.武夷学院 数学与计算机学院,福建 武夷山 354300;2.认知计算与智能信息处理福建省高校重点实验室,福建 武夷山 354300;3.苏州大学 计算机科学与技术学院,江苏 苏州 215006;4.武夷学院 茶与食品学院,福建 武夷山 354300;5.中国乌龙茶产业协同创新中心, 福建 武夷山 354300)
武夷岩茶属于乌龙茶,其加工制作工艺分初制和精制2大部分。初制主要包括采摘、萎凋、做青、杀青、揉捻、烘干等6道工艺。其中的做青工艺包括交替进行的摇青和静置,是制作武夷岩茶的独特工艺,也是形成武夷岩茶品质和风格的关键技术。
目前做青程度判断主要依靠人工感官经验,即通过查看青叶的表面物理变化来决定下一步做青的具体实施[1~3]。萎凋叶在做青过程中,叶片由绿色变成黄绿色,叶片边缘再慢慢出现红褐色,这是因为叶片中的茶多酚在做青过程中被部分氧化成明黄色的茶黄素,茶黄素进一步氧化成红褐色的茶红素[4~5],若长时间过重做青则会生成颜色更暗的茶褐素,故在做青过程中,主要看叶片的颜色变化[6~8]。
虽然可以通过色泽检测研究青叶颜色变化,但Gagandeep[9]指出,传统的检测手段如理化测定或使用色差计等方法,不仅损害了茶叶的质量,而且扰乱了茶叶的加工环境,对茶叶品质会带来不利影响。而机器视觉技术能实现颜色的无损、实时检测。Gurpreet[10]探讨了通过数码相机获得彩色图像并利用RGB模型来检测茶叶发酵过程的可能性,提出了一种能评估发酵茶叶颜色的算法。Laddi[11]对10个分级茶叶样品进行分析、探讨光照在茶叶样品鉴别中的作用。通过对获得的纹理特征进行主成分分析。结果表明,暗场光照下的判别效果最好。Wang[12]提出了利用茶叶图像彩色直方图和小波包熵的方法设计两个茶叶分类器来增加茶叶分类的精度。Tang[13]结合局部二进制模式和灰度共生矩阵提出一种新的纹理识别方法来区分不同的绿茶鲜叶。Zhu[14]利用BP-MLP和RBF神经网络建立了2个模型,一个是用加工过程中测得的11个参数作为变量,如叶片温度,水分含量等建立感官质量预测模型,另一个是用14个与绿茶有关的参数作为变量,如图像信息等建立感官质量评估模型。研究结果表明,生产过程中测得的叶片温度和含水量能有效地预测绿茶的感官品质,而以绿茶的图像信息为参数也能够有效地评价其感官品质。
因此,本研究通过探索使用机器视觉技术结合人工神经网络的方法,旨在为实现武夷岩茶做青无损检测和做青自动生产线的连续在线监测提供理论依据。
茶鲜叶样本来自武夷山燕子窠产区,为当年5月初采摘的肉桂品种,采摘当日天晴且采摘时间为当日下午14:00~15:00点,采摘的鲜叶均为1芽3~4叶,叶为中开面。该鲜叶经日光萎凋后做青。
基于机器视觉的图像采集系统如图1所示[15]。位于顶部的CMOS数码摄像机有效像素1 800万,镜头选用Teledyne DALSA的Genie Nano C4900工业镜头,最大分辨率4 912×3 684,像元尺寸1.25 μm,工作距离50 cm,光源选用PHILIPS公司的色温为4 100 K的白炽灯且离测试样品高度40 cm,茶叶样本随机选取,堆积并平摊在测试台上,厚度约9 cm。
图1 图像采集系统Fig.1 Image acquisition system
采用武夷山方明茶机械公司生产的型号FM-6CZQ-110滚筒式做青机进行机械摇青。该滚筒式做青机长300 cm,直径110 cm,转速3.3 r·min-1。做青过程步骤见表1。整个过程按吹风→摇动→静置的程序重复进行。先将萎凋叶摇动2 min,静置于做青机内。静置1 h后,进行第2次摇青,摇青时间5 min,静置1.5 h后,进行第3次摇青,方法同前,这样反复6次直到做青达到成熟标准,整个做青历时8.5 h。每一轮摇青、静置结束后拍摄一组图像,每组图像20张,拍摄从投料到结束共7组图像。
表1 做青过程步骤表Table 1 Steps of the green processing
为了加快图像处理速度,将获取到的彩色图像的分辨率采用双线性插值法降低至512*341[16]。
采用RGB和HSI颜色模型[16]来观察做青图像色彩的变化过程。2种颜色模型如图2所示。RGB颜色模型是一种描述人眼对红、蓝、绿光敏感度的基础彩色模式,R、G、B 分别为图像红、绿、蓝的亮度值,值范围为0~255。HSI颜色模型以色调、饱和度和亮度3种基本特征量来感知颜色。H是色调,是描述颜色的属性;S是饱和度,是纯度的度量;I是亮度,反映了人眼对视觉刺激的程度。在HSI模型中,H分量值用弧度表示,变化范围在0到2π之间;S分量值由距离中心轴的半径长度表示,离中心轴越近,S值越小,颜色越浅,H值越不稳定;I分量用沿中心轴方向上的高度表示,反映颜色亮度和灰度级[17,18]。
图2 RGB和HSI颜色空间模型Fig.2 RGB and HSI color space model
利用公式(1)~(3)将图像的RGB值转换为HSI值[19]。
(1)
(2)
(3)
其中
为了能更好地考察做青程度与各颜色分量值之间的关系,试验选择自组织竞争人工神经网络对做青程度进行识别。
自组织竞争神经网络是一种无导师监督的人工神经网络,可以对具有共同特征的数据进行正确的分类,其原理是反复观察、分析和比较给定的样本数据,发现其内在规律。该网络分为输入层和竞争层,其基本思想是竞争层的各神经元通过竞争来获得对输入模式的响应机会[20](图3)。
图3 自组织竞争人工神经网络Fig.3 Self-organized competition artificial neural network
假定输入层由N个神经元构成,竞争层有M个神经元,则网络的连接权值为
网络经过Hebb规则学习后得到权值,并按照“赢者全得”的思想组织竞争过程。在竞争结束后,获胜的神经元只有一个,代表当前输入样本的分类模式,其值为二值向量,状态按式(4)计算。
(4)
若神经元k获胜则其输出值ak=1,若神经元k竞争失败,则其输出值为0,如式(5)所示[21]。
(5)
权值则在竞争后修改为如式(6)所示。
(6)
利用Matlab(2015)软件建立自组织竞争型人工神经网络模型。为加快学习速度,将学习速率设置为0.1,竞争层神经元数目设置为2,调节收敛次数。对140个样本随机选择其中的98个样本(70%)为训练样本,42个样本(30%)为预测样本,每个样本有3个输入颜色分量值,R、G、B或H、S、I值。
采集到的部分原始图像如图4所示。
图4 每一轮摇青和静置后的彩色图像Fig.4 Images after each round of tossing and long staying
经过每一次摇青和静置后的彩色图像的RGB和HSI分量值如图5所示。
图5 经过每一轮摇青和静置后图像的RGB和HSI各分量值Fig.5 Component values after each round of tossing and staying in RGB and HSI model
图4是经日光萎凋后的青叶在做青阶段的变化过程图像。从图4中可看出,青叶呈现堆积状,叶片颜色由几乎都是绿色逐渐变化到开始在叶缘处出现红变直到最后更大面积的红变出现而形成绿叶红镶边,说明颜色是茶叶内含物质在做青过程中发生不同程度降解和氧化聚合的总反映,是茶叶做青过程的重要依据。做青环节的摇青对萎凋叶叶缘造成损伤,导致多酚类物质氧化和缩合形成茶黄素、茶红素和茶褐素。整个做青过程就是茶青叶中的部分茶多酚转化成明黄色的茶黄素,再由茶黄素转化成红褐色的茶红素,最后有极少部分茶红素变成更深的茶褐素的过程。
图5是将图4中的色彩变化用RGB和HSI分量值表示出来。图5(a)和(b)中各有3条曲线,每条曲线中间的标记点是每一轮图像单个颜色分量的均值,标记点的上下界是该轮所有图像颜色分量的最大值和最小值。
图5(a)中R值从较低的状态一直在不断地增加,呈上升的趋势,这表明在这期间茶红素不断生成。但最后一轮做青后,R分量却出现下降,这表明茶红素有少部分转化为茶褐素而使R分量降低。G值在下降一段时间后又显著上升,原因是部分叶绿素转化茶黄素后又转化为茶红素和茶褐素。B值先是上升后下降,然后又上升再下降,不断波动,直到最后做青结束后与刚开始相比,值是下降的。这表明叶片由刚开始较绿,到中间变成黄绿色,然后在叶缘慢慢开始出现红褐色,直到最后更深的红褐色出现,整个图像的颜色到做青结束时最深。
图5(b)中的H值,开始时缓缓上升,这是因为茶黄素的出现,其亮黄色使整个图像的颜色变浅。最后做青结束时,H值突然迅速下降,这表明图像的色相更靠近红色。S值从开始一直下降,直到第5轮时降到最低,但到最后做青结束时却突然上升,这表明图像颜色加深了,与最后一轮做青结束后R值轻微下降和B值迅速下降行程呼应。I值在整个做青过程中波动较小,这表明图像采集时的光源稳定不变且整个过程灰度值变化不大。
采用前述的自组织竞争人工神经网络建模并对数据集的分类结果如图6和图7所示。
图6 采用RGB颜色分量表示的分类结果Fig.6 Classification results represented by RGB color components
图7 采用HSI颜色分量表示的分类结果Fig.7 Classification results represented by HSI color components
由图6和图7可知,自竞争网络成功地对140个样本进行了聚类。图6中对采用RGB颜色分量表示的训练数据进行分类的错误率为18/98=18.36%,同时可以判断出:做青完成的输入样本的激活神经元编号为1,做青未完成的输入为样本的激活神经元编号为2。也就是说,激活了编号为1的神经元的样本属于做青完成的样本,而激活了编号为2的神经元的样本属于做青未完成的样本。在42个测试样本中,117、118、130、131、135、140号样本被错误划分为已完成样本,105、121、126号样本被错误划分为未完成样本,其余33个测试样本都聚类正确,对数据的分类错误率为9/42=21.4%。
同样地,图7中对采用HSI颜色分量值表示的训练数据进行分类的错误率为23/98=23.5%,同时也可以判断出:做青完成的输入样本的激活神经元编号为1,做青未完成的输入为样本的激活神经元编号为2。在42个测试样本中,106、109、115、122、124、126号样本被错误划分为已完成样本,112、120、130、138、139号样本被错误划分为未完成样本,其余31个测试样本都聚类正确,对数据的分类错误率为11/42=26.2%。
试验取得的140个样本以RGB分量值和HSI分量值表示的训练集、测试集分类的正确率分别为81.64%、78.6%和76.5%、73.8%,不同阶段颜色分量值和做青程度的相关系数R2及均方误差MSE值如表2所示。结果表明武夷岩茶萎凋叶在做青过程中获得的彩色图像颜色分量和做青程度高度相关。
表2不同阶段颜色分量值和做青程度的统计表现
Table2 Statistical performance of color components and degree of achievement at different stages
颜色分量Color component训练样本Training set预测样本Prediction setMSER2MSER2运行时间Running timeR、G、B1.472E-20.9291.037E-20.9032.882H、S、I1.765E-10.9001.874E-10.8792.660
对于分类结果存在的误判率,原因讨论如下:
(1)利用自组织竞争人工神经网络进行分类的方法虽然简单易用,但在训练样本数量不够多的情况下,会存在较高的误判率。
(2)可以根据反复测试的结果和已有的先验知识调节网络的训练参数来提高分类的精度与分类的效率。
(3)后续研究可以尝试采用其他的分类方法或考虑图像的光谱特征差异来提高分类结果的精度。
本文研究的目的是通过机器视觉的手段来分析武夷岩茶日光萎凋叶经做青工序后做青的程度与叶面颜色变化之间的关系,试验原理是用2种颜色参数模型RGB和HSI来表达茶鲜叶表面颜色的变化值,建立自组织竞争人工神经网络来预测做青程度,为今后利用机器视觉来监测乌龙茶做青过程提供参考。