宋华鲁,闫银发,2,宋占华,2,孙君亮,李玉道,李法德,2
·农产品加工工程·
利用介电参数和变量筛选建立玉米籽粒含水率无损检测模型
宋华鲁1,闫银发1,2,宋占华1,2,孙君亮1,李玉道1,李法德1,2※
(1. 山东农业大学机械与电子工程学院,泰安 271018; 2. 山东省园艺机械与装备重点实验室,泰安 271018)
为了实现玉米含水率的快速无损检测,该文利用精密阻抗分析仪和自制介电参数测量传感器通过激励电压在1 kHz~5.462 MHz频率范围内测量了热风干燥过程中不同含水率与不同温度下玉米籽粒的介电常数'和介电损耗"。通过对双介电参数频谱的分析,对含水率回归模型建模频段进行了初步选择,以1.072~5.462 MHz之间15个测量频点的双介电参数和温度值共计31维变量作为支持向量回归机(support vector regression,SVR)模型的输入全变量,分别利用竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、迭代保留信息变量算法(iteratively retains informative variables,IRIV)和CARS-IRIV联合算法筛选特征变量,建立全变量、CARS、IRIV和CARS-IRIV筛选特征变量与玉米籽粒含水率的SVR模型。引入鲸鱼优化算法(whale optimization algorithm,WOA)优化SVR模型参数(惩罚因子)和(核函数参数),结果表明CARS-IRIV筛选特征变量('3.854MHz、"3.854MHz、'5.462MHz、"5.462MHz、)建立的SVR模型经WOA优化后(CARS-IRIV-WOA-SVR)具有最优的预测精度,预测集决定系数、预测集均方根误差和剩余预测偏差分别为0.998 4,0.40%和24.55,且模型复杂度最低。该研究为基于双介电参数和支持向量回归机实现玉米含水率快速无损检测提供了新的研究思路和基础数据。
无损检测;算法;水分;双介电参数;竞争性自适应重加权算法;迭代保留信息变量算法;鲸鱼优化算法
谷物含水率是评价谷物质量的重要指标,也是谷物收获、加工和储存等过程中需要检测的关键参数[1-3]。谷物含水率的检测技术手段主要分为直接法和间接法,直接法是对谷物中的水分含量进行直接测量,包括烘箱干燥法、红外干燥法和卡尔·费休滴定法等,多在实验室内进行,较难实现谷物含水率的在线实时测量,其中,烘箱干燥法为谷物含水率测量国家标准采用的方法;间接法为通过测量谷物与水分含量相关的特定物理参数,并结合特定物理参数与谷物水分含量之间的对应关系实现含水率的检测[4]。国内外学者围绕声学法[5]、摩擦力法[6]、压力法[7]、电学法[8]、中子法[9]、核磁共振法[10]以及光谱法[11]等对谷物含水率检测技术与仪器开发已进行了许多研究。综合分析应用场合、测量精度、实现难易程度以及成本等方面,应用电学法的谷物含水率检测技术与设备研究较为普遍,按照测量过程中是否产生谷物籽粒损伤分为有损检测(电阻法)和无损检测(电容法、射频介电法和微波法等)。早在20世纪初,国外学者就发现小麦电阻的自然对数随着含水率的增加而线性减小,并基于此研发了电阻式谷物含水率测量装置[12]。在20世纪20年代,国外研究人员已经开始通过测量电容对谷物含水率进行检测,之后许多学者针对电容法谷物含水率装置与技术等做了广泛研究[13]。直到20世纪50年代,Nelson等开始对谷物复介电特性与其含水率、容积密度、温度和测量频率等影响因素之间的关系进行研究[14]。Nelson等对基于谷物的复介电常数实现谷物含水率的检测进行了持续研究,测量频率涵盖射频和微波[15],涉及谷物包括小麦[16]、花生[17]、玉米[18]等。国内学者李长友[19]和吴会昌等[20]基于电阻法开发了谷物含水率单粒在线检测设备,并通过采样机构优化、压辊优化、创新电路设计和信号处理方法等措施提高含水率测量的准确性和可靠性,但电阻法属于破坏性测量,测量过程中会碾压损伤籽粒。针对电容式谷物含水率测量技术问题国内学者在改进传感器形式[21]、优化信号测量方法[22]及回归拟合算法[23]等方面进行了积极探索。郭文川等通过测量薏米[24]、红小豆[25]和燕麦[26]等谷物的复介电参数及交流阻抗等对其含水率进行了检测。谷物复介电常数包括介电常数'和介电损耗",其均与谷物含水率、容积密度和温度密切相关[27],通过对谷物双介电参数的同时测量及融合处理可提高谷物含水率测量精度[28-29]。
近年来,随着机器学习的飞速发展,采用机器学习算法代替传统数学统计方法进行模型构建正在兴起[30-31]。支持向量回归机(support vector regression,SVR)是一种基于统计学习理论的机器学习方法,其核心思想是通过“核函数映射”将样本空间映射到高维的特征空间利用风险最小化原理构建决策函数,适用于解决样本数量少、维数高的非线性问题[32]。SVR模型参数(如惩罚因子和核函数参数)对模型的性能有显著影响,且选择困难,在建模过程中常引入参数优化算法进行SVR模型参数的优化[33]。
本文对新收获高水分不同品种的玉米进行热风干燥,测量干燥过程中玉米籽粒的双介电参数、温度和容积密度等数据随时间的变化,采用SVR建立玉米籽粒含水率快速无损检测模型,基于竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)、迭代保留信息变量算法(iteratively retains informative variables,IRIV)和CARS-IRIV联合算法筛选特征变量,降低模型复杂度,引入新型智能优化算法-鲸鱼优化算法(whale optimization algorithm,WOA)[34]对SVR模型的参数进行智能优化,提高玉米含水率SVR回归模型精度。本研究为基于双介电参数和支持向量回归机实现玉米含水率快速无损检测提供了新的研究思路和基础数据,为智能谷物含水率快速无损检测仪器开发奠定基础。
试验所用玉米为山东农业大学农学试验站2017年秋季新收郑单958和登海605,利用4目筛网对新收玉米籽粒进行筛选,剔除碎粒和杂物等,将清选后的玉米籽粒装进纱网袋中并放置在4 ℃冰箱进行储存备用,储存备用过程中每天进行3次翻动以平衡水分。新收玉米籽粒初始物性参数如表1所示。
表1 玉米籽粒物性参数
1.2.1 介电参数测量
玉米双介电参数测量系统示意图如图1所示。测量系统主要由计算机、阻抗分析仪(65120B,Wayne Kerr,英国)、数据采集器(HP34970A,惠普,美国)、自制双介电参数测量传感器和自制保温水套组成。
加装保温水套的双介电参数测量传感器如图2所示。该双介电参数传感器的介电测量容腔由2个同心放置不同直径的不锈钢筒状电极组成,在内电极两端设计有等位环电极以消除边缘效应,等位环电极与内电极之间利用厚度为1 mm聚四氟乙烯垫圈相隔,在传感器外围设计有屏蔽电极,增强传感器抗干扰能力,提高测量精度和稳定性。内外电极以及屏蔽电极等通过聚四氟乙烯材质的支撑件进行嵌套装配[35]。传感器设计有T型热电偶温度传感器,通过数据采集器对玉米籽粒温度进行连续测量。
1. 阻抗分析仪 2. 计算机 3. 数据采集器 4. 保温水套 5.双介电参数测量传感器
1.温度传感器 2.保温水套 3.排水口 4.屏蔽电极 5.外电极 6.等位环电极 7.分料锥 8.隔离垫 9.进水口 10.内电极
测量玉米籽粒双介电参数时,将玉米籽粒从顶端注入双介电参数测量传感器,内电极支撑柱顶端设计有分料锥以便于玉米籽粒在传感器内部实现均匀分布。传感器底部出口利用亚克力板进行封堵,测量结束时,将亚克力板抽出以便将玉米籽粒从底部放出。
测量开始前先对阻抗分析仪预热1 h,之后利用厂家标准件进行全频段(20 Hz~120 MHz)校准和补偿,将双介电参数传感器电极引出SMA连接线和测量治具(1002,Wayne Kerr,英国)相连,其中外电极作为激励电极与测量治具的高电位端相连,内电极作为响应电极与测量治具的低电位端相连。阻抗分析仪与双介电参数传感器连接电气原理图如图3所示[36]。
1.激励电极 2.玉米籽粒 3.响应电极
1.Actuation electrode 2.Corn kernel 3.Sensing electrode
注:图中Vs为激励电压源,Vstd为标准检测电阻电压,Vmut为被测物料电压,I为被测物料电流。
Note: Vswas the voltage source, Vstdwas the voltage of standard test resistance, Vmutwas the voltage of materials under test, Imutwas the current of materials under test.
图3 介电参数测量电气原理图
Fig.3 Electrical principle drawing
通过软件(WKE Factory View,Wayne Kerr,英国)设定阻抗分析仪连续采集1 kHz~5.462 MHz对数坐标等间距选取的75个频率点下的并联电容和电导(分别采集空载和满载),通公式(1)、(2)和(3)计算得出玉米籽粒的双介电参数和介质损耗角正切值tan[16]。
式中'为玉米籽粒介电常数;"为玉米籽粒介电损耗;0为真空绝对介电常数,0=8.85×10-12F/m;m为传感器盛满玉米籽粒时所测电容值, F;e为传感器空载时所测电容值,F;a为传感器空载时理论计算值,计算得a=10.45×10-12F;为电极容腔长度,=0.12 m;为响应电极外径,=0.019 m;为激励电极内径,=0.036 m;m为传感器盛满玉米籽粒时所测电导值, S;e为传感器空载时所测电导值,S;为测量频率,Hz;tan为介质损耗角正切值。
1.2.2 玉米测量试样制备
利用自制热风干燥试验台对新收高水分玉米籽粒进行烘干以便获取不同温度和不同含水率的玉米试样。自制热风干燥试验台如图4所示。
1.2.3 玉米籽粒真实体积测量
对干燥前后的玉米籽粒进行采样,使用比重瓶法结合甲苯溶液测量百粒玉米籽粒的平均真实体积[37],测量3次取平均值。记录干燥前百粒平均真实体积为0,干燥后百粒平均真实体积为1,按照公式(4)计算真实体积收缩率
1.热风温度传感器 2.温控仪 3.电热管加温室 4.送风机 5.热风干燥室 6.出风口
1.Temperature sensor 2.Temperature controller 3.Electro-thermal tube chamber 4.Forced draft fan 5.Drying room 6.Outlet chamber
图4 热风干燥试验台示意图
Fig.4 Diagram of hot-air dryer
1.2.4 测量步骤
试验前将玉米籽粒从冰箱中取出,放置在室温下平衡5 h备用。按照1.2.1所述方法预热阻抗分析仪并进行校准补偿,测量空载电容频谱和空载电导频谱。开启热风干燥试验台试验设置所需热风温度对热风干燥室进行预热。开启保温水套连接的恒温水浴锅(HWY-10,上海昌吉地质仪器有限公司,中国),设置与热风温度相同的循环水浴温度,对介电参数测量传感器进行保温预热。试验参数设置如表2所示。
表2 试验参数
注:热风风速恒定为1 m·s-1。
Note: Velocity of hot air was 1 m·s-1.
用电子天平(TC-6K,精度0.1 g,双杰兄弟集团有限公司,美国)称量空干燥托盘的质量,将玉米籽粒均匀撒入干燥托盘,直至玉米籽粒净质量达2 kg左右,记录干燥托盘和玉米籽粒总质量。将干燥托盘放入热风干燥室开始进行烘干。每隔20~30 min将干燥托盘从烘箱中取出,称量此时的玉米籽粒和干燥托盘总质量,将玉米籽粒从传感器顶部入口倒入直至装满传感器空腔,称量剩余玉米籽粒和干燥托盘总质量(结合传感器空腔体积可得知玉米籽粒容积密度),之后测量玉米籽粒温度和介电参数频谱(测量3次,取均值),测量结束后将玉米籽粒收集至干燥托盘并将其放入热风干燥室继续烘干等待下一次测量。当相邻2次称量玉米籽粒质量差小于2 g时停止热风烘干及测量。
对热风烘干结束时的玉米籽粒采用105 ℃标准烘干法进行含水率测定[38],计算玉米籽粒干物质质量。根据玉米籽粒干物质质量和每次测量得到玉米籽粒质量可计算得到进行玉米籽粒介电参数测量时的玉米籽粒含水率(测量3次,取均值,文中所述含水率均为湿基含水率)。
以选定频段内的双介电参数等变量作为模型输入全变量,分别利用竞争性自适应重加权算法(CARS)、迭代保留信息变量算法(IRIV)和CARS-IRIV联合算法筛选特征变量,建立全变量、CARS、IRIV和CARS-IRIV筛选特征变量与玉米籽粒含水率的SVR回归模型。引入鲸鱼优化算法(WOA)优化SVR模型参数(惩罚因子)和(核函数参数)。
1.3.1 SPXY样本集划分
本文采用SPXY(sample set partitioning based on joint-distances)算法对样品集进行划分,以保证有效覆盖多维向量空间,最大程度表征样本分布,提高模型的稳定性[39]。
1.3.2 迭代保留信息变量算法
IRIV是一种基于二进制矩阵重排过滤器提出的特征变量选择算法,其将所有变量分为强信息变量、弱信息变量、无信息变量、干扰变量4类[40]。IRIV算法经过多次迭代保留强信息变量和弱信息变量,消除无信息变量和干扰变量,最后通过反向消除选取最佳变量集。
1.3.3 竞争性自适应重加权算法
CARS是模仿达尔文进化论中“适者生存”的原则,以偏最小二乘(partial least squares,PLS)回归模型回归系数的绝对值作为每个变量重要性评价指标,以迭代和竞争的方式从多次蒙特卡罗采样(monte carlo sampling,MCS)中顺序选择变量子集,在每次采样中结合指数衰减函数(exponentially decreasing function,EDF)和自适应重加权采样(adaptive reweighted sampling,ARS)执行变量选择,选择交叉验证均方根误差(root mean square error of cross-validation, RMSECV)最小的变量子集作为最优变量集合[41]。
1.3.4 鲸鱼优化算法支持向量回归机
本研究选择稳定性较好、精度较高的径向基函数(radial basis function,RBF)作为SVR回归模型的核函数,引入WOA对SVR模型的惩罚因子和核函数参数进行智能寻优。WOA是一种较为新颖的群智能优化算法,其通过模拟座头鲸群圈记猎物、Bubble-net攻击(收缩包围机制和螺旋位置更新)以及随机搜索的捕食策略实现优化搜索,采用WOA算法对SVR的参数和进行寻优并建立预测模型步骤如下[42]:
1)参数初始化。对校正集和预测集进行归一化处理,设置WOA种群个体数量和迭代次数,设定和的寻优范围。
2)初始化鲸鱼种群位置向量(,),按照个体位置中的和建立校正集SVR模型,以SVR模型的交叉验证均方根误差作为种群内鲸鱼个体的适应度,选取适应度最小的鲸鱼作为当前最优鲸鱼位置。
3)以当前最优鲸鱼位置作为搜索代理,执行圈记猎物、Bubble-net攻击和随机搜索的捕食策略更新鲸鱼种群位置向量。
4)计算每个鲸鱼个体新位置的适应度值,并与上一次迭代最小适应度值比较,选择其中具有最小适应度值的鲸鱼个体位置作为最优鲸鱼位置。
5)重复步骤3和4,当迭代次数达到设定值时,输出的全局最优鲸鱼位置即为SVR模型中和的最优值。
6)采用优化后的和建立SVR回归模型。
图5为试验品种在不同热风温度下玉米籽粒干燥过程含水率、容积密度和温度随时间变化曲线。
图5 不同热风温度下玉米籽粒干燥特性和玉米籽粒容积密度以及温度随干燥时间变化曲线
图5a为不同热风温度下玉米籽粒干燥特性曲线,在干燥初始阶段,玉米籽粒含水率下降速率随着热风温度的升高而增加。
图5b为不同热风温度下玉米籽粒容积密度随时间变化曲线,由图可以观察到,玉米籽粒容积密度随着干燥时间先上升后下降。在玉米籽粒装填方式无较大差别的前提下,玉米籽粒容积密度发生变化的原因主要为干燥过程中玉米籽粒水分散失所引起的玉米籽粒体积收缩和质量减少。在干燥初始阶段,随着玉米籽粒水分的散失,玉米籽粒质量减少,但是玉米籽粒的真实体积收缩明显,传感器空腔内盛放的玉米籽粒数量增加,使得玉米籽粒容积密度上升。
随着玉米籽粒水分的进一步散失,玉米籽粒真实体积收缩减缓,传感器空腔内所盛放的玉米籽粒数量差别减小,玉米籽粒质量的减少造成了玉米籽粒容积密度的下降。表3为干燥前后玉米籽粒百粒真实平均体积对比,2个品种百粒真实平均体积无明显差别。
表3 烘干前后玉米籽粒百粒真实平均体积对比
注:郑单958烘干初始含水率为38.44%±0.92%,烘干结束含水率为5.43%±0.47%。登海605烘干初始含水率为40.57%±0.21%,烘干结束含水率为5.41%±0.24%;热风温度为55 ℃。
Note: Initial wet basis moisture content of Zhengdan958 was 38.44%±0.92%, the final wet basis moisture content of Zhengdan958 was 5.43%±0.47%. The initial wet basis moisture content of Denghai605 was 40.57%±0.21%, the final wet basis moisture content of Denghai605 was 5.41%±0.24%. The temperature of the hot-air was 55 ℃.
图5c为不同热风温度下玉米籽粒温度随时间变化曲线,在干燥初始阶段,玉米籽粒温度上升速率随着热风温度的升高而增加。
从图5中可以看出,不同品种玉米籽粒在干燥过程中含水率、容积密度和籽粒温度等变化趋势基本一致。
图6为热风温度45 ℃干燥过程中不同含水率玉米籽粒(郑单958)的介电常数和介电损耗频谱。
由图6a可知,不同含水率玉米籽粒的介电常数'随着频率的增加而下降,在低频段介电常数的下降趋势更为显著。
单个玉米籽粒作为生物体是由不同组分构成的非均质材料,因此可将玉米籽粒群视为由非均质材料构成的非均匀混合体系进行介电性能分析。由介质极化理论可知,在测量频率段内玉米籽粒的介电性能是离子电导、界面极化等多种机制共同作用的结果[43]。在测量频率范围内,玉米籽粒内部相界面、玉米籽粒颗粒群内部不均匀区域都会发生界面极化,即自由电荷在相界面或者不均匀区域积聚从而产生宏观偶极矩,这在一定程度上可以等效为偶极取向型极化。随着频率增加,等效偶极子取向极化趋于减缓,表现为介电常数随频率的升高而减小[43]。根据水分的结合状态可将玉米籽粒内部水分分为自由水、弱结合水和强结合水[44]。有研究表明,射频段纯水的介电常数在80左右,而同频段谷物干物质的介电常数小于3,因此水分是影响谷物介电性能的主要因素[45]。
在试验的全频段内,玉米籽粒的介电常数¢值随着含水率的降低而减小。含水率的降低导致玉米籽粒内极化分子的减少,因此玉米籽粒的介电常数随含水率的减少而降低。在较低测量频率(如1 kHz)介电常数的值较大,且随含水率的减少下降尤为明显,这是由于较低频率时,荷电离子等宏观堆积在与玉米籽粒接触的电极界面而出现电极极化,造成体系电容量的急剧增加[43]。
注:样品品种为郑单958,热风温度为45 ℃。
由图6b可知,玉米籽粒的介电损耗"随频率变化曲线较为复杂,低含水率玉米籽粒介电损耗"随频率的增加呈现先增大后减小的趋势,且在1 kHz~1 MHz内可观察到一个弛豫峰。高含水率玉米籽粒介电损耗"随测量频率的增加而减小。在全频段内,玉米籽粒介电损耗"值随着含水率的降低而减小。在试验频率范围内,玉米籽粒介电损耗来源主要是离子传导、界面极化[46]。离子传导引起的介电损耗随着频率的升高而减小,界面极化引起的介电损耗随频率的升高呈先增大后减小的趋势,即在一定频率范围内(1 kHz~1 MHz)可观察到界面极化弛豫峰[47]。高含水率玉米籽粒中存在更多可溶解离子的自由水,由离子传导引起的介电损耗下降占主导地位,界面极化等弛豫峰被掩盖。在热风干燥过程中,玉米籽粒中的自由水逐渐被去除,即低含水率玉米籽粒中界面极化等引起的介电损耗占主导地位,因此可以观察到弛豫峰。
在试验频段内,登海605和混合样品玉米籽粒介电常数¢值和介电损耗"值与图6所示郑单958的介电常数与介电损耗频谱变化趋势一致,限于篇幅限制未一一列出。
图7显示了热风干燥过程中不同含水率玉米籽粒(郑单958)介质损耗角正切值tan频谱。
图7 不同含水率玉米籽粒介质损耗角正切值频谱
由图7可知,低水分玉米籽粒的介质损耗角正切值随测量频率的增加呈现先增大后减小的趋势,高水分玉米籽粒的介质损耗角正切值随测量频率的增加而减小。介质损耗角正切值的物理意义为单位周期内介质损耗能量与介质储存能量的比值,可以从能量角度表征介质损耗大小,在一些情况下,介质损耗角正切值对介质特性的变化更为敏感[48]。
图8显示了测量频率为5.462 MHz时不同热风温度下玉米籽粒介质损耗角正切值tan和dtan/d随含水率变化曲线。由图8可知,玉米籽粒介质损耗角正切值随含水率的降低而减小(图8a),介质损耗角正切值对含水率的一阶导数dtan/d随含水率的降低呈现明显的分段趋势(图8b),推测这与干燥过程中玉米籽粒水分赋存状态变化有关。
在干燥初始阶段(含水率约35%~25%)玉米籽粒群损失的主要是自由水,随着含水率的降低,自由水中溶解的离子活动性减弱,离子运动引起的能量损耗降低,导致了dtan/d随含水率的降低呈明显下降趋势;随着含水率的继续降低(含水率约25%~10%),玉米籽粒群失去的主要是弱结合水,弱结合水引起的能量损耗随含水率的降低基本未变;随着含水率的进一步降低(含水率约小于10%),弱结合水持续损失的同时有可能存在着弱结合水向强结合水的转化[49],从而导致dtan/d随含水率的降低呈现先上升后下降的趋势。这为利用介电频谱数据分析干燥过程中谷物籽粒水分赋存状态变化提供了新的研究思路。
图8 不同热风温度下玉米籽粒介质损耗角正切值tanδ和dtanδ/dM随含水率变化曲线
本文以225个(郑单958、登海605和混合样本各75个)不同含水率样本建立SVR回归模型。通过前文中对于玉米籽粒介电参数的分析可以得知不同含水率玉米籽粒介电参数的差异随着测量频率的增加而减小,在较低频率下存在多数量级的差异且介电参数变化机理较为复杂,为获得更优的建模预测效果,本文以1.072~5.462 MHz之间15个测量频点的双介电参数和温度值共计31维变量作为SVR回归模型的输入全变量,分别采用CARS、IRIV和CARS-IRIV联合算法进行特征变量筛选简化模型,引入WOA鲸鱼优化算法优化SVR模型参数,提高模型预测精度。
采用SPXY样本划分方法,将225个不同含水率样本按照2:1的比例划分为校正集与预测集,划分结果如表4。从表4可以看出,校正集样品的含水率范围完全覆盖预测集的数据,表明样品集划分合理。
表4 样本参数表
3.2.1 CARS特征变量筛选
本文将CASR算法中蒙特卡罗采样运行的次数设置为50次,通过5折交叉验证建立的PLS回归模型中RMSECV最小值确定最优变量集合。图9为CARS选择变量数与RMSECV值随采样次数增加的变化趋势。CARS算法筛选的特征变量结果如表5所示。
表5 CARS、IRIV和CARS-IRIV筛选特征变量结果
注:′和″分别表示玉米籽粒的介电常数和介电损耗,介电常数和介电损耗的下标,如5.462表示测量频率为5.462 MHz;代表玉米籽粒温度。
Note:′和″stand for dielectric constant and dielectric loss of corn seed, respectively. The subscript of the dielectric constant and dielectric loss, such as 5.462, indicates that the measured frequency was 5.462 MHz;is the temperature of the corn seeds.
由图9可以看出,前10次蒙特卡罗采样中变量个数下降较快,随后下降趋势变缓,说明算法在变量筛选过程中存在着“粗选”和“精选”2个过程。随着蒙特卡罗采样次数的增加,PLS模型RMSECV值呈现先下降后上升的趋势,在蒙特卡罗采样次数增加至20时(图中竖线标示处)RMSECV下降到最小值,表明部分与玉米籽粒含水率无关的或者部分共线的信息被剔除。之后随着蒙特卡罗采样次数的增加,RMSECV逐渐上升,表明一些与含水率相关的信息被剔除。最终经CARS算法筛选得到11个特征变量,占全变量个数的35.48%。
3.2.2 IRIV特征变量筛选
本文采用5折交叉验证PLS回归模型的RMSECV作为评价指标选择特征变量,PLS回归模型中最大主因子数为10。如图10所示,经过4次迭代将31个变量缩减到17个,反向消除10个,最终得到7个特征变量,占全变量个数的22.58%。IRIV选取的特征变量结果如表5所示。
图9 CARS选择变量数与RMSECV值随蒙特卡罗采样运行次数增加的变化趋势
图10 IRIV迭代保留变量个数
3.2.3 CARS-IRIV特征变量筛选
考虑到CARS选择的特征变量较多,而且蒙特卡罗采样过程具有随机性,可能存在无关变量没有完全消除的情况,而IRIV算法在经过多次迭代后可以较稳定保留强有效变量信息但计算量相对较大[50]。鉴于此,本文提出将CARS筛选的特征变量作为IRIV算法的输入变量作进一步筛选处理,减少CARS算法产生的随机性问题和IRIV算法带来的计算量大问题,提高模型预测精度。CARS-IRIV联合算法将CARS筛选的11个特征变量经过1次迭代后经反向消除筛选出5个特征变量,仅占全变量个数的12.90%。
分别以全变量、CARS、IRIV和CARS-IRIV联合算法筛选的特征变量作为输入自变量,以玉米籽粒含水率作为输出因变量建立SVR回归模型(Full-SVR,CARS-SVR、IRIV-SVR和CARS-IRIV-SVR),模型参数和选择为默认值,建模结果如表6所示。
从建模变量筛选来看,基于特征变量的CARS-SVR、IRIV-SVR和CARS-IRIV-SVR模型预测效果与全变量回归模型FULL-SVR相比均有不同程度的提升,其中CARS-IRIV-SVR效果最佳,预测集决定系数P2和预测集均方根误差RMSEP分别为0.978 9和2.12%,P2较FULL-SVR提高了0.028 9,RMSEP降低了1.20%,剩余预测偏差(residual predictive deviation,RPD)由2.46提高到3.92。从回归模型复杂度来看,CARS、IRIV和CARS-IRIV联合算法都极大地简化了模型,变量个数分别减少了64.52%、77.42%和83.87%。结果表明,筛选的特征变量为玉米籽粒含水率回归模型的有效变量,在减少模型计算量的同时,预测效果并没有降低,经CARS-IRIV联合算法筛选特征变量建立的SVR回归模型可以更好的预测玉米籽粒含水率。
虽然CARS-IRIV-SVR模型具有较高的P2,但其RMSEP仍较大,表明模型预测精度仍可以获得较大提高。采用WOA算法对SVR回归模型参数和进行智能寻优。WOA优化算法中种群个体数量和迭代次数对寻优性能有重要影响,TE和较大时可明显提高参数寻优过程中的全局搜索能力,但会增加运行时间,同时当TE和增加至一定值时,TE和对寻优性能的提升作用不再显著,通过反复试验结果分析,本文中将WOA种群个体数量设置为100,迭代次数TE设置为50。经WOA算法优化后的全变量、CARS、IRIV和CARS-IRIV联合算法筛选的特征变量建模结果(FULL-WOA-SVR、CARS-WOA-SVR、IRIV-WOA-SVR和CARS-IRIV- WOA-SVR)如表6所示。
表6 SVR建模结果
分析表6结果可知经WOA算法优化后不同SVR回归模型预测精度均得到提升,其中基于CARS-IRIV联合算法筛选特征变量建立的SVR回归模型经WOA优化后(CARS-IRIV-WOA-SVR)预测效果最佳,预测集决定系数P2、预测集均方根误差RMSEP和剩余预测偏差RPD分别为0.998 4,0.40%和24.55。CARS-IRIV-WOA-SVR模型预测结果如图11所示,预测含水率分布在=回归线附近,预测结果较好,因此选择CARS-IRIV-WOA-SVR回归模型作为玉米籽粒含水率无损检测模型。
图11 CARS-IRIV-WOA-SVR模型预测含水率和烘箱实测含水率对比
在1 kHz~5.462 MHz频率范围内不同含水率玉米籽粒的介电常数′随测量频率的增大而减小;低含水率玉米籽粒介电损耗²随频率的增加呈现先增大后减小的趋势,1 kHz~1 MHz频率范围内可观察到界面极化弛豫峰,高含水率玉米籽粒介电损耗"随测量频率的增加而减小。
低水分玉米籽粒的介质损耗角正切值随测量频率的增加呈现先增大后减小的趋势,高水分玉米籽粒的介质损耗角正切值随测量频率的增加而减小。5.462 MHz测量频率下玉米籽粒介质损耗角正切值随含水率的降低而减小,dtan/d随含水率的降低呈现明显的分段趋势,推测这与干燥过程中谷物籽粒水分赋存状态变化有关。
通过双介电参数频谱分析,对玉米籽粒含水率回归模型建模频段进行了初步选择,以1.072~5.462 MHz之间15个测量频点的双介电参数和温度值共计31维变量作为SVR回归模型的输入全变量,基于、CARS、IRIV和CARS-IRIV联合算法筛选特征变量。分别建立全变量、CARS、IRIV和CARS-IRIV筛选特征变量与玉米籽粒含水率SVR回归模型,引入WOA鲸鱼优化算法优化SVR模型参数和,经反复试验将WOA种群个体数量设置为100,迭代次数TE设置为50。结果表明基于CARS-IRIV联合算法筛选特征变量建立的SVR回归模型经WOA优化后(CARS-IRIV-WOA-SVR)预测效果最佳,预测集决定系数P2、预测集均方根误差RMSEP和剩余预测偏差RPD分别为0.998 4,0.40%和24.55。
本文选择CARS-IRIV-WOA-SVR作为玉米籽粒含水率无损检测模型,后续研究中可推广应用于其他谷物含水率的快速无损检测,同时可针对提高WOA算法全局优化性能进行深入研究进一步提升模型预测性能。
[1] 张亚秋. 粮食干燥过程水分检测与自动控制[D]. 长春:吉林大学,2012.
Zhang Yaqiu. Moisture Detection and Automatic Control of Grain Drying Process[D]. Changchun: Jilin University, 2012. (in Chinese with English abstract)
[2] 蒋玉英. 电磁波仓外探测小麦水分含量反演研究[D]. 郑州:河南工业大学,2010.
Jiang Yuying. Inversion Study on Detecting Wheat Moisture Content Outside the Granary by Electromagnetic Wave[D]. Zhengzhou: Henan University of Technology, 2010. (in Chinese with English abstract)
[3] 方建卿. 联合收割机谷物含水率在线测量技术研究[D]. 北京:中国农业大学,2005.
Fang Jianqing. Research on Real Time Measurement Technology for Grain Moisture Content on Combine Harvester[D]. Beijing: China Agricultural University, 2005. (in Chinese with English abstract)
[4] 翟宝峰,郭宏林,许会. 粮食水分检测技术的综合分析及发展概况[J]. 沈阳工业大学学报,2001,23(5):413-416.
Zhai Baofeng, Guo Honglin, Xu Hui. Synthetic analyses and development survey of moisture measuring technology of grain[J]. Journal of Shenyang University of Technology, 2001, 23(5): 413-416. (in Chinese with English abstract)
[5] Amoodeh M T, Khoshtaghaza M H, Minaei S. Acoustic on-line grain moisture meter[J]. Computers and Electronics in Agriculture, 2006(52): 71-78.
[6] 曲东亮. 基于流动摩擦特性的玉米水分及容重检测方法的研究[D]. 长春:吉林大学,2009.
Qu Dongliang. Study on Maize Moisture and Bulk Density Detection Method Based on Frictional and Flowing Characteristics[D]. Changchun: Jilin University, 2009. (in Chinese with English abstract)
[7] 付海东. 压力式粮食水分在线检测系统的设计与研究[D]. 长春:吉林农业大学,2012.
Fu Haidong. The Design and Research on Grain Moisture Content On-line Measuring System Based on Pressure[D]. Changchun: Jinlin Agricultural University, 2012. (in Chinese with English abstract)
[8] 黄操军,田芳明,刘坤,等. 基于DSP的谷物含水率在线测量方法[J].农业机械学报,2009,40(S1):61-64.
Huang Caojun, Tian Fangming, Liu Kun, et al. Universal online measuring method of grain moisture content based on DSP[J]. Transactions of the Chinese Society for Agricultural Machinery, 2009, 40(S1): 61-64. (in Chinese with English abstract)
[9] 杨悦乾,王剑平,王成芝. 谷物含水率中子法在线测量的可行性研究[J]. 农业工程学报,2000,16(5):99-101.
Yang Yueqian, Wang Jianping, Wang Chengzhi. Study on on-Line Measurement of grain moisture content by neutron gauge[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2000, 16(5): 99-101. (in Chinese with English abstract)
[10] 张垚,陈琛,陈明,等. 基于低场核磁共振技术的玉米单子粒含水率测定方法研究[J]. 玉米科学,2018,26(3):89-94.
Zhang Yao, Chen Chen, Chen Ming, et al. Single kernel moisture content evaluation based on low field nuclear magnetic resonance in maize[J]. Journal of Maize Sciences, 2018, 26(3): 89-94. (in Chinese with English abstract)
[11] 李江波,苏忆楠,饶秀勤. 基于高光谱成像及神经网络技术检测玉米含水率[J]. 包装与食品机械,2010,28(6):1-4.
Li Jiangbo, Su Yinan, Rao Xiuqin. Detection of water content in corn based on hyperspectral imaging and neural network[J]. Packaging and Food Machinery, 2010, 28(6): 1-4. (in Chinese with English abstract)
[12] Briggs L J. An electrical resistance method for the rapid determination of the moisture content of grain[J]. Science, 1908, 28(727): 810-813.
[13] Bunrox E F, Pitt A. A new method for the rapid estimation of moisture in wheat[J]. Rapid Estimation of Moisture in Wheat, 1929, 1(2): 155-162.
[14] Nelson S O, Trabelsi S. Principles of grain and seed moisture sensing through radio-frequency and microwave dielectric properties[C]//ASABE Meeting Presentation, Washington, 2017.
[15] Nelson S O, Trabelsi S. A century of grain and seed moisture measurement by sensing electrical properties[J]. Transactions of the ASABE, 2012, 55(2): 629-639.
[16] Lawrence K C, Nelson S O. Radio-frequency density- independent moisture determination in wheat[J]. Trans. ASAE, 1993, 36(2): 477-483.
[17] Trabelsi S, Lewis M A, Nelson S O. Microwave moisture meter for in-shell peanut kernels[J]. Food Control, 2016, 66: 283-290.
[18] Lawrence K C, Funk D B, Windham W R. Parallel-plate moisture sensor for yellow-dent field corn[J]. Transaction of the ASAE, 1999, 42(5): 1353-1357.
[19] 李长友. 稻谷干燥含水率在线检测装置设计与试验[J]. 农业机械学报,2008,39(3):56-59.
Li Changyou. Design and experiment of online moisture metering device for paddy drying process[J]. Transactions of the Chinese Society for Agricultural Machinery, 2008, 39(3): 56-59. (in Chinese with English abstract)
[20] 吴惠昌,谢焕雄,胡志超,等. 连续单粒式谷物在线水分测定仪的设计与试验[J]. 农业工程学报,2017,33(11):282-290.
Wu Huichang, Xie Huanxiong, Hu Zhichao, et al. Design and experiment of continuous single grain typed online grain moisture test apparatus[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(11): 282-290. (in Chinese with English abstract)
[21] 杨柳,毛志怀,董兰兰. 电容式谷物水分传感器平面探头的研制[J]. 农业工程学报,2010,26(2):185-189.
Yang Liu, Mao Zhihuai, Dong Lanlan. Development of plane polar probe of capacitive grain moisture sensor[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2010, 26(2): 185-189. (in Chinese with English abstract)
[22] 陈进,王月红,练毅,等. 高频电容式联合收获机谷物含水量在线监测装置研制[J]. 农业工程学报,2018,34(10):36-45.
Chen Jin, Wang Yuehong, Lian Yi, et al. Development of online monitoring device of grain moisture content in combine harvester with high frequency capacitance[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(10): 36-45. (in Chinese with English abstract)
[23] 罗承铭. 基于电容法的谷物水分检测系统研究与设计[D]. 杨凌:西北农林科技大学,2011.
Luo Chengming. Research and Design of a Grain Moisture Detecting System Based on Capacitance Method[D]. Yangling: Northwest Agriculture and Forestry University, 2011. (in Chinese with English abstract)
[24] 郭文川,王婧,刘驰. 基于介电特性的薏米含水率检测方法[J]. 农业机械学报,2012,43(3):113-117.
Guo Wenchuan, Wang Qian, Liu Chi. Predicating moisture content of pearl barley based on dielectric properties[J]. Transactions of the Chinese Society for Agricultural Machinery, 2012, 43(3): 113-117. (in Chinese with English abstract)
[25] 王婧,郭文川,邓业胜. 基于介质损耗因数的红小豆含水率测量方法研究[J]. 食品科学,2012,33(16):216-220.
Wang Jing, Guo Wenchuan, Deng Yesheng. Determination of water content in small red beans based on dielectric loss factor[J]. Food Science, 2012, 33(16): 216-220. (in Chinese with English abstract)
[26] 郭文川,王婧,朱新华. 基于介电特性的燕麦含水率预测[J]. 农业工程学报,2012,28(24):272-279.
Guo Wenchuan, Wang Jing, Zhu Xinhua. Moisture content prediction of oat seeds based on dielectric property[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(24): 272-279. (Chinese with English abstract)
[27] Kraszewski A W, Trabelsi S, Nelson S O. Density- independent and temperature-compensated moisture content determination in shelled corn by microwave sensing[J]. Sensors Update, 2000, 7(1): 51-64.
[28] Berbert P A, Stenning B C. Analysis of density-independent equations for determination of moisture content of wheat in the radiofrequency range[J]. Journal of Agricultural Engineering Research, 1996, 65(4): 275-286.
[29] Berbert P A, Stenning B C. On-line moisture content measurement of wheat[J]. Journal of Agricultural Engineering Research, 1996, 65(4): 287-296.
[30] 肖治涛. 基于近红外光谱技术的谷物水分检测仪器开发[D]. 南昌:南昌航空大学,2018.
Xiao Zhitao. Development of Grain Moisture Detection Instrument Based on Near Infrared Spectroscopy [D]. Nanchang: Nanchang Hangkong University, 2018. (in Chinese with English abstract)
[31] 林碧莹. 基于介电谱预测牛乳体细胞数及乳牛乳房炎等级的方法研究[D]. 杨凌:西北农林科技大学,2017.
Lin Biying. Study on Prediction of Somatic Cell Count in Raw Milk and Inflammation Grade of Dairy Cattle Based on Dielectric Spectrum[D]. Yangling: Northwest A&F University, 2017. (in Chinese with English abstract)
[32] Chapelle O, Vapnik V, Bousquet O, et al. Choosing multiple parameters for support vector machines[J]. Machine Learning 2002, 46: 131-159.
[33] 孙俊,莫云南,戴春霞,等. 基于介电特性与IRIV-GWO-SVR算法的番茄叶片含水率检测[J]. 农业工程学报,2018,34(14):188-195.
Sun Jun, Mo Yunnan, Dai Chunxia, et al. Detection of moisture content of tomato leaves based on dielectric properties and IRIV-GWO-SVR algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(14): 188-195. (in Chinese with English abstract)
[34] Mirjalili S, Lewis A. The whale optimization algorithm[J]. Advances in Engineering Software, 2016, 95: 51-67.
[35] 山东农业大学. 一种基于介电参数的谷物含水率在线装置:中国,201610819370.7[P]. 2016-11-23.
[36] Wayne Kerr Electronics. Datasheet of precision impedance analyzers 6500b series: fixtures and cables[Z]. UK: Wayne Kerr Electronics, 2010.
[37] 刘双喜,孙林林,付千悦,等. 单粒谷物体积排液法精确测量研究[J]. 农业机械学报,2018,49(3):36-42.
Liu Shuangxi, Sun Linlin, Fu Qianyue, et al. Accurate measurement of single grain volume draining method[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(3): 36-42. (in Chinese with English abstract)
[38] 国家粮食局. GB/T 10362-2008粮油检验玉米水分测定[S]. 北京: 中国标准出版社, 2008.
[39] Galvão R K, Araujo M C, José G E, et al. A method for calibration and validation subset partitioning[J]. Talanta, 2005, 67(4): 736-740.
[40] Yun Y H, Wang W T, Tan M L, et al. A strategy that iteratively retains informative variables for selecting optimal variable subset in multivariate calibration[J]. Analytica Chimica Acta, 2014, 807: 36-43.
[41] 李江波,郭志明,黄文倩,等. 应用CARS和SPA算法对草莓SSC含量NIR光谱预测模型中变量及样本筛选[J]. 光谱学与光谱分析,2015,35(2):372-378.
Li Jiangbo, Guo Zhiming, Huang Wenqian, et al. Near-Infrared spectra combining with CARS and SPA algorithms to screen the variables and samples for quantitatively determining the soluble solids content in strawberry[J]. Spectroscopy & Spectral Analysis, 2015, 35(2): 372-378. (in Chinese with English abstract)
[42] 赵丹丹. 基于特征选择的结直肠癌预测模型研究[D]. 济南:山东师范大学,2019.
Zhao Dandan. The Research of Colorectal Cancer Prediction Model Based on Feature Selection[D]. Jinan: Shandong Normal University, 2019. (in Chinese with English abstract)
[43] 赵孔双. 介电谱方法及应用[M]. 北京:化学工业出版社,2008.
[44] 于国萍,吴非. 谷物化学[M]. 北京:科学出版社,2010.
[45] Sacilik K, Tarimci C, Colak A. Dielectric properties of flaxseeds as affected by moisture content and bulk density in the radio frequency range[J]. Biosystems Engineering, 2006, 93(2): 153-160.
[46] 王云阳. 澳洲坚果射频干燥技术研究[D]. 杨凌:西北农林科技大学,2012.
Wang Yunyang. Study on Radio Frequency Drying Protocol of Macadamia Nuts[D]. Yangling: Northwest A&F University, 2012. (in Chinese with English abstract)
[47] Funk D B, Wieliczka D M T. An Investigation of the Nature of the Radio-frequency Dielectric Response in Cereal Grains and Oilseeds With Engineering Implications for Grain Moisture Meters[D]. Missouri-kansas: University of Missouri-kansas city, 2001.
[48] (法)科埃略. R著,吕景楼等译. 电介质物理学[M]. 北京:科学出版社,1984.
[49] 任广跃,曾凡莲,段续,等. 利用低场核磁分析玉米干燥过程中内部水分变化[J]. 中国粮油学报,2016,31(8):95-99.
Ren Guangyue, Zeng Fanlian, Duan Xu, et al. Analysis of internal moisture changes in corn dry process investigated by low field-NMR[J]. Journal of the Chinese Cereals and Oils Association, 2016, 31(8): 95-99. (in Chinese with English abstract)
[50] 宋相中,唐果,张录达,等. 近红外光谱分析中的变量选择算法研究进展[J]. 光谱学与光谱分析,2017,37(4):1048-1052.
Song Xiangzhong, Tang Guo, Zhang Luda, et al. Research advance of variable selection algorithms in near infrared spectroscopy[J]. Spectroscopy and Spectral Analysis, 2017, 37(4): 1048-1052. (in Chinese with English abstract)
Nondestructive testing model for maize grain moisture content established by screening dielectric parameters and variables
Song Hualu1, Yan Yinfa1,2, Song Zhanhua1,2, Sun Junliang1, Li Yudao1, Li Fade1,2※
(1.271018,; 2.271018,)
To realize the rapid and nondestructive measurement of moisture content in corn, the dielectric constant () and the dielectric loss () of corn kernels of different moisture content under different temperature during hot air drying process were measured at an excitation voltage of 500 mV and frequency range of 1 kHz to 5.462 MHz with a precise impedance analyzer and a self-made dielectric parameter measuring sensor, and the mechanism of change in dielectric parameters during drying process was studied and analyzed; meanwhile, a support vector machine-based moisture content prediction model was established by incorporating double dielectric parameters, and a model verification experiment was carried out. It was shown by the experiment results that the dielectric constant () of the corn kernels in the different moisture content decreased with the increase of measurement frequency; the dielectric loss () of the corn kernels in the low moisture content increased first and then decreased with the increase of frequency, with an obvious relaxed peak observed within the frequency range of 1 kHz-1 MHz, while for the corn kernels in the high moisture content, the dielectric loss () decreased with the increase of measurement frequency; in addition, with the increase of frequency, the tangent value of the dielectric loss angle increased first and then decreased for corn kernels in the low moisture content and decreased for the corn kernels in the high moisture content. At the measurement frequency of 5.462 MHz, the dielectric loss angle of the corn kernels decreased with the decrease of the wet-basis moisture content, the first derivative of the dielectric loss angle versus the moisture content dtan/dshowed the obvious trend of the segmentation with the decrease of moisture content. Through the analysis of the double dielectric parameter spectrum, the frequency bands for modelling had been selected initially. A total of 31 dimensional variables, including the double dielectric parameters of 15 measured frequency points between 1.072 and 5.462 MHz and the temperature value, were used as the input full variables of the support vector regression machine (SVR) model. Competitive adaptive reweighting algorithm (CARS), iterative retention information variable algorithm (IRIV) and CARS-IRIV joint algorithm were used to screen the feature variables, respectively. SVR models were established respectively with full variables and the feature variables screened by CARS, IRIV and CARS-IRIV. By optimizing the parameter(penalty factor) and the parameter(kernel function parameter) of the SVR model with the WOA (whale optimization algorithm), the result indicated that the optimal prediction performance could be witnessed in the CARS-IRIV-WOA-SVR model. The feature variables screened by CARS-IRIV were3.854MHz,3.854MHz,5.462MHz,5.462MHzand. Determination coefficients of the prediction set,P2, RMSEP (root mean square error of prediction) and the RPD (residual predictive deviation) were 0.998 4, 0.40% and 24.55, respectively. This study provided a new research idea and basic data for rapid nondestructive testing of maize moisture content based on double dielectric parameters and SVR, and it also laid a foundation for the development of intelligent grain moisture content rapid nondestructive testing instrument.
nondestructive testing; algorithm; moisture; double dielectric parameters; competitive adaptive reweighted sampling; iteratively retains informative variables; whale optimization algorithm
10.11975/j.issn.1002-6819.2019.20.032
S125
A
1002-6819(2019)-20-0262-11
宋华鲁,闫银发,宋占华,孙君亮,李玉道,李法德. 利用介电参数和变量筛选建立玉米籽粒含水率无损检测模型[J]. 农业工程学报,2019,35(20):262-272.doi:10.11975/j.issn.1002-6819.2019.20.032 http://www.tcsae.org
Song Hualu, Yan Yinfa, Song Zhanhua, Sun Junliang, Li Yudao, Li Fade. Nondestructive testing model for maize grain moisture content established by screening dielectric parameters and variables[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(20): 262-272. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.20.032 http://www.tcsae.org
2019-05-31
2019-09-10
山东省农机装备研发创新计划项目(2015TH101)
宋华鲁,博士生,主要从事干燥测控装备技术研究。Email:songhualu@126.com
李法德,教授,博士,博士生导师,主要从事新型农业装备、农产品加工机械关键技术的基础理论及产品的开发研究。Email:lifade@sdau.edu.cn
中国农业工程学会高级会员:李法德(E041200051S)