谭佐军 陈 阳 谢 静 蔡万伦 石舒宁
(华中农业大学理学院1,武汉 430070)
(华中农业大学工学院2,武汉 430070)
(华中农业大学植物科技学院3,武汉 430070)
太赫兹时域光谱检测谷粒中储粮害虫的研究
谭佐军1陈 阳2谢 静1蔡万伦3石舒宁2
(华中农业大学理学院1,武汉 430070)
(华中农业大学工学院2,武汉 430070)
(华中农业大学植物科技学院3,武汉 430070)
快捷方便检测粮粒中是否有储粮害虫及其种类,对储粮害虫虫情调查和监测,实现粮库中储粮害虫的准确检测和口岸害虫快速检测检疫具有重要实践意义。以最主要的初期性害虫玉米象为例,对玉米象、谷壳、米粉样品进行了太赫兹时域光谱测试,获得了样品在0.2~1.6 THz波段的折射率和吸收光谱,分析了这些样品的特征吸收谱,并利用PLS-DA方法对含有玉米象和不含玉米象的谷粒样品的太赫兹光谱进行鉴别分析,结果表明用0.2~1.6 THz范围内的THz吸收光谱结合PLS-DA方法对校正样本建立判别模型,其校正和验证结果与实际分类变量的相关性高,交叉验证均方根误差(RMSECV)和预测均方根误差(RMSEP)都小于0.150,建立的PLS-DA分类模型对检测样本的判别准确率为100%,为检测粮粒中是否有储粮害虫提供快速方便的鉴别分析方法。
太赫兹 光谱 储粮害虫 偏最小二乘法判别
初期性害虫玉米象、谷象、米象、谷蠹、麦蛾、豆象类等在粮粒内蛀食,这些粮粒内部的隐蔽性害虫的卵、幼虫和蛹均在粮粒内生长发育,以蛀空式危害谷物,这类隐蔽性害虫既不容易检测,也不容易除掉,是粮粒中害虫最主要的来源。第二食性害虫锯谷盗、长角扁谷盗、赤拟谷盗等仅能危害谷物的碎屑和粉末,也是粮粒中害虫的来源。因此研究储粮害虫的快速实时的检测方法,快捷方便检测粮粒中是否有储粮害虫及其种类,对储粮害虫虫情调查和监测,实现粮库中储粮害虫的准确检测和口岸害虫快速检测检疫具有重要实践意义[1-2]。
国内外一直不断发展隐蔽害虫检测方法(染色法、比重法、尿酸高压液相色谱检测法、原子吸收光谱法、核磁共振光谱法、酶联免疫法、电导率法,蛋白指纹图谱法等),这些方法都不同程度成功检测到粮粒内部害虫。但这些检测方法费时、费力或者要求昂贵的特殊设备,至今难以推广应用或停留在试验阶段,因此需寻找更方便快捷的方法[3]。
从20世纪90年代开始国内外的学者积极地开展储粮害虫自动检测的研究,取得了很大进展,采用了声测法[4]、近红外光谱法、X射线透射法、电导法、微波雷达检测法、可见光图像识别法、近红外图像识别法、软X射线图像识别法等研究了储粮害虫的生物特征[5-6],但是上述方法离人们的期望还存在很大的距离。目前储粮害虫检测技术正朝着快速、准确、无损伤和早期诊断的方向发展,其中储粮害虫的早期诊断尤为重要,只有在虫害爆发前的潜伏期采取治虫措施才是最经济、最有效的。因此除了通过上述方法获取储粮害虫的生物特征信息外,还需要寻找新的检测方法和新的生物特征,以形成适于分类的最优知识库,利用多传感信息融合技术,研究储粮害虫快速自动检测系统。
在储粮害虫的快速自动检测技术中,光谱分析和成像技术是2个不可缺少的重要手段。近年来,随着超快激光技术和半导体材料科学的迅速发展,为太赫兹脉冲的产生提供了可靠、稳定的激发源和探测器,促进了THz技术在光谱学与成像技术方面的应用,在食品无损检测、化学物/生物质检测、无标记基因检测、农产品分析和质量控制等方面,THz波检测技术已显示出巨大的优势[7]。
太赫兹波通常指的是频率在0.1~10 THz(波长0.03~30mm)范围,典型中心频率为1 THz的电磁波。THz辐射源是一种新的、有独特优点的、位于微波和红外波段之间的辐射源。THz波段光子的电磁能量大约在1~10 meV,正好和分子转动能级之间跃迁的能量大致相当。大多数极性分子对THz辐射有强烈的吸收,许多有机大分子(DNA、蛋白质等)的振动能级和转动能级之间的跃迁正好也在THz波段。因此,物质的THz光谱(包括发射、反射和透射光谱)包含有丰富的物理和化学信息[8-10]。
本研究以最主要的初期性害虫玉米象为例,对玉米象、谷壳、米粉样品进行了太赫兹时域光谱测试,获得了其在0.2~1.6 THz波段的折射率和吸收光谱,分析了这些样品的特征吸收谱,利用偏最小二乘判别法(Partial least-squares discriminate analysis,PLS-DA)对含有玉米象和不含玉米象谷粒样品的太赫兹光谱进行鉴别分析,展示了THz技术在储粮害虫自动检测中的应用前景。
玉米象是一种最主要的初期性害虫,贮粮被玉米象咬食而造成许多碎粒及粉屑,易引起后期性害虫的发生。
将经历卵、幼虫、蛹、成虫几个发育阶段后(3~4周)的玉米象成虫放入70℃真空烘干箱烘干12 h,接着在干燥箱中放置72 h。然后用粉碎机将干燥后的玉米象碾碎,并用0.250mm(#60)和0.425mm(#40)的筛子过筛,获得的玉米象碎片放置于干燥箱中保存。
用10目(2mm)的筛子筛选颗粒饱满的没有被虫侵蚀的谷粒,然后用谷物脱壳机通过2次脱壳得到糙米和谷壳。利用粉碎机分别粉碎谷壳和糙米后,再用0.250mm(#60)和0.425mm(#40)的筛子过筛获得米粉粉末和谷壳粉末,然后放入70℃真空烘干箱烘干12 h。
分别取玉米象碎片、谷壳和米粉各0.1 g置于压片机上,缓慢加压,达到24 MPa的压力时维持2min,将样品压成厚度在1~2mm之间,直径为13mm,两表面互相平行、内部均匀的圆盘状薄片,获得玉米象碎片压片、谷壳粉末压片、米粉压片各50片。
分别取不同比例玉米象碎片、谷壳和米粉0.1 g如上述步骤制作不同比例混合压片,从而获得180份含有不同数量玉米象碎片谷粒粉末的压片样本。按上述步骤,取谷壳和米粉0.1 g制作不含玉米象碎片的谷粒粉末压片样本30份。
试验采用了美国Coherent公司钛蓝宝石飞秒激光器作为泵浦和探测光源,它的中心波长调谐到780 nm,脉宽小于100 fs,重复频率为80 MHz,平均功率960 mW。太赫兹时域光谱仪为美国Zomega公司的Mini-Z 4,激光脉冲被分为泵浦光和探测光两路,泵浦光激发大孔径GaAs光电导天线产生THz脉冲,探测光利用电光采样原理探测THz波的电场强度,探测元件采用ZnTe晶体。该THz时域光谱仪光谱覆盖0.1~3.5 Hz,THz动态范围大于70 dB,频域分辨率<5 GHz,THz脉冲FWHM约为624.54 fs。光路中灰色部分为充氮封离箱,主要是为了减少空气中水分对THz波的吸收,使用时充入氮气,使罩内湿度小于4%。
太赫兹发射的频域波形为E0(ω),探测器直接接收到的发射频域波形为Eref(ω),穿过样品后探测器接收到的频域波形为Esample(ω),此处ω为频率,样品厚度为d,太赫兹脉冲在自由空间传播距离为l,样品的负折射率为 n(ω)+iκ(ω),κ(ω)为消光系数,自由空间空气折射率为1,则参考光Eref(ω)表达式为:
穿过样品的信号光可表示为:
式中:1/n(ω)+1、2n(ω)/n(ω)+1分别为太赫兹脉冲入射样品和出射样品时的透射系数。
因此,太赫兹脉冲穿过样品后的透射谱可表示为:
因此可得实折射率和吸收系数分别为:
THz光谱数据经过格式转换后,应用PLS-DA对含有玉米象的谷粒粉末和不含玉米象的谷粒粉末进行鉴别分析。PLS-DA是一种基于PLS回归分析对不同类别之间的模型差异进行分类的一种分类方法[11]。将2种类别的THz光谱分别定义为1和2(1代表含有玉米象的谷粒粉末,2代表不含玉米象的谷粒粉末)作为THz光谱数据的参考值,应用交叉验证的方法及预测残差平方和(Predictive residual error sum of squares,PRESS)为依据选择建立PLSR模型的主成分,采用偏最小二乘回归建立鉴别模型。根据校正集建立的分类变量和光谱特征的PLS模型,计算验证集的分类变量值(Yp),当Yp在分类变量(1和2),且偏差<0.5,则判断预测准确。
利用THz-TDS获得的3种样品的THz时域波形如图1所示。各种分子之间弱的相互作用(如氢键的延伸、DNA)、核酸大分子的骨架振动(构型弯曲)、晶体中晶格的低频振动吸收频率以及偶极子的旋转和振动跃迁都对应THz波段范围,谷壳、米粉、玉米象由于内部成分不同,分子间的低频集体振动模式不同,太赫兹时域光谱响应也会有差异。
由图1可见,THz波通过3种样品后幅值明显衰减,衰减幅度超过50%,时间上也有不同程度的延迟,其中谷壳延迟时间约为1.581 3 ps,米粉延迟时间约为1.547 4 ps,玉米象延迟时间约为1.538 3 ps。因为样品厚度均为0.06 cm,显然幅值衰减和时间延迟主要是由于谷壳、米粉和玉米象内部成分的不同导致对THz波不同程度的吸收引起的,这也说明THz波在这些样品中的折射率大于氮气中的折射率。特别是玉米象与谷粒的主要组成成分(谷壳、米粉)在幅值和时间延迟上有明显的差异,这表明可以利用THz波检测谷粒中是否存在储粮害虫。
将THz时域波形信号进行傅里叶变换后,可得样品的THz频域波形信号,如图2所示。由图2可见,参考信号的检测范围为0~3 THz,米粉和玉米象有效频率信号在0~1.5 THz,而谷壳有效频率在0~1.6 THz,这说明0.06 cm厚的样品对于1.6 THz以上的频率是不透明的,如果采用本太赫兹时域光谱系统获得更高频率的太赫兹光谱,样品厚度需要进一步减小。利用式(5)可以获得3种样品的THz频段吸收系数谱,如图3所示。
图2 样品和参考信号的THz频域波形
图3 样品和参考信号的THz吸收光谱
由图3可见,在0.2~1.6 THz波段内,谷壳、米粉和玉米象的吸收谱在0.28 THz均有吸收峰,从0.4 THz开始,玉米象的吸收谱随着频率的增加成上升趋势,在1.46 THz存在明显的吸收峰,米粉和谷粒没有明显的吸收峰。三者相互之间的吸收系数存在明显的差别,因此在太赫兹频段,谷粒中是否存在玉米象可以根据玉米象的特征吸收峰和吸收谱的特征进行区别。
由式(4)计算,得到3种样品在0.2~1.6 THz的折射率,如图4所示,可见,折射率在1.425~1.601之间,因为3种样品成分不同,所以在不同的THz频率下有特定的折射率。因此,通过测量样品在THz波段的折射率,可以检测谷粒中是否存在储粮害虫。
图4 样品THz波段折射率谱
基于PLS方法建立样本分类变量与THz光谱特征间的回归模型,然后利用PLS回归方法对校正集样本的THz光谱与分类变量进行回归分析,并且建立分类变量与THz光谱特征间的PLS模型,验证方法采用交叉验证法,光谱范围选择0.2~1.6 THz。
图5是0.2~1.6 THz范围内各频率的变量投影重要性(Variable importance in projection,VIP),VIP反映了各个THz频率对谷粒中是否含有玉米象的解释水平及相关程度,VIP值越大,该频率越重要,通常认为VIP>1,说明该频率重要;VIP<0.5,说明该频率对于鉴别模型不重要。由图5可见,1.17~1.43 THz和1.50~1.60 THz这2个频段范围内,是否还有玉米象的谷粒存在显著差异,其中1.50~1.60 THz差异最为明显,因为在这个频段范围内玉米象有明显的吸收峰,低频范围0.12~0.19、0.24~0.32、0.42~0.47 THz也都存在显著差异。
图5 0.2~1.6 THz范围内各频率的变量投影重要性
根据交叉有效性检验来截取成分的个数,参数见表1,提取第1个成分交叉有效性达到72.6%,提取第2个成分时,累计交叉有效性减少为72.5.0%,提取第3个成分时,累计交叉有效性减少为69.4%,提取第4个成分时,累计交叉有效性减少为34.6%,说明第2个、第3个和第4个成分的交叉有效性为负,因此选择第1个成分预测性能为最佳。
利用THz光谱结合PLS-DA方法建立的判别模型,校正结果如表1和图6所示。图6为验证集样本的预测结果,其中验证集中所有的含有玉米象的谷粒样本的分类变量的预测值都接近于1,因为谷粒样本含有不同比例的玉米象的,偏差在0.5左右,而不含玉米象的谷粒样本的分类变量的预测值接近于2,偏差均小于0.1。根据PLS-DA方法的判别准则可知,检测集中所有的含有玉米象的谷粒样本均被正确识别。该研究建立的PLS-DA判别模型对谷粒中是否含有玉米象的判别准确率为100%。
表1 不同成分的累计交叉有效性
图6 PLDA验证集样本的预测结果
从表2可见,通过PLS回归分析建立的判断谷粒中是否有玉米象和分类变量的相关性较好,校正样品的识别率均为100%,说明模型的拟合较好。
表2 PLDA预测结果精度评价
以最主要的初期性害虫玉米象为例,对玉米象、谷壳、米粉样品进行了太赫兹时域光谱测试,获得了其在0.2~1.6 THz波段的折射率和吸收光谱,分析了这些样品的特征吸收谱,并利用PLS-DA方法对含有玉米象和不含玉米象的谷粒样品的太赫兹光谱进行鉴别分析,结果表明用0.2~1.6 THz范围内的THz吸收光谱建立的PLS-DA分类模型对检测样本的判别准确率为100%,说明THz吸收光谱结合PLSDA判别分析方法能够有效地检测和判别谷粒中是否有储粮害虫成分存在,展示了THz技术在储粮害虫自动检测中的应用前景。
[1]State Administration of Grain in China.Instruction on development of grain technology in the 12ndFive-Year plan.2012
[2]毛罕平,张红涛.储粮害虫图像识别的研究进展及展望[J].农业机械学报,2008,39(4):175-179
[3]耿森林,尚志远.储粮害虫声检测技术研究进展与展望[J].农业工程学报,2006,22(4):204-207
[4]张红涛,胡玉霞,邱道尹.储粮害虫检测现状[J].河南农业科学,2006,35(3):66-68
[5]胡丽华,郭敏,张景虎.储粮害虫检测新技术及应用现状[J].农业工程学报,2007,23(11):286-290
[6]Neethirajan S,Karunakaran C,Jayas D S,et al.Detection techniques for stored-product insects in grain Food Control[J].2007,18:157-162
[7]许景周,张希成.太赫兹科学技术和应用.北京:北京大学出版社,2007:1-78
[8]李允植.太赫兹科学技术和原理[M].崔万照译.北京:国防工业出版社,2012:10-80
[9]闫战科,张宏建,应义斌.THz技术在农产品/食品品质检测中的应用[J].光谱学与光谱分析,2007,27(11):2228-2234
[10]沈飞,应义斌.太赫兹光谱和成像技术在食品安全检测中的应用[J].光谱学与光谱分析,2009,29(6):1445-1450
[11]张旭,姚明印,刘木华.激光诱导击穿光谱结合偏最小二乘法定量分析脐橙中Cd含量[J].物理学报,2013,62(4):044211-042214.
Detection of Pests During Grain Storage by Using Terahertz Time-Domain Spectroscopy
Tan Zuojun1Chen Yang2Xie Jing1CaiWanlun3Shi Shuning2
(College of sciences,Huazhong Agricultural University1,Wuhan 430070)
(College of Engineering,Huazhong Agricultural University2,Wuhan 430070)
(College of Plant Sciences&Technology,Huazhong Agricultural University3,Wuhan 430070)
Detecting the stored-product insects in the grain kernels and determining the species of these insects quickly and accurately are very significant to survey and monitor the damage by the pest.It also has an important practical significance in the accurate detection of pests in food warehouse and the rapid detection of pests in import and export ports.The Sitophilus zeamais(S.zeamais),a common stored grain insectassociated with food-processing facilitiesworldwide was used as the test insect in this study.The study involved identification of 0.2~1.6 THz absorption characteristics and refractive indices of S.zeamais,chaff flour,rice flour andmixtures of them by terahertz time-domain spectroscopy(THz-TDS).The absorption characteristics of these samples(S.zeamais,chaff flour and rice flour)were analyzed.Partial least-squares discriminate analysis(PLS-DA)was applied to classify the healthy grain powder and the grain powdermixed with different concentration S.zeamais into two groups.The results demonstrated that the calibration and prediction resultswere highly correlated to the real classification variables by using of the discriminationmodel,which was built by PLS-DA method and the absorption spectrum in the region of 0.2~1.6 THz.The rootmean square error of calibration(RESECV)and rootmean square error of cross-validation(RESEP)were both less than 0.150.The correct classificationswere 100%by building PLS-DA discrimination model.This study provided a rapid and convenientmethod to detect the insect-damaged grain kernels.
terahertz,spectrum,pests in gain storage,partial least-squares discrimination
国家自然科学基金 (31000848),中央高校基本科研业务费专项 (2014QC013)
2014-01-11
谭佐军,男,1977年出生,副教授,生物信息技术与工程
谢静,女,1981年出生,讲师,生物信息技术与工程
TQ247
A
1003-0174(2015)06-0125-05