陈 通,高晓惠,杨 菊,刘 萍,祁兴普,程谦伟,
(1.广西科技大学生物与化学工程学院,广西柳州 545006;2.江苏农牧科技职业学院食品科技学院,江苏泰州 225300)
香米因香味浓郁,经济价值高等特点,在国际稻米贸易中占有重要地位[1]。由于香米价格高于其他普通大米,部分生产者易受利益驱使在香米中添加低档甚至劣质大米,冒充出售以牟取暴利[2]。广西作为我国优质大米的主要产地之一,其生产的特色香米也深受其害。因此,亟待开发一种香米品质检测的新方法,而风味指纹图谱为香米品质信息的客观可视化表征提供了可能[3]。
当前,相关学者基于风味物质成分对大米品质进行了深入研究,其分析检测方法也从传统的感官评定[4−6]、理化指标[7]等方法扩展到光谱法[8]、色谱法[9]、核磁共振法[10]、电子鼻[11−13]以及气相色谱-质谱[14−16](Gas Chromatography-Mass Spectrometry, GC-MS)等联用分析技术。气相离子迁移谱(Gas Chromatography-Ion Mobility Spectrometry, GC-IMS)作为一种联用分析技术,充分发挥了气相色谱的高效分离效能与离子迁移谱的高灵敏度优势,通过配备自动顶空进样装备可实现固态、液态食品中痕量挥发性有机成分的定性、定量检测,具有无需样品预处理、简便快捷、绿色无损以及重复性好的优势[17−19]。Zhang等[20]使用GC-IMS和GC-MS技术对正常大米和黄变米中的挥发性代谢产物进行了研究,结合化学计量学方法实现了两者的区分,筛选出的己醛、壬醛、辛醛、1-戊醇和2-戊基呋喃等物质可作为大米黄变的潜在标记,为大米黄变机理的研究提供了依据。Ju等[21]使用GC-IMS对大米品种鉴别与掺假检测进行了研究,结果表明:不同品种大米预测准确率达到98.00%,掺假识别率达到97.30%,表明GC-IMS技术在准确预测大米品种与掺假大米方面具有一定的可行性。张志斌等[22]使用顶空固相微萃取技术结合GC-MS对4份贵州特色“香禾糯”品系材料与常规香稻大粒香的挥发性成分进行了对比分析,结果表明:香稻中的主要挥发性物质为烃类和醛类,不同品系香稻中的2-乙酰-1-吡咯啉、壬醛、庚醛、戊醛以及己醇等挥发性物质含量差异显著,表明所测特色香稻的挥发性物质区别于已有常规香稻,为进一步探究特殊香型产生的原理提供新思路。谷航等[23]使用GCIMS技术监测了大米霉变过程中挥发性物质的变化,并建立了大米霉变早期预警的判别模型,结果表明:大米在不同霉变过程中产生的挥发性物质在种类和含量方面均存在显著差异,结合主成分分析与KMeans算法可有效区分大米的霉变程度,表明借助GC-IMS技术对大米霉变程度进行快速鉴定具有一定的可行性。综上所述,国内外关于GC-IMS技术在大米品质分析中的应用已有诸多报道,但研究方向多为挥发性物质的定性、定量分析,而针对GCIMS二维图谱的特征提取方法研究较少,未能实现指纹图谱中特征峰的自动化识别[24−27]。因此,开发一种简便、快速、高效的GC-IMS二维图谱特征提取方法,实现香米风味品质的快速无损分析具有重要意义。
本文以市场上典型的2类香米(广西香米与五常香米)为研究对象,借助GC-IMS技术结合数字图像处理研究二维共享风味指纹谱的提取方法,并使用化学计量学方法实现两类香米的快速判别,以期实现GC-IMS图谱特征峰的自动选取,为类似联用技术在关键特征变量提取过程中提供一种分析方法,也为区域特色食品、农产品的产地识别与保护提供新的判别方法。
采用线上购买和线下收集2种方式采集广西和五常区域香米样品共53个,其中五常香米25个,广西香米28个,具体产地信息见表1。
表1 香米样品的产地信息Table 1 Origin information for fragrant rice samples
AR124CN型电子分析天平 奥豪斯仪器(常州)有限公司;CTC PAL RSI多功能自动顶空进样器 瑞士CTC Analytics AG公司;FlavourSpec®型GC-IMS分析仪 德国G.A.S公司。
1.2.1 顶空进样条件 使用电子分析天平准确量取5 g待测香米样品置于20 mL顶空进样瓶中备用。孵育温度:90 ℃;孵育时间:10 min;孵化转速:500 r/min;顶空进样针温度:90 ℃;进样体积:500 μL。
1.2.2 GC条件 色谱柱SE-30(15 m×0.53 mm,1 μm);色谱柱温:40 ℃;载气:高纯N2(纯度≥99.999%);载气流量程序:初始2 mL/min,保持2 min,2~10 min内线性增加至15 mL/min,10~20 min线性增加至100 mL/min,20~30 min线性增加至150 mL/min,总分析时间为30 min。
1.2.3 IMS条件 漂移管温度:45℃;漂移管长度:9.8 cm;电场强度:500 V/cm;电离源:氚,正离子模式;漂移气流量:150 mL/min。
运用Matlab R2019b(The Mathworks Inc.)和PRTools 5.1插件(Delft University of Technology Netherlands)对GC-IMS二维图谱数据进行可视化分析处理。
由于每个香米样本对应的GC-IMS数据为一组二维矩阵,因此,采取Matlab软件对每类香米样品对应的数据矩阵进行均值处理,即计算所有样品矩阵每个元素位置对应数据组的均值,以每类样品GC-IMS的平均图谱表征样品的整体信息,并进行可视化显示。另外,由于每个样品对应的原始数据维度较大(3077×4500),因此,在尽可能保留原始图谱中挥发性风味物质特征峰的原则下,截取迁移时间为8.4870~16.2220 ms与保留时间78.3900~792.0900 s范围内的矩阵数据(1831×1161),结果如图1~图2所示。图1为广西香米样品的平均GC-IMS图谱,图2为以图1参比,五常香米样品的GC-IMS平均图谱对应的矩阵与参比(即广西香米平均图谱)的差值图谱。由图可知,2类香米样品含有部分相同的挥发性物质成分,如图1中虚线矩阵标记处,该区域在图2中对应区域位置未出现特征峰(即差值接近0),表明2类样品在该区域的挥发性风味成分含量接近;2类香米样品因条件差异(如产地气候、品种等)导致其产生的风味物质成分也不尽相同,图2中橙黄区域为五常香米中相较于广西香米含有的含量较高的挥发性风味物质(如图2中实线矩形框区域),而深蓝色区域则与之相反(如图2中箭头标记处)。综上可知,2类香米样品的挥发性风味成分中不仅含有相同的风味物质,同时每一类香米样品也含有其独有的风味物质成分,而如何提取一类香米样品中的共享风味物质成分实现判别分析需要进一步借助化学计量学方法进行处理。
图1 广西香米平均 GC-IMS 图谱Fig.1 GC-IMS average map of fragrant rice in Guangxi
图2 五常大米与广西香米平均 GC-IMS 差值图谱Fig.2 GC-IMS difference map of Wuchang rice and Guangxi rice
为实现广西香米样品中共享特征风味信息的提取,首先采用自动阈值分割方法进行GC-IMS二维图谱特征提取[28−29],其效果如图3所示。由图可知,该香米样品中共有54个特征区域被捕获,采用该方法分别对两类香米样品进行特征区域提取,并记录识别出的特征区域质心位置的特征值(即离子强度值)。然后,计算广西香米样品的质心位置数据集合与五常香米样品数据的差值,并采用非平面球形结构元素进行膨胀处理得到样品的特征区域质心差异密度膨胀处理图,如图4所示。使用差值数据表征是为了后期剔除广西香米与五常香米共有的特征区域,而膨胀处理则为消除GC-IMS图谱X轴的波动,使得质心相近的特征点被视为同一特征区域。图4中通过颜色表可知橙红区域为广西香米样品特征区域质心位置集合,而深蓝色区域则为五常香米区域质心位置集合。最后,再次采用自动阈值分割方法对质心数据集合进行特征区域分割,即可筛选得到广西香米样品中共享特征区域质心集合,结果如图5所示。由图可知,广西香米样品中共识别出了285个特征区域信息,以质心位置对应的离子强度值集合作为香米风味品质的表征变量进行进一步分析。
图3 自动阈值分割法提取图谱特征峰Fig.3 Automatic threshold segmentation method to extract characteristic peaks from the map
图4 特征区域质心差异密度膨胀处理Fig.4 Treatment of centroid density expansion in characteristic areas
图5 广西香米共有特征区域质心集合Fig.5 Centroid set of the common characteristic regions of fragrant rice in Guangxi
为进一步验证提取的特征峰的有效性,采用主成分分析(Principal Component Analysis, PCA)对特征变量集合(即53样品×285变量矩阵)进行处理。为对比验证所述方法的有效性,同时提取原始图谱中反应离子峰(Reactive Ion Peak, RIP)值为8.10 ms、保留时间为78.3900~792.0900 s范围内的单一色谱图为表征变量进行分析,GC-IMS图谱中反应离子的峰强度变化可以用来测量组分的产物离子生成,即反应离子峰强度的减少表明色谱柱的流出物中有分析物成分出现,该成分在漂移管反应区内产生了相应的产物离子,2种特征提取方法判别分析结果分别如图6和图7所示。由图6可知,提取的共享风味指纹谱特征变量经过PCA处理后,第1主成分贡献率为93.26%,第2主成分贡献率为5.74%,前2个主成分的累积贡献率为99.00%,表明经过PCA处理后原有的特征变量信息得到了保留;五常香米和广西香米均有各自归属的区域,其中广西香米样品在图6中呈狭长分布,而五常香米则呈椭圆状聚集,结合表1香米区域信息可知,产生该现象的主要原因为:广西区域采集的样品来源于整个自治区范围,区域跨度范围大,不同地级市之间的样品品质存在一定的差异,而五常香米对应的区域范围较单一,其区域仅仅为五常地级市范围;两类香米在图6中可明显分为2类,而图7中五常和广西两类香米样品的归属边界则明显重合,表明单一的一维向量处理方法取得的判别效果不佳;以共享风味指纹谱特征变量经PCA处理后的前2个主成分得分数进行二次线性判别分析(Quadratic Discriminant Analysis, QDA),结果如表2所示,由于采集的香米样品数量偏少,故未将样品集划分为校正集和预测集,仅将样品集用于建立判别模型以验证分析方法的可行性。由表2可知,所有产地香米样品的识别率均达到100%,表明该方法提取的特征指纹数据能够表征广西香米共有的风味品质信息。
图6 质心位置特征变量主成分得分图Fig.6 Principal component score chart of characteristic variables from centroid position
图7 RIP 特征变量主成分得分图Fig.7 Principal component score chart of characteristic variables from reaction ion peak
表2 香米样品QDA判别结果Table 2 Classification results of aromatic rice samples using quadratic linear discriminant analysis
本研究采用GC-IMS对广西香米和五常香米2类样品的挥发性风味成分进行检测,应用化学计量学方法结合数字图像处理技术建立了一种广西香米共享指纹图的提取方法,并实现了2类样品的准确判别。结果表明,图谱预处理结合图谱自动阈值分割方法可有效筛选特征风味变量,提取一类样品中的共享风味物质成分;同时,结合模式识别方法能够实现不同区域香米样品的判别。该方法为类似GCIMS设备生成的二维图谱的解析处理提供了一种研究思路,同时也为国内区域香米的产地保护提供了一种新的分析方法和解决方案。