刘 星 范 楷 杨俊花 宋卫国
(上海市农业科学院农产品质量标准与检测技术研究所,上海 201403)
薏仁米为禾本科植物薏苡(Coixlachryma-jobiL.)的成熟种仁,被广泛种植于中国各省、东南亚地区和巴西[1],中国年产量达30多万t。薏仁米富含脂肪、蛋白质和其他谷物所缺少的赖氨酸、蛋氨酸和半胱氨酸等营养成分[2],且含有薏苡素、多糖等功能因子,具有祛湿、抗肿瘤(康莱特注射液)、降糖降脂、免疫调节等作用[3-5]。不同品种和不同产地的薏仁米营养组成不同,价格也存在差距。
薏仁米的食用量在逐年增加,市场上薏仁米产品很多,且多为粉末状,其所用薏仁米依据其尺寸可分为小颗粒薏仁米(smallCoixseed,SCS)和大颗粒薏仁米(bigCoixseed,BCS)(图1),一般SCS的价格高于BCS。已有的研究[6-8]多针对薏仁米的淀粉结构和理化性质、脂肪提取应用、活性成分提取条件优化等,也有[9-10]开展某一种薏仁米或多种薏仁米的主要营养成分分析,但对于不同产地BCS和SCS主要营养成分的比较研究暂未见报道。对于与薏仁米相关的产品,一些商家为获得更高的利润均宣称其产品所用的薏仁米为SCS,而消费者很难判断真假,本课题组[11]前期研究发现可以借助近红外光谱来进行BCS和SCS的判别,但是否能通过薏仁米的主要营养成分含量来判别BCS和SCS还未见报道。本研究采集了国内外多地薏仁米样品,通过测定其主要营养组分(脂肪、蛋白质、氨基酸和矿物元素)来研究BCS和SCS中主要营养成分含量的差别,并将其主要营养成分含量结合化学计量学方法[主成分分析(principal component analysis,PCA)[12-13]和支持向量机(support vector machine,SVM)[14-16]]来判别BCS和SCS,以期为薏仁米产品的选材和薏仁米市场的规范提供参考。
图1 大小颗粒薏仁米的尺寸Figure 1 The size of big Coix seed and small Coix seed
1.1.1 主要仪器
加速溶剂萃取仪:ASE 350型,美国ThermoFisher公司;
自动凯氏定氮仪:Kjeltec 8200型,丹麦FOSS公司;
全自动氨基酸分析仪:L-8900型,日本Hitachi公司;
电感耦合等离子体发射光谱仪:iCAP 6300型,美国Thermo Fisher公司;
分析天平:AL204型和PL2002型,梅特勒—托利多仪器(上海)有限公司;
电热板:JH404型,上海锦凯科学仪器有限公司;
中药粉碎机:HK-02A型,广州旭朗机械设备有限公司。
1.1.2 主要试剂
丙酮:分析纯,上海凌峰化学试剂有限公司;
凯氏定氮催化剂:丹麦FOSS公司;
氨基酸标准溶液:日本Hitachi公司;
多元素混合标准溶液:美国SPEX CertiPrep公司;
硫酸、盐酸、硼酸、甲基红、亚甲基蓝、乙醇、浓盐酸、苯酚、茚三酮、硝酸、高氯酸等:分析纯,国药集团化学试剂有限公司。
1.2.1 样品采集 共采集了36个薏仁米样品,其中包括16个BCS和20个SCS,这些样品分别来自中国吉林、黑龙江、江苏、贵州、福建、辽宁、河北、湖南、湖北、广西、四川、山西、山东、陕西、浙江、安徽、宁夏、内蒙古18个省和自治区,以及缅甸和泰国。试验前将不饱满的薏仁米颗粒挑出,再用粉碎机将薏仁米粉碎并全部通过0.25 mm 标准筛。
1.2.2 粗脂肪、蛋白质、氨基酸和矿物元素测定 薏仁米样品中的粗脂肪利用快速溶剂萃取仪来提取,提取溶剂为丙酮[17],提取条件为温度120 ℃,时间20 min,循环2次。薏仁米样品中的蛋白质、氨基酸和矿物元素分别按GB 5009.5—2010《食品安全国家标准 食品中蛋白质的测定》、GB 5009.124—2016《食品安全国家标准 食品中氨基酸的测定》和GB 5009.268—2016《食品安全国家标准 食品中多元素的测定》方法来测定。
1.2.3 数据统计分析方法和化学计量学方法 数据为3次平行试验的平均值,通过单尾方差分析来反映BCS和SCS主要营养成分含量的差别,并将主要营养成分含量与PCA法和SVM法结合,建立BCS和SCS定性判别模型。SVM法借助SPXY[18]法从36个样品中选取75%的样品作为训练集,剩下的25%样品作为测试集。统计分析和定性模型建立都是由Matlab软件(R2009a 美国 Mathworks公司)来实现。
由表1可知,不同地区BCS和SCS的粗脂肪、蛋白质、苯丙氨酸、蛋氨酸、苏氨酸、异亮氨酸、亮氨酸、缬氨酸、半胱氨酸、酪氨酸、天冬氨酸、丝氨酸、谷氨酸、丙氨酸、脯氨酸、K、Mg、Cu、Mn、Al含量在统计学上有显著的差异,且除了粗脂肪、Mg、Al含量是BCS大于SCS外,其他营养成分均为SCS的含量高于BCS,说明不同地区来源的SCS主要营养成分在一定程度上是优于BCS,这一结果与之前[11]所得结论——同一地区的BCS和SCS主要营养成分的差异现象一致,也为市场上SCS的价格高于BCS提供了依据。同时,对于SCS而言,不同地区来源的薏仁米其赖氨酸、Na、Ca、Fe、Al含量偏差较大,而不同地区的BCS也在Na、Ca、Fe、Al含量上有较大的差异,在一定程度上说明这几种元素具有产地特征。
PCA是对数据进行降维处理的方法,是将多个变量转化为少数综合变量来表征原变量信息,即综合变量(又称为得分)保留原有变量的绝大部分信息,且可以由几个变量来反映样本数据的所有信息[12-13,19],所以PCA得分图在一定程度上能够反映数据集的分类。本研究前2个主成分中各营养成分的特征向量和累积贡献率见表2。由表2可知,前2个主成分的累积贡献率达71.044%,其中第1主成分PC1主要综合了丙氨酸、丝氨酸、亮氨酸、缬氨酸、天冬氨酸、苏氨酸、异亮氨酸、苯丙氨酸、脯氨酸、蛋白质、谷氨酸、酪氨酸、Cu等营养素含量的信息,第2主成分PC2主要综合了组氨酸、酪氨酸、谷氨酸、苯丙氨酸、异亮氨酸、天冬氨酸、蛋白质等营养素含量的信息,说明前2个主成分包含了氨基酸、蛋白质、Cu、Mn、Zn、Na、Ca、Fe等营养素的信息,基本能反映BCS和SCS的营养组成信息。
利用PC1 和PC2 绘制的得分图见图2。由图2可知,除了SCS中的5号辽宁样品和BCS中的32号山西样品外,不同地区的BCS和SCS基本可以借助主要营养成分分开,SCS样品集中在右侧(PC1>0),BCS样品集中在左侧(PC1<0);除了36号贵州样品远离数据集外,不同地区SCS样品在得分图中较均匀地分散,而BCS中椭圆形标识的1号贵州样品、8号山东样品、13号陕西样品和4号内蒙古样品、6号辽宁样品、7号贵州样品又分别聚到一起,可以认为这几个地区的BCS综合营养成分组成相似。说明薏仁米的产地和品种对其营养成分含量均有很大的影响,除个别样品外,PCA基本能辨别不同地区的BCS和SCS。
采用SPXY来划分训练集和测试集,选取了27个样品为训练集,剩余9个样品为测试集,其平均值、标准偏差和含量范围见表3。将表3与表1中平均值和标准偏差相比可知,训练集和测试集中各营养成分含量的平均值基本都落在SCS和BCS的平均值范围内,说明各变量中不同地区BCS和SCS样品均匀的分布在训练集和测试集中;且测试集的各变量含量范围也基本落在训练集范围内,说明此划分方法所得训练集和测试集是合理的,所建模型是具有通用性的。
表1 大小颗粒薏仁米中粗脂肪、蛋白质、氨基酸和矿物元素的含量†
† 同行不同字母表示差异显著(P<0.05)。
表2 前2个主成分各变量特征向量及累积贡献率
将上述所得训练集和测试集利用SVM来建定性判别模型。SVM是建立一个分类超平面作为决策曲面来使得正反例之间的隔离边缘被最大化,近似实现结构风险最小化[14]。SVM在进行模式分类预测时,先将训练集和测试集归一化到[0,1]区间,再进行建模,所建模型的正确率受惩罚参数c(c为回归误差的权重)和径向基核函数参数g的影响。因为c值过大,样本数据会发生过学习现象,而c值过小,样本数据又会发生欠学习现象,因此需要优化c、g值,采用交互验证(Cross validation,CV)意义下的网格搜寻(Grid search)法来进行参数优化。Grid search优化参数时,是先让参数c和g在一个大范围内粗略搜寻,再根据粗选结果缩小c和g的搜寻范围,最终得到最优值来建模。
Grid search优化参数的结果见图3。图中二维网格为c、g分别取以2为底数的对数后构成,等高线表示取相应的c和g后对应的CV方法的准确率,最佳的c、g值是通过交互验证准确率的高低来确定的,最终所确定的最优c为1,g为0.25。在最优的c、g值下,所建SVM的模型预测结果见图4。由图4可知,准确率达100%,说明薏仁米主要营养成分含量结合SVM法来定性判别其BCS和SCS是可行的。
图2 薏仁米主要营养成分主成分分析得分图Figure 2 Principal component analysis score plots for main nutritional components of Coix seed
营养物质单位训练集(样本数27)均值±标准偏差范围测试集(样本数9)均值±标准偏差范围粗脂肪%7.22±0.475.78~8.106.95±0.526.34~7.69蛋白质g/100 g14.49±1.1412.88~16.6514.99±1.0313.50~16.65赖氨酸mg/g2.56±0.222.20~3.072.55±0.182.31~2.84苯丙氨酸mg/g7.93±0.696.73~9.148.10±0.547.22~8.73蛋氨酸mg/g1.99±0.551.24~3.432.05±0.381.40~2.84苏氨酸mg/g4.25±0.353.68~4.874.31±0.293.79~4.63异亮氨酸mg/g5.79±0.494.98~6.665.87±0.385.24~6.33亮氨酸mg/g21.60±2.4217.86~26.1222.49±2.1518.92~24.73缬氨酸mg/g7.88±0.646.73~8.947.98±0.547.03~8.58组氨酸mg/g3.97±0.782.96~5.553.58±0.433.17~4.36半胱氨酸mg/g1.49±0.191.13~1.961.58±0.211.28~1.88酪氨酸mg/g5.83±0.784.71~7.406.02±0.475.40~6.78天冬氨酸mg/g9.48±0.798.20~10.809.66±0.678.54~10.42丝氨酸mg/g6.89±0.575.98~7.917.04±0.496.22~7.58谷氨酸mg/g35.81±3.5531.11~42.1936.37±2.4832.38~39.24甘氨酸mg/g3.54±0.223.13~4.073.52±0.153.28~3.73丙氨酸mg/g15.38±1.7312.65~18.7116.14±1.6413.34~17.76精氨酸mg/g6.23±0.385.42~7.036.20±0.255.77~6.55脯氨酸mg/g10.91±1.388.36~13.4011.44±1.418.98~12.75Kmg/g3.02±0.422.32~3.842.74±0.332.37~3.42Mgmg/g1.71±0.171.43-2.071.63±0.161.47~1.99Pmg/g4.08±0.633.20~5.533.79±0.513.37~4.83Smg/g1.78±0.391.13~3.521.73±0.061.65~1.82Namg/kg78.93±35.6526.67~166.4096.50±44.4846.65~197.90Camg/kg96.71±20.1668.58~153.10111.47±36.4579.24~201.30Femg/kg46.81±11.7329.69~71.0156.92±25.4334.74~119.20Cumg/kg4.01±1.582.09~7.004.83±1.532.18~6.24Mnmg/kg25.75±5.9316.96~35.7529.20±7.7919.66~44.94Znmg/kg38.58±9.5726.99~59.1543.18±10.7729.92~63.43Almg/kg18.11±14.071.54~55.7310.25±8.742.05~25.52
图3 网格搜寻法寻参示意图Figure 3 Schematic diagram of grid search parameter
图4 最优参数情况下的SVM分类结果图Figure 4 The classification result diagram of SVM with optimal parameters
本研究发现除了粗脂肪、Mg、Al含量是BCS>SCS外,其他营养成分含量均为SCS>BCS,在一定程度上说明不同地区的SCS营养价值高于BCS。对于BCS和SCS的判别,SVM能通过核函数参数的优化来实现测试数据误差最小,且同时缩小模型泛化误差的上界来提高模型的泛化性能,其所建模型的预测准确率可达100%,说明薏仁米主要营养成分含量结合化学计量学方法来判断BCS和SCS是可行的,也为大小颗粒薏仁米的判别提供了新的方法。由于不同地区的BCS和SCS主要营养成分含量有些差别很大,有些又很相近,PCA所提取的特征变量能将大部分薏仁米分开,但还是有个别的样品被错分,如5号辽宁样品和32号山西样品,后续还需要结合薏仁米中的其他特征成分开展大小颗粒的判别。