黄幸幸 - 陈 明,2 ,2 葛 艳,2 ,2 王文娟,2 -,2
(1. 上海海洋大学信息学院,上海 201306;2. 农业部渔业信息重点实验室,上海 201306)
南美白对虾货架期预测指标选择及模型研究
黄幸幸1HUANGXing-xing1陈 明1,2CHENMing1,2葛 艳1,2GEYan1,2王文娟1,2WANGWen-juan1,2
(1. 上海海洋大学信息学院,上海 201306;2. 农业部渔业信息重点实验室,上海 201306)
为研究南美白对虾品质指标与货架期之间的关系及南美白对虾在贮藏过程中的品质变化过程,精确预测其剩余货架期,通过检测277,272.2,255 K温度下南美白对虾的感官指标、理化指标和微生物指标,分别针对南美白对虾品质检测的综合指标和部分关键指标,以支持向量机模型和BP神经网络模型为基础,建立南美白对虾货架期预测模型。结果表明:基于综合指标构建的货架期预测模型的预测精度(支持向量机为97.71%,BP为91.41%)比基于关键指标的(支持向量机为84.08%,BP为83.76%)高;基于支持向量机的预测模型的预测精度(关键指标为84.08%,综合指标为97.71%)比BP预测模型的(关键指标为83.76%,综合指标为91.41%)高;基于综合指标的支持向量机预测模型的预测精度是4种模型中最高的,为97.71%。该结论也可为支持向量机方法和预测指标选择在其他食品领域货架期的应用研究提供一定的参考。
南美白对虾;货架期;预测指标;支持向量机;BP神经网络
南美白对虾因富含有人体必需的蛋白质、维生素、矿物质,并且低脂肪、低碳水化合物,而使消费者的需求量逐渐增加,同时对其新鲜度以及品质的要求也越来越高。货架期是消费者了解食品品质、保障食品安全的重要依据之一[1]。南美白对虾的货架期是指南美白对虾从加工或包装结束后进入流通过程中能够保证其安全可食用,保持理想的感官、理化和微生物特性的时间长度[2]。快速评估南美白对虾的新鲜度及准确预测其剩余货架期在实际应用中具有重要意义。
现阶段国内外关于生鲜食品货架期预测的研究主要是基于动力学方法来构建预测模型,如化学动力学法[3-5]、微生物动力学法[6-8]等。从上述文献的分析可得,传统动力学方法大多是从食品品质变化的机理建立模型的,但由于现有条件的限制,在水产品品质变化过程中尚且存在一些未知的机理及规律,这对模型的可信度及精度存在影响[1]。同时,这些研究大多选取某一种特定品质指标(如菌落总数、特定腐败菌或挥发性盐基氮)作为模型的参数,但没有相关论证表明其他品质指标与食品货架期预测模型构建之间没有关联。目前关于南美白对虾货架期的研究多采用动力学模型,但预测结果并不是很理想[3,8],急需构建一种预测指标更精确、模型精度更高的货架期预测模型。
国外有学者尝试采用人工智能方法来研究南美白对虾品质变化过程,如Ahmad I等[9]采用基于遗传算法的人工神经网络方法研究了冻结率、解冻速率、存储时间、冷冻虾的长度、宽度和厚度对冷冻虾仁的色差和纹理特性的影响,试验结果表明所选择的输入变量可以成功地预测冷冻虾仁的色差和纹理特性。这为基于人工智能的南美白对虾货架期预测提供了理论基础。基于人工智能的货架期预测模型构建方法已经在其他食品领域有较多的运用,预测结果比同等条件下的动力学模型精度更高[10-13]。
选择南美白对虾品质检测的关键指标(温度、TVB-N值和菌落总数,下文均简称为南美白对虾关键指标)和综合指标(温度、感官评分、色差值、TVB-N值、pH值和菌落总数,下文均简称为南美白对虾综合指标)作为建立货架期预测模型的输入参数,选择支持向量机和BP神经网络方法来构建南美白对虾货架期预测模型,研究南美白对虾品质指标的选择对预测模型精度的影响,旨在建立更高精度的货架期预测模型。
1.1 材料与仪器
1.1.1 试验材料
南美白对虾:同产地、同批次、外观相近的鲜活南美白对虾,购自上海市浦东新区临港新城古棕路菜市场。
1.1.2 主要仪器设备
电子天平:JT202N型,上海精天电子仪器有限公司;
智能温度记录仪:YB-HY001-00型,青岛海尔特种电器有限公司;
酸度计:PB-10型,德国赛多利斯集团;
全自动色差计:SC-80型,北京康光仪器有限公司;
医用低温箱:MDF-U541型,三洋电机株式会社;
电热恒温鼓风干燥箱:DHG-9143BS-II型,上海新苗医疗器械制造有限公司;
自动定氮仪:FOSS 2300型,丹麦Foss Tecator公司;
质构分析仪:TA-XT2i型,英国Stable Micro System公司。
1.2 方法
将试验南美白对虾60只流水洗净后,加冰使其猝死,随机分成3组(每组20只)分别在277,272.2,255 K环境下贮藏,定期检测每个贮藏温度每组样品的感官评分、色差值、TVB-N值、pH值和菌落总数,直到货架期终止。
1.2.1 感官评分 从组织、气味以及色泽3个方面对其进行打分,分值为0(完全腐败)到9(非常新鲜),其评分标准是参考食品感官鉴别手册[14]。
1.2.2 色差分析 采用SC-80型全自动色差计进行色度分析。
1.2.3 TVB-N值的测定 按GB/T 5009.44—2003执行。
1.2.4 pH值的测定 根据GB/T 5009.45—2003方法处理后用酸度计测定。
1.2.5 菌落总数值的测定 按GB/T 4789.20—2003执行。
1.3 预测模型的建立
1.3.1 模型参数的选择 现有的关于南美白对虾货架期预测的研究大部分聚焦在南美白对虾关键指标上,如温度、菌落总数和TVB-N值[3,8]。但除了菌落总数和TVB-N值,反映南美白对虾品质变化的指标还有许多,如虾体的感官评分、色差值(L*、a*和b*)、pH值等[15]9。而且目前还没有研究表明这些指标与南美白对虾货架期品质之间的关系,即这些指标作为模型输入参数时对最终模型精度的影响有待研究。
因此,本试验将分别选取关键指标(温度、菌落总数和TVB- N值)和综合指标(温度、感官评分、色差值、TVB-N值、pH值和菌落总数)作为表征南美白对虾品质的指标,并将它们作为预测模型的输入参数,南美白对虾的剩余货架期作为实际输出参数,来研究其对南美白对虾货架期预测模型精度的影响。
1.3.2 预测模型的建立
(1) 基于支持向量机的南美白对虾货架期预测模型。针对模式识别相关问题,相关学者专家在统计学习理论中的 VC维理论以及结构风险最小原理的基础上提出了支持向量机算法(Support Vector Machine,SVM)[16]。其中,支持向量回归算法(Support Vector Regression,SVR)可以解决线性或非线性回归问题,进行时间序列预测或非线性建模与预测[17]。由于支持向量机具有样本数据少、不依赖于经验、全局最优及良好的泛化性能等优点,因此在众多领域上得到应用[18][19]18-30。
非线性支持向量机回归预测模型可用下列方程表示:
(1)
式中:
φ(x)——非线性映射函数;
K(xi,x)——核函数;
b——阈值。
从已有的研究[18][19]13结果来看,高斯核函数是最常用的核函数,且在大多数情况下都获得了很好的预测效果,所以本试验也选择高斯函数作为核函数。
图1为根据支持向量机回归算法建立的南美白对虾货架期预测模型。其中,输入参数(x1,x2,…,xn)就是与南美白对虾品质变化相关的指标,输出参数(y)为南美白对虾的剩余货架期。
根据以上原理,对应图1所示的模型,分别构建基于南美白对虾关键指标的SVM模型和基于南美白对虾综合指标的SVM模型。这2种模型的区别在于模型的输入参数不同:基于南美白对虾关键指标的SVM模型的输入参数为温度、菌落总数和TVB-N值,而基于南美白对虾综合指标的SVM模型的输入参数为温度、感官评分、色差值、TVB-N值、pH值和菌落总数。在Matlab环境下,对建立的基于SVM的预测模型进行试验。
图1 基于SVM的南美白对虾货架期预测模型结构Figure 1 Structure of the prediction model of shelf-life of Penaeus Vannamei based on SVM
(2) 基于BP神经网络的南美白对虾货架期预测模型。BP神经网络又称多层前馈式误差反传神经网络,由输入层、输出层和若干隐含层组成。它可以很好地解决各个指标间的非线性关系,常用于构建预测模型,现已广泛应用于食品货架期预测研究[10-13]。
3层 BP神经网络的非线性映射能力比较强[10],因此选择3层结构的BP神经网络,含有1个输入层、1个输出层和 1个隐含层,结构见图2。xi(x1,x2,…,xn)为模型的输入层节点,其中,基于南美白对虾关键指标的BP网络模型的输入数据为温度、菌落总数和TVB-N值,而基于南美白对虾综合指标的BP网络模型的输入数据为温度、感官评分、色差值、TVB-N值、pH值和菌落总数;y为模型的输出层节点,指剩余货架期。
隐含层节点数的计算公式:
n=(n1+n0)1/2+a,
(2)
图2 基于BP神经网络的南美白对虾货架期预测模型Figure 2 Prediction model of shelf-life of Penaeus Vannamei based on BP neural network
式中:
n0——输入层节点数;
n1——输出层节点数;
a——1~10的常数。
根据式(2)计算结果,对网络隐含层节点数在3~12下的性能进行测试,结果表明隐含层节点数为10时网络收敛速度最快,故2种模型中隐含层节点数都为10。
2.1 试验测定数据
由于不同贮藏温度下南美白对虾品质变化速率不同,所以对277 K贮藏下的南美白对虾每天检测一次指标,272.2 K贮藏下的南美白对虾每2 d检测一次指标,255 K贮藏下的南美白对虾每7 d检测一次指标,分别取平均值。根据GB 2733—2015,对虾的TVB-N值超过30 mg/100 g 时,虾是不可食用的,即货架期终止。因此,把南美白对虾剩余货架期定义为当前检测指标日期和南美白对虾货架期终止日期的时间间隔。3组南美白对虾的各指标数据见表1。与文献[3]和[15]12-22中的南美白对虾品质指标数据对比,发现试验所得数据与其比较吻合,基本可以支撑本试验理论研究。试验共获得20组数据,随机选取第3、7、12和17组数据作为测试集,剩下的16组数据作为训练集。
表1 南美白对虾的指标数据Table 1 Indexes values for Penaeus Vannamei
由于本试验所选取的模型输入参数和输出参数有不同的量纲,为减少货架期预测模型的误判概率,需对以上数据进行归一化处理[11]:
(3)
式中:
p′——归一化数据;
p——原始数据;
pmin——原始数据最小值;
pmax——原始数据最大值。
2.2 南美白对虾货架期预测模型预测结果
2.2.1 基于SVM模型的南美白对虾货架期预测结果 首先利用交叉验证寻找模型最优惩罚参数c和核函数参数g。交叉验证后得到基于南美白对虾关键指标的SVM模型的最优惩罚参数c为20,g为0.471;基于南美白对虾综合指标的SVM模型的最优惩罚参数c为20,g为0.3。然后分别利用得到的最优参数对前面选定的4组测试数据集进行测试和预测,其预测结果见图3。
由图3可知,基于综合指标的SVM预测模型中每一组测试数据预测值与实际值之间的偏差都比基于关键指标的SVM预测模型的小;基于关键指标的SVM预测模型的相关系数R约为0.995 74,MSE约为0.427%,而基于综合指标的SVM预测模型的相关系数R约为0.999 77,MSE约为0.052%,其整体预测效果更好。
图3 基于SVM模型的南美白对虾货架期预测结果图Figure 3 Prediction of Penaeus Vannamei shelf -life based on SVM model
2.2.2 基于BP网络的南美白对虾货架期预测结果 通过训练,最终在2种模型的网络训练中动量常数都取为0.9,学习速率取为0.05,训练的最大步数设为10 000,网络性能目标误差为0.001,隐含层和输出层采用Sigmoid传输函数,训练函数选取trainlm函数,学习函数选取learngdm 函数,将样本数据对生成的BP网络预测模型进行训练并测试。基于南美白对虾关键指标的BP网络模型经过12次训练满足性能误差条件停止训练,基于南美白对虾综合指标的BP网络模型经过10次训练停止训练。将选定的4组测试数据分别代入2个模型进行预测,得到的测试结果见图4。
图4 基于BP网络的南美白对虾货架期预测结果图Figure 4 Prediction of Penaeus Vannamei shelf -life based on BP model
由图4可知,基于综合指标的BP预测模型要比基于关键指标的BP预测模型整体预测效果好,其每组测试数据预测值与实际值之间的偏差更小;但与图3(b)基于综合指标的SVM预测模型相比,图4(b)基于综合指标的BP预测模型每组测试数据的预测值与实际值之间的偏差要大一点,其预测效果没有基于综合指标的SVM预测模型好。
2.3 预测结果分析
将每一种模型预测到的值反归一化后,可得所预测的货架期,反归一化的计算公式:
p1=p′(pmax-pmin)+pmin,
(4)
式中:
p1——反归一化的预测值;
p′——归一化数据;
pmin——原始数据最小值;
pmax——原始数据最大值。
根据式(4)计算,基于SVM和BP神经网络的南美白对虾货架期预测模型所预测的货架期与实际货架期的比较见表2、3。
表2 基于SVM预测模型的预测货架期与 实际货架期的比较Table 2 Comparison between the predicted shelf life based on SVM model and the actual
表3 基于BP神经网络预测模型的预测货架期 与实际货架期的比较Table 3 Comparison between the predicted shelf life based on BP model and the actual
由表2可知,基于关键指标的SVM模型的平均相对误差为15.92%,基于综合指标的SVM模型的平均相对误差为2.29%,基于关键指标的BP网络模型的平均相对误差为16.24%,基于综合指标的BP网络模型的平均相对误差为8.59%。
从参数的选择来看,不管是采用支持向量机方法还是BP神经网络方法,基于综合指标构建的模型都比基于关键指标的精度高。这说明,影响南美白对虾品质变化的各个指标与其货架期都是相关的,影响着货架期预测模型的精度。因此,在预测货架期时,应综合考虑南美白对虾所有的品质指标变化情况,包括感官指标、理化指标和微生物指标。
从同等条件下的SVM模型和BP网络模型的预测结果来看,基于SVM的南美白对虾货架期预测模型的精度更高一点,预测结果更接近真实货架期情况。这是由于本试验模型所训练的样本数据比较少,而支持向量机算法相对于BP网络更适合解决小样本问题[20-22]。
综合4种模型的预测结果对比分析,发现基于综合指标的SVM模型的精度是最高的,误差在5%以内,最大相对误差为5.1%,平均相对误差为2.29%,预测精度为97.71%。而同等条件下的BP模型的平均相对误差为8.59%,传统动力学模型的平均相对误差一般为10%左右[3,8]。这表明,采用SVM方法来分析南美白对虾的品质变化过程,并选取温度、感官指标、色差值、TVB-N值、pH值和菌落总数作为模型的输入参数,从而预测南美白对虾的剩余货架期是可行的,且预测精度要高于传统的动力学方法。
本试验分析了不同温度环境下贮藏的南美白对虾的品质变化过程,采取南美白对虾品质检测的综合指标和部分关键指标,基于支持向量机和BP神经网络方法,建立了南美白对虾货架期预测模型。试验结果表明,南美白对虾的各个品质指标与其货架期都是相关的,将南美白对虾的综合指标(温度、感官指标、色差值、TVB-N值、pH值和菌落总数)作为模型输入参数得到的预测结果精度更高。同等条件下支持向量机模型预测的精度比BP神经网络的高,这说明在小样本的非线性问题解决时应采用支持向量机方法。此外,基于综合指标的SVM预测模型的精度可达97.71%,高于同等条件下的BP模型(91.41%)和动力学模型(约90%[3,8])。以上结论可以为支持向量机方法以及预测指标选择在其他食品领域货架期的应用研究提供一定的参考。但以上研究是基于恒温贮藏条件下南美白对虾剩余货架期的预测,对于波动温度条件下贮藏的研究不一定适用,故下一步工作将研究变温条件下贮藏的南美白对虾剩余货架期的预测。
[1] 陈晓宇, 朱志强, 张小栓, 等. 食品货架期预测研究进展与趋势[J]. 农业机械学报, 2015, 46(8): 192-199.
[2] KILCAST D, SUBRAMANIAM P. The stability and shelf-life of food[M]. Abington: Woodhead Publishing Limited, 2000: 2, 70-73.
[3] 林进, 杨瑞金, 张文斌, 等. 动力学模型预测即时南美白对虾货架寿命[J]. 食品科学, 2009, 30(22): 361-365.
[4] 于滨, 王喜波. 鸡蛋贮藏过程中品质变化的动力学模型[J]. 农业工程报, 2012, 28(15): 276-280.
[5] 张利平, 谢晶. Arrhenius方程结合特征指标在蔬菜货架期预测中的应用[J]. 食品与机械, 2012, 28(5): 163-168.
[6] 邢少华, 张小栓, 马常阳, 等. 波动温度下罗非鱼微生物生长动力学模型[J]. 农业机械学报, 2013, 44(7): 194-198.
[7] TOMACA A, MASCHERONIB R H, YEANNES M I. Mode-ling the effect of gamma irradiation on the inactivation and growth kinetics of psychrotrophic bacteria in squid tings during refrigerated storage. Shelf-life predictions[J]. Journal of Food Engineering, 2013, 117(2): 211-216.
[8] 王欢, 谢超, 孙媛. 凡纳滨对虾即时虾仁在常温保藏中的货架期预测及品质分析[J]. 海洋与湖沼, 2013, 44(4): 1 095-1 102.
[9] AHMAD I, JEENANUNTA C, CHANVARASUTH P, et al. Prediction of physical quality parameters of frozen shrimp (Litopenaeus vannamei): an artificial neural networks and genetic algorithm approach[J]. Food Bioprocess Technol, 2014, 7: 1 433-1 444.
[10] 潘治利, 黄忠民, 王娜, 等. BP神经网络结合有效积温预测速冻水饺变温冷藏货架期[J]. 农业工程学报, 2012, 28(22): 276-281.
[11] 刘雪, 李亚妹, 刘娇, 等. 基于BP神经网络的鲜鸡蛋货架期预测模型[J]. 农业机械学报, 2015, 46(10): 328-334.
[12] MI Chun-qiao, YANG Jian-yu, LI Shao-ming, et al. Prediction of accumulated temperature in vegetation period using artificial neuralnetwork[J].Mathematical and Computer Modelling, 2010, 51(11/12): 1 453-1 460.
[13] 曾祥燕, 赵良忠, 孙文兵, 等. 基于PCA和BP神经网络的葡萄酒品质预测模型[J]. 食品与机械, 2014, 30(1): 40-44.
[14] 傅德成, 刘明堂. 食品感官鉴别手册[M]. 北京: 中国轻工出版社, 1991: 52-53.
[15] 李蕾蕾. 南美白对虾低温贮藏过程中的菌相变化及货架期预测模型的建立[D]. 天津: 天津商业大学, 2014.
[16] VAPNIK V N.数据挖掘中的新方法——支持向量机[M]. 张学工, 译. 北京: 科学出版社, 2000: 71-74.
[17] 陈金凤. 支持向量机回归算法的研究与应用[D]. 无锡: 江南大学, 2008: 4-14.
[18] 王定成, 方延健 , 高理富, 等. 支持向量机回归在线建模及应用[J]. 控制与决策, 2003, 18(1): 89-91.
[19] 王芳. 基于支持向量机的沪深300指数回归预测[D]. 济南: 山东大学, 2015.
[20] 侯伟真. 求解支持向量机的若干优化算法的研究[D]. 青岛: 山东科技大学, 2007: 4-6.
[21] 刘静, 管骁, 易翠平. 近红外光谱技术结合支持向量机对食用醋品牌溯源的研究[J]. 食品与机械, 2016, 32(1): 38-50.
[22] 刘洋, 王涛, 左月明. 基于支持向量机野生蘑菇近红外识别模型[J]. 食品与机械, 2016, 32(4): 92-112.
基金项目:“十二五”国家科技支撑计划项目课题(编号:2015BAD16B07);重庆市社会民生科技创新专项项目(编号:cstc2015shmszx80004);重庆市社会事业与民生保障科技创新专项项目(编号:cstc2016shms-ztzx80005)
作者简介:王文军,男,西南大学在读硕士研究生。
通信作者:曾凯芳(1972—),女,西南大学教授,博士。 E-mail:zengkaifang@163.com
收稿日期:2017—01—19
The prediction index and model of the shelf-life of Penaeus Vannamei
(1.CollegeofInformation,ShanghaiOceanUniversity,Shanghai201306,China;2.KeyLaboratoryofFisheriesInformationMinistryofAgriculture,Shanghai201306,China)
In order to precisely predict the remaining shelf life ofPenaeusVannamei, the relationship between quality indexes and remaining shelf life and the quality change process of it during the storage process were studied. The sensory and physical-chemical indexes, and microorganisms ofP.Vannameiat 277 K, 272.2 K and 255 K were first tested in this study. Then, the prediction models of the shelf life ofP.vannameiwere established for the comprehensive and some key indexes of its quality, and this were based on both the support vector machine and the BP neural network models. The results showed that the prediction accuracies of the shelf-life prediction models based on the comprehensive indexes ofP.Vannamei(97.71% for SVM model and 91.41% for BP model) were higher than those of the prediction models based on several key indexes (84.08% for SVM model and 83.76% for BP model). Meanwhile, the prediction accuracies of the prediction models based on support vector machine (84.08% for key indexes and 97.71% for comprehensive indexes) were higher than those of BP prediction models (83.76% for key indexes and 91.41% for comprehensive indexes). Moreover, the prediction accuracy of the support vector machine (SVM) model based on the comprehensive indexes was 97.71%, which were the highest among the four models. The conclusion also provided a reference for the application of support vector machine and selection of prediction indexes in the shelf-life of other food fields.
PenaeusVannamei; shelf-life; prediction indexes; supp-ort vector machines; BP neural network
10.13652/j.issn.1003-5788.2017.04.021
湖南省食品科学与工程类专业大学生创新训练中心建设项目(编号:湘教通[2014]272号);湖南省普通高校学科带头人培养对象资助项目(编号:湘教办通[2014]209号);首批湖南省高等学校“2011 协同创新中心”粮油深加工与品质控制湖南省协同创新中心建设项目(编号:湘教通〔2013〕448 号)
李立华,女,中南林业科技大学在读硕士研究生。
周文化(1969-),男,中南林业科技大学教授,博士。 E-mail:zhouwenhua@126.com
2017-02-19