张 伏, 崔夏华, 丁 轲, 张亚坤, 王永县, 潘孝青
1. 河南科技大学农业装备工程学院, 河南 洛阳 471003
2. 江苏大学现代农业装备与技术教育部重点实验室, 江苏 镇江 212013
3. 机械装备先进制造河南省协同创新中心, 河南 洛阳 471003
4. 河南科技大学动物科技学院, 河南 洛阳 471023
5. 江苏省农业科学院畜牧研究所, 江苏 南京 210014
鸡蛋是营养丰富、 优质的动物蛋白质来源, 受到猪瘟的影响, 鸡蛋作为动物性蛋白的需求大幅增加, 蛋鸡养殖行业也在逐步发展与壮大以满足人们的需求。 如何在幼雏阶段甚至胚胎发育阶段能够简单、 准确与方便地判断出雌雄, 对蛋鸡养殖行业的发展具有重要意义[1]。 目前, 常用的幼雏雌雄判别方法多采用通过相关仪器肉眼识别或性状体现进行, 机械法判别雏鸡形状已经成熟。 上述研究方法为雏鸡和鸡胚胎雌雄判别提供了理论基础与方法依据。 但在孵化过程中, 种蛋无损、 快速鉴定性别的方法依然有待发展。
20世纪80年代后期迅速发展起来的近红外光谱分析技术以其分析速度快、 操作简单、 检测准确率高等优点已被广泛应用于水果、 农作物[2]、 药物[3-4]、 茶叶[5]等检测。 受采集环境和样本的影响, 采集到的光谱数据包含了各种各样的外界噪声, 包括基线漂移、 样本不均匀和光散射等。 因此, 对所获数据进行适当预处理以消除噪声污染对后期模型分析尤为重要。 潘庆磊等[6]搭建高光谱图像采集系统研究孵化0~12 d的种蛋胚胎圆头、 中间、 尖头3个部位的感兴趣区域, 对原始数据搭建模型进行分析比较; 祝志慧等[7]以紫外-可见光波段为有效波段研究鸡胚雌雄鉴别, 其采用多元散射校正对数据进行预处理后, 筛选特征波段建立模型; 刘燕德等[8]采用近红外漫反射研究鸡蛋品质, 采用多元散射校正、 最大-最小归一化、 一阶和二阶导数、 基线校正、 一阶导数+基线校正, 消除常数偏移量等预处理方法, 发现一阶导数+基线校正的预处理方法较好。
本文在深入研究近红外光谱预处理的基础上, 以种鸡蛋为研究对象, 为找到适合种鸡蛋性别鉴定的预处理方法, 比较了多种预处理方法对偏最小二乘判别和线性判别模型的影响。
实验样本为96个壳色相近、 表面无裂纹的新鲜种鸡蛋, 对蛋壳表面清理, 采用新洁尔灭溶液消毒后将样本标号, 且分别将鸡蛋的钝端、 锐端和赤道[见图1(a,b)]位置标记为1, 2和3, 如图1所示。 采集胚胎发育过程中的种蛋表面漫反射光谱, 样本采集后集中放置在温度为37.8 ℃、 湿度为60%的孵化机中, 且孵化机的温度和湿度根据变温孵化法调节。 待孵化完成后, 对雏鸡翻肛鉴定性别[见图2(a,b)], 对无法准确鉴定结果的雏鸡进行解剖检测, 通过雄性睾丸和雌性卵巢的形态变化进行区分, 如图2(a)公鸡性腺, (b)母鸡性腺。
图1 种鸡蛋测量位置图
图2 雏鸡性腺图
实验用可见/近红外光谱检测系统如图3所示, 系统主要包括一台光源(150 W卤素灯)、 波长范围为345~1 041 nm的USB 4000光纤光谱仪(Ocean Optics)、 装有与光谱仪配套采集软件Spectrasuite的计算机和一根Y型光纤。 采用便携式光源, 其入射光强度可调, 计算机与光谱仪间通过USB数据线连接。 所使用的孵化机型号为WQ-192(德州市通达孵化设备制造厂, 山东德州)。
图3 可见/近红外光谱检测系统
使用检测系统采集345~1 041 nm波长范围的种蛋样品表壳所标记的3个不同位置的漫反射光谱。 采集数据过程在黑暗环境下进行, 采集时将光纤探头在不损坏样本的前提下紧贴样本表面以避免除入射光外其他光源的影响。 采集数据前先将设备预热30 min, 采集软件Spectrasuite的积分时间设置为4 ms, 采集样本数据前, 将探头紧贴校准白板, 调节光源使最大反射率为最大量程的80%, 采集参考光谱, 而后采集暗光谱。 为消除暗电流的影响, 需进行光谱校正, 样本反射率的计算公式为
(1)
式(1)中,R为所测样本反射率;I为样本的反射光谱强度;IC为参考光谱的反射光谱强度;IA为暗光谱的反射光谱强度; (I,IC,IA均无单位)。
从放入孵化机时开始, 每隔24 h采集一次光谱数据, 采集时待光谱曲线稳定后保存所测数据。 经光谱校正后, 对数据进行预处理, 减弱数据中无关信息变量对光谱的影响, 提高模型的稳健性和预测能力[9]。 对胚胎发育216, 240, 264, 288和312 h的数据进行分析, 主要是因为发育216 h后, 胚胎各种器官已包入体腔。
对96个种蛋进行观察统计发现, 共有46个为雄性蛋, 50个母鸡蛋。 分析时按照2∶1的比例划分训练集和测试集, 本实验将雄性种蛋的类别变量设为1, 雌性种蛋的类别变量设为-1。
表1 样本划分结果
雄性种蛋和雌性种蛋的平均原始光谱曲线如图4所示。 由于光谱两端的噪声大, 信噪比低且信息少, 故选取440.27~874.6 nm中间区域内的光谱曲线进行分析。
图4 样本平均原始光谱图
采用偏最小二乘法判别PLS-DA和线性判别分析LDA模型, 使用训练集建模, 预测集进行预测, 得出预测集判别准确率, 求取相应的准确率变化, 216, 240, 264, 288和312 h预测集准确率数据见表2—表6。
表2 216 h不同位置、 不同预处理方法的预测集判别准确率变化
表3 240 h不同位置、 不同预处理方法的预测集判别准确率变化
表4 264 h不同位置、 不同预处理方法的预测集判别准确率变化
表5 288 h不同位置、 不同预处理方法的预测集判别准确率变化
表6 312 h不同位置、 不同预处理方法的预测集判别准确率变化
216~312 h内的准确率变化情况如图5所示, 图中黄色柱形表示PLS-DA模型的准确率变化, 红色柱形表示LDA模型的准确率变化, 短斜线分别表示无法预测胚胎发育216,264和312 h所采数据经Spectroscopic预处理后所建模型的判别准确率。 由图5知, 胚胎发育288 h时, 预处理可提高35个模型的准确率, 降低1个模型的准确率; 264 h的处理效果在分析时间内最差, 降低19个模型的判别准确率; 312 h的处理效果次之, 预处理降低12个模型的判别准确率。
Normalize是对数据进行归一化处理, 将其限制在一定范围内, 由图5可见其对模型判别准确率影响不确定。 SNV和MSC均是消除漫反射数据采集过程中光谱差异的方法, 本研究中分析比较不同时间的SNV和MSC预处理, 发现除胚胎发育264 h时位置2处的PLS-DA模型外, 两者对模型判别的准确率的影响相同, 由于存在实验误差, 可认为SNV和MSC预处理对不同时间、 不同位置的模型有相同作用。 导数法虽可有效消除基线和其他背景的干扰, 但其引入噪声, 降低信噪比。 本研究中采用二阶导数法对数据进行探索, 发现其可能对模型无作用效果, 判别准确率与原始数据相比没有明显差异。 比较胚胎发育288 h时的预处理影响, 发现Detrend和Spectroscopic两种预处理方法可显著提高判别效果, 其中Detrend是一种去趋势的方法, 可消除获取数据时产生偏移的影响, 而Spectroscopic是将反射率单位转换为吸光度的一种方法, 对比两种预处理方法在不同位置的处理效果可知, 其对位置2即钝端处的效果更优。 但经Spectroscopic预处理后可能无法获取模型的预测集预测准确率, 所以Detrend是一种较优的预处理方法。 由表5见, 此时PLS-DA模型的变化判别准确率为34.37%, LDA模型的变化判别准确率为43.75%, 故利用LDA模型对种蛋性别鉴定易获得较佳的判别效果。
图5 216~312 h内的准确率变化
综上, 对胚胎发育288 h的数据进行预处理可提高模型的判别准确率, 其中采集位置2即种蛋钝端处数据后, 进行Detrend去趋势预处理, 利用LDA模型分析种蛋性别效果较好。
(1)研究了基于可见/近红外光谱的受精蛋的性别判别位置和判别时间, 通过对光谱数据的截取, 最终确定440.27~874.6 nm波段的光谱为有效光谱, 通过对该段光谱的研究分析可以对种鸡蛋进行有效研究。
(2)研究了不同时间、 不同预处理两种模型的预测集准确率变化, 发现胚胎发育288 h时, 预处理可有效提高35个模型的准确率; 264 h的处理降低了19个模型的判别准确率; 312 h的预处理降低了12个模型的判别准确率。 288 h时的预处理效果较好, 264 h时的预处理效果分析时间内最差。
(3)研究了不同预处理方式间的差别及其对所建模型的预测效果影响。 发现Normalize对模型判别准确率影响不确定; SNV和MSC预处理对不同时间、 不同位置的模型有相同作用效果; 二阶导数法可能对模型无作用效果, 判别准确率与原始数据相比没有发生变化; Detrend和Spectroscopic两种预处理方法可显著提高判别效果, 且对位置2即钝端处的效果更优, 但经Spectroscopic预处理后可能无法获取模型的预测集准确率, 所以Detrend是一种较优的预处理方法。
(4)比较了种蛋孵化288 h时, 位置2即钝端处的模型预测效果。 此时, PLS-DA模型的变化判别准确率为34.37%, LDA模型的变化判别准确率为43.75%, LDA模型比PLS-DA模型的变化判别准确率高9.38%, 故利用LDA模型对种蛋性别鉴定易获得较佳的判别效果。
由于近红外光谱分析技术具有快速、 对样本无损等特点, 该研究对近红外光谱技术在孵化中期的性别鉴定时的数据采集位置和数据预处理方法进行了比较, 提供了一种新的思路。