高 峰, 徐嘉翊, 罗华平*
1. 塔里木大学机械电气化工程学院, 新疆 阿拉尔 843300 2. 自治区教育厅普通高等学校现代农业工程重点实验室, 新疆 阿拉尔 843300
进行户外探测时, 探测器接受到的不仅包含样品本身反射和散射的光线, 还会受到户外环境光线的影响, 使得采集到的光谱中存在部分与样品品质无关的信息。 受样品的二向反射特性影响, 入射天顶角、 探测天顶角和相对方位角也会对光谱产生一定影响[1-3]。 为了降低环境光线以及角度因素对光谱数据的干扰, 通常使用室内暗室环境采集光谱, 虽然能够获取较为准确的光谱信息, 但也限制了光谱检测的应用场景。 因此, 从降低环境光线与二向反射特性对户外光谱影响的角度出发, 探究一种提高户外探测精度的方法。
二向性反射是自然界物体对电磁波反射的基本现象, 一般用双向反射分布函数(bidirectional reflectance distribution function, BRDF)来表达[4], 由于BRDF具有方向性, 可以通过BRDF模型反演来预测任意角度下的反射率。 目前BRDF模型广泛应用于大气、 土壤、 植被、 冰雪等领域中, Zheng等[5]利用Ross-li模型反演华北地区的植被、 土壤、 农田以及城镇的地表反射率, 并对比了不同季节的地表反射率变化。 陶炳成等[6]使用Ross-li模型对敦煌辐射校正场的多角度观测数据进行拟合, 并与卫星遥感反射率进行对比。 杜沈达等[7]使用Roujean模型对不同太阳天顶角的地表高光谱数据进行校正, 结果表明BRDF模型校正不同几何角度是可行的。 Vountas等[8]使用RPV模型与Ross-li模型对气溶胶表面参数反演, 取得较好效果。 Li等[9]对敦煌戈壁的地表反射率进行研究, 采集不同探测天顶角个和方位角的地表反射信息, 分别使用Walthall、 Sine-Walthall、 Hapke、 Roujean与Ross-li几种模型地表反射率进行拟合, 结果表明Ross-li模型的反演值最接近观测数据。 相比之下, BRDF模型应用于果品反射率方面的研究较少, 徐嘉翊等[10]探究了方位与品质对冬枣、 红提及香梨这3种果品空间特性光谱的影响, 结果表明方位因素与空间特性光谱密切相关。 本工作以南疆冬枣、 红提、 小白杏为研究对象, 使用多种BRDF模型反演空间特性光谱, 通过反演的空间特性光谱对户外采集的光谱进行修正并建立品质预测模型, 探究提高户外检测精度的可行性。
实验样品均采集于新疆生产建设兵团第一师阿拉尔市, 选取大小一致, 无肉眼可见损伤的成熟样品进行实验。 户外光谱采集使用四川双利合谱科技有限公司的Image-λ-N17E-N3型增强型近红外高光谱相机, 采用透射光栅作为分光元件, 其光谱范围900~1 750 nm、 254个波长变量、 光谱中心分辨率5 nm。 室内光谱采集使用北京卓立汉光公司的Hyperspectral Sorting System推扫式高光谱分选系统采集。 使用HSIA-CT-150*150型标准白板进行光谱校正。 样品水分及可溶性固形物含量测定使用A2003型电子天平、 GZX-9140-MBE电热鼓风干燥箱、 GMK-701R型手持式糖度计。
1.2.1 光谱采集方法
选择晴朗天气采集户外光谱, 如图1所示, 将样品按照该序号置于实验架上。 高光谱相机距离实验架中心为1.5 m, 采集样品时测量太阳光线入射天顶角、 探测器探测天顶角以及相对方位角。 户外光谱采集完成后, 将样品移至室内高光谱分选系统内采集光谱, 相机高度设置为42 cm, 曝光时间11.5 ms, 传动带移动速度为2.0 m·min-1。 光谱采集完成后, 户外光谱使用ENVI软件进行平场校正, 室内光谱使用SpecView软件进行黑白校正。 使用ENVI软件提取光谱数据, 选取感兴趣区域大小为5 pi×5 pi, 对光谱进行去除包络线处理, 以突出光谱特征。 由于原始光谱首尾两段存在明显噪声, 因此选取932~1 718 nm范围光谱进行后续实验。
图1 户外样品摆放
1.2.2 理化指标采集方法
光谱采集完成后, 使用采集光谱的一面进行理化指标测定, 依据国标(GB/T 5009.3—2016)测定样品水分含量, 使用GMK-701R型手持式糖度计测量样品可溶性固形物含量, 样品的水分和SSC含量统计结果如表1所示。
表1 样品理化指标统计表
1.2.3 空间特性光谱提取方法
由于高光谱分选系统处于暗室环境, 不受外界环境光等干扰, 且有4个均匀分布的卤素灯作为光源, 因此认为暗室光谱采集的光谱最接近样品的真实光谱。 户外光谱采集时易受外界环境及角度因素影响, 使得采集的光谱数据中包含部分与样品品质无关的空间特征信息。 为了获取这部分能够反映环境及角度因素影响的空间信息, 定义空间特性光谱来描述这部分影响, 计算公式如式(1)
(1)
式(1)中:S为样品的空间特性光谱;S1为样品的户外光谱;S2为样品的暗室光谱。
由于空间特性光谱与方位因素有很好的相关性[11], 因此可以使用BRDF模型反演样品的空间特性光谱。 常用的BRDF模型分为经验模型、 半经验模型和物理模型[4], 经验模型依赖于大量野外实测数据, 易于计算和反演, 但缺乏明确物理机制; 半经验模型既具有计算简单灵活的特点又兼顾有一定物理意义, 其中半经验线性核驱动模型形式相对简单, 能实现快速反演, 广泛应用于卫星产品中。 物理模型中每个参数都有实际物理意义, 但通常较为复杂, 反演难度较大。 因此选择经验模型与半经验模型进行反演, 能快速得到空间特性光谱。
1.3.1 经验模型
Walthall[11]和Shibayama[12]模型都是基于大量野外数据为基础的统计经验模型, 二者都有a、b、c、d这4个线性参数。 函数形式分别如式(2)和式(3)所示
(2)
(3)
式(2)和式(3)中:p(θi,θv,φ)表示反射率,a、b、c、d为四个待定线性参数,θi为入射天顶角,θv为探测天顶角,φ为相对方位角。
1.3.2 半经验模型
Ross-li模型[13-14]是具有3个线性参数的核驱动模型, 有一个常数项和两个驱动核, Ross-li模型函数形式如式(4)—式(9)
R(θi,θv,φ,λ)=fiso(λ)+fvol(λ)kvol(θi,θv,φ)+fgeo(λ)kgeo(θi,θv,φ)
(4)
(5)
ξ=cos-1(cosθicosθv+sinθisinθvcosφ)
(6)
(7)
(8)
(9)
式(4)—式(9)中:R为反射率,fiso、fvol、fgeo分别为待定参数,kvol为体散射核,kgeo为几何光学核,ξ为散射相位角。
Roujean模型[15]也是3参数线性核驱动模型, 与Ross-li模型类似, 其函数形式为
R(θi,θv,φ,λ)=k0+k1f1(θi,θv,φ)+k2f2(θi,θv,φ)
(10)
(11)
式(10)和式(11)中:k0、k1和k2是待定参数,f1(θi,θv,φ)主要描述平面的反射特性,f2(θi,θv,φ)类似Ross-li的体散射核, 即f2(θi,θv,φ)=kvol(θi,θv,φ)。
Rahman模型[16-17]是一种3参数的半经验非线性模型, 有r0、k及b这3个参数, 其函数形式为式(12)和式(13)
R(-μi,μv,φ)=r0[μiμv(μi+μv)]k-1×
(12)
μi=cosθi
μv=cosθv
(13)
(14)
G=
(15)
式(12)中:r0,p(Ω)为散射相函数; 主要用来描述热点效应。
1.3.3 空间特性光谱反演流程
对于线性参数模型, 使用偏最小二乘方法拟合模型未知参数[18], 具体计算方法如式(16)
F00=KF
(16)
(17)
因此K的最小二乘解为
K=F00F#
(18)
式(18)中,F#表示F的伪逆, 即F#=FT(FFT)-1。 将计算得到的样品空间特性光谱以及入射天顶角、 探测天顶角、 相对方位角输入到式(16)中, 结合不同BRDF模型的计算公式即可得到模型的参数值, 依据式(18)即可反演不同角度下的空间特性光谱。 对于非线性参数模型, 其参数使用非线性方法拟合, 基本步骤与线性模型参数的获取一致。
1.3.4 空间特性光谱修正户外光谱方法
使用5种BRDF模型得到反演的空间特性光谱后, 利用空间特性光谱对户外光谱进行修正, 进而得到近似暗室光谱的修正光谱。 计算公式如式(19)所示
(19)
式(19)中,S3为修正后的户外光谱;S1为户外测得的样品光谱;S为通过反演得到的空间特性光谱。
为探究修正户外光谱进而提高户外探测精度的可行性, 需要建立样品品质预测模型。 而样本中的异常样本会对模型预测效果以及可靠性产生影响, 因此在建立预测模型之前需要提出部分异常样本, 图2为使用浓度残差方法剔除冬枣水分含量异常样本, 输入阈值为2, 对样本数量及理化值数据进行计算后得到实际剔除阈值, 结果如图2所示, 剔除了4个异常样本。 对冬枣SSC含量异常样本以及小白杏与红提的理化值异常样本使用同样方法进行剔除。
图2 浓度残差剔除异常样本
于全谱数据建立的模型较为复杂、 运算效率低, 而研究结果表明[19], 选择合适的特征变量即可建立准确度较高的模型, 能够有效简化模型、 提高模型稳健性和运算速度, 因此, 使用竞争性自适应重加权算法(competitive adaptive re-weighted sampling, CARS)提取光谱特征变量, 为保证提取特征变量的稳定性, 设置提取特征波长循环50次, 每次提取后使用偏最小二乘方法建立预测模型, 选择其中预测效果最好的一组作为最终选择的特征变量。 图3为使用CARS方法提取冬枣水分含量特征波长, 如图3所示, 随着迭代次数增加, 交互验证均方根误差在第19次迭代时达到最小, 最终选择了41个特征波长变量数据。
图3 CARS方法选取冬枣水分含量特征波长
选取特征波长后使用偏最小二乘法(partial least squares, PLS)建立品质预测模型, 模型评价指标为相关系数R、 决定系数R2、 预测均方根误差RMSEP以及剩余预测残差RPD, 其中训练集相关系数使用Rc表示, 预测集相关系数使用Rp表示。 剩余预测残差RPD小于2时, 表明模型效果一般, RPD为2~2.5时, 表明模型有较好的预测效果, RPD大于3时, 表明模型有很好的预测效果, 各评价指标大于计算公式如式(20)—式(23)所示
(20)
(21)
(22)
(23)
依据式(1)提取样品的空间特性光谱, 结果如图4所示。 其中, 红色为冬枣空间特性光谱, 蓝色为红提空间特性光谱, 绿色为小白杏空间特性光谱, 3种果品的空间特性光谱的趋势较为接近、 吸收峰位置一致, 但数值存在一定差异, 可能与不同品种的果品内部品质不同有关。
图4 部分样品空间特性光谱图
户外实验时入射光为太阳光, 测量得到本次实验太阳光入射天顶角为51.5°, 同时分别计算实验架上每个样品对应的探测天顶角及方位角。 分别使用Walthall、 Shibayama、 Ross-li、 Roujean与Rahman这5种BRDF模型反演样品的空间特性光谱, 结果如图5、 图6、 图7所示。 模型反演评价参数为决定系数R2与预测均方根误差RMSEP。
图5 冬枣空间特性光谱反演结果
图6 红提空间特性光谱反演结果
图7 小白杏空间特性光谱反演结果
图5、 图6、 图7分别为冬枣、 红提、 小白杏的1号样品空间特性光谱反演结果, 其中蓝色为实际计算得到的空间特性光谱, 红色为反演得到的空间特性光谱。 由图5(a—e)中, 5种模型对冬枣的1号样品空间特性光谱均有较好的反演效果, 预测值与实际值较为接近。 同时, 空间特性光谱中较为平滑的区域反演误差较小, 而970~1 100与1 150~1 350 nm这两段光谱中出现存在连续而密集的噪声, 反演误差较大, 说明光谱中的吸收峰以及噪声对反演模型的结果有一定影响。 由图6(a—e)可知, 红提样本的空间特性光谱反演效果较好, 5种模型反演效果无显著差异, 且同样在970~1 100、 1 150~1 350以及1 450~1 650 nm三个范围出现一定的反演误差。 由图7(a—e)可知, 小白杏样本同样在970~1 100、 1 150~1 350以及1 450~1 650 nm出现反演误差。 以上结果表明, 3种果品的空间特性光谱均有较好的反演效果,模型预测值与实际值较为接近, 且5种模型在反演结果上无显著差异。 同时, 3种果品的样品均在光谱吸收峰附近出现一定的反演误差, 表明光谱中吸收峰可能对模型反演有一定影响。
表2为3种果品全部样品的空间特性光谱反演结果。 由表2可知, 3种果品中冬枣与小白杏的空间特性光谱反演效果很好, 5种模型的平均决定系数R2分别为0.957、 0.947, 平均误差分别为3.56%、 4.90%, 红提的空间特性光谱反演效果较好, 5种模型的平均决定系数为0.927, 平均误差为8.23%。 在冬枣的空间光谱反演结果中, Rahman模型反演效果最优, 决定系数R2达到0.959, 误差仅为3.48%, Walthall与Ross-li模型反演效果最差,R2均为0.956, 误差均为3.61%。 小白杏的空间特性光谱反演结果中, Walthall模型反演效果最优,R2为0.954, 误差为4.54%, Ross-li模型的效果最差, 决定系数R2为0.935, 误差为5.41%。 红提的空间特性光谱反演结果中, Walthall模型效果最优, Ross-li模型效果最差, 决定系数R2分别为0.936、 0.910, 误差分别为7.84%、 9.13%。 反演效果从高到低依次为冬枣>小白杏>红提, 原因可能是在1 450~1 650 nm范围内红提与小白杏的反演误差相对较大。 在5种模型中, Walthall模型效果相对较优, 平均决定系数R2与误差分别为0.949、 5.33%, Ross-li模型效果相对较差, 平均决定系数与误差分别为0.934、 6.05%, 两种模型反演误差差距在1.5%以内, 说明两种模型反演结果并无显著差异。 在3种果品的空间特性光谱反演中, 5种模型的决定系数R2均高于0.9, 表明5种模型均适用于空间特性光谱的反演。
表2 空间特性光谱反演结果对比
分别使用Walthall、 Shibayama、 Ross-li、 Roujean与Rahman模型反演得到空间特性光谱后, 结合式(20)计算得到不同的修正光谱, 对光谱进行包络线去除后得到突出特征的归一化光谱, 结果如图8(a—e)、 图9(a—e)、 图10(a—e)所示。 蓝色曲线为暗室光谱, 红色曲线为修正光谱, 由图可知修正光谱与暗室光谱趋势一致, 光谱吸收峰位置一致, 光谱强度不同。 修正光谱强度高于暗室光谱的原因可能是反演得到的空间特性光谱值小于实际空间特性光谱, 使得经过式(19)计算得到的修正光谱被放大, 同时经过包络线去除处理时光谱特征被突出, 使得修正光谱整体偏高。 同时, 暗室光谱更为平滑, 修正光谱中出现较多的噪声, 原因主要是室外光谱受环境光线影响, 使得得到的空间特性光谱出现细微噪声, 因此反演的空间特性光谱同样不平滑(如图6, 图7, 图8中各分图所示), 影响了修正光谱。 总之, 3种果品中冬枣的修正光谱更为平滑, 红提与小白杏的修正光谱中噪声相对较多, 可能与图6与图7结果有关, 1 450~1 650 nm范围内红提与小白杏的反演误差相对较大, 影响了修正光谱。
图8 冬枣户外光谱修正结果
图9 红提户外光谱修正结果
图10 小白杏户外光谱修正结果
为了探究空间特性光谱修正户外光谱的可行性, 基于暗室光谱、 户外光谱与经过5种模型得到的修正光谱建立不同果品的水分与SSC含量的预测模型, 建模方法选择PLS方法, 建立模型之前使用浓度残差方法剔除异常样本, 再使用CARS方法选择特征波长, 模型评价指标为相关系数R、 预测均方根误差RMSEP与剩余预测残差RPD, 结果如表3、 表4、 表5所示。
表3 基于不同光谱的冬枣水分与SSC含量预测模型
表4 基于不同光谱的红提水分与SSC含量预测模型
表5 基于不同光谱的小白杏水分与SSC含量预测模型
冬枣的水分与SSC含量预测模型如表3所示, 基于暗室光谱建立的模型预测集相关系数最高, 水分与SSC的预测集相关系数分别为0.977与0.910; 基于户外光谱建立的模型中, 水分与SSC的预测集相关系数分别为0.946、 0.840; 基于修正光谱建立的模型中, 水分与SSC的预测集相关系数分别为0.969、 0.881, 高于户外光谱建立的模型, 表明经过修正后模型的预测效果得到提升。 经过修正后, 水分预测模型的RPD由2.78提升至3.73, 模型有很好的预测效果, SSC预测模型的RPD由1.361提升至1.992, 模型有较好的预测效果。 由表4可知, 红提的水分与SSC含量预测模型预测效果较差, 基于暗室光谱建立的模型中, 水分与SSC预测模型的RPD分别为1.867、 1.688, 说明其可能无法实现很好的预测效果, 而基于修正光谱建立的模型预测效果优于户外光谱建立的模型, 经过修正后水分及SSC预测模型的RPD分别由户外光谱的1.504、 1.492提升至1.601、 1.607, 模型预测效果提升。 表5为小白杏水分与SSC含量预测模型, 小白杏的水分与SSC含量有较好的预测效果, 基于暗室光谱建立的水分及SSC含量预测模型的RPD分别为2.931、 2.499, 基于修正光谱建立的水分及SSC含量预测模型的RPD高于户外光谱, 由1.839、 1.941提升至2.265、 2.221, 说明模型预测效果得到提升。
由以上结果可知, 3种果品的品质预测模型预测效果从高到低依次为冬枣、 小白杏、 红提, 其中冬枣与小白杏的水分及SSC含量预测模型的RPD可以达到2以上, 表明模型有较好的预测能力, 能用于定量检测; 红提的水分及SSC含量预测模型的RPD较低, 表明模型的预测效果一般, 可能无法实现定量检测。 对比使用5种BRDF模型得到的修正户外光谱建立的品质预测模型, 不同修正光谱建立的模型预测效果有一定差异, 说明对于不同果品、 不同品质指标, 应当使用不同的BRDF模型对光谱进行反演。 对比光谱户外光谱修正前后模型预测效果可知, 光谱修正后建立的预测模型RPD提高, 说明户外光谱经过修正后预测模型的预测能力得到提升, 表明使用反演的空间特性光谱对原始户外光谱进行修正的方法是可行的, 能够提高户外检测精度。
为提高户外探测精度, 在徐嘉翊等[10]研究基础上提出了一种使用空间特性光谱对户外光谱进行修正的方法。 分别使用Walthall、 Shibayama、 Ross-li、 Roujean与Rahman模型对冬枣、 红提、 小白杏的空间特性光谱进行反演, 采用空间特性光谱对户外光谱进行修正, 使用暗室光谱、 户外光谱和修正光谱建立3种果品的水分和可溶性固形物含量预测模型并对比模型结果。 结果表明: 对冬枣和小白杏的空间特性光谱反演效果较好, 对红提的空间特性光谱反演效果最差, 平均误差分别为3.56%, 4.90%以及8.23%, 5种模型反演效果并无显著差异, 说明5种BRDF模型均适用于3种果品的空间特性光谱反演。 户外光谱经过修正后更为平滑, 与暗室光谱趋势一致, 表明对光谱修正的方法可行, 经过修正后光谱中噪声减少。 品质预测模型中, 冬枣与小白杏的品质预测模型预测效果较优, 基于暗室光谱建立的品质预测模型效果最优, 而基于修正光谱建立的模型预测效果优于户外光谱建立的模型, 表明使用空间特性光谱修正户外光谱的方法可行, 能够有效提高户外检测精度。
研究结果表明, 使用空间特性光谱对户外光谱进行修正进而提高户外探测精度的方法可行, 可为提高果品的户外检测精度供一种新的思路。 但仍需进一步考虑更多角度及环境下的空间特性光谱反演, 下一步工作会着重构建空间特性光谱库, 拓展角度范围、 提升应用场景, 探究多场景下的光谱修正。