国洲乾,吕书强,侯妙乐*,孙宇桐,李淑阳,崔雯漪
1. 北京建筑大学测绘与城市空间信息学院,北京 102616 2. 建筑遗产精细重构与健康监测北京市重点实验室,北京 102616
壁画蕴含政治、经济、文化、科学技术及生产工艺等历史信息,具有重要的研究价值[1]。由于长期的自然侵蚀与人类活动的影响,壁画保存现状令人堪忧。尤其是壁画生存环境的温度与湿度的剧烈变化,导致壁画支撑体与地仗层中的水盐不断运移,处于结晶与游离态的硫酸钠体积相变,反复膨胀松弛,使得颜料表层出现酥碱、盐霜,甚至发展为起甲、脱落病害,造成壁画的永久损伤[2]。
针对壁画盐含量的定量检测主要为取样分析。张亚旭等[3]利用离子色谱仪,探寻壁画修补区酥碱成因与盐分含量分布。于宗仁等[4]对摩尼殿扇面地仗层进行色散分析,获取地仗层深度与盐分关系,揭示了水盐迁移规律。杜红英等[5]对莫高窟壁画盐害处取样,采用毛细血管电泳法按电泳淌度分隔离子,利用电泳图谱的峰高定量估计其浓度。该方法污染小,比离子色谱色散法具有更强分离性能。但上述方法均需实地取样,会对壁画造成一定损伤。另外,人工取样和化学分析的成本较高且时效性低。高光谱遥感凭借光谱分辨率高、光谱连续的优势[6],可以定量反演研究对象中的盐含量,目前大多聚焦于土壤与植被中盐分的定量反演。Martin等[7]对麻风树根部的反射光谱应用标准正态变量变换、乘法散射校正与高阶导数变换,将根茎按Cu含量分类。周伟等[8]通过包络线去除与倒数的对数变换,提升了三江源土壤有机质反演精度。Amer等[9]将高光谱植被指数应用于监测小麦生长阶段Zn与Cu浓度蓄积性,证实了可溶性盐与植被光谱存在胁迫相关性。多元线性回归(MLR)[10]与偏最小二乘回归(PLSR)[11]常用于土壤盐渍化预测Ni,Cr等元素含量,然而含盐的壁画与自然界土壤情况差异较大,其表面一般是较为光滑的固体颜料层。壁画中盐分和地仗层、颜料层中各组成物质之间的光谱混合异于含盐的土壤。因此有必要针对壁画制作工艺,对反射光谱与壁画中盐含量的关系进行研究。
根据壁画制作工艺,在实验室内配制成不同含盐量梯度的壁画地仗样本,测量其反射光谱,利用一阶微分、倒数的对数、去包络线等算子组合对反射光谱进行增强处理,分析不同盐分含量的壁画地仗样本反射光谱、增强光谱与盐含量的相关性,找出盐分敏感波段。将最强相关波段通过一次与二次拟合建立单波段反演模型,利用前三强相关波段组合,构建高光谱壁画盐分指数,通过回归分析构建壁画可溶性盐定量预测模型,探讨通过高光谱遥感定量反演壁画盐分含量的可行性。
参照壁画制作工艺配制不同含盐量的模拟壁画地仗样本[12]。我国原址保存壁画大多为干壁画,即文字图案绘制在干燥的地仗表层。地仗层下粘支撑体,上接颜料层,是盐分变化的主要位置,其性质的优劣直接影响壁画能否长期保存。本实验以寺观壁画为原型,壁画地仗层为研究对象。细泥层与粗泥层通过混合细黄土、麦草秸秆、粗粒土、细麻纤维、敦煌沙等制作。将样本下垫硫酸纸,放置于直径9 cm,高1.8 cm的铁圈模具。根据盐分含量同壁画酥碱病害发展速率关系[13],配置含盐率为0~1%的模拟壁画地仗样本,设置级差为0.05%。将样本置于室内阴干,期间利用土质检测仪MDN-6813对样本湿度、温度进行监测,确保盐分含量为唯一影响因子,样本如图1所示。
图1 实验室制含不同浓度Na2SO4模拟样本Fig.1 Laboratory simulated samples containing different concentrations of Na2SO4
选用ASD-FieldSpec4 HI-RES地物波谱仪测定样本表面光谱反射率。波长范围为350~2 500 nm,采样间隔为1.4 nm(350~1 000 nm)与2 nm(1 001~2 500 nm)。为避免其他光线影响,选择在夜晚无其他光源的室内封闭条件下进行测量。样本下垫黑色绒布,且表面中心直径3 cm范围内用玻璃试片修整齐平。仪器预热30 min后先进行标准反射率定标。将仪器自带的57条光纤嵌入ASD Panalytical (Model:A122317)高亮度接触式探头,光源为70 W石英-钨-卤素灯,出光孔孔径为25 mm。将出光孔垂直倒扣于样本中心表面,开启光源开关,待曲线稳定后采集,将探头平行样本表面旋转90°重复采集,测量4个方向,取平均值作为样本光谱数据,全程在暗室中完成。间隔24 h重复采集4次,建立样本光谱集。
为去除数据采集中仪器与环境产生的噪声,通过断点校正与光谱平均对实测反射光谱进行优化。光谱微分可以提取曲线斜率突变、拐点与极值点,增强局部光谱响应差异。Savitzky-Golay滤波适用于高频去噪,在平滑光谱的基础上保留线性趋势,滤波窗口宽度为21,采用二阶多项式进行平滑。倒数的对数变换可以有效去除光照与样本表面起伏造成的误差,包络线去除可以突出光谱吸收反射特性。应用以上光谱增强与微分组合提高光谱信噪比,形成不同的数据集,包括:原始光谱反射率(R)、反射率一阶微分(R+1D)、包络线一阶微分(CR+1D)、倒数对数后一阶微分(LR+1D)、SG平滑一阶微分(SG+1D),其光谱曲线如图2。
图2 预处理后光谱反射率曲线Fig.2 Spectral reflectance curves after pre-processing
增强后的光谱仍存在冗余信息,通过显著性检测与相关性分析提取盐浓度变化敏感的强相关波段。显著性p值检测可以表征变量间显著水平,用于检测峰谷特征中的极值波段,对通过显著性p值检测后的波段逐一计算Pearson相关系数,筛选得到不同增强处理下,与盐含量有强相关性的前三波段。相关系数值位于-1~1之间,绝对值越大,相关性越强。表1为特征波段与其相关系数。
表1 特征波段与相关系数Table 1 Characteristic bands and correlation coefficients
1.4.1 高光谱盐分指数
通过将强相关性盐分敏感特征波段信息进行数学组合运算,得到归一化盐分指数(NDSI)[14]、盐分指数1(SI1)[15]、盐分指数2(SI2)[15]、盐分指数3(SI3)[15]和亮度指数(BI)[14]。通过特征波段筛选组合,构造一种新的盐分指数。对表2中6种盐分指数分别进行归一化后与盐浓度进行回归拟合,选择精度最高的指数作为高光谱壁画盐分指数(MSI)。
表2 盐分指数Table 2 Salinity index
1.4.2 精度评价
将样本光谱按7∶3随机划分为建模集与预测集。建模集用于回归拟合模型的校准与建立,预测集用于验证并评估其预测能力与模型适用性。通过决定系数(R2)、均方根误差(RMSE)、拟合线斜率与截距,对30种不同反演组合的盐分指数模型与10种单波段模型的稳定性与预测精度进行评估。其中R2越大、RMSE越小,模型拟合效果越好。拟合线斜率越接近1,模型预测精度越高,截距越小,对低浓度范围的预测偏差越小。
含盐壁画样本反射光谱特征主要由有机物含量、沙土比、盐分占比等因素共同决定。其特征波段的提取为盐分含量反演提供支持。样本光谱反射曲线如图3所示,不同盐分壁画样本的反射率曲线相对平行,曲线形态和变化趋势基本一致,而其反射率值整体有明显差异。含盐壁画样本反射率在不同波段具有明显特征,在可见光波段内反射率随波长迅速提高,自800 nm后上升趋势开始平缓。在1 400~2 500 nm近红外范围内波动性强,整体呈下降趋势。在1 410和1 940 nm左右处出现不对称吸收谷,后者的宽度深度更明显,未发现明显峰谷偏移。随着盐浓度增加,反射率先降低后大幅上升,与徐文筎等人研究结果一致[16]。其原因可能是在低浓度的水盐运移中,钠离子由于半径较大对水分子吸附能力强,形成稳定的含水化合物,加强对电磁波吸收。随着浓度增大,盐分趋于饱和析出,亮度指数占据主导,导致反射率增高。在可见光-近红外范围内盐浓度为0.3%时反射率较低,浓度高于0.6%后反射率急剧上升,0.75%与0.6%两种盐浓度样本的反射率差值较大。图2中不同预处理后反射光谱峰谷特征得到不同程度加强,其中一阶微分对350~600、1 420、1 944与2 200 nm左右的反射率峰谷特征更加突出,综合表1所呈现的盐浓度与波段之间的相关系数,在1 410与1 940 nm左右对盐浓度变化表现出较大敏感度。
图3 不同盐浓度的样本光谱反射率曲线Fig.3 Spectral reflectance curves of samples with different salt concentrations
单波段线性与抛物线回归的预测方程与其反演精度见表3。
表3 单波段回归模型与反演精度Table 3 Single Band Regression model and inversion accuracy
通过对比同组预处理下的两种回归方式的精度可知,其中仅有R+1D、CR+1D、LR+1D三组中二次拟合比一次拟合的决定系数略优,证明二次拟合提高精度效果一般。经过一阶导变换的模型R2可以达到0.75以上,其中R+1D在抛物线回归中R2与RMSE分别为0.819与0.129,为单波段一元回归最优模型。由图4中R+1D拟合模型可见,其散点分布较为规律,呈现一定线性趋势。如图5中R-1D抛物线实测-预测散点图可见,建模集与预测集的两条拟合线斜率存在较大偏差,斜率相差约0.65。预测集在较低浓度预测值偏高,在较高浓度预测值偏低,将预测集数据代入建模方程得到的预测结果较差。R+1D抛物线回归实测-预测散点分布见图5,建模集与预测集拟合线斜率相近,但整体散点到拟合线的垂直距离之和较大,中高浓度处预测值与实测值存在较明显偏差。综上,单波段一元回归建模对数据有一定依赖性,仅用单一强相关特征波段对浓度反演不够可靠,还需引入更多变量,发掘其他拟合反演方法。
图4 R-1D在1 944 nm波段抛物线回归反演盐浓度模型Fig.4 R-1D parabolic regression inverse salt concentration model in the 1 944 nm band
将构建的6种壁画盐分指数与壁画样本含盐量进行反演拟合分析,其精度如表4所示。
表4 不同盐分指数回归模型反演精度Table 4 Inverse accuracy of regression models with different salinity indices
表4中参考归一化植被指数构建的比值类盐分指数拟合效果相对一般,R2低于0.7,RMSE最高为0.294。CR+1D与LR+1D的R2虽能达到0.8左右,但相比于R+1D与SG+1D的精度略低,与单波段回归模型结果相一致。其原因可能是由于CR与LR变换对盐分吸附有机质或壁画土质成分效果不好,未能引起光谱敏感表达。CR+1D与LR+1D特征波段组合运算下的盐分亮度指数(BI)在壁画盐分预测中有较好的适用性。经R+1D增强后的MSI回归模型R2可达0.85,且RMSE仅为0.116。SG+1D增强后的MSI(R2=0.836)回归模型较未增强光谱下的单波段回归模型有较好的精度提升,所构建的壁画盐分指数有较好稳定性。
为进一步验证其预测效果,如图6构建不同光谱增强下的精度最好的4个高光谱盐分指数与盐浓度之间映射关系,四种模型中散点呈明显抛物线趋势,其中在对低浓度与中浓度的盐分(0.2%~0.6%)预测中,图6(b—d)散点较于拟合线存在偏差,这与2.1中盐浓度与反射率非单调变化结论相对应。通过将特征波段筛选组合构建高光谱壁画盐分指数,可以改善上述偏差,R-1D-MSI模型域内散点均匀分布于拟合线两侧,可以实现在0~1%浓度范围内更为准确的盐浓度线性量化预测。高光谱盐分指数回归方程与精度由表5所示。CR-1D-SI1的预测集均方根误差最小为0.11,但就模型拟合线与散点分布看,在中浓度预测效果一般。四种模型通过独立预测集代入方程所得验证误差较低,建模集的决定系数均达0.8以上,相比于单一波段模型由明显改善,证明特征提取与组合可以有效提升反演精度。
表5 最优高光谱盐分指数回归方程与精度Table 5 Optimal hyperspectral salinity index regression equations and accuracy
图6 最优高光谱盐分指数反演盐浓度拟合图Fig.6 Inversion fitting of salt concentration using optimal hyperspectral salinity index
图7为4种高光谱盐分指数模型实测-预测散点图。R-1D-MSI与SG-1D-MSI预测效果更优,预测集拟合线斜率分别达到0.955与0.998,更接近于真实值1,说明预测浓度与实测浓度更为接近。前者的拟合截距更小,对低浓度处的预测效果更优。图7中建模集与预测集拟合线斜率相近且存在相交,相较于单一波段回归斜率偏差大有明显改善,盐分指数模型对建模数据依赖性低。所构建的壁画盐分指数MSI相比于其他高光谱盐分指数在壁画盐分反演中更具优势,对R2提升效果好,R-1D-MSI兼顾了模型稳定性与预测精度,更适用于壁画的盐含量的定量反演。
为了高效无损反演壁画中盐分含量,揭示反射光谱与盐分浓度变化的相关性,在实验室制得不同盐浓度模拟壁画样本,利用ASD-FieldSpec4HI-RES地物波谱仪测定350~2 500 nm样本反射率,分析了盐浓度与反射光谱的相关性,通过对光谱特征提取、波段组合运算,应用多种回归分析,构建了单波段线性回归模型、抛物线回归模型与高光谱壁画盐分指数模型,分别对壁画中Na2SO4浓度进行反演预测并得出以下结论:
实验中影响反演精度的主要因素是盐分含量变化特征波段受水分因素影响大,盐分浓度单因子物理响应难以保证,此外现场图谱采集条件、传感器波段对盐分浓度变化敏感程度与特征波段提取方式也会间接影响其精度。壁画中盐分光谱的特征发掘与定量反演有重要意义,可为壁画的保护与修复提供决策支撑。同时,围绕壁画光谱增强、盐分变化特征信息智能提取的深入探索十分必要,将多元回归分析与机器学习结合应用于其他不同类型的真实壁画盐分预测是未来的研究趋势。