王少波,张江坤,程青彪,沈 宁,刘 洁,冯 洁
(1.云南师范大学 物理与电子信息学院,云南 昆明 650000;2.云南省博物馆,云南 昆明 650000)
柴米油盐酱醋茶,是老百姓家庭中的必需品,俗称“开门七件事”。在古代,茶不仅供人日常饮用,在事用方面也有诸多记载。中国古人早有使用植物染料在织物上染色[1],且早有利用茶,从茶叶或茶用香花中提取色素,通过直接染色法[2]或媒染法[3],对天然纤维面料进行染色。但是茶染色彩不可控,在染色过程中因为地域、原料、温度等各种原因,色彩会出现较大差异,因此至今仍未广泛使用。如果用光谱来准确描述茶染的颜色信息,则对于茶染用于纺织品类、字画类文物修复时的仿色、配材等具有参考价值,对于这类文物的保护研究也具有理论意义。
我国各地档案馆或博物馆中收藏有大量古代的珍贵书籍,但受自然老化[4]和保管环境的影响,这些档案用纸大多已出现开裂、污染、变色、粉末脱落等情况[5],纸张颜色变暗、发黄;纸质变硬、变脆;纸张出现黄色斑点[6]。因此,当务之急在于对这些珍贵古书所用纸张的原料、特征等进行研究与分析,以采取更加适宜的措施来保护和修复这些已破损的古书。在修复选料时,选择材质和理化性能一致或接近一致的修复用纸,必要时可对纸张进行做旧,例如染色、加固处理等[7]。一般来说,修复这些书籍所用的纸张主要采用两种方法,一种是旧书籍的边角料重新利用做成纸张,一种是用现用纸张做旧染色以达到与古籍相近的颜色[8]。其中茶叶染色具有很好的做旧纸张的效果[9]。对比现代工业化合物染料,茶染更健康,颜色更素雅[10],具有其它合成染料难以企及的绿色环保价值,被广泛应用于纸质文物修复。纸质文物分析诊断与评估,基本靠修复工作者的经验判断,有较大的随意性。由于文物的特殊价值和不可再生性,开发无损的纸张分析与诊断方法来获取更多信息,是近年来的一个热点。随着现代科技的发展,许多无损光谱技术被引入文物保护领域[11-13]。
综上所述,目前国内对于光谱技术辅助完成纸质文物修复的研究尚少。如果可以分析古籍的光谱特征[14],通过光谱无损检测得到古籍的光谱反射率,计算出茶染过程确定所用修复的纸张和茶染的浓度,然后使用对宣纸进行茶染做旧的方法,准确高效地实现用茶染宣纸来修复字画书籍类文物,这对于纸质文物的保护也具有重大意义。本文采集用茶叶浸染过后的宣纸,用分光光度计测出其400~700 nm 波段的光谱反射率,分别用偏最小二乘法和BP 神经网络建立光谱数据与茶叶量相映射的模型。之后采用连续投影算法(SPA)提取茶染宣纸光谱的特征波长,去除冗余信息降低光谱信息维度,并作为模型的输入用于建立光谱反演模型。研究发现这几种方法建立的预测模型通过光谱信息来预测茶叶用量精度很高,可以为茶染艺术光谱方面的研究提供参考价值。
在茶染艺术中,绿茶、红茶、黄茶、黑茶、乌龙茶及普洱茶都是茶染的染料[15]。因各地品种、土壤、气候、水源等自然因素的不同,染出来的色泽会有差异,其中红茶得色偏红,绿茶得色较浅、暗、偏黄[16],普洱茶有不错的染色感。普洱茶上色比较明显,染出来的宣纸颜色层次分明,博物馆茶染做旧纸张大多选用普洱茶作为染料,所以本文选用的茶叶是乔木大叶普洱茶。宣纸出现以来因其特有的优越特性,一直是中国书画的绝配,现在流传下来的古籍很大一部分都是以宣纸为承载物的[17]。因此本文选用汪六吉牌、明星牌、微经牌、红星牌四种品牌的宣纸作为用来染色的纸张,依次称为Paper1、Paper2、Paper3 和Paper4。
本文主要采用直接染色法,对定量茶叶煮沸后再对宣纸进行染色。在实验中,为了研究自来水微量元素对染料的影响,首先取定量茶叶放入加热容器中,分别加入500 mL 蒸馏水和自来水,定时加热10 min,让茶叶中的色素及茶多酚[18]完全分解,煮好的茶汁自然冷却20 min。选取Paper1 和Paper2 两种宣纸裁成标准比色卡大小尺寸(8 cm×8 cm),采用直接染色法,将宣纸浸渍于冷却好的茶汁染液中着色,注意让宣纸表面受色均匀。经茶汁浸染后的宣纸标记好序号之后平铺全部晾干,获得待测样本。最后在爱色丽标准光源箱D65 光源下,采用CIE 推荐的45/0(45°/垂直)照明和观测条件,利用佳能彩色数码相机获取两种样本的彩色图像,如图1 所示。同时,使用分光光度计X-Rite SP64 在D65光源2°视场下,以10 nm 为间隔采集400~700 nm 波长下的样本的平均光谱反射率数据,如图2 所示。计算得到Paper1 两组同浓度下光谱反射率曲线平均相关系数为0.998 6,Paper2两组同浓度下光谱反射率曲线平均相关系数为0.997 9。用CIE2000 色差△E00计算公式来计算两种不同水质下对宣纸进行染色后的色差(chromatism),将光谱反射率转化到CIE L*a*b*色度空间,不同水质下宣纸样本的L*a*b*值和色差对比如表1 所示。根据光谱反射率和色差综合分析,自来水微量元素对染料的影响可以不考虑。为了节约成本,实验选用自来水。普洱茶的用量设置为(20+5k)g,其中k=0,1,2,3,4,5,共6 个浓度梯度。
表1 使用蒸馏水和自来水的两种茶染宣纸色差Tab.1 Chromatism of two kinds of tea dyed rice papers using distilled water and tap water
图1 使用蒸馏水和自来水的两种宣纸茶染图像Fig.1 Images of two kinds of tea dyed rice papers using distilled water and tap water
图2 使用蒸馏水和自来水的两种茶染宣纸平均光谱反射率Fig.2 The average spectral reflectance of two kinds of tea dyed rice papers using distilled water and tap water
六种不同浓度的茶叶汁对四种不同品牌的宣纸进行染色,标准照明观测几何条件下获取的样本图像如图3 所示。图3 中由上至下分别是Paper1、Paper2、Paper3 和Paper4 四种品牌的宣纸,第一列是宣纸未经染色的原始图像,第二列至第七列从左到右依次是20 g,25 g,30 g,35 g,40 g,45 g 共六种不同浓度茶叶染色后形成的宣纸图像。从图中明显看出,随着茶叶用量的加大,四种宣纸的颜色逐渐接近于古代书籍的颜色。
图3 四种品牌宣纸茶染图像Fig.3 Images of tea dyed rice paper of four brands
在实验中,每种浓度下的茶染宣纸分别选取50 个样本,六种浓度梯度下四种宣纸品牌各300 个样本,用分光光度计测量出光谱反射率,四种宣纸得到的光谱图如图4 所示,图中采用六种不同的颜色代表六种不同的染色浓度。从图4中四种宣纸的反射率曲线可以看出,茶叶汁在不同浓度下对于宣纸浸染有较好的聚类效果。而且在400~700 nm 波段,宣纸各个染色浓度下的光谱反射率的变化曲线也基本一致。总体来看,茶染宣纸的光谱反射率是随着茶叶浓度的增加而逐渐减小的,并且随着波长的增加而增大。这说明,茶染后宣纸的光谱反射率符合一般规律,且每个浓度下茶染宣纸的光谱各有差别,这有利于预测模型的建立。
图4 四种品牌宣纸各300 个样本的光谱曲线Fig.4 Spectral curves of 300 samples of each of the four brands of ricepaper
光谱建模分析目前主要采用的线性校正方法是偏最小二乘法(PLS),非线性校正方法是BP神经网络[19]。本文运用 PLS 和BP 神经网络模型建立普洱茶使用量与茶叶汁浸染宣纸所得光谱反射率之间的映射关系。通过计算预测正确率、决定系数R2以及均方根误差(RMSE)3 个结果指标对两种建模方法的精度进行评价。建立稳健可靠的模型,并利用该模型对普洱茶使用量进行预测。实验随机选择各类宣纸样本的300 个光谱反射率数据的70%作为建模集,剩余30%样本作为验证集,即210 份数据作为训练集,90 份数据作为测试集。
2.2.1 偏最小二乘法模型的建立
为了评估光谱数据对普洱茶使用量的实际预测能力,使用偏最小二乘回归模型将光谱数据与普洱茶使用量进行关联,将不同种类宣纸品牌不同浓度下的茶染光谱数据作为光谱矩阵输入变量,对应使用的茶叶克重作为输出变量,建立预测茶叶量的PLS 模型。茶叶量实测值与预测值的对比如图5 所示,偏最小二乘法建模效果如表2 所示。综合图5 和表2 的信息可以看出,Paper1 的预测结果误差较大,其预测集样本的预测正确率仅为88.13%,决定系数和均方根误差分别为0.872 6 和2.798 8。Paper2 在茶叶使用克重为20 g 时预测效果很好,其余几个浓度预测结果波动较大。Paper3 的整体预测效果略优于Paper1 和Paper2。Paper4 偏最小二乘法建模效果最好,预测集样本的预测正确率、决定系数和预测标准差分别为95.69%、0.952 1 和1.012 1,获得了较好的预测结果。结合图4 发现,四种宣纸的光谱反射率在600 nm 后,不同浓度之间出现交叠,影响预测效果。
表2 四种品牌宣纸PLS 模型结果Tab.2 PLS model results of four brands of rice paper
图5 四种品牌宣纸PLS 模型估算结果Fig.5 Results of PLS model estimation for four brands of rice paper
2.2.2 采用BP 神经网络建立预测模型
运用BP 神经网络模型建立经茶叶染色宣纸光谱值与使用普洱茶含量之间的映射关系,提取全部波段下图像的平均光谱反射率,作为神经网络的输入变量部分,实际使用的普洱茶用量作为输出值。本次实验设置输入层与隐藏层、隐藏层与隐藏层的激活函数AF(activation function)均采用Tansig 函数,隐藏层与输出层的激活函数为线性函数Purelin,学习率设定为0.01,误差设定为 1×10-5,训练次数为1 000,建立具有稳健性和精确度的BP 神经网络预测模型。普洱茶使用量实测值与预测值的对比如图6 所示,BP 神经网络建模效果如表3 所示。由图6 可以看出,Paper1 经BP 神经网络建模后实测值与预测值的差距波动比较大,Paper2 和Paper3 整体表现较好,在一些浓度梯度上有所波动。Paper4在各个浓度梯度的差距都比较小,达到了很好的预测效果。从表3 可以看出,Paper1 经BP 神经网络建模效果最差,Paper4 经BP 神经网络建模效果最好,这与偏最小二乘法建模得到的预测结果相同。总的来说,经BP 神经网络建模预测得到每种宣纸染色的茶叶浓度预测正确率都达到了95%以上,预测性能优于偏最小二乘法建模,这表明BP 神经网络模型具有较好的预测性能,可以更准确地预测普洱茶使用量。
表3 四种品牌宣纸BP 神经网络模型结果Tab.3 BP neural network model results of four brands of rice paper
图6 四种品牌宣纸BP 神经网络模型结果Fig.6 Results of BP neural network model for four brands of rice paper
2.2.3 采用连续投影算法提取特征波长建立预测模型
通过以上实验发现,由于四种宣纸的光谱反射率在不同浓度和波段之间有重叠,无论是线性还是非线性校正,其预测精度均受到影响。因此我们采用连续投影算法提取特征波长,再建立预测模型,以提高预测精度。连续投影算法能够从光谱信息中充分寻找含有最低限度的冗余信息的变量组,使得变量之间的共线性达到最小,大大减少建模所用变量的个数,提高建模的速度和效率[20]。利用SPA 进行波长选择,提取出最能表征全谱图信息的波长组合,剔除光谱中的冗余信息,既能减小建模工作量,降低模型复杂度,又可得到预测性能更好的模型。本文使用连续投影算法在全波段光谱中提取与预测茶叶量相关性高的有效波段,将所提取的有效波长作为PLS 和BP 神经网络的输入值,进而建立相应的模型。原始光谱经过S-G 平滑预处理去除噪声干扰后使用SPA 进行特征波长筛选,从全光谱数据和茶叶量分析中提取具有最多相关信息的特征波长,建立简化模型并进行比较。利用筛选的特征波段数据建立多元线性回归校正模型,通过均方根误差(RMSE)值决定最佳建模波长数目。图7 是SPA 对原始光谱进行筛选过程中的RMSE的变化曲线。随着筛选变量数量的增加,RMSE先是迅速下降,然后趋于稳定状态。四种宣纸光谱不同波长点个数对应的RMSE 值如图7 所示。
图7 四种品牌宣纸利用SPA 筛选光谱特征波长Fig.7 The characteristic spectral wavelengths of four brands of rice paper were screened by SPA
应用在连续投影算法下所提取的有效波长,作为PLS 和BP 神经网络模型的输入变量,普洱茶使用量作为输出变量,分别建立相应的SPAPLS 和SPA-BP 神经网络模型,建立的模型性能如表4 所示。与全光谱模型相比,SPA 选择的特征波长建立的校正模型效果较好。用SPA 提取有效波长建立的模型均优于全波段的模型,其中SPA-BP 组合获得最优的预测结果。基于表4获得的模型准确性和可靠性,进一步说明利用SPA 选择的有效波长建立的检测模型可以准确无损地用光谱反演来评估茶染过程中普洱茶的使用量。
表4 四种品牌宣纸SPA-PLS 和SPA-BP 神经网络估算模型结果Tab.4 Results of SPA-PLS and SPA-BP neural network estimation models for four brands of rice paper
以经不同浓度普洱茶染色后的四种品牌宣纸为检测对象,用分光光度计测量各个样本在400~700 nm 波段中的光谱反射率值。分析了基于全光谱和SPA 提取的特征光谱分别建立的偏最小二乘模型和BP 神经网络预测模型对预测普洱茶使用量的影响,用所得预测值和真实值进行对比。经过验证,四种预测模型都可以很好地预测出普洱茶使用量,其中SPA-BP 组合模型识别效果最佳,训练集与测试集的平均预测正确率分别为98.30%和98.40%,具有明显优势,可以作为基于光谱反射率的茶染宣纸茶水浓度的预测研究的最优算法进行使用。应用茶染后宣纸的光谱反射率对使用茶叶量进行预测是可行的,这对于茶染艺术的光谱研究有一定的参考价值。纸质文物的历史价值非常高,利用光谱检测技术,结合偏最小二乘法、BP 神经网络、连续投影算法等计量方法,建立足够完整的数据库,能够更好地保护和传承纸质文物。