基于数码相片和颜色空间转换的滨海土壤盐渍化定量估算

2021-08-17 02:50邱思怡练靖文王李娟
光谱学与光谱分析 2021年8期
关键词:相片盐分亮度

徐 璐,王 慧,邱思怡,练靖文,王李娟

江苏师范大学地理测绘与城乡规划学院,江苏 徐州 221116

引 言

土壤盐渍化不仅影响农业可持续发展,而且对生态环境也有一定的破坏,是导致土壤退化的全球性问题之一[1]。由于自然环境的变化和人为活动的影响,土壤盐渍化程度和分布一直处于变化的状态,因此精确监测土壤盐渍化的变化动态是科学管理和合理利用盐渍土的重要前提[2]。传统的土壤盐渍化监测方法需要大量人力、 物力和时间成本,而且采样的时间和地区都有一定的限制,对土壤表面也有一定的破坏,难以实现盐渍化监测的快速更新[1]。利用遥感定量监测土壤盐渍化已经成为公认的方便快捷的新途径,也是科学界比较重要的研究热点[3-4]。但是遥感仍然存在一定的局限性,如受天气影响和反演地表参数的尺度较大等,而近地表传感可以解决这些问题。

数码相机作为日常电子用品,可以用于土壤信息的精确反演[5-7]。Persson利用数码相机获取土壤相片,经过颜色空间转换得到RGB和HSV等不同颜色参数,并发现S和V变量与土壤含水量有较好的关系,建立了较好的预测模型[7]。吴才武等利用数码相机提取黑土表面的颜色信息,然后定量化研究其与黑土有机质之间的关系,发现R波段与土壤有机质有较高的相关性,并建立了精度较高的预测模型[6]。相比其他高精度的贵重仪器,数码相机等电子产品的通用性和普遍性为科学研究的应用推广提供了良好的平台,结合无人机技术的快速发展,将会加快实现土壤精准监测和土地精细化管理,为精准农业发展提供了技术支持。

1 实验部分

1.1 研究区概况

研究区位于江苏省盐城市大丰区(120.52°—120.86°N,33.03°—33.5°E),濒临黄海,该区属于亚热带海洋季风气候,受南北气流和海洋、 大陆双重气候的影响,年降水量约为900~1 100 mm,年平均气温约为13.7~14.8 ℃[8]。海水倒灌导致地下水矿化度较高,人类活动的不合理利用使得浅咸地下水上升至地表导致土壤加剧盐渍化。如今土地利用类型以围垦用地,建筑用地,水产养殖用地和滨海滩涂等为主,而且随着复垦和养殖用地的增加,滩涂用地也越来越少,茅草,盐蒿,芦苇和米草等群落也在逐渐减少。图1展示了研究区和采样点位置。

图1 研究区和采样点分布图Fig.1 Study area and sampling points distribution

1.2 数据获取

1.2.1 相片数据获取

2018年6月22日—24日,天气多云转晴,时有微风,温度为18~33 ℃。我们沿着海岸线一路考察,选择不同状态的裸露地表进行采样,同时拍照获取数码相片。为了增加相片数据的复杂性以获得鲁棒性较强的模型,我们选择在晴天和多云的状态下进行全天时拍照和采样,最终共采集了52个样品。

图2 各采样点的拍照时间和平均亮度值Fig.2 Sampling time and mean brightness of sampling points

1.2.2 土壤数据获取

拍照完成后,将视场内的表层土壤(小于5 cm)采集装入封口袋,并放入保温箱以防止土壤水分蒸发,同时使用GPS记录采样点的经纬度。每天将采集样品进行称重获取土壤湿重,之后在105℃烘箱中干燥24 h以获取土壤干重,进而得到土壤含水量。

用2 mm筛子将烘干土样过筛,并配制土水比为1∶5的混合溶液,充分混合后获取表层清液用来测量土壤理化性质。土壤电导率(EC)和pH值数据通过电导率仪(DDS-307A)和pH计(PHSJ-3F)测量得到。滨海盐土的主要盐分是NaCl,其可溶性使得土壤含盐量与电导率之间有非常好的相关性[10],因此本区域可以用电导率表示土壤盐渍化程度。土壤的理化性质如表1所示。

表1 土壤理化属性数据描述Table 1 Summary of soil physical and chemical properties

1.3 颜色空间

1.3.1 RGB和HIS

RGB颜色空间是最常用的颜色系统,是由红(R)绿(G)蓝(B)三种基本色构成,其相对应的光谱波段为700,546和436 nm。对于常用的8位图像,每个基本色都有28=256个位阶,其灰度值由黑(0)到白(255)变化[11]。本研究中JPG格式的相片是基于RGB颜色系统的,可以直接从相片的各像素中提取RGB的亮度值。

RGB三原色的亮度值具有高度相关性,HIS颜色空间则是去相关后的颜色空间,H代表色相,I代表强度或亮度,S代表饱和度。该颜色空间可以由RGB颜色空间转换而来,为了与其他颜色空间参数区分,本文用HIS_H,HIS_I,HIS_S表示HIS颜色空间的三个参数。

1.3.2 CIEXYZ,CIELAB,CIELUV和CIELCH

怀远石榴虽然品质良好,但是缺乏宣传,知名度十分有限。怀远县的石榴很少利用新媒体的宣传方式,只是依靠品质与口碑扩大销路。当今社会,信息繁多,如何吸引消费者的关注成为了产品销售的重要因素之一。“酒香不怕巷子深”的时代早已不复存在,缺乏宣传的产品很容易导致无人问津。而怀远的石榴却恰恰忽视了宣传这个重要因素。虽然怀远的石榴拿到了国家的农产品奖项,但是由于缺乏宣传,怀远石榴的知名度仅限于安徽省北部的地区即周边省。这样会使得即使怀远石榴及其相关产品生产出来,也只会积压在仓库内,造成资源浪费。因此,知名度小是该地区石榴产业化的重大阻碍。

1931年,国际照明组织(CIE)通过指定光源为颜色系统制定了标准,并提出CIEXYZ颜色系统。这里的Y代表亮度值,X和Z是虚拟组分,该系统经常作为其他颜色系统转换的中间媒介,如CIELAB和CIELUV[11]。

国际照明组织在1976年提出了新的CIELAB和CIELUV颜色空间,都是有CIEXYZ颜色空间转换而来。CIELAB中,L表示亮度,取值范围是[0, 100],A表示从绿色到品红色的范围,B表示从蓝色到黄色的范围,取值范围都是[-128,127],该颜色空间的三个参数用LAB_L,LAB_A和LAB_B表示。

CIELUV中的L的意义和取值范围都与CIELAB相同,U和V表示色度,且取值范围是[-100, 100][12],颜色空间的三个参数用LUV_L,LUV_U和LUV_V表示。

CIELCH颜色空间与CIELAB一致,但是它采用了不用的表示方法,L表示亮度,C表示饱和度,H表示色相,这里用LCH_L,LCH_C和LCH_H表示。

图3给出了不同颜色空间之间的转换关系,各颜色空间之间的转换公式可参考文献[12]。这里LAB_L,LUV_L和LCH_L都表示亮度且值相同,因此数据分析时统一用LAB_L表示。所有的颜色空间转换计算由“colorscience” 软件包完成。

图3 不同颜色空间的变换关系Fig.3 Color space transformations

1.4 建模与评价

本研究采用随机森林算法进行建模,随机森林是一种集成学习方法,该算法会生成很多树,每棵树都是通过自举抽样的样本数据训练得到的,并用袋外样本进行精度验证,随机森林的预测结果则是所有输出结果的平均情况[13]。该算法的主要参数都用默认值,即决策树个数(ntree=500)和节点数(mtry约为总变量数的1/3)。利用随机选取的建模数据集(70%)进行建模,采用留一交叉验证(LOOCV)进行精度校正,然后用余下的验证数据集(30%)进行检验,重复100次以确定最优模型参数。此外,选取决定系数(R2),均方根误差(RMSE)和相对分析误差(RPD)作为模型精度检验指标,其计算方法如下

一般情况下,预测能力较好的模型具有较高的R2和较低的RMSE。有研究表明,RPD>2 表明模型有较高的预测能力,1.4

2 结果与讨论

2.1 土壤颜色参数与电导率的关系

从数码相片中获取图像的RGB空间的颜色参数之后,经过上述颜色空间转换得到其他颜色空间参数。将所有颜色空间的参数和电导率做相关分析,结果如图4所示。图中将所有颜色参数分成3组,相关性较大的参数聚集成一组,且只显示相关性达到极显著水平(p<0.01)的值,相关性未达到极显著水平的值不予显示。可以看出,LAB_A,LAB_B,LUV_U,LUV_V,LCH_C和HIS_S之间的相关性较大,且与其他参数的相关性基本都未达到极显著水平; LCH_H和HIS_H的相关性较大,HIS_H与其他参数相关性基本未达到极显著水平,但LCH_H与LAB_A和LUV_U有一定的负相关关系; 余下的颜色参数(R,G,B,X,Y,Z,LAB_L,HIS_I)之间具有较高的相关性,且与其他颜色参数都未达到显著水平。

图4 颜色空间参数与电导率之间的相关系数 ×表示参数间的相关性未达到极显著水平Fig.4 Correlation coefficient between EC andparameters in various color spaces × means the non-significant correlation

从颜色模型的角度分析,LAB_A,LAB_B,LUV_U,LUV_V,LCH_C和HIS_S都是表示颜色纯度的参数,虽然在不同的颜色空间中有自己的值域,但是经过转换后的参数之间的相关系数仍较高(r>0.82,p<0.001)。HIS_H和LCH_H都是表示颜色色相的参数,二者之间的相关系数为r=0.81 (p<0.001)。R,G,B,X,Y,Z,LAB_L和HIS_I都是表示颜色亮度的参数,在不同的颜色空间也有自己的值域,相关系数最小值为r=0.92(p<0.001)。可以理解为,虽然各颜色空间的颜色表达不一样,但是颜色三要素(纯度,亮度,色相)之间互相影响较小。

从电导率与颜色参数之间的相关关系可以看出,电导率与所有表示颜色亮度参数的相关性都达到了极显著水平,最小值是R参数与电导率之间的相关系数r=0.39(p=0.005)。电导率与表示颜色纯度的参数也都达到了显著水平,最小值是LAB_A与电导率之间的相关系数r=0.35(p=0.011)。电导率与表示颜色色相参数(LCH_H和HIS_H)之间的相关性都没有达到显著水平,相关系数分别为0.26(p=0.06)和0.05(p=0.72)。

2.2 模型构建与评价

图5 土壤电导率的观测值与预测值对比Fig.5 Scatter diagram of observed and predicted EC

已有研究利用相机拍照获取颜色参数来构建土壤盐分模型。Ren等[15]研究了东北地区典型的苏打盐碱土,发现土壤盐分越大,地表干燥后的裂纹就越大,以此现象着手,计算每个相片的灰色共生矩阵纹理特征,基于此建立了精度很高的土壤盐分预测模型(R2=0.92)。Xu等[5]研究了西部干旱区土壤盐分,发现盐分有表聚现象,泛白的盐分对日光有较高的反射率,导致相片有较高的亮度值,在获取相片数据RGB颜色空间参数后,对相片的每一个像素进行深度分析,建立了精度很高的土壤盐分预测模型(R2=0.90)。与上述研究不同,本文研究区位于东部滨海,土壤盐分常常受到土壤水分的影响,表1中可以看出滨海地区很少有地表干燥的土壤,所以既无盐分表聚,也无地表裂纹现象。因此,本文从颜色空间的角度探索一种新的土壤盐分反演途径,在有土壤水分干扰的情况下,获得了精度较好的模型。除此之外,获取相片时的光环境变化会对相片的RGB颜色空间有一定的影响,最终对模型精度有一定的影响。

图6对各参数变量的重要性做了比较。可以看出得分较高的前5个变量都是颜色纯度参数,如LUV_U,HIS_S,LUV_V,LCH_C和LAB_B,位于中间的8个变量是颜色亮度变量,如HIS_I,R,Y,B,Z,X,G和LAB_L,最后两个变量是色相参数,也是与电导率相关性较小的两个个变量,其中LCH_H与电导率的相关性最小,在模型中的贡献也最小,该结果与图4中电导率与颜色参数的相关系数结果一致。

图6 不同颜色空间参数的重要性比较Fig.6 The importance of variables in different color spaces

土壤颜色空间逐渐成为土壤研究方向的科研热点[16-17]。吴才武等[17]利用数码相机获取黑土表面颜色信息,研究了不同颜色空间参数(RGB,CIELAB,CIELUV和CIELCH)及其数学变换形式,并建立其与有机质含量之间的关系,根据模型建立和检验的综合评价,认为RGB颜色空间更能有效反演土壤有机质,其次是CIELUV,CIELAB和CIELCH。Fu等[16]在实验室内用手机拍照获取不同水分状态下的土壤相片,反演复杂情况的土壤有机质含量,通过5个颜色空间(RGB,HIS,CIELUV,CIELAB和CIELCH)的参数对比分析,发现不同水分状态下土壤有机质含量与颜色参数的相关性不同,认为土壤水分含量较少(<10%)的情况下,R对土壤有机质有较好的预测能力。土壤水分含量较高(>10%)的情况下,LCH_H,LCH_C和LUV_U能够较好的预测土壤有机质含量。以前的研究大多针对不同颜色参数与土壤属性之间的关系,较少的认识到颜色参数间的属性归类,而且颜色空间在土壤盐分预测方面的研究也较少。本研究弥补了这一空白,认为土壤颜色纯度是土壤含盐量估算的重要参数,其次是土壤颜色亮度,而土壤颜色色相对土壤含盐量的估算能力较小。

土壤颜色本身并不是土壤的功能属性,却是反演土壤功能属性的重要参数。本研究通过数码相机获取滨海土壤颜色参数,并通过颜色空间转换获取了其他颜色参数,通过多个颜色参数建立了土壤含盐量快速预测的新方法。土壤颜色受多种因素的影响,如土壤有机质,土壤质地,土壤铁含量,土壤含水量等[5, 12],而最终获取的土壤相片颜色又受到天气情况,日照强度,相机参数设置等因素影响[9]。因此,该模型是在众多因素影响下建立起来的鲁棒性较强的土壤盐分反演模型。

采样区聚集在东部滨海地区,我们认为土壤有机质、 土壤铁含量和土壤质地等土壤背景参数基本相同,并认为土壤含水量和含盐量是影响土壤相片颜色的主要因素,这样得到的模型就可以忽略土壤含水量的影响。同时为了模型具有更大的鲁棒性和普适性,我们选择在不同天气情况下获取相片数据,以此获取对天气因素免疫的土壤盐分模型。

作为颜色三要素之一的颜色纯度是模型中起主要作用的参数,它们大都与土壤盐分有极显著的负相关关系,具体物理联系尚不清楚。土壤颜色亮度与土壤含水量、 周围光环境和相机曝光设置有一定的关系[7],在天气多变的情况下,选择自动曝光模式对相片亮度有较好的统一作用。颜色色相是常用来分辨颜色的重要参数,在模型中的作用却是最次要的,可能是由于同一地区土壤颜色差异较小,仅通过色彩差异不足以反演土壤盐分带来的变化。本文仅仅通过颜色空间转换等方法来探索颜色参数对土壤盐分的反演过程,各个颜色参数与土壤盐分的物理关系仍不明确,需进一步实验研究。

3 结 论

猜你喜欢
相片盐分亮度
我没有爸爸了
亮度调色多面手
黑白相片
亮度一样吗?
基于斩波调制的LED亮度控制
人生的亮度
长期膜下滴灌棉田根系层盐分累积效应模拟
摄影欣赏
基于PLSR的陕北土壤盐分高光谱反演
电导率法快速测定榨菜盐分含量