基于可见—近红外光谱和神经网络的土壤类型鉴别

2014-07-11 20:20马海姣崔晨风
江苏农业科学 2014年4期

马海姣 崔晨风

摘要:提出一种利用近红外光谱快速、无损鉴别土壤种类的方法。首先利用近红外光谱仪测定不同种类土壤的光谱特征曲线,利用主成分分析法提取主成分,再结合人工神经网络建立模型进行类型鉴别。主成分分析表明,主成分1、2、3的累积方差贡献率达到99.839%,可以很好地代表原始数据特征。以主成分分析得到的前3个主成分作为神经网络输入,以土壤类型为输出,通过对30个样本的训练学习,分别建立了反向传播人工神经网络(BP)和径向基函数人工神经网络(RBF)。对10个样本进行预测,结果表明2种模型预测的准确性均达到100%。RBF神经网络运行时间明显小于BP网络,具有一定优势。

关键词:可见-近红外光谱;土壤类型;主成分分析;BP神经网络;RBF神经网络;分类鉴别

中图分类号: S155;O657.33 文献标志码: A 文章编号:1002-1302(2014)04-0284-03

收稿日期:2013-08-25

基金项目:国家自然科学基金-新疆联合基金(编号:U1203182);国家自然科学基金(编号:51279166);高等学校学科创新引智计划(编号:B12007);水资源与水电工程科学国家重点实验室项目(编号:2011B083);西北农林科技大学大学生创新创业训练计划(编号:1210712077)。

作者简介:马海姣(1990—),女,甘肃武威人,研究方向为“3S”技术在农业水土工程中的应用。E-mail:18700807193@163.com。

通信作者:崔晨风,博士,讲师,研究方向为“3S”技术在农业水土工程和水文水资源中的应用、大坝安全监测、精密工程测量。E-mail:cuichenfeng@163.com。光谱技术作为一种简单、快捷、非接触、非破坏的分析方法,已经被广泛地应用到土壤和植物研究、食品行业等领域[1-4]。由于土壤的光谱反射率能综合反映土壤理化特征和内在结构,所以土壤光谱测量为土壤光谱特征分析、土壤分类提供了新途径[5-6]。目前已有基于土壤光谱特征对土壤各项生理指标参数的研究[7],但是基于土壤近红外光谱和神经网络的土壤分类研究较少[8]。刘家雄[9]、付强等[10]分别利用土壤理化指标,结合主成分分析、聚类分析、神经网络等方法对土壤分类进行研究。由于土壤理化性质测量方法复杂,工程量大,无法快速、无损地对土壤进行分类。曾庆猛等利用土壤近红外光谱和聚类分析对土壤分类进行了研究[11],宋海燕等利用近红外光谱和正交信号-偏最小二乘法对土壤进行分类,但分类精度最高仅达到85%[12]。

神经网络模型作为一种强有力的学习系统,模拟了人脑思维过程,能够实现输入层、输出层的非线性映射,已经在很多领域得到广泛应用,并取得良好效果[13-14],但目前还没有基于土壤近红外光谱和神经网络[反向传播人工(BP)神经网络和径向基函数人工(RBF)神经网络]的土壤分类研究。本研究采用新疆土、土、沙土、阜阳土等4种类型土壤的室内可见-近红外光谱反射数据为研究对象,利用主成分分析方法,结合BP神经网络和RBF神经网络技术进行土壤分类研究,探讨基于土壤反射光谱特性的土壤分类技术,以期提高土壤分类精度和运行时间,为实现基于遥感方法进行土壤快速分类奠定基础。

1材料与方法

1.1仪器设备

使用美国ASD(analytical spectral device)公司的Handheld Field Spec 型光谱仪,其光谱测定范围为325~1 075 nm,采样间隔为10 nm,光谱分辨率为3.5 nm,探头视场角为15°。光源采用与光谱仪配套的14.5 V卤素灯。采用ASD View Spec Pro和Matlab R2009b软件分析数据。

1.2样本采集与制备

供试土壤分别为新疆土、土、沙土、阜阳土。每种土壤各取10个样本,每个样本扫描20次,取平均值作为最终光谱反射率数据。

1.3主成分分析(PCA)原理

PCA是一种降维映射方法,可以有效地压缩数据特征,把原有多维空间信息通过一系列线性变换在低维空间表现出来,从而消除众多信息中的重叠部分。提取的每个特征都是原来特征的函数,使新得到的特征数少于原有特征数,同时保存了原有特征的主要信息。

1.4神经网络原理

1.4.1BP神经网络BP神经网络是目前应用最广泛的神经网络方法之一,具有较强的信息处理能力,能够实现输入和输出之间的非线性映射。典型的神经网络具有1个输入层、数个隐含层、1个输出层,层与层之间采用全连接的方法,同层神经元之间不存在相互连接。理论上已证明,1个具有隐含层的3层网络可以逼近任何连续的非线性函数。隐含层中神经元多采用“S”型函数(tansig),输出层的神经元多采用线性传递函数(purelin)。

传统的BP算法存在很多未解决问题,如收敛速度较慢,易于陷入局部极小等。在实际应用中,该算法存在网络结构参数和学习训练参数难以确定的问题,这在一定程度上影响了神经网络的推广应用。

本研究采用3层BP神经网络,该网络由1个输入层、1个隐含层、1个输出层组成,隐含层采用“S”型函数,输出层采用线性传递函数,目标误差0.01,设定训练迭代次数 1 000 次。

1.4.2RBF神经网络多变量插值的RBF神经网络具有优秀的离散数据内插特性,可以提供最优逼近功能,其网络结构域与多层前向型网络类似,是一种3层前向型网络,由输入层、隐含层、输出层组成,隐含层神经元传递函数是对中心点径向对称且衰减的非负非线性函数(radbas),从输入层空间到隐含层的空间变换是线性的,从隐含层空间到输出层空间变换也是线性的。RBF具有结构简单,训练速度快,函数逼近能力和分类能力强,不存在局部最优问题等特点。endprint

本研究采用3层RBF神经网络,径向基函数扩展速度(spread)为5.5。

2结果与分析

2.1可见-近红外光谱分析

2.2主成分分析

3结论

通过试验获得4种类型土壤的可见-近红外光谱特征曲线,结合主成分分析和有导师学习型的2种神经网络,分别建立了鉴别土壤类型的模型,2种模型预测效果很好,识别率均达到100%。其中RBF神经网络克服了BP神经网络运行时间长的缺点,在应用时更加快捷方便。利用可见-近红外光谱技术可以快速、准确、无损地对土壤类型进行鉴别,为土壤类型鉴别提供了一种可靠的新途径。

参考文献:

[1]何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[2]何勇,李晓丽. 用近红外光谱鉴别杨梅品种的研究[J]. 红外与毫米波学报,2006,25(3):192-194+212.

[3]李晓丽,何勇,裘正军.一种基于可见-近红外光谱快速鉴别茶叶品种的新方法[J]. 光谱学与光谱分析,2007,27(2):279-282.

[4]邵咏妮,何勇,潘家志,等. 基于光谱技术的桔子汁品种鉴别方法的研究[J]. 光谱学与光谱分析,2007,27(9):1739-1742.

[5]黄应丰,刘腾辉. 华南主要土壤类型的光谱特性与土壤分类[J]. 土壤学报,1995,32(1):58-68.

[6]刘焕军,张柏,张渊智,等. 基于反射光谱特性的土壤分类研究[J]. 光谱学与光谱分析,2008,28(3):624-628.

[7]张娟娟,田永超,姚霞,等. 基于高光谱的土壤全氮含量估测[J]. 自然资源学报,2011,26(5):881-890.

[8]王遵义,金春华,刘飞,等. 基于光谱技术的土壤快速分类方法研究[J]. 浙江大学学报:农业与生命科学版,2010,36(3):282-286.

[9]刘家雄. 主成分分析与聚类分析在土壤分类中的应用[J]. 上海农业学报,2011,27(3):110-113.

[10]付强,王志良,梁川. 自组织竞争人工神经网络在土壤分类中的应用[J]. 水土保持通报,2002,22(1):39-43.

[11]曾庆猛,孙宇瑞,严红兵. 土壤质地分类的近红外光谱分析方法研究[J]. 光谱学与光谱分析,2009,29(7):1759-1763.

[12]宋海燕,秦刚,韩小平,等. 基于近红外光谱和正交信号-偏最小二乘法对土壤的分类[J]. 农业工程学报,2012,28(7):168-171.

[13]吴桂芳,蒋益虹,王艳艳,等. 基于独立主成分和BP神经网络的干红葡萄酒品种的鉴别[J]. 光谱学与光谱分析,2009,29(5):1268-1271.

[14]杨芳,李红睿,田学东. 基于RBF神经网络的汉字粗分类方法[J]. 计算机工程与应用,2009,45(6):170-172.endprint

本研究采用3层RBF神经网络,径向基函数扩展速度(spread)为5.5。

2结果与分析

2.1可见-近红外光谱分析

2.2主成分分析

3结论

通过试验获得4种类型土壤的可见-近红外光谱特征曲线,结合主成分分析和有导师学习型的2种神经网络,分别建立了鉴别土壤类型的模型,2种模型预测效果很好,识别率均达到100%。其中RBF神经网络克服了BP神经网络运行时间长的缺点,在应用时更加快捷方便。利用可见-近红外光谱技术可以快速、准确、无损地对土壤类型进行鉴别,为土壤类型鉴别提供了一种可靠的新途径。

参考文献:

[1]何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[2]何勇,李晓丽. 用近红外光谱鉴别杨梅品种的研究[J]. 红外与毫米波学报,2006,25(3):192-194+212.

[3]李晓丽,何勇,裘正军.一种基于可见-近红外光谱快速鉴别茶叶品种的新方法[J]. 光谱学与光谱分析,2007,27(2):279-282.

[4]邵咏妮,何勇,潘家志,等. 基于光谱技术的桔子汁品种鉴别方法的研究[J]. 光谱学与光谱分析,2007,27(9):1739-1742.

[5]黄应丰,刘腾辉. 华南主要土壤类型的光谱特性与土壤分类[J]. 土壤学报,1995,32(1):58-68.

[6]刘焕军,张柏,张渊智,等. 基于反射光谱特性的土壤分类研究[J]. 光谱学与光谱分析,2008,28(3):624-628.

[7]张娟娟,田永超,姚霞,等. 基于高光谱的土壤全氮含量估测[J]. 自然资源学报,2011,26(5):881-890.

[8]王遵义,金春华,刘飞,等. 基于光谱技术的土壤快速分类方法研究[J]. 浙江大学学报:农业与生命科学版,2010,36(3):282-286.

[9]刘家雄. 主成分分析与聚类分析在土壤分类中的应用[J]. 上海农业学报,2011,27(3):110-113.

[10]付强,王志良,梁川. 自组织竞争人工神经网络在土壤分类中的应用[J]. 水土保持通报,2002,22(1):39-43.

[11]曾庆猛,孙宇瑞,严红兵. 土壤质地分类的近红外光谱分析方法研究[J]. 光谱学与光谱分析,2009,29(7):1759-1763.

[12]宋海燕,秦刚,韩小平,等. 基于近红外光谱和正交信号-偏最小二乘法对土壤的分类[J]. 农业工程学报,2012,28(7):168-171.

[13]吴桂芳,蒋益虹,王艳艳,等. 基于独立主成分和BP神经网络的干红葡萄酒品种的鉴别[J]. 光谱学与光谱分析,2009,29(5):1268-1271.

[14]杨芳,李红睿,田学东. 基于RBF神经网络的汉字粗分类方法[J]. 计算机工程与应用,2009,45(6):170-172.endprint

本研究采用3层RBF神经网络,径向基函数扩展速度(spread)为5.5。

2结果与分析

2.1可见-近红外光谱分析

2.2主成分分析

3结论

通过试验获得4种类型土壤的可见-近红外光谱特征曲线,结合主成分分析和有导师学习型的2种神经网络,分别建立了鉴别土壤类型的模型,2种模型预测效果很好,识别率均达到100%。其中RBF神经网络克服了BP神经网络运行时间长的缺点,在应用时更加快捷方便。利用可见-近红外光谱技术可以快速、准确、无损地对土壤类型进行鉴别,为土壤类型鉴别提供了一种可靠的新途径。

参考文献:

[1]何勇,李晓丽,邵咏妮.基于主成分分析和神经网络的近红外光谱苹果品种鉴别方法研究[J]. 光谱学与光谱分析,2006,26(5):850-853.

[2]何勇,李晓丽. 用近红外光谱鉴别杨梅品种的研究[J]. 红外与毫米波学报,2006,25(3):192-194+212.

[3]李晓丽,何勇,裘正军.一种基于可见-近红外光谱快速鉴别茶叶品种的新方法[J]. 光谱学与光谱分析,2007,27(2):279-282.

[4]邵咏妮,何勇,潘家志,等. 基于光谱技术的桔子汁品种鉴别方法的研究[J]. 光谱学与光谱分析,2007,27(9):1739-1742.

[5]黄应丰,刘腾辉. 华南主要土壤类型的光谱特性与土壤分类[J]. 土壤学报,1995,32(1):58-68.

[6]刘焕军,张柏,张渊智,等. 基于反射光谱特性的土壤分类研究[J]. 光谱学与光谱分析,2008,28(3):624-628.

[7]张娟娟,田永超,姚霞,等. 基于高光谱的土壤全氮含量估测[J]. 自然资源学报,2011,26(5):881-890.

[8]王遵义,金春华,刘飞,等. 基于光谱技术的土壤快速分类方法研究[J]. 浙江大学学报:农业与生命科学版,2010,36(3):282-286.

[9]刘家雄. 主成分分析与聚类分析在土壤分类中的应用[J]. 上海农业学报,2011,27(3):110-113.

[10]付强,王志良,梁川. 自组织竞争人工神经网络在土壤分类中的应用[J]. 水土保持通报,2002,22(1):39-43.

[11]曾庆猛,孙宇瑞,严红兵. 土壤质地分类的近红外光谱分析方法研究[J]. 光谱学与光谱分析,2009,29(7):1759-1763.

[12]宋海燕,秦刚,韩小平,等. 基于近红外光谱和正交信号-偏最小二乘法对土壤的分类[J]. 农业工程学报,2012,28(7):168-171.

[13]吴桂芳,蒋益虹,王艳艳,等. 基于独立主成分和BP神经网络的干红葡萄酒品种的鉴别[J]. 光谱学与光谱分析,2009,29(5):1268-1271.

[14]杨芳,李红睿,田学东. 基于RBF神经网络的汉字粗分类方法[J]. 计算机工程与应用,2009,45(6):170-172.endprint