顾畛逵,宋召军,周金,陈桥
(山东省沉积成矿作用与沉积矿产重点实验室/山东科技大学地质科学与工程学院,山东 青岛 266590)
黄河和长江是我国东部海域中泥沙堆积的最主要来源,渤海和黄海广泛分布着地质历史时期的黄河和长江沉积物.进入晚更新世以来,黄河和长江入海位置在一段比较长的时间内都处于苏北岸外陆架之上,使其沉积物在这一地区广泛堆积.在南黄海陆架之上,具有黄河和长江物源属性的沉积物相互混杂和叠加,不易判别[1],因此,对于黄河和长江沉积物的物源识别自然成为中国东部陆架海域的热点研究问题之一.近年来,国内外众多学者在对黄河和长江沉积物的物源识别方面已经取得了许多重要成果[1],主要是依靠矿物学、地球化学以及环境磁学等手段,凭借沉积物矿物元素组合、粒度差别和磁性特征等指标的对比,着重于物理和化学特征方面,但还没有从沉积物各元素含量在数值关系中所表现出来的规律来进行判别.而且由于黄河和长江沉积物中都存在的一些共同的元素,它们的物理和化学特征相似时,实验方法不易测定,便容易产生多解和误判.根据人工神经网络中各种方法的适用范围,考虑通过自组织人工神经网络方法,依据对沉积物各元素含量在数值上所表现出来的规律进行物源判别.
1.1自组织竞争网络原理特点及应用自组织神经网络是一种前向型人工神经网络模型,是基于生物神经系统的“侧抑制”现象而提出的一种非线性数学模型,模拟生物神经细胞兴奋后对其周围神经细胞产生侧抑制现象,通过无导师学习算法,让竞争层各神经元通过竞争与输入模式进行匹配,最后得出竞争胜出者.自组织竞争网络是基于并行处理机制的一种广泛连接的巨型系统.其分布式结构使其具有和人脑一样的容错性和联想能力,具有自学习、自组织和自适应能力,通过对样本的“学习和培训”,可记忆客观事物在空间和时间方面比较复杂的关系,从而实现对事物的分类和识别.与人工神经网络模型中最为常用的BP网络相比,自组织竞争网络自组织自适应的学习能力能够进一步拓展模式识别的应用,能够将输入模式进行自组织训练和判断并实现识别.目前,自组织竞争网络在各个学科中已经有了一定的实践,尤其是在评价、预测、分类和识别等方面已经取得了一定的进展,如环境评价、城市功能分区、土壤分类和故障诊断等,但在地质科学中的应用实例仍然较少,应用推广前景应当引起人们的注意.
图1 自组织竞争神经网络结构图[2]
1.2自组织竞争网络结构自组织竞争网络是人工神经网络中的一种单层神经网络,其结构图如图1所示[2].在建立模型的过程中输入的向量P和输入的权值向量IW输入到‖ndist‖中,输出S1X1列向量,其各元素为通过距离函数negdist计算出来的P和IW距离的复数.n1的值为P和IW距离的复数与阀值b1之和,作为竞争层传输函数的输入.n1中最大的元素表示“获胜者”,传输函数输出“1”,其他函数输出为“0”,神经元的权值向量最接近输入向量时,它在n1各元素中负值最小,而绝对值最大,赢得竞争,传输函数输出“1”,其他输出为“0”,R为输入层节点数目,S为神经元数目.
1.3自组织竞争网络学习规则假定提供给网络的M个输入模式向量为P,对应竞争层输入模式为A,则网络学习规则依次为[3]:
(1)
(2)
利用单位向量特点可将式(1)转化为求最大点积,并作为竞争层神经元的净输入,见式(3).
(3)
3) 网络输出与权值调整.
(4)
按照式(4),获胜神经元输出为1,其余输出为0,获胜神经元用于调整权向量wj*,调整后为:
(5)
学习率α∈(0,1),当j≠j*时对应神经元权值得不到调整,直到学习率衰减到0或规定值.
从空间上看,黄河中、上游地处西北半干旱地区,流经黄土高原并受其重要影响,而长江流经多个构造单元,其携带沉积物主要来自上游支流,沉积物种类和来源都较为丰富.根据已有的研究结果,黄河和长江在沉积物元素分布和含量上都存在着差别,因此,一方面我们可以利用元素分布上的差异进行黄河和长江物源的区分,另一方面对于分布相同的元素可以从含量数值关系进行区分.从时间尺度上看,黄河和长江在晚更新世以来的流域与现代相似,其携带沉积物应与渤海和黄海堆积的晚更新世以来的长江和黄河沉积物各元素含量在数值上应表现出相近的特征,可以利用这一原理建立自组织竞争神经网络模型,“将今论古”,对南黄海晚更新世以来的黄河和长江沉积物进行区分.
2.1指标选取黄河与长江沉积物的常量和微量元素的组成特征不同.黄河相对富含Ca、Na、Sr和Zr等少量元素,长江相对富含K、Fe和Al等常量元素及绝大多数微量元素.本文中主要针对物化性质重叠的情况进行研究,因此选取黄河和长江悬浮沉积物中都具有的常量元素,包括Fe2O3、MgO、Al2O3、Na2O、K2O、TiO2和MnO共7种元素氧化物指标.该选取沉积物可以代表黄河与长江的入海沉积物[5].
2.2网络创建以现代黄河和长江中所采集的入海沉积物常量元素含量(表1)为基准数据建立自组织竞争神经网络模型,使竞争层各神经元通过竞争与输入模式进行匹配,最后竞争胜出者代表输入模式的分类.将表1中的数据进行归一化处理,映射到[0,1]区间内以利于提高神经网络运算速度.对数据矩阵处理后将其作为网络输入,开始进行网络创建.利用Matlab7.0提供的函数net=newc(RP,S,KLR)建立一个自组织竞争人工神经网络.其中RP为输入矩阵,S为神经元个数(本文中S为2),KLR为学习速率(本文中为0.05).参数net为输出的自组织竞争神经网络.最后再利用train()和sim()进行训练和仿真检验,若效果良好,便可用于物源判别.
表1黄河、长江悬浮沉积物常量元素组成%
编号类别Fe2O3MgOAl2O3Na2OK2OTiO2MnO1黄河3.800.854.040.702.700.450.082黄河4.291.827.980.933.100.530.093黄河3.030.604.020.610.950.400.064长江4.892.2011.620.352.900.770.125长江5.842.6213.400.473.420.970.146长江5.762.6013.810.493.670.930.14
数据来源[4].
表2黄河、长江悬浮沉积物常量元素组成验证%
编号类别Fe2O3MgOAl2O3Na2OK2OTiO2MnO1黄河3.361.657.450.992.860.470.062黄河5.061.637.281.072.180.630.103黄河4.610.774.260.821.930.600.094黄河3.430.704.920.921.430.500.065黄河2.551.3310.242.392.520.350.066长江5.762.5013.810.463.660.900.137长江5.772.5313.830.493.600.920.138长江5.732.5713.980.503.660.920.139长江7.293.1017.261.753.320.860.1310长江5.192.5413.671.202.530.760.0811长江6.422.8616.041.423.050.820.1012长江8.552.5119.931.123.301.170.17
数据来源1~4、6~8[4],5[5],9~11[6],12[7].
依据对6组黄河和长江入海沉积物中常量元素数据矩阵所建立的自组织竞争神经网络在进行物源
表3 可靠性分析结果
判别时实现正确判别17次,错误判别1次,需要对其判别可靠性进行分析.根据改进后的二项分布参数估计方法[8](见式(6)、(7)),其中n为验证数据组数,F为错误判别次数.通过获得其正确概率最大似然估计值及对应置信区间,分析结果见表3.
(6)
(7)
图2 判别过程图
以南黄海NT2孔作为分析对象,根据基准数据选取和其相同指标的常量元素含量数据(表4)建立判别数据矩阵,并进行归一化处理.归一化处理后直接调用上文所建立的网络,通过sim()函数对数据进行分析,从而进行黄河和长江沉积物的判别.调用函数为Y=sim(net,a),其中“net”为已经建立的自组织竞争网络模型,“a”为对判别矩阵进行归一化后的数据矩阵,运算结束后再对运算结果利用vec2ind(Y)函数转换为串行数据并得到判别结果,判别过程见图2.
运算之后的判别结果显示为“2、2、1、2、1、1”,即NT2孔中0~19.36 m和其中28.07~52.88 m深度范围内的沉积物为长江沉积物,而其中19.36~28.07 m和52.88~70.28 m深度范围内以及表层沉积物为黄河沉积物.这一结果与蓝先洪和张志珣等研究员对南黄海NT2孔沉积物物源的研究结果[9](南黄海NT2孔0~19.30 m、27.00~54.60 m深度范围内的沉积物以长江源为主,19.30~27.00 m、54.60~70.31 m沉积物以黄河源为主)大致相同,而表层沉积物表现出黄河沉积物的特征,有可能是受黄河在近现代未改道入渤海之前的影响.该判别结果进一步说明南黄海NT2孔附近在中更新世中晚期以来属于黄河和长江沉积物交互影响区域[9].
表4南黄海NT2孔常量元素含量%
样品深度Fe2O3MgOAl2O3Na2OK2OTiO2MnO0~8.14 m4.711.6812.302.042.390.770.138.14~19.36 m5.092.3712.951.632.560.760.0819.36~28.07 m4.382.3710.191.722.020.660.0828.07~52.88 m5.692.7513.911.392.730.790.0952.88~70.28 m3.321.149.682.062.280.520.08表层沉积物4.662.1112.312.382.730.600.09
数据来源[10].
1) 自组织竞争神经网络对于模式样本具有一定的要求,当样本自身杂乱无章时,网络对输入模式的响应会呈现出振荡的现象,对同一类输入模式的响应可能激活不同的输出神经元从而不能实现正确判别。但考虑到样品在采集时已经经过了一定的程序,并对野值数据进行了剔除,一定程度上排除了意外因素的干扰,样品数据值应具有一定的可靠性.
2) 网络除了对建模基准数据的稳定性有要求之外,其判别分类性能还与权值和阀值的初始值、学习速度以及训练样本时间具有一定的关系,但这种关系对判别结果的影响并不能通过自身给予评价,因此,本文中通过对判别结果的正确次数得出了其正确率的最大似然估计值,可靠性达到94.4%,并规定了其在相应置信度下的置信区间.
3) 本文中利用黄河和长江在地质历史时期的沉积物与现代黄河长江沉积物应具有一定的相似性这一原理,以现代黄河和长江沉积物部分常量元素含量作为基准数据建立自组织竞争神经网络,但根据已有的研究结果[11],最近一个世纪以来人类活动包括土地利用方式的变化以及沿河筑坝等对河流的泥沙通量变化产生重要作用.这可能对河流沉积物各种元素含量的百分比产生影响,所以在实际应用中可以选取相应年代或人类活动较强烈之前的黄河和长江三角洲沉积物样本作为建模基准数据,使所建立的网络模型更具可靠性.
4) 对南黄海NT2孔各深度范围的常量元素进行判别,其结果与通过传统方法得到的结果大致相同,反映出将自组织神经网络用于黄河和长江的物源判别具有一定的实用性和可靠性,并进一步说明南黄海在中更新世中晚期以来就开始接受黄河和长江沉积[12].
[1] 胡邦琦,李军,李国刚,等.长江和黄河入海沉积物的物源识别研究进展[J].海洋地质与第四纪地质,2011,31(6):147-152.
[2] 张德丰.Matlab神经网络应用设计[M].北京:机械工业出版社,2011:226-229,233-234.
[3] 韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006:14-20,84-86.
[4] 周晓霞.黄河与长江入海沉积物常见矿物的矿物学和地球化学识别特征[D].青岛:中国海洋大学,2004:31-32.
[5] 国制标物10000803.黄河三角洲沉积物成分分析标准物[S].青岛:青岛海洋地质研究所,2007-12-11.
[6] 项立辉.长江口滨外泥质区末次冰消期以来沉积特征与沉积环境演化[D].青岛:中国海洋大学,2008:45.
[7] 范德江,杨作升,毛登,等.长江与黄河沉积物粘土矿物及地化成分的组成[J].海洋地质与第四纪地质,2001,21(4):7-11.
[8] 李鸿.二项分布的参数估计问题研究[J].应用数学学报,2010,33(3):386-391.
[9] 蓝先洪,张志珣,王红霞,等.南黄海NT2孔沉积物物源研究[J].沉积学报,2010,28(6):1182-1189.
[10] 王红霞.南黄海晚更新世以来环境演变的矿物—地球化学记录[D].青岛:中国海洋大学,2008:94-95.
[11] Yang S L, Shi Z, Zhao H Y, et al. Effects of human activities on the Yangtze River suspended sediment flux into the estuary in the last century[J]. Hydrology and Earth System Sciences,2004,8(6):1210-1216.
[12] 蒲小平,陈克兴,戴桂康.人工神经网络的哲学意义[J].自然辨证法研究,1993,9(1):18-23.