吴旻,王振亮,郑金兴,钱永平
(福建林业职业技术学院,福建南平353000)
改进投影寻踪模型在砾石形成评价中的应用
吴旻,王振亮,郑金兴,钱永平
(福建林业职业技术学院,福建南平353000)
利用改进投影寻踪法可将砾石形成评价样本的多维评价指标综合成一维投影函数值,根据投影函数值的大小对砾石样本集进行科学评价、成因分类。实例分析表明,由砾石样本数据构建的改进投影寻踪模型对砾石成因评价准确性好,具有较强的适用性和应用性,可以在砾石成因评价与分类判定中应用。
改进投影寻踪法;砾石;成因评价
地质工程领域经常需要对各种地质构造、地质现象进行识别和分类。目前通常采用判别分析方法加以解决[1]。随着各种先进技术特别是一些交叉学科(如数学地质)的发展,现代统计学在地质工程学科得到了非常广泛的应用,并成为地质工程学科中研究中一种新的方法。投影寻踪技术(projection pursuit,PP)是采用“审视数据-模拟-预测”的探索性数据分析技术[2-5],一直被国内外统计专家和信号处理学者的关注,并已广泛应用于多个领域[4-7],包括在地质工程学科的应用[8]。但由于该技术适用于高维、非线性、非正态问题的分析和处理,导致计算过程相对复杂、编程实现难度较大,从而限制了其应用。鉴于此,吴承祯等[9]提出了基于改进单纯形法(modified simplexmethod,MSM)的改进投影寻踪模型,通过MSM直接优化投影寻踪模型中的投影方向参数,实现投影方向参数的全局最优。
在地质工程中,砾石是重要的原料,其存在于海滩、河谷、河流阶地、坡麓等地,其形成原因多样,但砾石的特性在一定程度上可反映沉积环境,是沉积环境和形成原因的一种指示标志[10],因此,本研究拟将改进投影寻踪模型应用于地质工程中砾石形成评价,以丰富砾石形成机制评价技术并发展地质工程领域分析评价理论与技术。
改进投影寻踪评价模型的基本思想[9],是以计算机技术为手段,以改进单纯形法直接求解投影寻踪模型投影方向参数为出发点,通过降低样本高维数据信息于某个具体投影指标,从而实现样本集的定量评价与分级评价。其相比于传统投影寻踪模型的优势表现在:(1)克服了样本数据较多或样本数据维数较大时难求解全局最优投影方向参数的困难;(2)简化了投影寻踪模型编程与计算过程的复杂性,拓展了其在众多领域的应用。因此,为拓展改进投影寻踪模型(projection pursuit evaluation,PPE)[9]在地质工程领域的应用。本研究提出将其具体应用于地质工程领域的砾石形成评价中的应用,具体步骤包括4步。
第1步:筛选样本数据指标体系,对样本数据进行预处理。根据砾石形成评价的目的,结合砾石特征的野外勘察基本数据,采用粒径、球度、扁度、磨圆度等指标[10]构成砾石形成评价的指标体系。设根据砾石特征野外调查基本指标数据分别为xij(i=1~n,j=1~p),其中n、p分别表示砾石采样样本单元数和评价指标的数目。为了消除各指标的量纲的影响,以保证建模不失一般性,需对xij(i=1~n,j=1~p)进行标准化处理[9],形成标准化指标值yij。
第2步:构造砾石形成投影指标函数。砾石形成评价模型的投影指标函数可构造为[2]:
其中,Sz为投影值Zi(i=1~n)的标准差,Dz为投影值Zi(i=1~n)的局部密度,吴承祯等已对Sz、Dz的含义及计算过程进行了探讨[9]。
第3步:砾石形成评价模型投影方向参数的优化。当给定已知砾石特征指标的样本数据,xij(i=1~n,j=1~p)时,投影指标函数Q(β)只随投影方向β的变化而变化。借助改进单纯形法[11]通过求解投影指标函数最大化问题以估计最佳投影方向,即:
第4步:砾石形成评价的投影值的计算。通过改进单纯形法实现投影方向的全局最优,从而获得投影方向参数,据此按(4)计算降维后的投影值Zi为:
其中,β=(β1,β2,…,βp)为投影方向参数。通过Zi(i=1~n)值大小的比较,可对各样本集进行形成原因评价;也可以建立砾石形成评价标准的基础上,对未知砾石样本进行形成原因的判定与分类分析。
2.1黄山不同类型砾石的形成评价
引用文献[10]的资料,选取砾石的粒径(a、b、c三轴)、球度、扁度、磨圆度等6个指标,构成黄山不同类型砾石的形成评价指标体系(表1)。其中样本采样地包括桃花溪、凤凰源等11个采样点,判定砾石形成原因含现代河谷沉积、第四纪泥砾沉积、坡麓沉积等4种类型[10]。
利用改进投影寻踪模型对该样本集进行成因评价,首先对样本集各指标进行标准化处理,然后以(2)式为目标函数、(3)式为约束条件,采用改进投影寻踪法对目标函数进行优化求解,经过计算机运算,当窗口半径参数为0.3时,得到最大投影指标函数值为1.972 1,最大投影方向为(0.250 8、0.506 0、0.244 4、0.242 7、0.000 4、0.749 9)。将代入(4)式即可计算得到黄山不同类型砾石11个样本的投影值Zi(表1)。
投影值Zi越大,表示该砾石越接近坡麓沉积;投影值Zi越小,砾石越接近第四纪泥砾沉积。根据各砾石样本的投影值大小,不难发现,黄山不同类型砾石特征投影值的变化幅度较大,如样本3(采样点为松骨庵)投影值为1.799 0,而样本8(采样点为大门建筑工地-空洞)投影值仅为0.087 7,变幅达1.711 3。当将投影值临界值设定为0.5和1.3时,11个样本可分为3类,样本1~2、4~5号为第1类,样本6~8、10号为第2类,样本3、9、11为第3类,显然此3子集内投影值变化幅度较小,3类投影值取值范围分别为[0,0.5]、(0.5,1.3]、(1.3,1.8]。按此评价标准,11个样本可分为3类(图1),第1类砾石形成因素为第四纪泥砾沉积、第2类砾石形成因素为现代河谷(含河流一级阶地)沉积、第3类砾石形成因素为坡麓沉积。这与周秉根等[10]调查取样时的判定基本一致,吻合率为81.81%。但分析不同类型砾石特征不难发现,松骨庵采样点的砾石与坡麓沉积形成的砾石在特征上更为吻合,因此其形成因素实质上应为坡麓沉积而非现代河谷沉积;而汤口岭头采样的砾石形成因素也应为第四纪泥砾沉积而非坡麓沉积。因此,可以认为改进投影寻踪模型评价砾石形成原因的判定准确率可达100%,也在一定程度上克服了人为判断的误差,可以达到预期目的和精度要求,也可在砾石成因分析中应用。
图1 黄山不同类型砾石评价投影值散点图
2.2河流与海滩砾石的分类评价
引用文献[1]的资料,选取中值粒径、磨圆指数、扁平指数、不对称指数4个指标,构成砾石评价的指标体系。将砾石榜样本分为2类,每类7个样本(表2)[1]。基于改进投影寻踪模型对该样本集进行分类评价,当窗口半径参数为0.3时,得到最大投影指标函数值为0.759,最大投影方向为(0.680 1、0.567 3、0.096 5、0.453 9)。将β代入(4)式即可计算获得14个砾石样本的投影值Zi(表3)。
表1 黄山不同类型砾石特征值及其评价投影值
表2 不同类型砾石特征值
砾石样本投影值的散点图分析表明,14个样本分为两类(图2),一类为河流砾石、另一类为海滩砾石。样本1~4、6~7号样本单元为第一类,样本5、8~14号样本单元为第二类,2类砾石投影值分级标准为[1.0,1.6]、[0,0.9],分别对应于河流砾石和海滩砾石。判定结果,与王喜华等[1]采用判别分析进行判定时,在样本单元5上不一致,但分析其砾石特征值后,可以认为判别分析法存在误判的可能。本研究提出的改进投影寻踪模型是准确的。
表3 砾石类别评价结果的比较
图2 河流与海滩砾石样本数据的投影值散点图
为进一步探讨砾石评价模型的具体应用过程,对中值粒径为3.3 cm、磨圆指数为290、扁平指数为4.1、不对称指数为650的砾石,判定其属于哪一类砾石。将此样本单元有关指标值标准化后代入模型(2)可得样本单元投影值为0.8179,[0,0.9]之间,属于海滩砾石,判别结果与实际在相符,说明采用改进投影寻踪模型对砾石进行评价并判定其成因及类型具有可操作性并可达到相应精度要求,可以在实际评价中应用。
在砾石评价中,不论是成因分析还是类型判定,即存在人为判定的误判、也存在方法判定上的误判,而采用改进投影寻踪模型建立评价模型可以克服上述两类误判,从而提高判定的精确性。2个案例分析表明,改进投影寻踪模型具有上述优势,可在地质工程分级、定量评价案例分析中推广应用。改进投影寻踪模型在评价地质工程案例时,由于已实现计算机程序化优化投影方向参数,因此应用方便,但投影方向参数初值和步长的设置十分重要[11],尤其是初值的确定,建议采用随机设置或等值设置,但必须满足方向参数的约束条件。
砾石评价过程中,指标体系的构建也是基础性工作,对评价结果存在一定的影响。除了可选择砾石粒径、球度、扁度、磨圆度等指标外[12],还可考虑搬运距离及沉积环境有关指标。指标的多少,并不影响改进投影寻踪模型的计算过程与运行精度,仅体现在投影方向参数的大小上,投影方向参数越大,影响越大即权重越大。
[1]王喜华,赵志明.判别分析在地质工程中的应用[J].西部探矿工程,2004,16(4):3-5.
[2]Friedman JH,Turkey JW.A projection pursuit algorithm for exploratory data analysis[J].IEEE Trans.1974,23(9):881-890.
[3]李祚泳.投影寻踪技术及其应用进展[J].自然杂志,1997,19(4):224-227.
[4]李祚泳,邓新民,辛文清.旱涝趋势的投影寻踪预测模型[J].自然灾害学报,1997,6(4):68-73.
[5]金菊良,张礼兵,潘金锋.基于投影寻踪的天然草地分类模型[J].生态学报,2003,23(10):2184-2188.
[6]李祚泳,丁晶,张欣莉.环境监测优化布点的投影寻踪回归分析法[J].环境科学进展,1999,7(6):127-130.
[7]范建容,刘淑珍,钟祥浩,等.金沙江热河谷土地荒漠化评价方法研究[J].地理科学,2002,22(2):243-247.
[8]汪明武,金菊良.投影寻踪方法在边坡稳定性评价中的应用[J].岩土工程学报,2002,24(5):619-621.
[9]吴承祯,洪伟.基于改进的投影寻踪的森林生态系统生态价位分级模型研究[J].应用生态学报,2006,17(3):357-361.
[10]周秉根,李典友.黄山不同类型砾石特性及成因分析[J].安徽师范大学学报(自然科学版),2000,23(1):57-60.
[11]吴承祯,洪伟.BP-MSM混合算法及其在森林自疏规律研究中的应用[J].应用生态学报,2000,11(5):655-659.
[12]李燕,金振奎,金婷,等.岩浆岩砾石磨圆度地质意义的研究[J].沉积学报,2014,32(2):189-197.
(责任编辑:华伟平)
Application of Modified Projection Pursuit Evaluation Model in Evaluation of Gravel Formation
WUMin,WANG Zhenliang,ZHENG Jinxing,QIAN Yongping
(Fujian Forestry Vocational Technical College,Nanping,Fujian 353000)
The modified projection pursuitmethod is a new method that used modified simplex method to realize?global?optimization for the parameters of projection direction.This new method was applied to evaluate the cause of formation of gravel,in which this technique was utilized to integrate themulti-dimensional indices into one-dimensional projection function value,then the gravel sample data was evaluated and classified for its cause of formation scientifically based on the projection function value.Example analysis shows that themodified projection pursuitmodel which constructed by gravel sample data is good in evaluation the cause of formation of grave,with high accuracy,strong applicability and extensive application.This new method can be applied to evaluate and classify the cause of formation of gravel.
modified projection pursuitmethod;gravel;formation evaluation
TU42
A
1674-2109(2016)06-0076-04
2016-03-22
福建省林业厅科研资助项目(闽林科[2012]2号)。
吴旻(1990-),男,汉族,助教,主要从事工程地质研究。