柳炳利,郭 科,敖 东,武 菊
(1.成都理工大学 地球物理学院,成都 610059;2.数学地质四川省高校重点实验室,成都 610059;3.内江师范学院 数学与信息科学学院,内江 641112)
成矿过程的多期性和多源性,必然使得地球化学元素分布具有高度的非线性特征。众多复杂地质因素对地球化学元素的控制,必然会表现出元素的群体特征,即共生组合特征。矿床的成矿元素及其伴生元素是指示矿床存在的重要标志,单一的指示元素异常存在着不确定性,多元素的综合指示能够有效地反映矿体的存在。因此,采用多元素的组合评价,则可以弥补单元素评价的不足。
基于以上考虑,作者在本文引入了信息论中的JADE算法,用于寻求地球化学成矿元素组合的关键问题。
独立分量分析[1](ICA,Independent Component Analysis)是近年来由盲源分离技术(BSS,Blind Source Separation)发展起来的一种新的多维信号处理方法,是信号处理技术发展中的一项前沿热点。与传统的二阶空间去相关技术相比,ICA不仅可以去除各分量之间的一阶、二阶相关性,同时还具有发掘并去除数据间的高阶相关信息的能力,使得输出分量之间相互独立[2]。因此ICA可以被看作是二阶空间去相关技术的一种扩展。JADE是独立分量分析理论中的典型算法。
独立分量分析发展至今,时间虽然不长,但在算法上已得到了深入的研究,成为现代数字信号处理的一个十分活跃的领域,在电子信息、通信、生物医学、图像增强、雷达、地球物理信号处理等领域中,都取得了丰硕的成果。但在地球化学领域的应用,目前仍是空白状态。作者在本文将JADE算法应用于寻求地球化学矿化元素组合当中,取得了较好的应用效果。
多道观测信号X是由多个信源S,经混合矩阵A组合而成(X=AS)。现在的任务是:
在S与A均未知的条件下,求取一个解混矩阵W,使得X通过它后所得输出Y(Y=WX)是S的最优逼近(见下页图1)。
独立分量分析有多种算法[5],如基于代数结构的AMUSE、SOBI、JADE,以及基于信息论的FastICA和Infomax。其中JADE的估计精度较高,使其成为了独立分量分析方法中的典型算法。该
图1 ICA的基本框图Fig.1 The basic diagram of ICA
(1)去均值。设X(t)=(x1(t),x2(t),…,xn(t))T,t=1、2、…、N为随机矢量X的N个样本,则采用以下方法去除样本的均值:
(2)白化。随机矢量X的白化,就是通过一定的线性变换T,令
其中 T称为白化矩阵。
其中 δij为Kronecker delta函数。
白化后的信号的分量之间二阶统计独立。
极大峰度法[1、2]的处理过程有二步,前一步使数据正交化,但未必独立;后一步则在保持熵值不变的前提下,使各分量尽可能独立。
(1)正交化。Givens旋转是Jacobi算法的基础,它是按照一定优化要求,通过一种迭代步骤对一个随机矢量进行正交归一变换的方法。通过反复进行一系列坐标平面旋转,来达到正交归一变换的目的。每一次的平面旋转,都只施加在一对坐标上。
令z为M×1矢量,对它的i、j分量,按式(3)作平面旋转,同时保持z中其它元素不变。
(2)极大峰度法。上述步骤中的关键问题,是计算Givens旋转角θij。作者在本文中以采用白化数据输入条件下的极大似然判据εML为例加以说明。根据ML判据,对正交变换后的输出y有:算法的主要特点是加强了算法的代数概念,即引入了多变量数据的四维累积量矩阵,并对其作特征分解,简化了算法,也提高了结果的稳健性。
其中 Kij、Kijkl分别表示二阶及四阶联合统计量;σ2、k4分别表示方差和峰度。
图2 JADE算法流程图Fig.2 JADE algorithm flow chart
经白化及正交变换后Kij(y)=δij,又根据原始假设δ2(si)=1,于是有:
在式(5)中,第二项与y无关。在白化输入下,第一项Kijkl(y)为常数,而第三项只有在i=j=k=l时有值,故式(5)可以写成式(6)。
式(6)中 =c表示与原式只相差一些与y无关的项(包括常数)。
式(6)即为极大峰度算法的表达式。
作者可以对JADE算法进行总结:
(1)化探数据的零均值化。
(2)稳健预白化方法得到W0,并令白化后的数据为Z=W0X。
(3)求出白化数据的四阶累计量。
(4)根据Givens找到一个旋转阵V,使累积量尽可能地对角化,使得判据εML最小。
(5)源信号估计,得到被恢复信号的估计:
算法流程图见图2。
由ICA的数学模型可知,在源信号S(t)未知,混合矩阵A未知的情况下,若要使求得的最优逼近信源的独立信号Y,只要求得解混矩阵W即可。因此,将多道观测信号X(t)作为输入值,经由去均值、白化的数据预处理后,以负极大峰度法作为优化判据,从而确定目标函数。Givens旋转是判据最小以求得解混矩阵W,最终得到相互独立的信号Y。
为解决寻求最优的成矿元素组合的问题,作者在本文中,应用JADE算法加以剖析:
将单元素地球化学数据视为多道观测信号,将影响元素组合的各种因素视为混合矩阵,在影响因素难以确定的前提下,从统计独立性的角度出发,将分离出各独立分量中能量最大的分量,视为最易致矿的元素组合。从而得到了一种非线性科学与高新信息处理技术相结合的地球化学数据处理新方法。
为验证模型的可靠性,作者选取西藏洞嘎金矿1∶10 000土壤地球化学测量资料作为实验数据,应用JADE算法得到成矿元素组合,最后采用分形理论,求得异常下限和异常浓集分带[11~13]。
应用JADE算法,可以得到能量最大的独立分量式(7)。由式(7)的系数可以看出,对独立分量Y的影响最大的元素是Zn和Au。所以我们可以判定Y是我们要寻求的成矿元素组合,而Zn和Au是最能影响元素组合异常分布的元素。根据异常图,我们可以对结论提供进一步的论证,见图3。
图3 某矿区元素异常对照图Fig.3 Element anomalies contrast diagram
对比单元素的等值线叠加图与JADE的元素组合异常图我们可以看出,JADE算法能够反映单元素叠加图中的密集区域。也就是说,JADE算法能够准确地反映成矿元素的空间分布。
从组合异常图与各单元素异常图的对比可以清楚地看出,元素组合异常清晰地反应了Zn和Au的异常形态,这与由公式(7)所得到结果是一致的。
通过应用实例研究,可以得到以下结论:
(1)JADE算法从元素亲和性、相关性,以及样品和变量的空间对应关系的角度出发,在分离过程中,通过对分离结果的非高斯性或相互独立性的度量来监视分离结果,力求定量地分离出能量最大的元素组合。即在一定区域范围内,按照地球化学元素的空间组配形态与机制来度量异常。从组合异常图来看,效果明显。
(2)从处理技术上看,依据独立性分解,势必涉及概率论密度函数或高阶统计量,并且在处理过程常常要引入非线性环节。而地球化学数据的空间分布特征也是非线性的[11],所以应用该技术来对地球化学数据进行处理是合理的、可行的。从这一意义上看,ICA技术优越于常用的,只建立在二阶统计量的线性处理技术。
(3)JADE算法能够更科学地去除元素组合之间的相关性,得到的元素组合比传统方法更具有说服力。从对比图来看,组合异常更能反映矿致异常的分布情况,为研究地球化学次生晕的产生和分布提供了新的有力支撑。
[1] 张发启.盲信号处理及应用[M].西安:西安电子科技大学出版社,2006.
[2] 杨福生,洪波.独立分量分析的原理与应用[M],北京:清华大学出版社,2006.
[3] 唐江波,曾庆宁,郭威.基于ICA的快速定点算法[J].桂林电子科技大学学报,2007,31(8):47.
[4] 胡增辉,炬波,梁甸农.基于盲源分离的近场源参数估计[J].信号处理,2010,26(6):951.
[5] 郭武,朱长仁,王润生.一种改进的FastICA算法及其应用[J].计算机应用.2008(4):960.
[6] 郭科,郭思.基于独立分量分析的地震信号多次波盲分离方法研究[J].地球物理学进展,2010,25(3):1075.
[7] 刘喜武,刘洪,李幼铭.独立分量分析及其在地震信息处理中应用初探[J].地球物理学进展.2003(3):90.
[8] CARDOSO J F.High-order for independent component analysis[J].Neural Computation.1999(1):157.
[9] POLETTO F,ROCCA F,BERTELLI L.Drill-bit signal sep-aration for RVSP using statistical independence[J].Geo-physics,2000(65):1645.
[10]郭科,陈聆,唐菊兴.复杂地质地貌区地球化学异常识别非线性研究[J].成都理工大学学报:自然科学版,2007,34(6):599.
[11]陈聆,魏友华,郭科.用含量面积法确定深切割地区地球化学异常[J].西南师范大学学报:自然科学版,2004,29(5):867.
[12]郭科,陈聆,唐菊兴,等.分形含量梯度法确定地球化学浓集中心的新探索[J].地学前缘,2007,14(5):285.