FastICA算法在土壤地球化学异常检测中的应用

2014-08-02 03:57魏友华詹泽东
金属矿山 2014年5期
关键词:原始数据矿化混合

刘 斌 郭 思 魏友华 詹泽东

(1.成都理工大学地球物理学院,四川 成都 610059;2.数学地质四川省重点实验室,四川 成都 610059)

FastICA算法在土壤地球化学异常检测中的应用

刘 斌1,2郭 思1,2魏友华1,2詹泽东1,2

(1.成都理工大学地球物理学院,四川 成都 610059;2.数学地质四川省重点实验室,四川 成都 610059)

将FastICA算法应用于青海省大柴旦镇某地区1∶10 000土壤地球化学数据处理中,借鉴相关系数来解决FastICA算法分离后顺序不确定性的局限,使用累积频率法解决分离后数据幅度不确定性问题,进而划分元素异常分带序列,选取85%、95%和98%作为异常分级。可以发现,相比直接用传统累积频率法圈定异常,FastICA算法充分考虑了数据的高阶统计特性,经过FastICA算法处理后的数据更能体现元素的空间分布特征。经后期工程验证,FastICA算法处理后的元素异常分布与实际的矿(化)体吻合度很高,能起到还原真实信息的目的,对指导下一步找矿具有现实意义,从而说明将FastICA算法应用于地球化学数据处理中是有效的。

FastICA 异常检查 累积频率 地球化学异常

地球化学数据作为矿产资源定量预测的重要信息源,关键就是从中提取矿产资源信息,圈定找矿范围,提供预测靶区[1]。由于地球化学的元素数据是经过采样和分析得来的,在这一过程中就会产生相应的干扰,为了抑制这种干扰,突出元素的空间分布特征,提取其中的异常信息显得尤为重要[2]。传统的数据分析方法(如均值方差法、累积频率法、直方图解法等)没有考虑数据的高阶统计特性[3],再加上地学信息的复杂性,异常提取效果并不是十分理想。为了进一步挖掘化探数据的深层次地学信息,很多学者研究了元素的空间分布特征和出露地质体的物理、化学性质[4]。同时,各种各样的定量地球化学方法得到快速发展,比如空间统计、分形、判别分析和模糊聚类[5-6]。这些方法都与元素浓度值频数分布相关,并且都建立在认为跟矿化有关的认知上,可能导致与矿化无关的假异常[7]。客观来说,化探数据处理方法应该只考虑数据基数[8],比如独立成分分析方法(ICA)是一种考虑了数据的高阶统计特性的方法,可以用来挖掘有用的隐含信息,为后续分析提供支持。在先期的研究中,独立分量分析(ICA)在地球化学中的应用尚处于起步阶段[9]。

1 算法原理

1.1 独立成分分析

独立成分分析(ICA)是一种满足统计独立假设下的从高阶统计相关角度来分析数据的技术[10]。通过对混合信号的“分解”来完成一组随机初始量对隐含在混合信号中独立源信号的逼近,而每个混合信号都是多个原始信号的线性组合,见图1。

图1 信号混合过程Fig.1 Signal mixing process

因此,独立分量分析的基本数学模型为

(1)

其中,x为混合信号,

s为源信号,

W为n×n阶非奇异混合矩阵,wj为混合矩阵的n维列向量。

由于公式中仅混合信号x是已知的,那么若要分离出源信号,就必须构建一个n×n阶的矩阵A,并使其对混合信号x满足

(2)

则y即为对源信号s的一个最优估计。

1.2 FastICA算法

FastICA算法原理可简述为:通过负熵最大化确

定目标函数和针对目标函数进行牛顿迭代求得最优值。为使负熵达到最大,获得最优的E[G(wTx)],根据Kuhn-Tuchker条件,在

时,最优值必须满足

(3)

其中,β为常量,且

w0是w的最优值;g是G的一阶导数。经过进一步简化迭代公式,

(4)

(5)

2 地质背景

研究区位于青海省,东距西宁市700 km,西距大柴旦镇35 km。地理坐标范围为东经95°47′51″~95°58′18″、北纬37°42′44″~37°45′14″。研究区1∶10 000土壤地球化学测量面积约6 km2。经过1∶10 000地质草测工作可知,研究区大面积出露的地层为志留系、二叠系及第四系,岩石类型有砾岩、蚀变砾岩、砂岩、石英片岩、蚀变石英片岩、长石石英砂岩、岩屑砂岩、长石石英砂岩、板岩、千枚岩,矿化包含硅化、褐铁矿化、黄铁矿化、孔雀石化、黄铜矿化。研究区主要包含Au矿化带和Cu矿化带,其中Au矿化带主要分布于二叠系地层中,Cu矿化带主要分布于志留系地层中。在研究区内发现的矿物有方铅矿、孔雀石和蓝铜矿等。

3 模型应用

以青海省大柴旦镇某地区1∶10 000土壤地球化学测量工作为基础,共布施了34条土壤化探剖面线,完成土壤地球化学测量6 km2,网度为100 m×20 m。采集土壤地球化学样品3 307个,Au、Cu、Pb、As、Sb、Zn的土壤地球化学数据的特征见表1。

表1 土壤地球化学测量元素地球化学特征参数Table 1 Parameters of soil geochemical characteristics

注:Au元素含量单位为10-9,其余元素含量单位为10-6。

首先对原始数据用Kolmogorov-Smirnov方法作正态分布检验,得出6种元素的渐近显著性结果都小于0.05,均不服从正态分布,所以FastICA算法可以应用于该数据。根据原始地球化学数据相互统计独立等特征和FastICA算法原理,分析得到的6种元素含量值即看作混合信号,应用FastICA算法对其进行处理,由于FastICA算法是对源信号的一种拷贝或估计,从分离结果来说,顺序和相位都发生了变化,借助相关系数矩阵,将分离出的6种元素与原始数据形成一一对应关系,其相关系数见表2。其中,y1、y2、y3、y4、y5、y6独立成分对应的元素分别为Pb、Sb、As、Au、Cu、Zn,分析结果既保持了数据的基本形态,又能从地球化学数据中提取有效元素信息。

表2 相关系数结果Table 2 The correlation coefficient

由于FastICA算法分离后数据的相位跟原始地球化学数据有所不同,是因为该算法只是对源数据的一个拷贝或估计,它体现的是数据整体趋势。在这里,通过累积频率来确定元素的分布特征,进而解决幅度不确定问题,选定分级频率85%、95%和98%作为圈定元素异常的外带、中带和内带。同样,对原始数据用累积频率来圈定异常等值线,其原始数据和分离后数据的三级累积频率值见表3,原始数据异常分带和FastICA算法分离后数据异常分带见图2~图7。

4 结 论

根据圈定的异常等值线开展探槽工作,对研究区范围内成矿元素Au和Cu 2种元素进行异常分析,结合圈定的土壤化探Au和Cu的异常分布图可以看出,2种方式圈定的Au和Cu异常等值线图区别较明显。在点(749 485,4 182 843)附近,Au元素原始数据有明显的异常显示,而经过FastICA处理过后的数据则没有,与实际情况相符;在点(748 941,4 181 961)和点(749 739,4 183 184)附近,Cu元素原始数据无明显的异常显示,而经过FastICA处理过后的数据则异常明显,与实际情况相符。从应用结果来看,直接对原始数据圈定的异常找矿指示意义并不明显,而经过FastICA算法处理过后圈定的异常跟真实情况更为接近,更能反映元素的空间分布特征,提高找矿的有效性。

表3 累积频率圈定的分带序列 Teble 3 Zoning sequences delineated by cumulative frequency

注:Au元素含量单位为10-9,其余元素含量单位为10-6。

图2 Au元素处理前后异常Fig.2 Anomalies of Au before and after processing

图3 Cu元素处理前后异常Fig.3 Anomalies of Cu before and after processing

图4 Pb元素处理前后异常Fig.4 Anomalies of Pb before and after processing

图5 As元素处理前后异常Fig.5 Anomalies of As before and after processing

图6 Zn元素处理前后异常Fig.6 Anomalies of Zn before and after processing

图7 Sb元素处理前后异常Fig.7 Anomalies of Sb before and after processing

[1] 王世称,陈永良.综合信息矿产资源预测理论与方法[M].北京:科学出版社,2002. Wang Shicheng,Chen Yongliang.Theory and Methods of Mineral Resources Prediction Based on Synthetic Information[M].Beijing:Science Press,2002.

[2] Cheng Q,Xu Y,Grunsky E.Integrated spatial and spectrum method for geochemical anomaly separation[J].Natural Resources Research,2000(9):43-52.

[3] Cheng Q M.Mapping singularities with stream sediment geochemical data for prediction of undiscovered mineral deposits in Gejiu,Yunnan province,China[J].Ore Geology Reviews,2007,32(12):314-324.

[4] Wang Wenlei,Zhao Jie,Cheng Qiuming.Analysis and integration of geo-information to identify granitic intrusions as exploration targets in southeastern Yunnan district,China[J].Computers & Geosciences,2011(37):1946-1957.

[5] Ghavami-Riabi R,Seyedrahimi-Niaraq M M,Khalokakaie R,et al.U-spatial statistic data modeled on a probability diagram for investigation of mineralization scalings and exploration of shear zone gold deposits[J].Journal of Geochemical Exploration,2010(104):27-33.

[6] Goncalves M A,Mateus A,Oliveria V.Geochemical anomaly separation by multifractal modeling[J].Journal of Geochemical Exploration,2001(72):91-114.

[7] Parisa R,Ahmad R M,Seyed H T.Objective based geochemical anomaly detection-application of discriminant function analysis in anomaly delineation in the Kuh Panj porphyry Cu mineralization (Iran)[J].Journal of Geochemical Exploration,2013(130):65-73.

[8] Lenca P,Meyer P,Vaillant B,Lallich S.On selecting interestingness measures for association rules:User oriented description and multiple criteria decision aid[J].European Journal of Operational Research,2008(184):610-626.

[9] 余先川,刘立文,胡 丹,等.基于稳健有序独立成分分析(ROICA)的矿产预测[J].吉林大学学报:地球科学版,2012,42(3):872-880. Yu Xianchuan,Liu Liwen,Hu Dan,et al.Robust ordinal independent component analysis(ROICA)applied to mineral resources prediction[J].Journal of Jilin University:Earth Science Edition,2012,42(3):872-880.

[10] 张建明,林亚平,吴宏斌,等.独立成分分析的研究进展[J].系统仿真学报,2006,18(4):992-1001. Zhang Jianming,Lin Yaping,Wu Hongbin,et al.Advances of research in independent component analysis[J].Journal of System Simulation,2006,18(4):992-1001.

(责任编辑 邓永前)

Application of the FastICA Algorithm in Detection of Soil Geochemical Anomaly

Liu Bin1,2Guo Si1,2Wei Youhua1,2Zhan Zedong1,2

(1.CollegeofGeophysics,ChengduUniversityofTechnology,Chengdu610059,China;2.GeomathematicsKeyLaboratoryofSichuanProvince,Chengdu610059,China)

The FastICA algorithm is applied to process the 1∶10 000 soil geochemical data in the area of Dachaidan town in Qinghai province.The correlation coefficients are introduced to overcome the limitation of sequential uncertainty after the separation of FastICA algorithm,and the cumulative frequency method is used to solve the problem of data amplitude uncertainly after separation.The elements anomaly zoning sequences are divided,among which 85%,95% and 98% are selected as the three levels of anomaly in classification.It is clear that the FastICA algorithm takes full consideration of the characteristics of high order statistics,so the data from the algorithm can more clearly reflect the spatial distribution characteristics of elements compared with delineating anomaly by the traditional cumulative frequency method.The late engineering validation confirmed that the elements anomaly distribution acquired by the FastICA algorithm highly matches with the actual ore body (mineralization).So,the FastICA algorithm has the function of restoring the real information and has the significance in guiding the next prospecting work.It is effective to process the geochemical data by applying the FastICA algorithm.

FastICA,Anomaly detection,Cumulative frequency,Geochemical anomaly

2014-01-23

国家自然科学基金项目(编号:41272363),青海省地质勘察基金项目(编号:QGTZXG2012-01),四川省教育厅科研项目(编号:13ZB0063)。

刘 斌(1987—),男,博士研究生。

P628

A

1001-1250(2014)-05-125-05

猜你喜欢
原始数据矿化混合
矿化剂对硅酸盐水泥煅烧的促进作用
混合宅
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
大麦虫对聚苯乙烯塑料的生物降解和矿化作用
受特定变化趋势限制的传感器数据处理方法研究
一起来学习“混合运算”
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
混合所有制
不同矿化方式下丝素蛋白电纺纤维的仿生矿化
仿生矿化法制备HA/SF/Ti复合材料的研究进展