基于决策树技术的土壤重金属污染预警分析研究

2014-10-17 20:30焦梦姝张麒彭佳红
电脑知识与技术 2014年26期
关键词:重金属污染决策树数据挖掘

焦梦姝 张麒 彭佳红

摘要:土壤重金属污染的日益恶化对我国生态环境、食品安全等构成严重的威胁,土壤重金属预警的研究是一个重要的内容。采用决策树技术中的C4.5算法对山东省新泰市土壤中Cu、Zn、Pb、Cd、Cr、Ni、As、Hg等8种重金属的污染情况进行数据挖掘,得到并分析决策树和产生式规则,从而对土壤重金属污染进行预警,能够辅助防止土壤质量的退化、生态环境的污染以及食品安全的危害。

关键词:决策树;重金属污染;数据挖掘

中图分类号:TP301 文献标识码:A 文章编号:1009-3044(2014)26-6210-04

随着经济的发展,我国土壤污染日趋严重。据估计,我国受农药、重金属等污染的土壤面积达上千万公顷,已对我国生态环境质量、食品安全和社会经济持续发展构成严重威胁[1]。我国大多数城市近郊土壤都受到了不同程度的污染,其中镉的污染比较普遍,污染面积近一千万公顷,其次是铅、锌、铜、汞等[2-5]。土壤一旦遭受重金属的污染,由于其具有不可逆性和长期性,不易在生物物质循环中分解,所以很难恢复,并且通过食物链最终将影响人类的健康。

数据挖掘是近几年国内外迅速发展起来的一门交叉学科,涉及到数据库、统计学、人工智能与机器学习等多个领域[6]。将数据挖掘技术应用于土壤重金属污染的预警分析无疑是非常有益的,它能全面分析各种土壤重金属之间隐藏的内在联系。决策树技术就是数据挖掘分类方法中的一种,其具有易理解、需要信息量少,效率及准确率均较高等特点,是目前最为广泛应用的分类方法之一。采用决策树算法中的C4.5算法对新泰市的8个乡镇的数据进行数据挖掘,以分析山东省新泰市土壤中Cu、Zn、Pb、Cd、Cr、Ni、As、Hg等8种土壤重金属的污染情况及其联系。

1 材料与方法

1.1 数据来源

数据来源于基于决策树算法的考试成绩分析系统的研究与开发[7],并对其中的单项污染指数借助表2中的土壤评价指标通过公式[Pi=CiS]还原为实测浓度,部分数据如表2。

2 结果与分析

由表1与表2对比得出:Hg、As、Cu、Pb、Cr的土壤重金属实测浓度全都小于其相应背景值,西张庄镇太平庄村土壤中Ni的含量大于其土壤元素背景值23 mg·kg-1,但低于土壤环境质量一级标准,因此Hg、As、Cu、Pb、Cr、Ni等重金属并无超标。Zn的含量有6个乡镇大于其土壤元素背景值61.9 mg·kg-1,分别是宫里镇夏家隅村、宫里镇上宫隅村、羊流镇洋流村、宫里镇杨家隅村、翟镇小港村、楼德镇西柴城村,其中宫里镇和羊流镇超过土壤环境质量一级标准,宫里镇的污染情况最为严重。大部分乡镇土壤中Cd的含量超过其土壤背景值0.079 mg·kg-1,其中西张庄镇西韩庄村、西张庄镇后高佐村、西张庄镇东韩庄村、羊流镇洋流村、翟镇高家店村等5个乡镇超过土壤环境质量一级标准,宫里镇夏家隅村超过土壤环境质量二级标准,达到污染水平。

将置信度为100%的规则与GB15618-1995《土壤环境质量标准》和表1结合观察,得到如下结论:

3 总结

土壤是人类赖以生存和发展的最根本的物质基础。土壤重金属污染对人类健康和社会发展都存在一定威胁,因此防止土壤环境污染,维持土壤环境的质量,促进土壤资源的可持续利用具有重要意义。通过对新泰市的土壤重金属污染数据使用C4.5决策树算法进行分类处理,得到决策树和规则,并对决策树进行分析,发现土壤中Cu、Zn、Pb、Cd、Cr、Ni、As、Hg等8种重金属之间的关联,从而能够借助这种关联对地区土壤重金属污染进行预警,提前采取防治措施。

参考文献:

[1] 赵新双.土壤污染现状及防治措施[J].现代农业科技,2009(12):37-39.

[2] 杨苏才,南忠仁,曾静静.土壤重金属污染现状与治理途径研究进展[J].安徽农业科学,2006,34(3):549-552.

[3] 陈秀玲,张文开,李明辉,等.中国土壤重金属污染研究简述[J].云南地理环境研究,2009,21(6):8-13.

[4] 崔德杰,张玉龙.土壤重金属污染现状与修复技术研究进展[J].土壤通报,2004,35(3):366-370.

[5] 史贵涛,陈振楼,李海雯,等.城市土壤重金属污染研究现状与趋势[J].环境监测管理与技术,2006,12(8):9-12.

[6] 李梦红.农田土壤重金属污染状况与评价[D]. 泰安:山东农业大学,2009.

[7] 黄爱辉.基于决策树算法的考试成绩分析系统的研究与开发[D].长沙:湖南大学,2008.

[8] 罗凤娥.基于Web的农业数据挖掘平台技术研究[D].长沙:湖南农业大学农业,2010.

[9] 徐路.基于决策树的数据挖掘算法的研究及其在实际中的应用[D].成都:电子科技大学,2009.

猜你喜欢
重金属污染决策树数据挖掘
探讨人工智能与数据挖掘发展趋势
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于并行计算的大数据挖掘在电网中的应用
重金属土壤污染的植物修复技术研究进展
十堰市畜禽养殖场周边土壤重金属污染评价
会泽县者海区域重金属污染调查与防治探索
农田土壤重金属污染现状及生物修复防治对策
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用