王 臻
(福建省海洋环境与渔业资源监测中心 福州 350003)
基于主成分-聚类分析法的沙埕港海域水质状况评价*
王 臻
(福建省海洋环境与渔业资源监测中心 福州 350003)
通过对2012年沙埕港海域水质调查数据的主成分分析,并利用聚类法,对12个调查站位进行分类。根据分析结果对水质状况进行评价。结果显示沙埕港水质污染情况总体是从湾中部往湾顶和湾口逐渐加重。中部区域主要污染因子为无机污染物,湾顶和湾口的主要污染因子为油类和重金属。主成分-聚类分析较为客观地反映了实际情况,可较好地应用于海洋环境评价。
主成分分析;聚类分析;沙埕港;水质;评价
沙埕港位于福建北部的福鼎市,与浙江苍南县接壤,是福建省重要渔港之一。港道弯曲狭长,深入内陆,水深无礁,久不淤积,不起风浪,航道稳定,是我国东南沿海的天然良港。沙埕港周边无大河汇入,流入湾内的河流有水北溪、照兰溪、大岳溪、百步溪及店下溪等11条,其中9条流入湾顶,2条汇注港湾中下段,均属山溪性河流[1]。2009年福鼎市政府以沙埕港为中心,实施渔业兴市和加大对台贸易,投资上亿元用于港口建设。由于深度开发而造成的沙埕港海域水质污染状况日趋严重。本文利用主成分-聚类分析法对沙埕港海域水质污染状况进行评价,客观反映水质实际污染情况,对行政主管部门优化海洋产业结构,创建海洋生态文明提供科学依据。
1.1 样品采集和调查方法
2012年在沙埕港海域布设调查站位12个(图1),分别于1月、5月、8月、10月对其表层海水水质进行采样调查。样品采集方法按照GB 17378.3-2007《海洋监测规范第3部分样品采集、储存和运输》[2]执行,样品测定方法依据GB 17378.4-2007《海洋监测规范第4部分:海水分析》[3]执行。调查及评价指标为p H、悬浮物、溶解氧、化学耗氧量、活性磷酸盐、亚硝酸盐-氮、硝酸盐-氮、氨-氮、石油类、铜、铅、镉,总汞、砷。
图1 调查站位图
1.2 主成分—聚类分析法
主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。其分析步骤为:① 原始数据标准化处理;② 计算各因子相关关系矩阵;③ 求解矩阵特征根和特征向量;④ 选择主成分,写出主成分表达式;⑤ 计算主成分得分;⑥ 依据得分数据,用回归方法得出评价结果;⑦ 对评价结果进行聚类分析。
2.1 调查结果
调查结果描述统计分析见表1。
表1 调查结果描述统计分析 mg/L
2.2 主成分-聚类分析
本文利用spss13.0软件对调查数据进行运算和分析,将数据进行标准化后计算相关系数矩阵,结果见表2。
表2 各指标相关系数矩阵
由表2看出,原始数据中COD和p H之间,悬浮物和溶解氧、化学需氧量等指标之间都存在很强的相关性,因此,该组数据满足降维的条件。对数据进行主成分分析,对数据矩阵求解特征值,结果见表3。
表3 各成分特征值
续表
由表3看出,前3个主成分的特征值均大于1,且累计贡献率达到83.362%(大于80%),因此,用前3个主成分的信息损失率为16.638%,基本可以反映原始数据的信息。
由表4可知,第一主成分中,p H、SS、COD、DIP、DIN、DO、As载荷较高,可以认为该主成分代表了影响水质的无机因子。第二主成分中,Cu、Pb、Cd、Hg荷载较高,可以认为该成分代表了影响水质的重金属因子。第三主成分Oils荷载较高,因此该成分代表了以油类为主的有机因子。
表4 因子载荷矩阵
计算出各因子在前3个成分上的得分系数,并通过回归分析,得出各调查站位在前3个主成分上的得分及调查站位综合得分,见表5和表6。
表5 因子得分系数矩阵
表6 各调查站点在主成分中的得分
由表6的综合评价得分可以看出,沙埕港水质SC04最好,而SC11最差。本文在参考了多篇相关研究报告[4-9],并根据实际情况选择Q型聚类方式,小类与小类间亲疏程度的度量使用组间平均连锁法,测量间距为欧几里得距离平方和,根据表6中各调查站点在主成分中的得分,按照站点距离进行聚类,画出聚类谱系图(图2)。
图2 聚类谱系图
由图2可以看出全部站点按照样本距离远近被分为若干个相似的小类,最后聚为一类。若选用某个固定距离作为阈值,则可将各站位按照需要分为几个大类。沙埕港水体污染特征比较复杂,为了更好地体现各区域污染情况的共性特征,本文以距离24作为阈值 (图2中虚线表示),将各调查站点分为三大类。由此可以看出,第一大类包含站位SC03~SC010,这类站位主要位于沙埕港中部,主航道附近,主要污染因子是无机污染物。第二大类包含站位SC11、SC12站位,这类站位位于湾口区域,主要污染因子是重金属。第三大类包含站位SC01、SC02,位于湾顶区域,主要污染因子为油类和重金属。
(1)沙埕港水质污染情况总体是从湾中部往湾顶和湾口逐渐加重,腰屿、青屿和牛屿之间海域水质最好,沙埕镇和霞关镇之间海域水质最差。沙埕港中部区域主要污染因子为无机污染物,湾顶和湾口的主要污染因子为油类和重金属。
(2)主成分-聚类分析方法选取了特征值较大的几个主成分对调查站点进行分类,客观地反映了沙埕港水质的污染状况,具有不受个别评价因子和人的主观分类影响等优点,是进行海洋环境评价的良好方法。
[1] 刘苍字,郭成涛.福建沙埕港的沉积特征与泥沙来源研究[J].地理学报,1992,47(4):344-352.
[2] 中华人民共和国国家质量监督检验检疫总局.GB 17378.3-2007海洋监测规范第3部分样品采集、贮存和运输[S].北京:中国标准出版社,2007.
[3] 中华人民共和国国家质量监督检验检疫总局.GB 17378.5-2007海洋监测规范第5部分:沉积物分析[S].北京:中国标准出版社,2007.
[4] 林小苹,黄长江,林福荣,等.海水富营养化评价的主成分-聚类分析方法[J].数学的实践与认识, 2004,34(12):69-74.
[5] 张妍,尚金城,于相毅.主成分-聚类复合模型在水环境管理中的应用:以松花江吉林段为例[J].水科学进展,2005,16(4):592-595.
[6] 谢贤健,兰代萍.基于因子分析法的沱江流域地表水水质的综合评价[J].安徽农业科学,2009,37 (3):1304-1306.
[7] 卢敦,张丽.聚类分析与因子分析在天津港富营养化分析中的应用[J].数学的实践和认识,2010,40 (11):72-79.
[8] 吕晋,邬红娟,林济东.主成分及聚类分析在水生态系统区划中的应用[J].武汉大学学报:理学版, 2005,51(4):461-466.
[9] 陈斯婷,耿安朝.海洋环境影响评价技术研究初探[J].海洋开发与管理,2011,28(9):84-89.
福建省海洋与渔业厅主要海湾环境监测专项(闽海渔2012166号).