基于时序全局主成分分析—熵权法的地区水质健康评价

2023-05-30 11:15吕秀勤
环境科学导刊 2023年1期
关键词:熵权法

吕秀勤

摘 要:针对饮用水水源地水质健康评价研究方法中的不足,提出使用时序全局主成分分析与熵权法结合的新工具,构造水质生态健康综合指数。使用时序全局主成分分析,能将截面数据扩展到面板数据,保证评价体系的统一性、整体性与可比性。此外,将原始数据降维至互不相关的若干主成分再代入熵权法,可防止无效信息重复赋权。运用新工具对厦门市“一江两库”水质健康评价,结果表明:①新方法与营养状态指数法显著负相关,验证此方法结果准确有效。②坂头-石兜水库、九龙江和汀溪水库的年均水质生态健康综合指数分别为0.608、0.372和0.774,评级分别为好、较差和好。③从时间变化趋势来看,坂头-石兜水库呈现“V型”反转;九龙江季节变动更明显,总体呈现改善趋势;汀溪水库一直处于最佳,波动较小。

关键词:时序全局主成分分析;熵权法;水质健康评价;厦门饮用水源

中图分类号:X824文献标志码:A文章编号:1673-9655(2023)01-0-09

0 引言

随着社会经济的迅速发展,人民日益提高的生活水平与城市饮用水水质健康之间产生矛盾。饮用水水质健康情况易受到周边城市建设、土地利用加强和污染物排入等原因影响,产生水体富营养化等一列导致生态退化、破坏水质健康的问题。“山水林湖田草是一个生命共同体”,如何维持和恢复一个健康的生态系统已经成为生态学和环境管理的重要研究方向[1-3]。重视地区的水质健康,尤其是具有最高使用功能的饮用水源地水质的监测、分析与评价[4],对保障城市水质安全和提高人民群众的生活幸福感、获得感、安全感具有重要现实意义。

为了准确监测和分析饮用水源水质健康状况,选取合理的评价方法是水质评价能否客观的关键因素。目前运用于区域水质健康评价的方法主要有单因子判别法、综合营养状态指数法、物元分析法、层次分析法、模糊综合评价法、投影寻踪模型法、主成分分析法、熵权法等[5-11]。虽然评价方法很多,但存在两方面不足:一方面是环境监测部门对水质健康的评价偏向于简单的判断,运用较多的是单因子判别法和综合营养状态指数法等,未能充分利用水质因子数据的信息构造出定量指标,进行综合评价。另一方面是即使有学者们运用较科学的方法对水质健康进行判断,也可能存在两个问题:①方法模型过于复杂,适用性不强,现实操作有难度;②有些方法虽可操作性强,但定量精度有待进一步改善。因此本文提出将时序全局主成分分析(GPCA)与熵权法(EWM)相结合,通过对水质因子指标进行降维、综合和赋权,尝试建立一种操作简单、适用性广且能同时充分利用水质因子数据的评价方法。

1 研究方法

1. 1 相关研究方法存在的不足

回顾相关文献,大部分学者是单独使用主成分或熵权法对水质健康进行评价,也有少部分学者将二者结合[10-16]。归纳文献后,发现存在以下问题:①仅用主成分分析时,通常提取特征值>1或累计贡献率>85%的前k个主成分,以方差贡献率进行赋权。但按照方差贡献率赋权不能使权重归一[17],同时提取的第一主成分权重过大,挤压了其余主成分占比,赋权不够客观。②仅用主成分分析时,由于缺少定量得分标准,只能用于样本间的相对比较。③仅用熵权法时,若原始指标间存在相关关系,容易造成信息重叠问题[18]。重叠信息未处理,直接熵权法赋权,将造成无效信息的重复赋权问題。④虽然将主成分分析与熵权法结合使用后可以克服以上问题,但仍存改善的空间,本文的出发点正是基于此。以往学者使用的传统主成分分析是针对由样本和指标构成的截面数据,只能统一研究对象分年度进行主成分分析[12, 19]或统一年度分研究对象进行主成分分析[20-21]。但不同截面具有不同的“主超平面”,对每个截面数据表进行主成分分析,其实是无法对同一对象不同时间点或同一时间点不同对象进行对比。然而同一地区的面板数据一般是具有共同变化趋势的,如果能在统一的模型中进行评价,将使评价更客观、科学。GPCA的使用解决了该问题。GPCA在经济学领域已有较广泛运用[22-25],而运用于水质健康评价还鲜有涉及。GPCA在传统主成分分析的基础上,以一个综合变量取代原有全局变量,能用于多年、多样本、多指标的面板数据分析,保障了评价体系的统一性、整体性与可比性。

因此,将GPCA-EWM作为新的评价工具应用于地区的水质健康评价,存在以下优势:①GPCA一方面将数据运用扩展到面板数据,另一方面通过降维构建的互不相关主成分,解决EWM重复赋权问题。②EWM的运用解决了仅使用主成分分析时无法客观赋权与定量评级问题。

1. 4 时序全局主成分分析-熵权法(GPCA-EWM)

首先通过GPCA对原始数据进行降维,提取特征值>1或累计贡献率>85%的前k个主成分,并计算各主成分的得分;然后运用熵权法对前k个主成分得分进行客观赋权;最后将各主成分得分与熵权法计算得到权重先相乘后累加。为能更好表征水质的健康状况,对综合得分进行一个定量的评价。参考以往相关研究标准[19, 26-28],选取水质生态健康综合指数(EHCI)作为评价依据,并划分为表1中的五个等级。

以上各步骤,均可通过Stata软件完成。

2 研究区域

2. 1 研究区域概况

厦门市位于台湾海峡西侧,福建省东南部沿海;北邻泉州,南毗漳州,东南濒临东海,与台湾隔海相望;地理坐标北纬24°23′12.7″~24°54′29.3″,东经117°52′53.8″~118°26′1.2″;是淡水资源匮乏的海岛型城市,多年平均水资源总量12.47亿m3,人均水资源占有量仅有513 m3。其中水资源量最多的是同安区,占全市的55.42%;最少的是湖里区,占全市的2.87%,水资源分布严重不均。根据饮用水源地的定义:提供城镇居民生活及公共服务用水取水工程的水源地域,包括河流、湖泊、水库、地下水等。厦门市目前的水资源供应主要是“一江两库”:市域外的九龙江、同安的汀溪水库和集美的坂头-石兜水库。

2. 2 指标体系的选取

为客观准确地评价厦门市饮用水源水质健康状况,本文拟采用“一江两库”2017年1月—2019年12月,共计36个月的月度面板数据。参考相关文献,选取13项指标作为原始数据,描述性统计结果见表2。

3 结果与讨论

3. 1 变量相关性检验

GPCA是以变量相关性为基础的,因此使用前应先对原始数据进行检验。本文采用KMO和Bartlett检验,结果显示,“一江两库”的KMO检验值为0.836,远大于0.5,非常适合运用GPCA。同时Bartlett球型检验在1%水平下显著,进一步表明原始数据适合运用GPCA进行分析。

3. 2 水质生态系统健康评价的主成分确定

由表3可知,前三个主成分的特征值>1,其累计贡献率达到74.4%,因此取前3个主成分作为新的降维变量。即原始的13项指标变成由3个主成分所替代。

3. 3 初始因子载荷矩阵

初始因子载荷矩阵可以表征原始指标与主成分之间的关系。正值表示原始指标与该主成分间正相关,数值绝对值越趋近1,代表占比越大,则该原始指标可作为该主成分的主要控制变量。由表4可知,第一主成分(F1)在氨氮、总磷、总氮、氟化物、硫酸盐、硝酸盐、透明度和氯化物上具有较高载荷,贡献率达到42.9%;第二主成分(F2)在高锰酸盐指数、化学需氧量、五日生化需氧量和叶绿素a上具有较高载荷,贡献率为23.2%;第三主成分(F3)在溶解氧上有较高载荷,贡献率为8.3%。

结合表5相关关系系数。第一主成分中,氨氮、总磷、总氮和硝酸盐之间均显著正相关,该四个指标可表征富营养化指标;氟化物、氯化物和硫酸盐之间均显著正相关,该三个指标可表征无机阴离子污染物,其中氟化物又是典型毒理性指标;透明度与第一主成分中其他指标均显著负相关,因此单独代表感官指标。第二主成分中,高锰酸盐指数、化学需氧量和五日生化需氧量之间显著正相关,该三个指标可表征有机污染物;叶绿素a表征藻类数量,是“水华”的特征指标。第三主成分中,溶解氧是典型的维持生态平衡和生化分解的指标。综上,三个主成分表征含义汇总表6。

3. 4 GPCA-EWM综合得分与水质健康评价

将上述得到三个主成分值作为新变量,代入熵权法中重新确认权重。进一步计算得到EHCI图(图1)。综合指数值越大,代表水质越健康。结合表1,可知“一江两库”各时期的水质健康评级(表7)。经统计,坂头-石兜水库、九龙江和汀溪水库的年均EHCI分别为0.608、0.372和0.774,总体评级分别为好、较差和好。分年份统计,同时结合图1可知,2017—2019年坂头-石兜水库EHCI均值为0.643、0.593和0.587,总体呈现下降趋势;近三年九龙江水库EHCI均值为0.384、0.339和0.392,呈现波动趋势,但2019有相对改善,尤其是4—9月相对前两年同期有明显改善。近三年汀溪水库EHCI均值为0.793、0.754和0.775,呈现波动趋势,但水质健康均较优。

为更进一步探究水质健康变化情况,统计各年中水质健康评级占比(表8)。近三年坂头-石兜水库水质总体处于Ⅱ类和Ⅲ类,但是Ⅱ类比例从66.7%下降为33.3%,Ⅲ类比例从33.3%上升至58.3%。从时间趋势上看,呈现“V型”反转。坂头-石兜水库主要面临农业面源污染和生活面源污染。其中农业面源问题来源于库区周围大面积的果林种植。果林种植户在科学用药、合理施肥上认知不足,造成残留农药和化肥进入库区;生活面源污染主要是周边居民和农家乐影响,生活污水未经处理便排入库区,造成库区污染。鉴于坂头-石兜水库水质的恶化,2018年5月,厦门市集美区人民政府印发《关于饮用水源地保护区环境专项整治工作的纪要》,开始着手治理坂头-石兜水库。因此2018年7月起,从图1可以看出,水质健康综合指数开始缓慢提升,至2019年底,坂头-石兜水库水质健康状况重回Ⅱ类评级,治理取得成效。

九龙江近三年总体处于Ⅲ类和Ⅳ类评级,其中2018年5月出现一次Ⅴ类。从占比角度看,Ⅲ类水质占比先从50.0%下降为25.0%再上升为33.3%,而Ⅳ类水质占比从50.0%上升为66.7%,Ⅴ类水只在2018年出现一次,占比8.3%。水体健康指数呈现先恶化再改善的趋势。结合图1,可以发现,九龙江2017年初期水质变化总体波动很小,但2017年7月—2018年7月,水质有一段时间的严重恶化,尤其是2018年5月恶化最严重,而在2018年7月后,Ⅲ类水质占比再次提升,水质健康总体呈现上升趋势,其中2019年4—9月有明显改善。九龙江水源相对库区水源,季节变化更明显,主要是由于两个原因导致:一方面由于库区水体流动不如九龙江,存量易受人工调节,因此相对封闭的生态系统内更易造成库区水质指标均值化,季节变化不明显。另一方面龙岩、漳州的城市雨水管网系统收集雨水后汇入九龙江,因此九龙江受到降雨因素影响更大。

汀溪水库在样本期均是厦门三个饮用水源区水质健康状况最好的,水质健康处于Ⅰ类和Ⅱ类。从占比角度看,汀溪水库Ⅰ类水质占比从41.7%先下降为16.7%再上升为33.3%,Ⅱ类水质占比从58.3%上升为83.3%再下降为66.7%,水质健康呈现先下降再上升的趋势。结合图1,可以发现汀溪水库水质健康波动其实很小,EHCI指数最大值为0.87,最小值为0.68,总体在0.8左右波動,即使是最小值,水质健康评级仍为“好”。汀溪水库的高质量水质主要在2017年前,水库的各项整治工作已有序开展。主要有以下措施:水库上游全面实施牲畜禁养,尤其是生猪禁养;清退或整改水产养殖,最大限度减少养殖污染;搬迁或清退库区周边全部工业企业,拒绝工业污染入库;库区实施封闭式管理,关停库区内多家农家乐,禁止无关人员进入库区;全面排查库区周边村庄生活污水排放口,建设农村生活集中式污水设施统一收集处理。

3. 5 方法对比与评价

列出三种方法赋权的对比(表9)与GPCA综合得分图(图2)。可以发现,仅使用GPCA,提取特征值>1的前3个主成分,赋权和为74.4%,权重无法归一。从GPCA综合得分图看,只能初步判定汀溪水库水质健康程度最高,坂头-石兜水库次之,九龙江健康程度最低,由于缺少相对标准,无法对水质作出评级;仅使用EWM法,根据表5结果,可知各主成分的构成指标间存在的相关关系,信息存在重叠。若重叠信息未处理,直接熵权法赋权,将造成无效信息的重复赋权问题;而使用GPCA-EWM,相比于EWM,F1权重下降7.74%,F2权重下降3.22%,F3权重提升10.96%,F3权重的提升来源于F1和F2中被重复赋权的权重重新分配,相当于提升了生态平衡指标的权重。

进一步检验GPCA-EWM的可靠性,参照中国环境监测总站发布的《湖泊(水库)富营养化评价方法及分级技术规定》,采用综合营养状态指数法对坂头-石兜水库和汀溪水库进行评价,将所得结果与GPCA-EWM得到的EHCI作线性回归(图3)。可以发现二者是呈现显著负相关(均在1%水平上显著),即综合营养状态指数越大,则EHCI越小,水质越不健康。这说明运用GPCA-EWM评价地区水质健康是科学的。

综上,GPCA-EWM作为一种操作简单、适用性广且能同时能充分利用地区水质因子数据的评价工具是具有科学性与客观性。

4 结论

4. 1 GPCA-EWM对水质健康评价

在现有城市饮用水源地水质健康的评价方法中,传统主成分分析存在按方差贡献率赋权不能使权重歸一、缺少定量评级标准、只能针对截面数据进行分析等问题;运用熵权法对水质健康的评价,存在无效信息重复赋权等问题。两种方法都会造成对水质健康评价失真。GPCA-EWM的引入,一方面将截面数据分析扩展到面板数据分析,保证了评价体系的统一性、整体性与可比性,另一方面通过GPCA降维,构建互不相关的主成分,减少信息重叠问题,降维后的主成分运用EWM的赋权,有效防止无效信息重复赋权,使得对饮用水源地水质的健康评价更客观与科学。在实例中可以发现:①单独使用GPCA赋权,权重之和为74.4%,不能归一。同时从GPCA综合得分图,只能初步判断水质优劣,无法进一步定量评级。② GPCA-EWM相比于熵权法,主成分F1权重下降7.74%,主成分F2权重下降3.22%,主成分F3权重提升10.96%,这是主成分F1和F2中由于存在相关关系而被重复赋权的权重重新赋权到主成分F3上。

GPCA-EWM在将数据扩展到面板数据,同时解决重复赋权问题的基础上,还需保证评价结果的准确性。本文进一步运用综合营养状态指数法对坂头-石兜水库和汀溪水库进行评价,并与EHCI作线性回归。结果发现二者在1%显著水平下呈现负相关,即综合营养状态指数越大,EHCI越小,水质越不健康,这进一步说明新方法的可信性。

4. 2 厦门市地区饮用水源水质健康评价

在实例中,对厦门市水资源供应的“一江两库”水质健康进行分析。结果发现经过GPCA后原始的13项指标变成由3个分别表征不同含义的主成分替代。再运用熵权法后,发现坂头-石兜水库、九龙江和汀溪水库的年均EHCI分别为0.608、0.372和0.774,总体评级分别为好、较差和好。从健康评级占比变化与EHCI变化图看,坂头-石兜水库呈现“V型”反转,样本初期先恶化,2018年5月开始整治后,ECHI缓慢回升。九龙江相对库区受季节变化影响更大,水体健康指数呈现更明显季节性波动,但近年总体为改善趋势。汀溪水库得益于库区周边的各项整治工作较早开展,因此水质健康总体处于Ⅰ类和Ⅱ类,且波动很小。

参考文献:

[1] Karr J R. Biological integrity: a long‐neglected aspect of water resource management [J]. Ecological applications, 1991, 1(1): 66-84.

[2] Norris R H, Hawkins C P. Monitoring river health [J]. Hydrobiologia, 2000, 435(1-3): 5-17.

[3] Rapport D J. Myths in the foundations of economics and ecology [J]. Biological Journal of the Linnean Society, 1991, 44(3): 185-202.

[4] 段顺琼,王静,彭云,等.城市饮用水源水质变化趋势及突变研究——以昆明市松华坝水库为例[J].中国农村水利水电,2013(11):143-146,150.

[5] 李婧,唐敏,梁亦欣.2015—2018年河南省辖海河流域水质改善效果评价 [J].环境工程,2020,38(5):60-64,190.

[6] 汪琪,黄蔚,陈开宁,等.大溪水库浮游植物群落结构特征及营养状态评价[J].环境科学学报,2020,40(4):1286-1297.

[7] 彭福利,张永勇,李茜,等.官厅水库入库断面水质多指标评价与演变特征分析 [J].中国环境监测,2020,36(1):65-74.

[8] 赵嫣然,刘艳秋,黄木柯,等.港珠澳大桥周围海洋水环境监测站选点的优化研究[J].环境工程,2018,36(7):149-154.

[9] 于嘉骥,张慧妍,王小艺,等.基于改进的投影寻踪-云模型的农业灌溉水质综合评价[J].水资源保护,2017,33(6):142-146.

[10] 杜展鹏,王明净,严长安,等.基于绝对主成分-多元线性回归的滇池污染源解析[J].环境科学学报,2020,40(3):1130-1137.

[11] 宋景辉,刘汉湖,付博,等.基于熵权法的富营养化二级模糊综合评价模型—以江苏九里湖国家湿地公园为例[J/OL].环境工程:1-13[2020-06-21] http://kns.cnki.net/kcms/detail/11.2097.X.20200612.1616.006.html.

[12] 周及,关卫省,付林涛.基于多元统计的西安市河流水质评价及污染源解析[J].水资源保护,2020,36(2):79-84,104.

[13] 杨芳,杨盼,卢路,等.基于主成分分析法的洞庭湖水质评价[J].人民长江,2019,50(S2):42-45,58.

[14] 胡漾,唐金平,陈友良,等.基于PCA与熵权的贝叶斯地下水环境质量评价模型[J].节水灌溉,2018(12):60-64.

[15] 苏子龙,袁国华,郝庆,等.基于熵权法的海洋生态环境承载力评价——以廣西近岸海域为例[J].中国国土资源经济,2018,31(2):13-18.

[16] 马乐宽,谢阳村,温勖,等.基于主成分分析法的现有水质评价体系改进探讨[J].环境污染与防治,2016,38(6):101-104.

[17] 崔庆飞.基于主成分和熵权的房地产投资环境评价[J].河北工程大学学报(自然科学版),2014,31(4):105-108.

[18] 陶菊春,吴建民.综合加权评分法的综合权重确定新探[J].系统工程理论与实践,2001(8):43-48.

[19] 谢飞,顾继光,林彰文.基于主成分分析和熵权的水库生态系统健康评价——以海南省万宁水库为例[J].应用生态学报,2014,25(6):1773-1779.

[20] 蔡广强,张金松,刘彤宙,等.基于主成分分析的中国南方某市水库水质评价[J].环境科学与技术,2018,41(S2):88-94.

[21] 王晴晴,陈星,常进.主成分分析法与熵值法结合在水质评价中的应用[J].人民长江,2015,46(8):10-13,18.

[22] 金芳,苏倩,梁益琳.山东省制造业细分产业竞争力分析——基于新旧动能转换视角[J].经济与管理评论,2020,36(3):152-164.

[23] 陈莹,吴秀兰.土地集约利用与生态效率的耦合协调发展研究[J].长江流域资源与环境,2019,28(5):1025-1035.

[24] 周丽.基于时序全局主成分分析的西部农村生态经济研究[J].中国农业资源与区划,2017,38(12):192-196,234.

[25] 朱鹤,刘家明.中国东部地区旅游业竞争力研究——基于时序全局主成分分析法[J].地域研究与开发,2015,34(5):100-104.

[26] 余波,黄成敏,陈林,等.基于熵权的巢湖水生态健康模糊综合评价[J].四川环境,2010,29(6):85-91.

[27] 刘丽萍,赵世民,张宇,等.滇池水环境质量综合评价方法[J].中国环境监测,2019,35(4):100-108.

[28] 项颂,庞燕,侯泽英,等.基于熵值法的云南高原浅水湖泊水生态健康评价[J/OL].环境科学研究:1-15[2020-06-21].https://doi.org/10.13198/j.issn.1001-6929.2020.05.31.

猜你喜欢
熵权法
高职机电专业学生数学能力的调查及对策
大学周边健身房满意度调查报告
基于熵权法的京津冀区域信息化协调发展规律模型及其应用
基于熵权法的“互联网+”农业发展影响因素权重确定
基于熵权法的西安市外向型经济发展综合评价研究
城市与区域经济可持续发展
兰州市城关区银行顾客满意度调查研究
福建省高新技术产业竞争力评价研究
“互联网+”时代的出租车资源配置研究
基于熵权TOPSIS模型的出版企业核心竞争力评价