吴雁晶,陈浩辉,姜俊狄,孔维华
(1.浙江水利水电学院 测绘与市政工程学院,浙江 杭州 310018;2.河海大学 地球科学与工程学院, 江苏 南京 211100)
环境的污染与企业的分布、规模和排污量有一定联系。目前很多学者对地理对象的空间分布特征及影响因素之间的关系开展了研究。高会旺等[1]运用聚类分析等空间分析方法,对各省市空气污染地区的分布特征进行分析,并将73个城市分成了6个类群;张庆等[2]利用空间聚类等方法研究了生产类服务业在杭州市的聚类情况,研究表明,生产类服务业聚集区所在的邻近地区的城市功能等级越高,聚集区的范围以及规模就越大;张乐勤等[3]利用空间自相关分析方法,研究了水资源生态压力空间的关系,提出水资源如何持续利用的政府决策建议;原康丽[4]利用回归分析方法,研究了2006—2007年甘肃省城镇居民的收入与支出的关系,研究得出如何提高居民自由支配收入的政府决策建议;李晨曦等[5]利用空间分析方法,得出兰州市工业企业空间分布呈“城密县疏”的特征。
本文通过GIS技术、空间聚类分析、空间自相关分析和回归分析方法得出工业企业空间分布与水污染的关系,研究成果可供浙江各地政府了解本地的工业分布对环境污染的影响,为环境治理提供科学有效的数据,为工业合理布局、水污染治理、水资源的保护等提供合理的参考依据。
浙江省共辖11个地级市,地跨东经118°01′—123°10′,北纬27°02′—31°11′。拥有钱塘江、瓯江、鳌江等八大水系。据浙江省统计年鉴,浙江省2018年生产总值达51 775亿元,相比上一年增长7.8%。其中,第二产业产值增加22 472亿元,同比增长7.0%,占总生产值的43.4%,工业较为发达。[6]
本文数据主要来源于浙江省生态环境厅以及11个地市级生态环境局,包括2018年浙江省重点排污工业企业信息、2018年第3季度的重点工业企业的废水排放量以及各地级市的水污染指数等统计数据。其中,2018年第3季度浙江省工业企业废水排放量涵盖1 061家重点排污企业,其中部分企业的排污量(见表1)。浙江省八大水系上中下游各段水系水质指标(Ⅰ—Ⅴ类)(见表2)。
表1 第3季度浙江省部分企业废水类污水排放量
表2 2018年浙江省八大水系各段水系水质指标
1.3.1 空间数据处理
利用ArcGIS软件导入浙江省地图,建立污染企业点状空间数据库,再将重点排污工业企业的具体位置展现到浙江省地图上(见图1),并在数据库属性表中添加相对应的企业名称、企业所在地经度以及第三季度的排污量的信息;将以上所有基础数据在ArcGIS软件中呈现后,利用ArcGIS软件自带的点密度分析功能、空间自相关性分析功能、热点分析功能进行空间分析;最后通过R语言程序,利用相应的代码进行EM聚类分析,得出浙江省工业企业分布的分类图和误差椭圆、二维密度图以及三维密度图,间接得出某个区域间的污染值分布图。
1.3.2 排污量与水污染的数据处理
导入浙江省水系数据,并将钱塘江、京杭运河、瓯江等八大水系的上中下游段水质指标(Ⅰ—Ⅴ类)添加至相对应的水系属性中。将以上所有基础数据在ArcGIS软件中呈现后,对水系数据在10 km的范围进行面缓冲区分析,得出京杭运河、钱塘江等水系上中下游段缓冲区内所有工业企业排污量总和,利用回归分析法,以京杭运河、钱塘江等水系上中下游段水质指标(Ⅰ—Ⅴ类)为Y轴,以缓冲区内所有工业企业排污量总和为X轴得出工业企业污染与水污染之间的关系图,并得出自变量和因变量之间的线性关系。
图1 浙江省污染企业点分布图
1.4.1 EM聚类算法(最大期望算法)
期望最大化EM聚类法是一种通过迭代运算来实现的分析法,在进行运算时每一次迭代由E步、M步组成,其中:M步找一个点θ(i+1),使Q(θ(i+1)|θ(i),Y)=maxQ(θ|θ(i),Y)形成了一次迭代θ(i)→θ(i+1),E步将logP(θ|Y,Z)或p(θ|Y,Z)后针对Z的条件分布求期望,从而把Z积掉,Ez[logp(θ|Y,Z)|θ(i),Y]=[p(θ|Y,Z)]ʃlogp(Z|θ(i),Y)dZ。最后将上述两次迭代进行运算直至||θ(i+1)-θ(i)||或||Qθ(i+1)|θ(i),Y-Q(θ(i)|θ(i),Y)||时停止。[7]
1.4.2 空间自相关分析法
空间自相关分析法用莫兰指数(Moran’sI)进行表示,是用于分析空间自相关的程度的一种分析方法,是Moran’sI大于0表示空间正相关性,其值越大,空间相关性越明显;值小于0表示空间负相关性,其值越小,空间差异越大,若Moran’sI=0,空间呈随机性。[8]
空间自相关的Moran’sI统计可表示为:
1.4.3 回归分析
回归分析是用于了解两个及多个元素之间是否具有关联性,以及元素之间的是否成正相关、负相关或零相关关系和R2值的方法。回归分析可分为两类:参数和因变量均有且仅有一个,进行回归分析后,可用直线(y=ax+b)大致表示,则这种分析称为线性回归分析法;另一种是多元线性回归分析,其用于分析两个或多个相互独立的自变量。
运用ArcGIS软件中的点密度分析功能可以获得点要素的密度,将每个栅格像元(本次分析采用单位为地图)中心(本次分析半径采用0.6)都向外划分一个邻域,再计算邻近区域内点数量的总和,最后将点数量总和除以邻域面积。图2是利用点密度分析工具,根据工业企业所在位置得出的点密度分析图,由图2可知,杭州市余杭区东部地区;萧山区东北部及北部地区、绍兴县东北部地区、嘉兴海宁市中部地区、桐乡市中部等地区为工业企业聚集区域以及企业排污严重地区。
图2 点密度分析结果图
图3是利用ArcGIS软件中的空间自相关工具,根据工业企业所在位置生成的空间自相关报表,其中Moran’sI指数为0.062 701,大于0,呈正相关,z得分为17.998 304,大于1.96,可以得出结论,工业企业根据其所在位置和排污量来看具有良好的聚类效果和相关性。
图3 工业企业空间自相关报表
通过分析浙江省工业企业空间数据库中排污量的属性原始数据和其在浙江省地图中的空间分布结构特征,对浙江省工业企业污染点进行线性无偏最优估计并得出分析结果。[10]根据浙江省工业企业的排污量进行克里金插值分析得出结果(见图4),由图5可知绍兴市北部地区、杭州萧山区、上虞区北部(红色区域)污染最严重。
图4 浙江省企业排污量克里金插值分析结果
空间热点分析(Getis-Ord Gi*)可以反映出浙江省工业企业在浙江省地图上的热点和冷点分布,污染值高值聚集区即“热点”(Hot),低值聚集区即“冷点”(Cold)[11]。分析结果如图5—6所示,可得出结论,杭州市萧山区北部、东北部地区、余杭区东部地区、绍兴市北部地区、上虞区北部地区、嘉兴桐乡市中部地区、海宁市中部地区等地区为高值聚集区且聚类较明显。说明在浙江省的工业企业分布特征以及企业排污情况中,杭州市南部、东南部地区(工业企业数量为77家、总排污量240 260.9 t/d)、绍兴市北部地区工业企业分布较密(工业企业数量为106家、总排污量328 903.4 t/d),并且污染较为严重。
利用ArcGIS软件几何计算功能提取浙江省工业企业的经纬度,并在Excel表格中导出数据,保存为“.csv”格式,运行R程序,输入相应的代码,得出浙江省工业企业浙分布的分类图和误差椭圆、二维密度图以及三维密度图,如图7—9所示。可知绍兴市北部地区,即绍兴县滨海工业区,企业数达100余家,是浙江省规模较大的开发区;杭州萧山区北部地区,即大江东产业聚集区,拥有70余家大型企业,上虞区北部为工业企业聚集地,据统计,该工业企业聚集地所在位置为杭州湾上虞工业园区,是省级开发区,拥有企业180余家,间接表明这些区域的污染量较高。
图5 浙江省企业污染热点分析结果
图6 热点分析中高值聚类区域
图7 分类图和误差椭圆
图8 二维密度图
图9 三维密度图
利用2018年京杭运河、钱塘江等水系上中下游段水质指标(Ⅰ—Ⅴ类)以及水系面缓冲区内所有工业企业排污量总和的数据进行回归分析,结果如图10所示,工业企业污染与水污染之间的线性关系为y=0.072x+1.814,其中R2值为0.453,说明二者是呈正相关关系。有两个点远远偏离了线性回归的趋势线,源于当地污水治理力度及效率的影响,这也是相关性降低的主要原因;同时说明工业企业污染与水污染之间大致呈现正相关的关系,与大部分地区情况一致,符合线性回归模型。
拟合的R2值为0.453,说明水质指标和所有工业企业排污量总和呈正相关关系,但是该拟合结果并未体现强相关性。因此进一步对工业企业密度与流域水质进行回归分析:以点密度分析结果中不同密度环内的工业企业排污量平均值以及相应密度环附近的流域水质质量进行回归分析(见图11),工业企业分布密度与流域水质间的线性关系为y= 0.000 6x+1.393 8,其中R2值为0.768 8,说明二者呈正相关关系,符合线性回归模型,说明随着工业企业分布密度的增大,相应流域水质质量会呈现下降的趋势。
图10 工业企业废水类污水排放量与水污染的线性关系图
图11 工业企业分布密度与流域水质的关系图
通过点密度分析、克里金空间插值分析、空间自相关分析、热点分析四种空间分析法,结合R语言EM聚类分析以及回归模型分析浙江省工业企业排污量与浙江省八大水系之间线性关系,研究得出浙江省工业企业分布有较强的空间聚类性和自相关性,呈现出高值聚集性,且聚类较明显的主要区域分布在绍兴市北部滨海工业地区、萧山大江东产业聚集区、杭州余杭区东部、上虞区北部杭州湾上虞工业园区、嘉兴桐乡市中部地区和海宁市中部地区等地区。工业企业污染与水污染之间大致呈现正相关的关系,且大部分地区的工业企业污染与水污染之间呈现线性关系,符合线性回归模型。