陈禹璇
摘 要:本文以云南省16个州市政府所在地的空气质量为研究对象,采用聚类分析法,运用R软件进行系统聚类和K均值聚类,将16个城市依据相关指标分为4类,针对每一类城市的特点,有针对性地提出改善空气质量,推进生态文明建设的建议。
关键词:空气质量;聚类分析;云南省
中图分类号:F2 文献标识码:A doi:10.19311/j.cnki.16723198.2023.20.009
0 引言
云南省是中国通往南亚、东南亚的门户和窗口,自然生态环境和区位优势极其优越。云南是全国植物种类最多的省份,森林面积居全国第3位,森林覆盖率为65.04%,被誉为“植物王国”;同时云南素有“动物王国”之称,动物种类数居全国之冠,脊椎动物达2273种,占全国的51.4%。其中,鸟类793种,占63.7%;兽类300种,占51.1%;鱼类366种,占45.7%;生态环保力度空前,九大高原湖泊水质稳步向好,近5年来云南省各州市政府所在地城市空气质量优良天数比率稳定在98%以上,良好的生态环境已经成为云南最大的亮点和特色,COP15在云南成功举办,亚洲象北上南归,使云南的国际影响力和美誉度大幅提升。城镇化率随着云南省经济社会的发展而不断提升,截至2022年底,云南省的常住人口城镇化率为53%,比2012年的38.47%提高了14.53个百分点;城市空气质量随着大量人口向城市聚集,成了社会关注的热点,保持优良的空气质量成为云南省各主要城市的高质量发展的重要基础。本文以云南主要城市10年来的空气质量为样本,16组样本数据通过聚类分析的方法将被分为4类,之后则提出各类城市继续保持优良空气质量,促进经济社会發展的建议。
1 云南省主要城市空气质量的聚类分析
1.1 研究方法
本文运用的聚类分析方法核心是将样品或变量按照自身特性进行合理分类,该方法经常应用在经济、管理、气象预报等多个领域。不同于传统的分类方法,聚类分析采用定性与定量相结合的方式科学合理地对样品或变量进行分类。本文主要采用系统聚类和K均值聚类法对16组样本数据进行分类即Q型聚类即对样品进行聚类。根据样本进行的Q型聚类,是根据各个样本之间的距离来衡量的,每组数据可看作Rp(p维空间)的一个点,n组样本数据就是Rp中的n个点,需要利用欧式距离来度量这n个点之间的距离即靠近程度。
设X=(X1,X2,…,Xp)T和Y=(Y1,Y2,…,Yp)T是p维向量,可将其视为p维空间中的两点,测量点X与Y之间的欧式距离公式为:
d(x,y)=[(∑pi=1(xi-yi)2)]12
1.2 数据说明
本文采用的数据来源于2013-2022年《云南省统计年鉴》,统计范围是云南省各州、市所在地监测城市,统计数据包含年份、可吸入颗粒物(PM10)、细颗粒物(PM2.5)、二氧化硫(SO2)、二氧化氮(NO2)和空气质量达到及好于二级的天数。数据时间跨度为2012-2021年。
基于上述数据,同时云南省空气质量普遍优于全国大部分省市,而且细颗粒物(PM2.5)的年平均浓度基本小于35(μg/m3),因此选取云南各主要城市2012-2021年空气质量的四个指标:可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)和空气质量达到及好于二级的天数,各个指标的含义如下:
可吸入颗粒物(PM10):可吸入颗粒物指空气动力学当量直径≤10微米的颗粒物。
二氧化硫(SO2):大气主要污染物之一,在许多工业生产过程中会产生此类污染物,特别说明当二氧化硫溶于水会形成会形成亚硫酸(酸雨的主要成分)。
二氧化氮(NO2):是在人类活动中产生的类物质,在臭氧的形成过程中起着重要作用,比如机动车尾气、锅炉废气的排放等。
空气质量达到及好于二级的天数:空气污染指数(API)处于51~100,达到国家空气质量日均值二级标准,空气质量良好,符合城市空气质量的要求。
根据统计数据,分别计算2012-2021年可吸入颗粒物、二氧化硫、二氧化氮、三个指标的平均浓度和年平均空气质量达到及好于二级的天数,得到新的数据表,见表1。
1.3 系统聚类分析
采用R软件对16个主要城市进行系统聚类,此方法适用于样本容量较小的情况,可主观地判断出应当将样本分为几类。首先采用类平均法做系统聚类,此方法优势在于较好地利用了所有的样品信息。当取合并距离为16时,则16个主要城市可分为4类。类平均法聚类结果如图1所示。
在取得类平均结果后,采用离差平方和法(Ward法),此方法是最常用的系统聚类方法,这种方法的核心思想是在同类样品的离差平方和即类内离差平方和应当较小,而不同类之间的离差平方和即类间离差平方和应当较大。当取合并距离为21时,则16个主要城市可分为5类。Ward法聚类结果如图2所示。
采用两种不同的系统聚类法得出的结果大致相同,除景洪市和芒市外其余城市分类相同。当采用类平均法时,这两个城市归入第3类;而采用Ward法时,这两个城市则单独成一类即第5类。
1.4 K均值聚类分析
由于采取的系统聚类方法不同,最终产生的分类也不同,无法确定最终分类结果,为确定最优的分类结果,故采用K均值聚类法进行分类。
K均值聚类的基本思想为:首先确定参数K,然后将n个样本大概分为K类,之后按照相关函数准则去修改不合理的分类,直到有关函数收敛即可停止,就可得到最终分类结果。判断分类结果的好坏则需看between_SS/total_SS,即类间平方和在总离差平方和中的占比,当比值越大时则说明分类结果越好。
当K取4时,聚为4类。类间平方和在总离差平方和中的占比(between_SS/total_SS=70.2%)。
此方法和系统聚类中类Ward法的分类结果完全相同。
在考虑到样本容量较小的情况下(16个),分类的个数也应相应的较少。同时在分析类间平方和在总离差平方和中的占比时,应注意此项标准不能去判断分类的个数,只是在确定分K类的情况下去分析此种分类方式的合理性。因此在分4类时(between_SS/total_SS=70.2%),每个类之间的差别较为显著,最后得到的分类结果见表2。
針对分类结果进行检验,将上述K均值分析结果进行方差分析,如表3所示。
可知可吸入颗粒物(PM10)、二氧化硫(SO2)和二氧化氮(NO2)这三项指标呈现出的显著性(p<0.05),说明这三项指标在聚类分析中有显著性的作用,即按照这几项指标对16个主要城市进行分类的。而空气质量达到及好于二级的天数(天)这一项的p值则是明显地大于0.05,说明在聚类过程中此项指标不显著,虽不能作为明显的划分的依据,但其实际意义依然显著。
因为本文的目的是在确定分类后,针对不同类别的城市提出相应的绿色发展建议,在R软件中可得到类均值,即可具体分析4个类之间的差别,见表4。
第1类只有昆明一个城市。昆明是云南省的经济、社会发展中心,是云南省唯一的特大型城市。由于人口高度集聚,其PM10的年平均浓度达到了571μg/m3位居4类第一,而二氧化氮(NO2)年平均浓度达到316μg/m3同样位居4类第一,空气质量整体上低于省内其他主要城市。
第2类中有香格里拉市、大理市、丽江市、普洱市。前3座城市都是云南省的传统旅游城市,旅游业作为主导产业,工业比较不发达,普洱市则是近几年凭借普洱茶成为名扬国内的新兴旅游城市,此类中的各项均值均位于4类中的最后,即这3项指标均为最优,说明4个城市空气质量总体位于全省前列。
第3类中有景洪市、芒市、泸水市、保山市、临沧市和文山市,这6个城市是沿边州市所在地,临近缅甸、老挝边境线,空气中二氧化硫(SO2)和二氧化氮(NO2)年平均浓度均不高,空气质量整体较好。
第4类中有楚雄市、蒙自市、昭通市、曲靖市和玉溪市,这5个城市基本处于滇中地区,传统工业较为发达,工业体系较为完善,因此空气中二氧化硫(SO2)和二氧化氮(NO2)年平均浓度较高,空气质量一般。
2 提升城市空气质量的建议
2.1 第1类城市
昆明作为云南省经济社会发展中心,应将绿色发展作为首要目标。一是对传统工业进行转型升级,推动钢铁、有色金属等行业高质量发展,从源头上控制污染源;二是积极倡导民众绿色生活方式,推进绿色低碳出行;三是加强生态园林、生态小区建设,提高绿地占有率。
2.2 第2类城市
作为云南省主要的旅游城市,香格里拉市、大理市、丽江市和普洱市应继续锚定旅游兴市,建设生态文明旅游名城,一是因地制宜发展旅游业,利用地理文化优势打造宜居城市;二是保护生态绿地,共享生态福祉,将绿色作为发展的底色,积极建设生态文明示范市;三是结合脱贫攻坚与乡村振兴战略的有效衔接,推动城乡一体化发展。
2.3 第3类城市
此类城市为沿边州市所在地,临近缅甸、老挝边境线,一产、三产所占比重较大,因此应利用地域优势和当地丰富的自然资源推进绿色发展。一是保护生态环境,加强林草生态建设,重点发展地方特色农特产品;二是利用沿边优势,加强与缅甸、老挝等地的边境贸易,开发旅游产业;三是进一步加强环保宣传教育,开展全民性绿色活动,提高民众环保意识。
2.4 第4类城市
作为传统工业城市,应注重产业升级改造,发展绿色产业,构建“绿水青山就是金山银山”的发展思路。一是加大对传统工业产业的环保资金投入,逐步转型升级,坚决遏制“两高”产业盲目发展;二是坚持生态优先、绿色发展的理念,促进各产业园区和开发区向绿色化、低碳化、循环化转型;三是传播绿色发展理念,提升全民低碳意识,共建美丽家园。
3 结论
本文对云南省16个主要城市的空气质量进行了聚类分析,并根据分类结果对4类城市提升空气质量提出建议。本文在查找数据上存在一定缺陷,在后续研究中可以查找较多指标,建立更加复杂的对比及预测模型,从而增强统计分析的针对性,为各州市提高空气质量,推动绿色发展提供更有建设性的意见和对策。
参考文献
[1]刘莎妮.论地方政府对中国参与东盟区域合作中的支持[D].上海:上海师范大学,2013.
[2]范必成.越南老街省与中国云南省次区域旅游合作研究[D].昆明:云南大学,2014.
[3]虞颖,孟彦菊.中国31个主要城市空气质量的聚类分析和主成分分析[J].科技和产业,2022,22(05):246250.
[4]费宇.多元统计分析—基于R[M].北京:中国人民大学出版社,2020.
[5]姚胜,孙周寅,贾如,等.基于聚类分析法的河北省传统村落现状特征及活化策略研究[J].中国集体经济,2022,(32):1923.