近20年来我国空气污染研究热点与趋势的文献计量分析

2016-11-01 01:47曹永强朱明明
关键词:共词聚类群体

曹永强, 朱明明

(辽宁师范大学 城市与环境学院,辽宁 大连 116029)



近20年来我国空气污染研究热点与趋势的文献计量分析

曹永强, 朱明明

(辽宁师范大学 城市与环境学院,辽宁 大连 116029)

以CNKI中国学术期刊

空气污染;关键词;文献计量;研究热点

随着我国城市工业化、市场化的加速发展,国内产生了区域性的大规模空气污染,全球性的空气污染情况也逐渐凸显,空气污染已成为21世纪最严峻的环境问题[1]。我国是全世界空气污染较为严重的国家之一。据统计,在调查的341个城市中,单就悬浮颗粒物这一项污染物的调查,就有近64%的城市的平均浓度超过国家空气质量2级标准[2]。因此,如何处理和防治空气污染带来的危害已成为当今社会普遍面临的问题。

当前,由于空气污染对不同城市的影响程度不同,全国各地已采取相应措施积极应对与控制空气污染现象并提出了有效的治理方法[3]。2013年李克强总理主持召开了国务院常务会议,就改善我国污染问题部署了空气污染防治十条措施。2015年8月29日我国重新修订了《中华人民共和国大气污染防治法》[4]并于2016年1月1日起施行。这一问题也引起了各领域专家学者的高度重视,并提出了治理和预防方法。如段玉森等[5]利用正交函数的方法将47个重点城市进行了空气污染指数时空划分,并建立了全国环保重点城市的空气污染指数时空模态区域分异体系;任婉侠等[6]利用小波分析法测量了我国特大城市的空气污染指数,分析解决了空气污染带来的环境问题;王海鹏等[7]利用数值模拟对兰州大气污染进行了模拟预报,以减少空气污染带来的负面影响;潘竟虎等[8]通过GIS空间分析,对118个重点城市667个环境监测站的各种空气污染指标进行了大气污染指数的空间格局分析,为大范围的雾霾预防和控制提供依据。

近年来,我国关于空气污染的治理和预防等研究方向的文献数量逐渐增多,大多数是针对某一特定时期、特定区域的纵向研究,但是对某一时间段内空气污染研究领域的文献计量方面的研究稀缺。为科学、有效地治理空气污染带来的环境问题,明确未来空气污染的研究方向,有必要对空气污染研究现状进行统计分析。

1 方法与数据

1.1 分析方法

文献计量法是一种以数学和统计学方法为基础,借助文献中提供的各种特征数据,并以文献外部特征为研究对象的量化分析方法[9],分析某一学科领域在一段时间内的研究内容。本文通过对CNKI数据库中的数据进行分析,结合文献计量法中共词聚类分析和战略坐标系分析,对近20年空气污染领域的文献进行全面的计量统计。

首先,借助Bibexcel软件得到共词矩阵。为了消除关键词频次悬殊所造成的影响,利用Ochiia系数计算得到斯皮尔曼相关矩阵,也被称为共词相异矩阵[10],见式(1)。

Ochiia系数=

(1)

基于得到的相异矩阵,利用Ucinet软件和Netdraw软件建立共词网络可视图,从而揭示各个关键词的内部关系以及外部联系。此外,借助SPSS统计软件建立聚类分析树状图,便于直观地对聚类群体进行划分。最后,通过Excel建立战略坐标系,通过二维坐标象限的位置分布可得出各聚类群体在某领域的结构分布与地位,以此进行网络数据分析[11-12]。

1.2 数据统计

本文数据来源于CNKI中国学术期刊网络出版总库的高级检索中以“空气污染”为主题词的核心期刊,检索时间范围设定为1996年1月1日—2014年12月31日,剔除重复文献记录。数据源更新时间为2015年10月10日。

某领域出现频次较高的关键词可以在很大程度上反映该领域的研究重点与研究趋势[13]。根据数据收集的结果,结合相关文献对高频关键词频次的定义,利用Bibexcel软件对关键词进行统计,将本文统计频次大于30次的25个关键词作为本次研究的高频关键词,并对相同含义的关键词进行合并。

各个高频关键词的具体频次见表1。从表中可以看出,近20年的空气污染研究现状为:①空气污染(室内)和甲醛一直是近20年的研究热点,说明室内装修产生的污染问题仍是当前空气污染领域的重点问题;②近年来,空气质量、PM2.5和PM10在空气污染研究领域发展速度较快,大气污染和颗粒物的出现也较为频繁,这与当前社会环境问题具有紧密的关联性,因此研究较多;③关键词“儿童”出现了56次,通过查阅文献发现,近年来由于房屋装修不当等问题,造成室内空气污染严重,对人类尤其是儿童的身体健康造成极大的危害,因此“儿童”也是空气污染研究领域的热点问题;④大气的主要污染物为二氧化硫、颗粒物等,其造成的环境问题尤为严重,是加强室外空气污染治理的重点;⑤近年来,城市空气污染状况较为严重,已成为当今城市环境亟待解决的首要问题,因此出现频次较高。

表1 近20年空气污染领域高频关键词及词频

2 结果分析

2.1 期刊总体分布情况

2.1.1 期刊数量分布情况

在CNKI中共检索出符合条件的核心期刊文献3 296篇。具体的期刊论文数量变化趋势见表2以及如图1所示。

根据表2和图1中数据的趋势变化,分析得到:近20年以“空气污染”为主题词的文献发布数量整体呈上升趋势。1996—2008年关于空气污染的期刊论文数量呈逐年上升趋势,说明空气污染问题的严重性已经逐渐受到各领域专家、学者的关注。到2008年空气污染期刊论文的数量达到13年来的峰值,占近20年的8.04%,说明我国对空气污染已有一定的认识并且整个领域在国内引起了广泛重视和讨论;2009—2014年论文数量出现波动,先小幅度下降后迅速增长,仅2014年一年的论文数量就已经达到369篇,达到近20年发文数量的顶峰,占总发文量的11.2%。这是由于2010年以来我国空气污染问题逐渐凸显,沙尘、雾霾等在全国各地时有出现且污染情况严重,伴随着“十二五”规划的初步形成,我国由单一污染因子治理向区域性、复合性的空气污染治理方向转型[14]。该阶段空气污染研究领域的理论与方法正处于摸索阶段,有关研究的发文数量有所波动,2013年以后在全国范围内开启了较为普遍的空气污染治理措施[15]。

表2 近20年主题词为“空气污染”的核心期刊论文分布情况

图1 CNKI中近20年主题词为“空气污染”的期刊论文数量分布图

2.1.2 期刊发刊机构及学科领域分布情况

根据对CNKI数据库的发文机构和学科领域的数据进行统计,结果如图2所示。

图2 发文机构及学科领域分布图

总体来看,近20年来主题词为“空气污染”的研究具有明显的学科差异,期刊发文机构主要由在环境、医学和气象领域位于前沿的高等院校和科研机构组成,如北京大学在气象学领域研究位于我国领先水平,其在空气污染领域发文数量达155篇;中国疾病防控中心在预防医学与卫生学领域位居前列,在空气污染领域发文数量达81篇。以空气污染为主题词的学科领域主要有环境科学与资源利用、预防医学与卫生学和气象学等,同时在建筑科学与工程、公路与水路运输等领域也有所涉猎。在环境科学与资源利用学科领域,期刊发文数量达1 866篇,说明空气污染问题已经不再是单纯的环境问题,其影响的范围较广,研究领域较宽,因此解决空气污染问题已经成为多个领域的共同目标。

2.1.3 高引论文分布情况

基于上述文献搜索方法,得到被引次数前10位文献的名称、作者、文献来源及被引次数,统计结果见表3。

表3 以“空气污染”为主题词的前10位高引论文分布情况

续表3

从整体上看,被引次数较多的文献大多研究的是近年来较为突出的空气污染问题,如雾霾、PM2.5、PM10等;从文献名称来看,研究区域大多限定在中国经济发展较好的几大著名城市,说明这些地区空气污染问题较突出,并引起了广泛关注;从发文作者来看,对此领域较为关注的专家有吴兑、吴国平、毛节泰、李成才等;从文献来源看,中国环境科学在此领域发文质量较高,引用次数最高。

2.2 期刊的文献计量分析

2.2.1 可视化分析

前文的25个关键词在某种程度上代表了空气污染研究领域的研究方向,根据出现频次由高到低的顺序,对这些高频关键词进行共词分析,形成25×25的共词矩阵,主对角线上的数据为该词出现的频次,其余的数据表示两个关键词共同出现在同一篇论文中的次数。为了消除各个关键词频次间的差异,对共词矩阵进行距离相关性分析,结合式(1)得到各关键词的相异矩阵,见表4。

为了更为直观地呈现各关键词在空气污染领域的地位以及关键词两两之间的相关关系,通过Ucinet软件对数据进行处理,形成.##h文件,再利用Netdraw软件绘制共词网络,来观察这些关键词内部和外部之间的关系,从而分析关键词所代表的研究主题内容,得到的共词网络可视图如图3所示。

表4 近20年高频关键词相异矩阵(部分)

图3 高频关键词共词网络可视图

由图3可知:空气污染(室内)、空气质量、大气污染等关键词的连接节点较大、与其连线的关键词数量较多且多位于可视图的中心。说明这些关键词在研究空气污染的文献中出现的频次较高,也是近20年空气污染方向研究的重点;卫生调查和空气污染(室内)、甲醛和空气污染(室内)、卫生调查和甲醛、可吸入颗粒物和细颗粒物、细颗粒物和灰霾等,这些关键词两两之间的连线较粗,说明这几组两两相接的关键词在期刊文献中共同出现的频次较高,相互之间的联系较多;多环芳烃、气候变化等关键词位于可视图的边缘,节点小且连线细而少,说明在文献中出现的几率较小,现阶段不作为空气污染领域研究的重点。

2.2.2 聚类分析

聚类分析是通过计算各类之间的距离作为可否划分为同一类别的依据,距离相近的关键词归为一类。利用SPSS中系统聚类的模块功能对25个关键词的斯皮尔曼相异矩阵进行系统聚类分析,选择绘制树状图并定义度量标准为卡方度量,生成的聚类分析树状图如图4所示,其中横轴代表的是组间相关性。从图4中的聚类结果来看,大致可将频次大于30次的25个关键词分为4个聚类群体。

各聚类中所包含的具体关键词详见表5。由表可知:第1聚类群体为室内装修引起的空气污染卫生调查研究,既有室内的空气污染,也有甲醛、苯等室内装修产生的挥发性有机物,均是空气污染分支中室内的部分;第2聚类群体为近年来新兴且污染较为严重的一些污染物,如PM2.5、PM10、二氧化硫等,这些影响因素与大气污染的关系属于空气污染分支中的大气污染物;第3聚类群体为室内空气和污染,是室内与空气污染间接相关的一个分支;第4聚类群体为大气环境污染监测以及城市污染状况的研究内容,包括大气质量监测时常见的颗粒物、空气质量,以及近年来重点研究的气候变化和环境问题。

为进一步验证上述聚类分析结果的真实、可靠性,可通过建立战略坐标系来分析。在Excel中绘制战略坐标图,横坐标为向心度,表示各聚类之间的紧密程度,横坐标对应的值越大则不同聚类间的紧密程度越高;纵坐标为密度,表示同聚类内各关键词的紧密程度,纵坐标轴对应的值越大则同一聚类内部各个关键词的紧密程度越高[16]。通过共词矩阵的数据值, 分别计算每一聚类群体的向心度和密度值,具体结果如图5所示。

图4 聚类分析树状图

表5 聚类群体划分

图5 聚类群体的战略坐标图

图5结果表明:密度最高的为第1聚类群体,说明第1聚类内部的关键词与关键词两两之间的联系较为紧密,在文献中共同出现的频次较高;其次为第2聚类群体和第3聚类群体,内部关键词之间的联系密切程度呈中等偏弱;第4聚类群体包含的关键词数量虽多但是密度较小,说明两两关键词之间联系不密切,共同出现的几率较小。经上述结果验证,本组密度结果与相异矩阵所得的结果基本一致。向心度最高的为第2聚类群体,说明第2聚类群体的各个关键词与其他聚类的关键词联系较为紧密,内部各关键词整体频次较高;第1聚类群体和第3聚类群体次之,第4聚类群体的向心度最小,说明与其他聚类关键词联系较小,在文献中不常与其他聚类中的关键词共同出现,本组向心度测量结果与共词分析网络结果大致相同。上述结果说明,表5的聚类群体划分结果较为合理,可以作为分类结果进行研究。

3 结 语

1)从期刊总体分布来看,近20年以“空气污染”为主题词的文献发布数量经历了从升到降再到升共3个阶段,2014年发文量达到近20年最高,发文机构多集中于高等院校和国家设立的单位机构,分布的学科领域也较为广泛,说明空气污染问题在近年来受到了一定程度的关注。

2)通过对高频关键词统计和高引文分布情况的分析来看,近年来空气污染领域的研究热点为雾霾、PM2.5、PM10等较为普遍的污染问题。说明面对当前空气污染问题,我国的专家、学者在最短时间内给予了回应,并提出了自己的建议和解决方法。

3)从文献计量分析结果来看,我国空气污染领域的研究热点可分室内空气污染和大气污染两大类,并由这两大类分为室内空气污染监控、室内空气、大气污染监测与防控、大气污染物4类聚类群体。

4)本文选取了近20年词频大于30次的前25个高频关键词进行文献计量分析。从整体研究结果来看,我国空气污染问题形势严峻,且国内空气污染方面的文献数量较少,重视程度、研究程度远不能解决当前污染问题。建议相关专家、学者多重视此领域的研究。

[1]吕明权,吴胜军,陈春娣,等.三峡消落带生态系统研究文献计量分析[J].生态学报,2015,35(11):3504-3517.

[2]刘新生,刘娜欢.我国城市大气污染现状、后果及防治对策[C]∥作者不详.2014京津冀钢铁业清洁生产、环境保护交流会论文集.北京:中国金属学会,2014.

[3]全国人民代表大会常务委员会.中华人民共和国大气污染防治法[J].中华人民共和国全国人民代表大会常务委员会公报,2015(5):837-852.

[4]李小飞,张明军,王圣杰,等.中国空气污染指数变化特征及影响因素分析[J].环境科学,2012,33(6):1936-1943.

[5]段玉森,魏海萍,伏晴艳,等.中国环保重点城市API指数的时空模态区域分异[J].环境科学学报,2008,28(2):384-391.

[6]任婉侠,薛冰,张琳,等.中国特大型城市空气污染指数的时空变化[J].生态学杂志,2013,32(10):2788-2796.

[7]王海鹏,张斌,刘祖涵,等.基于小波变换的兰州市近十年空气污染指数变化[J].环境科学学报,2011,31(5):1070-1076.

[8]潘竟虎,张文,李俊峰,等.中国大范围雾霾期间主要城市空气污染物分布特征[J].生态学杂志,2014,33(12):3423-3431.

[9]杨浩.基于SPSS的聚类分析在行业统计数据中的应用[D].长春:吉林大学,2013:7-11.

[10]柴彦.基于共词聚类分析方法的知识管理国内研究述评[J].情报科学,2015,33(4):149-153.

[11]宋长青,谭文峰.基于文献计量分析的近30年国内外土壤科学发展过程解析[J].土壤学报,2015,52(5):957-969.

[12]陈宝明,彭少麟,吴秀平,等.近20年外来生物入侵危害与风险评估研究的文献计量分析[J].生态学报,2016,36(20):1-9.

[13]陈建新,濮励杰.中国资源地理学学科地位与近期研究热点[J].资源科学,2015,37(3):425-435.

[14]赵其国,骆永明,滕应,等.当前国内外环境保护形势及其研究进展[J].土壤学报,2009,46(6):1146-1154.

[15]郝吉明,李欢欢,沈海滨.中国大气污染防治进程与展望[J].世界环境,2014(1):58-61.

[16]陈枫楠,沈镭.基于共词分析方法的“能量流动”国内外研究述评[J].资源科学,2014,36(12):2517-2528.

(责任编辑:张陵)

Bibliometric Analysis of Research Hotspot and Trend about Air Pollution in Recent Twenty Years in China

CAO Yongqiang, ZHU Mingming

(School of Urban Planning and Environmental Science, Liaoning Normal University, Dalian 116029, China)

In this paper, taking CNKI China Academic Journal Network Publishing Database as data source, combined with the multi-dimensional statistical analysis of SPSS software and the co-word cluster analysis of Bibexcel, Ucinet and Netdraw tools, the literatures with the subject heading air pollution from 1996 to 2014 were statistically analyzed to explore the correlation among high-frequency keywords. In order to reliably analyze the research hotspot and trend about air pollution in recent twenty years, and clear the key research directions in the field of air pollution, the clustering results were verified by the strategic coordinate system established with Excel, which would afford some support for the research on air pollution in our country.

air pollution; keywords; bibliometric analysis;research hotspot

2016-04-11

国家自然科学基金项目(51279072)。

曹永强(1972—),男,内蒙古丰镇人,教授,博士,主要从事水文水资源研究。E-mail:caoyongqiang@lnnu.edu.cn。

10.3969/j.issn.1002-5634.2016.03.015

TV213.4;G353.1

A

1002-5634(2016)03-0076-06

I中国学术期刊网络出版总库1996—2014年的相关论文为基础数据,采用共词聚类分析和多尺度分析相结合的文献计量方法,分析近20 年来“空气污染”领域的研究概况以及研究热点。该项研究在一定程度上可为未来空气污染的研究热点与方向提供依据。

总库为数据源,结合Bibexcel、Ucinet和Netdraw等工具下的共词聚类分析以及SPSS软件下的多尺度分析,对1996—2014年主题词为“空气污染”的文献进行计量分析,探究高频关键词之间的关联性。最后结合Excel建立战略坐标系对聚类结果加以验证,以期可靠地分析我国近20年来空气污染领域的研究趋势及研究热点,明确空气污染领域在未来几年的重点研究方向,为我国空气污染的研究工作提供可靠支持。

猜你喜欢
共词聚类群体
通过自然感染获得群体免疫有多可怕
基于K-means聚类的车-地无线通信场强研究
“群体失语”需要警惕——“为官不言”也是腐败
基于突变检测与共词分析的深阅读新兴趋势分析
基于Matlab的共词矩阵构造
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
中国文化在国际社交媒体传播的类型分析——基于共词聚类的研究
基于共词知识图谱技术的国内VLC可视化研究