国内环境监测数据研究热点、前沿与趋势
——基于CiteSpace6.2的可视化分析

2023-09-28 06:48杨彬刘中梅
关键词:监测数据环境监测聚类

杨彬 刘中梅

(大连海洋大学 海洋法律与人文学院,辽宁 大连 116023)

在环境问题突出的当下,环境监测是世界各国研究较多的课题。2015年国务院办公厅发布了《关于印发〈生态环境监测网络建设方案〉的通知》后,我国环境监测数据相关研究呈增长趋势。

环境监测是一种对环境生态圈进行观察和研究的科学活动。通过各种专门手段,例如法律、专项技术和行政方法等,对环境中各项数据指标进行有效监测和分析,并通过预测和分析达到保护环境、促进经济社会发展的目的。环境监测作为环境科学管理和执法监督的基石,是解决环境污染事故和纠纷等问题的重要技术依据。环境监测机构需要监测、检测和分析环境污染因子及其对生态系统的影响,通过现场监测、遥感监测、无人机监测和生物标志物监测等技术手段得到关键的观测与测量数据——环境监测数据,从而助力环境保护工作的实施。

以文献计量学为核心方法,利用文献的各种数量特征进行定量分析,运用统计学和数学方法进行分析,通过可视化图谱展示演化过程和结构之间的关系图。在研究过程中,基于时态数据库的目标文档和被引数据进行统计,以可视化图谱的形式总结研究热点和核心词汇,揭示该领域相关研究的发展趋势[1]。

1 数据来源与研究方法

1.1 数据来源

本文基于CNKI“高级检索”,检索截止时间为2022年12月28日,检索主题为“环境监测数据”,共得到7 488篇文献。利用高级检索功能,剔除其中包含的学位论文、会议征稿、报纸书评、标准与成果等文献,获得有效文献6 138篇,再将文献来源检索范围限制为仅包括SCI、EI、北大核心、CSSCI、CSCD以及AMI的来源期刊,通过检索获得798篇文献。最后将学科限定在环境科学与资源利用和法学类,检索得到400篇文献,导入运行后最终识别396篇核心期刊文献信息。

1.2 研究方法

在目标文献中锚定重点文献,前瞻环境监测数据研究的前沿理论,找到环境监测数据的研究热点是开展环境监测数据研究的首要任务。我国学者进行文献管理主要运用EndNote、NoteExpress等软件,趋势分析则主要运用HisCite、Vosviewer及CiteSpace。其中,CiteSpace可对多种数据源的文献进行分析,故本文采用由陈超美教授开发的CiteSpace(6.2R2Basic版本)进行可视化分析。借助Excel软件绘制环境监测数据研究发表文章量的分布趋势图,分析发表文章量的变化趋势,再利用CiteSpace软件绘制关键词共现、关键词聚类、关键词时区以及关键词突现图谱[1]。以文献计量法为基本方法对基础数据进行统计和分析,研究环境监测数据研究的热点和发展趋势。

2 基础特征分析

2.1 文献发文数量分析

通过CiteSpace输出以年份为单位的环境监测数据相关研究文献数量,再利用Excel函数功能进行去重,绘制出1992—2022年国内环境监测数据文献数量分布图(见图1),可以清晰地反映环境监测数据的研究在各个时间段受重视的程度。如图1所示, 1992—2022年环境监测数据相关研究的文献研究总体呈增多的趋势。具体可分为3个阶段:1992—2000年为第一阶段,该阶段研究文献数量较少,在1到4篇之间。由于1994年是中国环境监测总站出版环境水质监测质量保证手册10周年,1996年是国家环保局出台环境监测技术规范第一册与第二册10周年的节点,故在1994年和1996年环境监测数据相关研究文献达到了10篇和8篇。2000—2010年为第二阶段,总体趋势上该阶段增幅最大,研究文献量较前一阶段有了一定的增加。2005年11月30日国家环保总局发布的《松花江水污染事故监测方案》是引发学者们研究热潮的原因之一。2010—2022年为第三阶段,发文量持续稳定上升,其中2010年减少到了5篇,当年环境监测相关工作重点集中于环境监测质量管理与环境监测人员检测技术的提升。2020年1月,生态环境部办公厅颁布《生态环境档案管理规范 生态环境监测》为国家环境保护标准,促使2020年的发文量达到25篇。2021年12月生态环境部印发《“十四五”生态环境监测规划》,提出要以更高标准保证环境监测数据的质量,环境监测数据相关研究在未来还需要更加深入的研究。

图1 1992—2022年国内环境监测数据文献数量分布图

2.2 研究热点共现分析

关键词可以体现出文献的中心思想和主要内容,也反映了文献的研究领域,还可以最大程度地概括作者的研究内容与思想。将 CiteSpace 操作界面的节点类型选择为关键词(Keyword)进行科学图谱的可视化分析,构建了核心关键词共现图谱(见图2),并利用 CiteSpace软件对其进行分析[2]。图2中显示共有617个节点,982条连接线,网络密度为0.005 2。节点代表关键词,节点的大小代表关键词出现的频次,连线代表关键词在同一篇文献中出现过,连线越粗则代表关键词共现的次数越多[3]。关键词的网络虽有一定密度但显著性不足,还需要进一步提高,这就要求研究人员不仅要注意研究的范围,而且要注意研究的深度,这样才能推动环境监测资料研究的全面发展。图谱中出现了环境监测、监测数据、环境监测站、数据库、监测布点、水质监测、数据审核,信息系统等频次较高的关键词,表明这些关键词在文献库中出现的频率比较高。与此同时图2中还出现了其他频次较低的关键词,如大气法、审核程序、可追溯性、法律地位、排污证据认定等,说明学者开始了对环境监测数据与其他学科的交叉研究,但研究还不够深入也未形成体系。对热点进行共现分析在一定程度上能反映出关于环境监测数据研究兴起的原因、解决的问题以及研究的方法及趋势,对后续的研究具有一定的参考意义。

图2 核心关键词共现图谱

为了使分析更加深入,利用CiteSpace对核心关键词的频率和中心性进行了计算,并将各指标下的前10个关键词进行整理,制作了关键词频次、中心性表(见表1)。从频次角度来看,环境监测、水质,监测数据等频次较高,反映出环境监测数据的研究中环境监测理论是研究重点,监测对象大多为水质。从中心性角度来看,环境监测、监测数据和数据传输这3个关键词中心性较高,表明这3个关键词是目前国内学者研究的重点。未来对环境监测资料的研究应更深入、更全面地展开,从而使环境监测数据相关研究范围更广,深度更深。

表1 关键词频次、中心性表

3 研究热点、前沿及趋势展示与分析

3.1 研究热点聚类展示

图2中的关键词较多,为了提高总结研究领域的精确度,本文借助CiteSpace 的关键词聚类这一功能,将图2中联系较为紧密的关键词进行汇总形成聚类,得到关键词共现聚类知识图谱(见图3)。CiteSpace根据网络结构和聚类的清晰度,提供了模块值(Q值,即 ModularityQ)和平均轮廓值(S值,即Mean Silhouette)两个指标,当Q值>0.3时,聚类结构就是显著的,当S值达到0.7就可认为聚类是令人信服的[4]。从图3中可以看出,Q值为0.863 8,S值为0.968 6,因此该聚类图谱的聚类结构十分显著,且结果令人信服。

图3 关键词共现聚类知识图谱

3.2 研究前沿与趋势展示

3.2.1 研究前沿展示

突现词是指在短时间内使用频率较高的词,它们代表着新概念或新事物的出现,预示着未来可能成为热门话题。使用CiteSpace 软件γ算法计算出不同年份的关键词热点突现统计图(见图4)有助于发现不同阶段的研究热点。将函数γ值设置为0.1,可以得到排名前25位的热点关键词[4]。

图4 环境监测数据研究突现词图谱

3.2.2 研究趋势展示

将图2的关键词共现图转换成为关键词聚类时区图谱(见图5)。关键词时区分析可以在关键词共现的基础上,从时间的角度分析研究热点,进一步探索环境监测数据研究的发展趋势[5]。通过CiteSpace软件绘制的关键词聚类时区图谱(见图5),结合环境监测数据研究的现状和特点,对热点问题的发展过程进行了分析和总结,并对未来的演变趋势进行了预测。在图5中,节点代表的是关键词第一次出现的年份,节点的大小代表的是关键词出现的频率;连接线代表的是这个关键词在之后的几年中是否与其他关键词同时出现,连接线越粗,说明关键词与其他关键词的联系就越紧密。

图5 关键词聚类时区图谱

3.3 研究热点主题分析

通过关键词聚类分析可以探索出环境监测数据领域中的重心,对选取文献的关键词进行聚类,发现研究领域可以分为9个不同的聚类:环境监测(#0)、动态监测(#1)、水质(#2)、信息系统(#3)、环境监测站 (#4)、水环境监测(#5)、环境监测数据(#6)、数字化(#7)、环境保护局(#8)。进而对关键词聚类时间线图谱(见图5)进行分析,可以看到每个聚类所包含的关键词及其对应的时间节点、相关关键词之间的联系,通过分析可将结果分为三大重点主题。

3.3.1 环境监测数据的模型优化研究

环境监测数据模型的优化研究主要体现在以下两方面:

第一,基于不同算法或平台对监测系统进行开发研究。现有研究成果中具有代表性的有通过Autodesk World 2.0平台开发远程用户模块,实现多源数据在远程用户端的GIS集成[6]。基于Web GIS的水环境监测信息系统,实现环境信息的空间化、可视化管理,以及沿河污染源分析、河流水质预测等功能,为环境管理部门提供准确的监测信息和技术支持[7]。基于ZigBee技术的无线传感网络水质监测系统,具有优良合理性与准确性,科学稳定[8]。基于物联网的水质监测系统,提高了监测设备pH值测量精度,监控平台运行稳定可靠[9]。基于物联网的信息预警系统,以声波实现通信和组网水下数据采集节点,使用Zigbee系统对数据汇集节点进行自动组网和数据汇集,由GPRS传递给服务器,再对数据进行处理[10]。算法与平台的使用呈现出多元化的研究局面,有利于寻找最实用的算法或平台,但对信息间的互联互通以及系统的通用程度关注度较低。

第二,以多种方法对监测点优化进行研究。曾雁湘等较早地对监测模型开发领域进行了研究,以洞庭湖前期监测布点为基础,根据多种环境特征,运用三种理论方法(系统论、控制论、信息论)选取参数,设计了创新型模型,进行多目标系统优化,获得了洞庭湖水质监测布点优化方案,为大型湖泊监测与规划提供了新的理论和方法[11]。冯治宇等采用网格采样—聚类分析法对沈阳经济技术开发区的空气监测采样点进行了优化研究,以最少的采样点位获得了具有代表性的监测数据[12]。林鸿雁等应用物元分析理论和熵权法,建立了地下水水质监测优化选点的理论模型[13]。利用先进的理论与方法对环境监测点位进行优化是学者们一直探讨的方向,环境监测点位的优化可以节省人工与经费,利用最简洁的监控点位得到最有代表性的数据。

3.3.2 环境监测数据传输优化与质量核查的研究

第一,环境监测数据传输优化相关研究。环境监测数据传输的标准化设计是我国目前亟需深入研究的课题之一。由于缺乏统一的数据传输管理的标准,数据汇总与输出困难,监测网络系统间不兼容导致数据无法迅速共享的现象也时有发生。对此,张霞等为提高数据共享与融合效果,对监测数据传输结构、协议、编码设计了规范性的方案[14]。司源等梳理多源数据融合的加权平均法、卡尔曼滤波、D-S证据理论、粗糙集理论等主要技术方法后,论述了多源数据融合技术在水质监测评价领域的研究现状和应用前景,提出推进多元检测业务体系建设,建立数据共享交换机制,加强水质动态评价方法研究的建议[15]。魏房忠等为实现环境监测数据传输系统的高效互联互通与数据共享,设计了充分满足环境监测部门数据传输需求,保障水环境监测数据在各个数据中心之间规范有序地传输的新型国家级水环境监测数据传输系统[16]。

第二,环境监测数据质量核查相关研究。顾红明在相关研究基础上提出了一种综合性水环境质量考核办法——区域水环境综合评价考核指标,可以全面、客观地反映区域水环境质量状况,基本满足对区域水环境质量考核评价的管理需求[17]。为了制定改善环境质量的污染源治理方案和综合防治规划,吴智诚团队在水质评价中引入了多目标决策TOPSIS法,建立数学模型,并成功利用该方法对某地4个测点的水环境质量的监测数据进行分析,证明了可行性[18]。熊明等对水资源监测类型及监测方式方法进行分析,找出适用于水资源考核要求的水文站水量监测数据、取用水户在线水量监测数据、水质实验室水质监测数据以及水质自动监测数据的特点及问题,提出为保证数据的正确性, 应尽快建立取用水户在线水量监测数据质量保证体系等建议[19]。

此部分研究成果多探讨数据传输的优化路径以及构建覆盖国家环境监测网的质量控制体系的必要性和重要性,认为优化数据传输系统和质量控制体系能提高监测数据的可信度,为环境管理提供科学依据。

3.3.3 环境监测数据的审核及其法律地位

第一,环境监测数据审核的相关研究。审核环境监测数据应从代表性、完整性、精密性、准确性和可比性几方面进行审核,才能保证监测数据的质量[20]。张哲等基于2014—2017年长三角地区2 100余组环境空气PM2.5组分监测数据,建立了组分监测数据有效性的审核指标[21]。万黎等提出了在城市空气质量自动监测网络的质量保证管理中使用计算机数据审核系统对监测数据进行自动审核的开创性设计构想[22]。

第二,环境监测数据法律地位的相关研究。在环境监测工作的不断深入下,环境监测数据的法律地位也得到了广泛的关注。环境监测数据的法律地位研究,对指导当前的环境保护法治工作具有重要的现实意义[23]。傅军等认为在环境污染刑事案件中,应在合法性、合规性、数据逻辑性等方面对环境监测数据进行重点审查,尽快出台相关规范性文件,让数据审核有据可依[24]。胡文翔则认为,在环境监测数据的采集与认可过程中提高采样规范性、确保监测人员现场采样技术能力、重视评价标准的选用等是提高环境监测数据在环境污染刑事案件中认可度的有效措施[25]。廖德兵等认为软硬件基础条件建设不完善、与政法系统沟通不畅以致各行其是导致了环境监测机构对数据的可追溯性认识不够深入[26]。李义松等认为污染源监测数据是行政机关进行监管、环境司法中认定当事人是否违法的关键证据。应当完善立法,明确生态环境监测机构资质认定规范,实现全过程监管;同时加大对监测数据造假行为的惩罚力度,使监测数据更好地为行政与司法机关服务[27]。周卫对2015—2020年的环境行政诉讼裁判文书进行考察后指出,在数字化转型时期环境监测主体、工具和形式多元化的背景下,由于环境行政执法过程中不同主体出具污染源监测数据不一致,使得司法过程中不同法院对环境监测数据这类证据的审查方式、审查强度及审查标准也存在较大差异。提出应制定裁判指引,建立二阶审查模式,附条件地采纳“实质性证据标准”以确定合适的审查强度,并根据行政行为的不同种类适用多元化证明标准,以提高裁判的规范性及证据效力判断的可预见性,进而提升环境监测数据产出的质量[28]。未来,随着数字化转型的不断深入,环境监测数据规范及其证据效力的认定等问题需要进行更加深入的探讨。

3.4 研究前沿与趋势分析

通过可视化分析和相关领域文献的梳理可以将环境监测数据的前沿与趋势研究分为3个阶段:

起步阶段(1992—2000年)。作为研究的起步阶段,本阶段学者基于统计学对数据进行分析,对环境监测数据的记录整理、分布类型和统计检验方法及判断准则进行研究,为环保工作者提供了解环境监测数据的应用方法[29]。对于环境监测网络体系构建局限于某地区的单点分析,对于环境监测信息共享、数据处理、质量控制与数据传输的探讨也只是处于初步阶段。

发展阶段(2000—2010年)。该阶段学者在深化第一阶段研究的同时,尝试在理论方法与应用技术层面找到提高环境监测数据质量的路径。特别是随着2007国家环保总局发布《环境监测管理办法》后,国内关于环境监测与环境监测数据的研究变得更加细致起来,有关如何对环境监测数据进行更深层次的审核、剖析与应用以及信息系统构建与创新的研究逐渐增加。在众多关于提升数据技术层面的研究以外还出现了对信息共享系统等较为深入的研究[30]。

深入阶段(2010—2022年)。该阶段的研究范围较之前更广,层次较之前更深。对环境监测设备便携化、智能化、模块化、综合化进行了较为全面的研究,逐步探索以监测仪器为基础的物联网、大数据、云平台、现代远程监控等技术[31]。在建立信息化质量控制体系、提高质量控制水平、数据全过程可追溯性等方面进行了创新性研究。与此同时还出现了环境监测数据领域的立法、执法、司法相关方面的交叉研究[32]。

4 结语

4.1 研究结论

通过对过去30年的环境监测数据相关领域研究进行梳理,可见环境监测数据相关研究已形成了较为全面的脉络体系,得到如下结论:

(1)环境监测数据相关研究历经3个阶段:1992—2000年的起步阶段、2000—2010年的发展阶段以及2010—2022年的稳定增长阶段。在2021年12月生态环境部印发《“十四五”生态环境监测规划》表示要以更高标准保证监测数据“真、准、全、快、新”的背景下,环境监测数据相关研究更加深入。

(2)环境监测数据的研究热点主要有3个主题:以环境监测数据的模型优化为导向的研究,以环境监测数据传输优化与质量核查为导向的研究和以环境监测数据的审核及其法律地位为导向的研究。

(3)得到了9个聚类关键词:环境监测、动态监测、水质、信息系统、环境监测站、水环境监测、环境监测数据、数字化、环境保护局。关键词之间相互联系,涵盖了环境监测数据领域的绝大部分研究成果,具有较高的代表性和概括性。

(4)环境监测数据相关领域研究视角呈现多元化,以环境科学为核心与统计学、法学等多领域学科知识相交叉的研究逐渐增多。研究方法从早期的统计学发展为构建系统评估体系、通过大数据进行数据融合。研究范围从获取环境监测数据的技术方法研究向数据融合、共享,促进生态文明建设以及法学上环境监测数据的证据效力研究发展。

4.2 优化路径

基于上述结论,环境监测数据的研究可从以下几个方面进行提升:

(1)科学合理确定环境监测数据研究目标,有针对性地开展环境监测数据相关研究。结合国家重大战略和生态文明建设目标,根据各学科实际情况,深化各学科环境监测数据的深入研究;同时加强环境监测数据的交叉学科研究,深化环境监测数据研究。

(2)提高环境监测新技术应用水平相关研究,加快开发便携化、智能化、模块化、综合化监测仪器研制和标准化应用,从而提高监测数据的真实性;探索利用大数据、云平台、现代远程监控技术,推动建立以仪器为基础的物联网、信息化质量控制体系,提高采样现场的质量控制水平,实现全程监控,使过程监控和全过程数据可追溯,实现现场质量控制全程跟踪,保存并形成完整的证据链,保证数据质量,满足执法监测需要[33]。

(3)完善环境监测数据数据共享和信息公开制度,加强相关部门和从业人员技能培训。需要更加关注多元化的环境要素,进一步完善信息共享规划使其具有可扩展性,相关应用技术也要与时俱进[34]。同时,作为建设环境监测数据管理体系的保障,高素质的环境监测队伍的培养也需要更加深入的研究。

(4)建立健全法律法规与环境标准,提高环境监测数据的证明力。在立法方面,需要出台专门的环境监测数据安全管理机构法规,提供强有力的法律制度保障。在环境执法中,在当前真实性、关联性、合法性研究的基础上,有必要深入开展证据能力状况的获取条件及缺陷修正研究,同时加强对证据链构成的研究[35]。最后,通过完善重点排污单位名录制度、企业监测设备与生态环境部门监控设备联网制度、监测设施工控机软件管理制度等一系列相关法律制度,使得环境监测数据的证明力得到严密的保障[36]。

猜你喜欢
监测数据环境监测聚类
环境监测系统的数据分析与处理
GSM-R接口监测数据精确地理化方法及应用
大气污染问题的环境监测
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
对环境监测数据造假必须零容忍
便携式GC-MS在环境监测中的应用
GPS异常监测数据的关联负选择分步识别算法
基于小波函数对GNSS监测数据降噪的应用研究
一种层次初始的聚类个数自适应的聚类方法研究