熊丽君,袁明珠,吴建强*
1. 上海市环境科学研究院,上海 200233,2. 华东理工大学资源与环境工程学院,上海 200237
大数据分为数据产品、处理过程和认知过程 3个层次,其中数据产品主要特征为容量大(Volume)、类型多(Variety)、存取速度快(Velocity)和应用价值高(Value),处理过程指对海量数据进行采集、存储、关联分析和可视化,认知过程指通过对数据的处理获得新知识、从而创造新价值,改变人们认知结构(郭少青,2017;赵苗苗等,2017)。通过大数据分析(Big Data Analytics,BDA),可以更好掌握客观事件的特征,找到有利于决策的信息(Yong,2014)。生态环境大数据指运用大数据理念、采用处理方法和分析技术对生态环境数据进行收集、分类、存储、分析与利用,在此基础上进行应用,以解决生态环境问题。国际生物学计划(International Biological Program,IBP)推动长期生态学研究网络(The International Long Term Ecological Research,ILTER)发展,标志着生态学进入“大科学、大数据”时代(Aronova et al.,2010)。
传统的生态环境数据呈现无序性、孤立性和缺乏群体性,给生态环境监测评价及综合管理造成了一定困难(程春明等,2015)。发展生态环境大数据技术,有利于有效集成多来源、多类型、多尺度的生态环境数据,并进行高效管理和综合利用,为生态环境保护和发展提供新的支撑(Yong,2014)。生态环境大数据推动环境信息化发展,是生态环境保护面对新形势、新趋势的必然选择,也是生态环境管理的重要支撑。2016年生态环境部出台《生态环境大数据建设建设总体方案》,明确指出加强生态环境大数据综合应用与集成分析,实现生态环境综合决策科学化、生态环境监管精准化、生态环境公共服务便民化(董玉红等,2017)。
本文通过分析生态环境大数据技术体系,对大数据技术在气、水、噪声、土壤等生态环境要素的监测评价、模拟预测、优化管理中应用进行阐述与剖析,针对当前存在的不足,提出相关建议,为后续大数据技术在生态环境领域的应用研究提供技术支撑,对加快生态环境大数据平台建设、高效应用生态环境大数据具有重要的参考价值。
生态环境大数据技术将各种数据有机结合在一起,并进行分析,解决错综复杂的生态环境问题,提升环境决策的准确性和科学性。通过利用现代化生态环境监测仪进行数据采集,获取海量数据,在云计算等技术基础上对生态环境大数据进行处理,进而进行实践应用,使生态环境大数据价值获得最大化(Johnson et al.,2017),其技术体系见图1。
大数据主要通过卫星遥感、传感器、射频识别、物联网和移动平台等技术手段进行采集(图1)。随着科学技术水平提高及信息化发展,生态环境大数据获取方式趋向多样化,采集数据主要分为五类:地面监测数据、卫星遥感监测数据、地理信息数据、社会统计数据以及其他数据(表1)。
图1 生态环境大数据技术体系框架Fig. 1 Technology system framework of big data in ecological environment
表1 生态环境大数据采集来源及主要内容Table 1 Collection sources and main contents of big data in ecological environment
在数据采集技术中,遥感技术使空间信息在生态环境领域发挥着独特的作用。目前建立覆盖全球的生态环境监测网络主要分为全球卫星遥感监测网络和地面监测网络两大类,其中地面监测网络包括气象站监测网络和全球环境监测网络。地面气象站监测网络包括100多种数据来源和35000个气象站点,集成了不同国家、不同地区的实时天气观测数据,获取参数为云量、气压、风速、风向、温度、可见度、降水等(赵海凤等,2018);全球环境监测网络主要涵盖生态系统监测和环境污染监测,收集并分析水生态、陆地生态、环境质量、环境污染以及生态环境要素的时空变化情况(胡沅等,2014)。除此以外,全世界建立的多个公民科学项目平台利用“公民科学家”参与收集环境数据,对生态环境监测网络也起到了一定的数据完善和丰富作用,如美国 BudBurst项目采用全美人民收集的植物生命周期数据来帮助研究植物如何应对环境变化(于贵瑞等,2018)。2018年4月,中国生态环境部启动生态环保遥感大数据建设,推动遥感大数据的获取与应用,但遥感大数据仍存在收集标准不统一、质量较大差异和使用率低等问题,为了能够对生态环境状况开展全天候监测,生态环境部基于卫星遥感等技术初步构建生态环境监测网络体系,目前天地立体监测系统具备 2—3 d对全国进行覆盖一次的生态环境监测的能力(王桥等,2016)。
大数据来源广泛,数据类型和处理方法千差万别,不同学者对大数据处理技术流程进行了划分,如窦万春等(2013)将其划分为获取、集成、分析解释3个阶段;刘智慧等(2014)基于中国人民大学网络与移动数据管理实验室(WAMDM)研究将其划分为采集、处理集成、分析、解释4个阶段;常杪等(2015)将其划分为采集预处理、存储、分析、可视化4个阶段;赵芬等(2017)将其划分为获取、存储管理、计算、分析4个阶段。大数据处理技术的功能主要为分析和处理数据,并获得有用信息。本文基于大数据技术的储存、处理、分析、融合等特点,将生态环境大数据处理流程划分为 4个系统:数据存储管理系统、数据预处理系统、数据深入处理系统与数据整合挖掘系统(图2)。
数据存储管理系统是生态环境大数据处理的基础,应具备良好的兼容性、拓展性、先进性、稳定性和安全性,并能满足复杂条件下的不同需求,主要包括文件系统和数据库系统两类,其中具有代表性的文件系统有:HDFS(Hadoop Distributed File System)、GFS(Google file system)、Ceph和Tachyon,具有代表的数据库有 Big Table(Google公司)、PNUTS(Yahoo公司)和Dynamo(Amazon公司)(赵芬等,2017)。由于数据来源结构复杂、类型多样,数据预处理系统采用 Data Stage、Data Flux、Informatica Power Center等方法(常杪等,2015)对源数据进行清洗,将其转换为单一或便于处理的结构。在预处理后,进一步对数据进行深入处理,包括机器学习、智能算法、统计分析和系统建模(汪自书等,2018),其中统计分析包括描述分析、相关分析、回归分析、聚类分析以及主成分分析等,是数据处理最常用的技术;鉴于生态环境大数据的特殊性和复杂性,生态环境大数据分析往往涉及多种分析方法,需充分利用各类先进的统计分析、地理信息等算法及软件。在数据进行深入处理后,再采用Meta分析方法、基于数据驱动的挖掘方法和基于过程机理的模型-数据融合方法对生态环境大数据进行整合挖掘(于贵瑞等,2018),获得科学性、融合性和有效性信息,从而应用于生态环境的管理与决策。
大数据平台是数据处理和分析的基础,生态环境大数据平台以信息化系统为基础,能够开辟各领域、系统间数据通道,对历史动态数据进行整合,快速提取有价值的信息,提升生态环境重大风险预警预报和科学决策水平,成为推进生态环境保护的重要手段(宋蕾,2019)。中国《生态环境大数据建设总体方案》设置了大数据环保云、大数据管理和大数据应用3个平台(王建民,2016),邱立新等(2018)提出“能源-经济-环境”大数据平台,为政府、企业、研究机构等部门信息资源提供数据支撑和工具支撑。云计算是当前大数据分析的最新技术和趋势,以MapReduce、Hadoop等为代表的云计算平台成为大数据分析基础平台(刘智慧等,2014),江苏省环境保护厅依托物联网、云计算和移动互联网等信息化技术,建立了以环保云为代表的生态环境大数据平台,实现省内生态环境数据融合统一,初步构建了环境数据质量监控体系(张毅等,2019)。
图2 生态环境大数据处理技术流程Fig. 2 Technological process of big data for ecological environment
通过应用生态环境大数据技术,将多种复杂的环境信息与各类数据融合,克服信息数据片面性,全面深入分析环境成因,评判环境损害,提供科学环境决策,从而更有效保护生态环境(Johnson et al.,2017;Kossenko et al.,1994;Zhao et al.,2017;李娜等,2015)。目前大数据技术主要应用于大气、水、噪声、固废、土壤等生态环境要素的监测评价、模拟预测与优化管理。截至2018年,中国有15个生态环境厅(局)已建或在建大数据决策支持应用服务中心,其中上海市生态环境局采用大数据技术收集环境执法、监督等数据,建立监察执法决策数据中心,并进行实时分析,促进环境监管的精细化和科学化(张毅等,2019)。
大数据技术在监测评价中的应用主要是基于生态环境在线监测和数据处理系统,进行数据长期监测、自动传输、在线计算和可视化应用。大数据技术的发展使生态环境监测从短期向长期转变,从单要素向宏观结构、时空协同监测转变(Carey et al.,2019),特别是水和大气环境要素,受水文、气象、污染等因素影响,变化复杂,在线监测数据量大、种类繁多,大数据技术可以整合水文、水利、气象、环境、能源、经济等领域数据,建立数据平台,简化数据交换共享流程(Chen et al.,2017);并可基于无线传感网络和动态监测,结合遥感技术和地理信息系统,开发多功能生态传感网络服务平台,促进了生态环境监测数据的查询、分析、评价、共享和应用(宋东泽等,2015)。
在有效性方面,大数据技术实现大区域环境污染数据互联互通,优化分析数据,实现环境网格化监控和数据高效处理分析,实时显示环境质量评价指数(张毅等,2019)。如黄刚等(2010)等结合e-Science的大气数据分析平台,提出数据处理算法与分析结合系统,通过平台对数据进行在线分析和计算,节省网络带宽;黄丹雯(2018)基于自主学习神经网络算法设计校准体系,提高大气网格化监控有效性;谭清海等(2013)提出基于Server-Client的远程数据抽取和并行可视化解决方案,实现快速抽取和快速可视化地诊断分析,并在中国气象信息综合分析处理系统(Meteorology Information Comprehensive Analysis Process System,MICAPS)得到应用;Malbéteau et al.(2016)采用DisPATCh(Disaggregation based on Physical and Theoretical scale Change)方法解决卫星观测和现场测量的差异,提高土壤遥感数据(湿度、温度等)准确性。在便利性方面,大数据技术能够对准确度降低的传感器实时报警,降低校准技术人员工作强度,保障了特殊区域的气体监测质量;对野外长期动态监测数据进行实时传输,透明访问与高效读取复杂环境数据,包括气候变化特征、水文水质特征、河湖岸线地貌、生态状况和生态景观等,提高数据收集便利性,并挖掘各类环境数据关联性(Zhong et al.,2015;Boulil et al.,2014;Cravero et al.,2018)。
大数据技术通过整合各污染源数据,结合分析技术和计算软件,优化监测数据的分析与评价。张璐璐(2017)基于大数据采用监测预警诊断、数字信号处理等技术优化噪声大数据监测分析平台;刘肃平等(2018)结合数据实时分析和批处理技术,采用Storm+Hadoop大数据处理架构,实现辅机设备运行噪声的实时监测和分析;王爱娟(2015)基于水利、土壤等数据库,应用土壤流失方程,集成水利普查的流程及计算方法,开发水土流失快速测评系统,推动了网络、水利、土壤等大数据平台的联合应用;郭书海等(2017)采用“互联网+”技术对土壤环境数据进行提取与补充,并对数据进行自我比对、更新和完善,从而实现土壤生态环境数字化评价。同时,基于大数据技术可针对生态环境的“源-汇”特征,跟踪评价生态环境质量和影响因素。Zawadzki et al.(2016)基于土壤水分、海洋盐分(SMOS)数据库,结合全球土地数据同化系统(GLDAS)跟踪分析区域土壤特征变化;Xie et al.(2017)基于土壤大数据平台,结合气候、社会、经济等多部门大数据平台,剖析京津冀地区土地生态变化的影响因素,为科学管理提供了重要依据。
大数据技术提高了数据监测的有效性和便利性,并提升了监测数据的分析与评价效率,但随着生态环境保护要求的提高,数据类型和数据量不断增加,基于大数据技术的多领域、多来源监测数据缺乏有效整合和分析(赵苗苗等,2017),评价效率不高,与其他领域关联的潜在数据价值尚未被发掘。不同生态环境要素的动态变化特征复杂,污染来源多样,指标评价受人为主观因素影响较大,大数据技术对人为主观因素的纠错及优化评价功能有待进一步研究。生态环境数据时空尺度多样,针对不同管理目标和管理范围,需要确定合适的评价方法和评价模型(张永瀚等,2015),当前结合大数据技术智能筛选、优化评价方法或模型的研究较少。
通过大数据技术与生态环境专业模型结合,能够对区域生态环境质量进行不同时空尺度下的预测以及对污染进行预警,特别是针对影响因素多样,动态变化复杂的水和大气两种环境要素。模型模拟是水和大气环境预测预警和风险评估的重要手段(周煜申等,2017),水循环涉及气象、水文、水动力过程,大气循环涉及辐射、对流过程,对应的数值模型包括气象模型、大气污染模型、水文模型、水动力模型、水质模型和水生态模型等(Gonzalez et al.,2019;汤秋鸿等,2019)。数据涉及区域特征数据、空间属性数据和时间序列数据,时空变化复杂。大数据处理技术为生态环境要素的精准模拟、预测预警提供了科学手段。
大数据技术与专业模型有效结合能够提升模型模拟的有效性和精度,实现快速预测或可视化预测。在大气环境方面,生态环境部信息中心联合微软公司开发城市局地大气主要污染物时空分布大数据模型(U-Air系统),基于空气质量、交通流、道路结构、气象条件等数据,实现1 km×1 km高精度空气质量预报(张毅等,2019);IBM公司与北京市政府联合开发“绿色地平线”大数据平台,对实时气象条件和企业排放数据进行关联分析,实现高精度预报未来 72 h的空气环境质量(郭书海等,2017);IBM 中国研究院基于认知计算模型,实现对全国367个城市精细化监管,预测未来7—10 d、精度为 1 km×1 km 范围内的城市细颗粒度(张毅等,2019);通过对空气污染监测数据挖掘、整合和分析,结合天气预报数据,基于大数据平台,可实现以可视化方法预测未来空气污染物时空分布特征(武装等,2015)。在水环境方面,Kristof et al.(2015)基于地理空间和水文大数据,采用专业模型对洪水进行模拟和快速预测;Zhang et al.(2018)提出 MOPSOGA(Multi-Objective Particle Swarm Optimization-Genetic Algorithm)算法,大幅度精简水环境数据量,提高水资源数据的处理速度;Shafiee et al.(2018)提出采用新的 Application Program Interfaces(API)优化水环境模型,进行动态建模和数据循环,提高了水环境数据评价系统的性能。在土壤环境方面,基于互联网平台采用遥感、GIS等手段,有效整合土壤空间属性数据、特征数据和污染数据,提升土壤空间大数据精准性,结合专业软件建立空间土壤预测模型,促进土壤特征及污染情况空间预测(Bui,2016)。在生态方面,Fer et al.(2018)将大模型与大数据结合,通过贝叶斯仿真模拟提高生态系统模型校准的有效性,减少模型不确定性。Soltis et al.(2016)基于生态环境大数据平台实现生物多样性准确预测,为城市规划者、管理决策者和公众农业提供关键数据。
通过大数据技术与专业模型整合,可以构建生态环境污染的可视化预报预警系统,评估生态环境风险。在大气污染方面,已有研究者构建了PM2.5预警系统和重污染天气预报系统,如曹骝等(2015)基于PM2.5云监测仪和大数据处理平台,将环境质量控制与大数据技术有机结合,建立PM2.5监测预警系统;张丽艳等(2019)利用气象台大数据资料,开发秦皇岛市重污染气象模型,建立重污染天气预报系统,实现AQI和重污染天气预报预警;Song(2019)基于 PM2.5大数据评估京津冀地区的高度时空暴露风险,量化评估城市的暴露水平和健康风险。在水环境污染方面,岳强等(2017)结合模糊数学理论和层次分析法建立了基于大数据分析技术决策树C5.0算法的平原水库健康预警模型,对水库进行更为客观和高效的健康预警评价;王永桂等(2017)基于大数据特点及环境风险评估预警需求,构建三峡库区水环境风险评估与预警示范系统,实现常规水质指标、突发水污染事故与水华的风险评估、甄别、预测及信息发布等功能,在四川省环境监测总站、湖北省环境监测中心站、长江水利委员会等机构得到应用;Wang et al.(2010)采用 PEMSEA(Partnerships in Environmental Management for the Seas of East Asia)环境风险评价方法,基于水环境大数据平台,评价渤海海域风险不确定性。在生态保护方面,王英超等(2018)基于生态保护红线管控实际需求,依托多功能生态传感网络服务平台,设计基于大数据分析的预警系统,为宁夏空间规划、项目实施和生态保护政策决策提供技术支撑和依据。
大数据技术提高了生态环境模拟的精度和处理速度,并实现不同时空尺度的污染预报预警。然而,大数据技术在数据采集、传递、接受、融合、转化等过程中易产生时滞和缺失,以及受外界环境影响导致部分动态数据异常,这些将会影响生态环境要素模拟的及时性和准确性(Cai et al.,2019),针对不同环境要素和污染源,结合模型模拟需求对监测数据进行智能化预处理的技术有待进一步完善。而且,现有模拟、预警及预报模型系统大多采用简单的主要因素分析法(Kebaili et al.,2016),多领域模型耦合应用尚不完善,难以满足实际复杂情景的分析。另外,生态环境领域面广、涉及数据类型多样,实际应用中数据信息变化频繁,如传感器淘汰、升级、变化,原有数据源价值缺失,新的数据源增加(Horita et al.,2017);面对新的生态环境保护需求,管理决策不断调整、优化,对基于大数据技术的环境模拟、预测、预报、预警提出了新要求,目前缺少更为专业、开放的大数据运行与分析系统支撑庞大的模型库。
大数据技术在智慧城市建设中发挥重要作用(Kamel et al.,2014),有利于污染科学溯源,有效控制污染、提高生态环境监管效率,为生态环境优化管理和科学决策提供依据。
生态环境大数据技术在实时监测、动态分析、预测预警等方面具有突出优势,有利于实现生态环境污染有效溯源与控制。在水污染防治方面,依托大数据平台可对取水、用水、排水进行实时监测与分析,及时发现水污染问题;对河道监测断面进行数据动态跟踪,结合线性趋势、累积异常、迁移扩散模拟等方法探明河道污染物的时空变化(Lu et al.,2018),追溯污染源,从而有效促进水资源监督管理和污染源头控制。在大气环境污染防治方面,基于大气污染源和大气环境质量的在线监测数据,进行大数据处理和分析,明确大气污染成因及污染源的时空分布,并通过监控平台的可视化技术实现污染源准确定位(Yang et al.,2019)。在固体废物削减方面,可基于大数据优化产业园区布局,实现企业间的资源、能源和废物信息的交换和循环利用,减少废物排放并降低处理成本(Song et al.,2015)。在工业污染控制方面,通过大数据技术分析污染负荷、浓度排放强度、污染企业密度与区域生态环境质量、工业污染物类型的相关性(Xiao et al.,2019),促进工业污染有效控制,如京津冀“2+26”污染防治强化督查应用基于大数据的热点网格技术,高效监督企业污染排放,提高执法的针对性和精准性(陆新元等,2019)。
生态环境大数据技术能够突破传统污染、监测数据分析过程中的众多困难和局限,有效跟踪并整合大量动态数据,有利于大尺度、大区域的污染联防联控,改变生态环境污染防治工作被动响应和处理缓慢的模式。在水环境方面,水文、水质数据冗杂,管理难度大,结合大数据建模并联合多部门管理可实现不同流域、不同水质、不同功能区条件下的定向管理,降低水环境管理工作量,提高管理效率和管理精度(Ford et al.,2018)。在大气环境方面,大数据深度处理技术能够基于环境、人口、经济、气象和能源等数据,优化大气污染的可视化时空分布特征及预测结果,突破大气污染监管的空间局限性,从而便于管理部门对大气污染进行更精确、更高效的监督与管理。在固体废物处理方面,可以通过大数据技术建立全过程管理平台,提升监管效率(孔云茹,2018),如实时监测生活垃圾桶丰满度,辨认垃圾流,智能管理生活垃圾收集和回收利用(Catania et al.,2014);核准建筑垃圾的清运、处置,实现产生方、运输方、处置方三方监管,提升执法的精准性和有效性(苏文芝,2017);结合大数据和云计算技术有效管理工业固废的产生、运输、回用、处置等环节,实现网上公开、高效交易和有效利用(Bruno et al.,2018;Zhao et al.,2016);基于大数据和物联网技术建成危险废物动态管理系统,对危废车辆进行实时监控,实现危废处理全过程的监管(凌江等,2016)。
生态环境各因素相互联系,数据规模大、动态变化过程复杂,监管难度大。在不同管理要求下,需要对大数据传递的信息进行不同规模和程度的筛选和概化,对数据的专业性、广泛性、应变性和及时性提出较高要求。但是,目前可支撑环境优化管理的数据平台尚不成熟,新兴污染源时空分布数据不全面;不同行业的工业污染排放特征数据尚不充分,特别是对环境影响较大的特征污染物(Xiao et al.,2019),给基于大数据平台的优化管理带来局限性。而且,基于大数据技术的多尺度、多目标污染风险管控与污染防治研究尚处于发展阶段,可供科学决策的系统性数学模型与风险评价体系尚未完善,需要整合多部门数据,进行深度处理与分析,为环境风险与污染管控提供科学决策(Nimmagadda et al.,2017)。
本文通过对前人研究成果的总结与分析,得出以下结论:
(1)大数据技术体系分为数据采集、处理和应用3部分,大数据采集来源主要为地面监测、遥感监测、地理信息、社会统计及网络抓取,大数据处理技术流程为存储、预处理、深入处理及整合挖掘,通过处理获得科学性、融合性和有效性信息,并主要应用于生态环境的监测评价、模拟预测、优化管理3个方面。
(2)大数据技术提高生态环境监测的有效便利性,优化监测数据评价,有利于网格化实时监控生态环境质量、长期跟踪污染“源-汇”以及大尺度、长时段评价生态环境质量。但是,现有大数据技术对多领域、多来源监测数据耦合分析尚不完善,评价效率有待提升,评价中人为主观因素的智能纠错、方法优化的能力尚不成熟。
(3)通过大数据技术与生态环境专业模型整合,能够提高不同时空尺度下复杂环境要素的模拟精度和预测速度,实现动态预警和生态风险评估。但是,大数据预处理技术仍不完善,影响生态环境要素模拟的及时性和准确性,缺乏基于大数据技术的高精度存储、分析和集成模型,缺少更为专业、开放的大数据运行与分析系统支撑庞大的模型库。
(4)大数据技术促进污染的有效溯源与控制,以及多领域全过程监管。但是,目前新型污染时空分布数据和特征污染物排放特征尚未被全面掌握,给基于大数据平台的优化管理带来局限性,基于大数据技术的系统性数学模型与风险评价管理体系尚未完善,影响环境风险与污染管控的有效决策。
中国仍面临突出的生态环境问题,多部门、跨介质污染问题日趋复杂,生态环境的污染防治、管理决策亟需系统优化和全面创新。大数据技术在中国生态环境领域的应用取得一定进展,但仍需进一步完善。
(1)需有效集成多领域生态监测数据,满足政府多源管控需求
生态环境大数据涉及多领域和多部门,如气象、水利、生态、国土、农业、林业、交通、社会经济等,复杂程度高。对于部分同类指标,部门之间采样方案和监测方法存在差异,统计方法和计算标准不一,缺乏有效沟通、整合和统一,给生态环境大数据的跨部门检索、整合与共享带来困难。而且,污染源排放、社会经济、农林交通、土地利用、气象水文均是大气、水(地下水、地表水)和土壤等生态环境要素的影响因子,相互之间紧密联系,多领域数据平台尚未有效集成,互不连通,无法形成真正意义上的“大数据”,给大数据的联动分析、模拟计算、生态环境问题溯源及解析带来困难。今后应推进多领域、多部门的大数据平台集成,优化整合生态环境大数据监测网络,统一数据存储和共享标准,包括监测点位、采样方法、监测指标、分析方法、评价方法以及相关标准,确保历史数据纵向延续性和多部门横向数据可比性,以及多领域监测数据的联系性、经济性和统筹性,形成定位清晰、要素齐全、点位合理的生态环境监测大数据网络,以支撑对多领域、多部门之间数据的有效集成共享。同时,基于多领域大数据平台,开展生态环境要素的评价方法智能优选研究,针对不同管理目标和管理范围,筛选最有效的评价方法和评价模型,满足生态环境多目标、多维度、多尺度的管控需求。
(2)需继续提升数据处理技术能力,充分发挥大数据优势
受应用软件开发滞后、机器集成利用率低、高级技术研发人员缺乏等限制,大数据的处理、分析、挖掘和融合等方面还存在较大不足,中国现阶段生态环境大数据难以在生态环境领域充分发挥优势。随着全球气候变化加剧,灾害天气爆发频繁,生态环境的影响因素和动态变化过程更为复杂,使大数据技术在生态环境领域的精准预测、预报及预警中应用面临挑战,难以满足数据信息化时代的生态环境保护需求。目前虽然有强大的硬件(超算和云计算)支撑生态环境大数据的建设与发展,但受限于专业应用软件开发滞后,大气、水(地表水、地下水)、土壤等相关领域大数据技术发展不平衡,难以充分利用硬件实现对数据的高效处理、优化模拟以及多领域整合,无法充分发挥大数据在生态环境领域的优势。今后有待完善和提升生态环境专业软件的开发水平,将大数据技术和生态环境专业软件有效整合,提升大数据的高效处理、挖掘整合、系统分析能力,不断优化适用于不同条件下的高精度存储、分析和集成模型,实现生态环境多领域、长时段、全流程的精准预测、预报和预警;灵活运用机器学习和人工智能等前缘科技技术,实现大数据技术应用创新,充分发挥大数据优势。
(3)需有效推进大数据应用,提升政府科学决策效果
在生态环境要素中,大数据技术在大气和水环境领域应用相对较为广泛,包括环境质量的跟踪监测、环境污染的模拟与预报预警等,在其他生态环境领域的应用有待深入。噪声大多被应用于监测分析,固废基本应用于回收管理,土壤污染物迁移转化的精准模拟及污染事故的预警预报尚处于初步应用阶段,生态环境遥感监测大多服务于生态环境质量评价和风险评估。而且,各地区生态环境大数据建设与发展不平衡,尚未形成成熟的生态环境大数据体系。今后有待通过生态环境多领域的大数据整合分析,发挥综合应用效果。通过反馈机制优化调整并提升大数据技术应用水平,从而发挥科学决策效果;建立成熟的生态环境大数据综合决策管理体系,推进大数据技术在水环境、大气、固废、噪声、土壤、生态等领域的全面应用和协调发展,促进各区域紧密交流,推进跨区域一体化应用,针对各地环境差异性充分发挥生态环境大数据的作用,提升生态环境科学决策管理水平。