张 毅,贺桂珍,吕永龙,马艳飞,宋 帅,*
1 山东理工大学农业工程与食品科学学院, 淄博 2550492 中国科学院生态环境研究中心,城市与区域生态国家重点实验室, 北京 1000853 山东理工大学资源与环境工程学院, 淄博 255049 4 中国科学院大学, 北京 100049
生态环境大数据是大数据的一部分,具备大数据的一般特征[10]。一般来说,生态环境大数据是指运用大数据理念、技术和方法,解决生态环境领域数据的采集与存储、计算与应用等一系列问题,是大数据理论和技术在生态环境领域上的应用和实践[11]。早在20世纪中叶,生态环境领域就已出现“大数据”思想,以国际地球物理年(1957—1958)和国际生物学计划(1964—1974)为代表的大科学研究目前已演变成收集和存储海量生态环境观测数据的生态系统研究网络[12-14]。另外,生态环境大数据在生物多样性保护领域和大数据平台建设方面也得到快速发展,例如,为帮助科学家准确掌握全球热带森林的生物多样性丧失情况,2012年惠普公司在惠普地球观察项目中利用Vertica分析平台对全球高达3兆兆字节的生物多样性和气候数据进行了系统分析[10];微软、谷歌等美国IT企业为加速生态领域的大数据平台建设,向政府和公众提供了全球最先进的服务器、数据库和存储设备。
虽然大数据的概念早已存在,但直到2013年大数据才开始在我国逐渐展开,战略性文件《关于促进大数据发展行动纲要》于2015年8月开始实施,意味着大数据上升到国家战略层面。同时,国家高度重视大数据在推进生态文明建设中的地位和作用,2016年3月,我国环境保护部率先发布了《生态环境大数据建设总体方案》(简称《方案》),这不仅为环保系统开展生态环境大数据建设提供了强有力的政策支持和技术框架[15],也为新常态下环境管理转型规划了一条路径。《方案》实施2年来,从中央到地方,各级环保部门纷纷开始探索生态环境大数据建设的实践,与此同时相关专家针对生态环境大数据的建设也开展了不同层面的研究[16- 19],但目前对各级环保部门的《方案》落实情况尚不明确,尤其在生态环境数据资源整合共享、生态环境科学决策、生态环境监管模式、生态环境公共服务、大数据平台及大数据试点方面的落实情况缺乏系统、深入的剖析。因此,笔者针对我国环境保护部门落实《方案》的具体情况进行调查,全面评估生态环境大数据建设方案的实施及数据公开效果,以期为继续推进生态环境大数据建设提供决策支持。
《方案》仅涉及到环保领域内的大数据建设规划,因此本次调研主要关注环保系统的生态环境大数据建设,而其他部门的大数据建设不予考虑。本次调研主要通过访问各环境保护厅/局的门户网站来了解有关生态环境大数据的建设情况,并根据《方案》中的主要任务,从机构建设、制度建设、数据整合共享、数据公开、环保云平台建设和大数据应用6个方面对各环境保护厅/局的生态环境大数据建设情况进行客观评估。运用文献研究、专家访谈等方法,建立如下评估方法体系(表1),此处并未对评价进行分级或打分,主要是对目前生态环境大数据的建设情况进行了客观呈现。调研对象为我国31个省/市/自治区、27个省会城市和6个大数据建设试点城市的环境保护厅/局。调研时间为2018年7—8月。
表1 我国生态环境大数据建设客观评估项目和内容
从组织领导机构建设情况看,有44个(百分比为68.75%)环境保护厅/局成立了生态环境大数据建设工作推进小组(表2),而其他20个(百分比为31.25%)并未见到成立生态环境大数据建设领导小组的报道。在负责生态环境大数据建设的工作机构方面,环境保护厅/局作为环境信息的主管部门,有51个(百分比为79.69%)都是厅/局直属单位环境信息中心作为生态环境大数据建设的负责协调机构,有10个(百分比为15.63%)为环境监控中心,而贵州为电子政务中心,拉萨和乌鲁木齐不明确。
表2 我国生态环境大数据机构建设统计情况
从工作人员的安排和配备情况看,25个(百分比为39.06%)环境保护厅/局有专职人员,24个(百分比为37.50%)有兼职人员,15个(百分比为23.44%)环境保护厅/局配备人员情况未知。在大数据建设培训方面,有33个(百分比为51.56%)开展过生态环境大数据相关研究的人才培养,而其他31个(百分比为48.44%)未见开展专门培训的报道。
图1 截至2018年8月调研的64个环境保护厅/局生态环境大数据制度建设情况Fig.1 Institutional construction of eco-environmental big data by 64 environmental protection bureaus by August 2018
为了实施《方案》和响应国家大数据战略,目前有34个(百分比为53.13%)环境保护厅/局编制了本部门的生态环境大数据建设整体规划(图1),例如贵州省“十三五”环境保护大数据建设规划的制定有效提高了贵州省生态环境保护综合决策、监管治理和公共服务水平。但多数大数据建设整体规划基本是按照《方案》的体例和格式编制,有些地方直接复制了相关的条款。
生态环境大数据的类型、来源和格式具有复杂多样性[20],因此数据标准的统一就尤为重要。截至调查时,已有38个(百分比为59.38%)环境保护厅/局按照环境保护部信息中心编制的《环境专题空间数据加工处理技术规范》、《环保物联网总体框架》等文件制定了统一的数据标准和规范。例如,内蒙古自治区环境保护厅作为生态环境大数据建设的试点单位,目前已初步建立资源目录体系,共9大类,109小项;江苏省环境保护厅针对资源目录、安全体系、数据交换、系统建设标准和项目建设管理五大类,建设了53项标准规范,包括资源目录11条,安全体系2条,数据交换9条,系统建设14条,项目管理14条。
肾移植术后他克莫司联合五酯胶囊致1例高钾血症………………………… 杨 婧,杨 辉,刘丽宏(2·150)
为了规范生态环境数据的采集、存储、共享和应用,有37个(百分比为57.81%)环境保护厅/局制定了数据管理制度,例如,2016年福建省发布的《福建省政务数据管理办法》对数据采集、登记汇聚、共享开放等提出了具体要求。为了保障大数据自身安全和大数据技术安全,有24个(百分比为37.50%)环境保护厅/局制定了统一的安全管理体系和运维体系,其他环境保护厅/局未见报道大数据信息的安全管理。
我国的生态环境建设经过“十二五”时期的快速发展,建成了大量纵横相连的环保业务系统,可由于各业务数据标准格式和技术路线不统一,导致现实中出现了不同程度的数据割据,形成了“数据孤岛”[21]。大数据的核心是数据资源,数据难以全面整合共享一直是制约大数据发展的突出问题,没有数据共享,就不能形成大数据。因此,数据整合共享是开展生态环境大数据建设的前提和基础。在环保系统内部数据资源的整合共享上,有48个(百分比为75.00%)环境保护厅/局已建成环境数据资源中心,在数据资源上逐步整合了环境统计、污染物普查、环境质量、排污许可、环境监测、监察执法、应急指挥、核与辐射等业务数据,并形成了各业务部门间的信息资源共享,加强了各个部门间的业务协同力度。
生态环境具有多样性和复杂性,与生态环境相关的数据众多,因此我国生态环境大数据不仅仅分布在环保领域,还包括水利、林业、国土、气象、交通、生态、规划等其他部门的大数据,涉及多领域、多部门和多源数据。只有不同类型的生态环境大数据相互连接、碰撞和共享,才能释放生态环境大数据的价值[15],因此要想挖掘大数据背后的潜在价值,打通环保系统以外的生态环境数据资源链接通道是关键,也是实现“数据真正在一起”的前提和基础。截至调查时,已有22个(百分比为34.38%)环境保护厅/局通过政府公用网站实现了多领域、多部门和多源数据的整合共享(图2)。根据数据统计显示,北京作为最早上线的城市目前已整合了55个部门约7653万余条数据,并形成1087类数据集。贵阳整合的数据集更是达到2758类,整合共享数据数量较多的还包括贵州、上海、青岛、广东等地(图3)。此外,重庆市环境保护局还与重庆公安局签订了数据资源共享合作协议,双方通过电子政务外网开展信息资源共享工作,内蒙古自治区环境保护厅通过共享协议方式实现了与自治区国土资源厅地理信息的共享与交换,而其他42个(百分比为65.63%)环境保护厅/局不明确(未得到相关信息)。
图2 截至2018年8月各省、市数据整合情况Fig.2 Number of data integration by environmental protection bureaus by August 2018
图3 截至2018年8月各省、市数据整合的区域数量分布情况 Fig.3 Regional quantitative distribution of data integration by environmental protection bureaus by August 2018
截至调查时,有41个(百分比为64.06%)环境保护厅/局的政府信息公开目录里包含环境数据目录,例如,贵州省环境保护厅的政府信息公开目录里有环境质量状况、污染源环境监管、辐射安全、环境影响评价等环境数据目录。然而所有的厅/局没有专门公布关于生态环境大数据的开放清单。
在生态环境数据公开平台建设方面,有45个(百分比为70.31%)环境保护厅/局依托本部门网站建设了环境数据公开平台(图4)。为了更好的评估平台的建设情况,将从公开内容、数据时效性和平台使用的方便性三个方面进行评价,每项指标通过很好、较好、一般、较差、很差这样5个档次来赋值,并把相应赋值定为5、4、3、2、1。最终有7个环境数据公开平台得到13分,12个平台获得12分,17个平台得到10分,9个平台获得8分,其中河北省生态环境信息综合发布平台的空气自动站、河流断面水质和饮用水源地的数据资源无法查看,只能查看自然保护区的信息。
图4 截至2018年8月64个环境保护厅/局数据公开平台建设情况Fig.4 Construction of environmental data disclosure platforms by 64 environmental protection bureaus by August 2018
按照《方案》要求各级环保部门要优先向社会开放生态环境监测数据、环境质量数据、风险源数据、自然生态数据和监察执法数据。其中在生态环境监测方面:有60个(百分比为93.75%)环境保护厅/局实时发布了空气质量新标准六项指标监测数据和AQI值,26个(百分比为40.63%)环境保护厅/局发布了近岸海域水质监测数据,46个(百分比为71.88%)实时公布了集中式生活饮用水水源地水质监测信息,江苏省环境保护厅更是将全省107个县级及以上城市集中式饮用水水源地监测信息统一公布在厅门户网站上,并列出了每个水源地的达标情况。在环境质量方面:有57个(百分比为89.06%)环境保护厅/局按时发布了环境状况公报、水质月报、空气质量月报等环境信息,34个(百分比为53.13%)公布了重点污染源信息。在风险源方面:有54个(百分比为84.38%)环境保护厅/局通过环境状况公报公开了核与辐射、固体废物等风险源数据。在自然生态方面:有24个(百分比为37.50%)环境保护厅/局发布了自然保护区、生物多样性、生物环境状况和生态环境状况等自然生态数据。在监察执法方面:有37个(百分比为57.81%)环境保护厅/局公布了环境违法、处罚等监察执法数据,监察执法涉及内容方面,主要包括污染物超标排放、危险废物非法处置、治污设施不正常运行、私设暗管违法排污、建设项目环保违法违规等方面。
2016年和2017年分别有55个(百分比为85.94%)和57个(百分比为89.06%)环境保护厅/局报告了公开的环境数据量(图5)。2016年主动公开环境质量、建设项目环境影响评价、污染源环境监管、国家重点监控企业污染源监督性监测信息和污染减排、核与辐射等方面的环境数据量为702—18263条,2017年公开的环境数据量为300—26630条。总的来说,2017年环境数据公开的数量要多于2016年,其中作为生态环境大数据建设试点单位的贵州省环境保护厅2017年公开的环境数据数量达到26630条。北京、广东、重庆、山东、江苏等环境保护厅/局公开的环境数据数量也较多(图6、图7)。
图5 各省、市环境保护厅/局2016和2017年公开环境数据数量Fig.5 Number of environmental data for disclosure by environmental protection bureaus in 2016 and 2017
图6 2016年各省、市环境保护厅/局公开的环境数据区域数量分布情况Fig.6 Regional quantitative distribution of environmental data for disclosure by environmental protection bureaus in 2016
图7 2017年各省、市环境保护厅/局公开的环境数据区域数量分布情况Fig.7 Regional quantitative distribution of environmental data for disclosure by environmental protection bureaus in 2017
大数据环保云平台是《方案》总体架构中的首个建设平台,无论数据整合共享还是数据应用都要以环保云平台的建设为前提。截至调查时,福建、江苏、江西、内蒙古、广西、贵州、贵阳等17个(百分比为26.56%)环境保护厅/局已建成或正在建大数据环保云平台,而其他47个(百分比为73.44%)环境保护厅/局并未见到环保云平台建设情况的报道。例如,2018年4月福建环保云平台正式上线,该平台整合了来自省、市、县三级环保系统及气象、水利、国土、电力、交通等其他厅局的海量生态环境数据资源,并在此基础上构建了环境监测体系,目前已接入167个大气环境质量监测点、87个水环境质量监测点、21个核电厂周边监测点、998个污染源在线监测点等,实现了对大气、水、土壤、核与辐射等要素的统一动态监控。江苏省环境保护厅依托物联网、云计算和移动互联网等信息化技术,建立了以环保云为代表的大数据监管平台,该平台实现了全省生态数据的统一汇聚,共整合了环境质量、污染源、环境影响评价、核与辐射等11个领域的数据资源,其中接入数据库表5300多张、数据量10亿条,包含结构化数据1.2 T、非结构化数据1.8 T,并初步构建了数据质量监控体系。
大数据的潜在价值最终体现在大数据的应用上,截至调查时,有15个(百分比为23.44%)环境保护厅/局已建成或正在建大数据决策支持应用服务。例如,上海市环境保护局通过对基础数据(执法部门、人员等)、执法责任制数据、执法监督数据和监察执法案件数据进行采集,建立了监察执法决策数据中心,借助该决策中心可以对处罚案件量、部门职权履责情况等进行实时分析,实现了环境监管精准化、综合决策科学化。
我国生态环境大数据的研究起步较晚,《方案》也仅涉及到环保系统大数据的建设规划,遥感大数据的获取与建设并没有在《方案》中得以体现,另外遥感大数据也存在数据收集标准不统一、质量参差不齐和数据共享困难等问题,因此截至调查时,我国31个省/市/自治区、27个省会城市和6个大数据建设试点城市的环境保护厅/局更多的是对环境大数据进行建设与应用。但是随着我国生态环境问题的日益突出,生态环境监测与管理方面越来越需要遥感大数据发挥其独特作用,针对这种情况,环境保护部已于2018年4月正式启动生态环保遥感大数据应用建设项目,这无疑将会推动未来几年各级环保部门在遥感大数据方面的建设进展。另外,为了能够对自然资源和生态环境保护状况开展全天候监测,现如今环境保护部基于卫星遥感等技术手段已初步建成综合资源环境遥感监测平台,并用于构建生态环境监测网络体系。
环保部门还开展了生态环境大数据在空气质量预测方面的应用。例如,生态环境部信息中心联合微软共同开发了城市局地大气主要污染物时空分布大数据模型—U-Air系统,通过获取地面监测站的空气质量数据,并结合交通流、道路结构、气象条件等数据,实现了1 km×1 km的高精度空气质量预报;天津综合信息平台通过对全市16个区县的大气污染防治信息进行整合,实现了大气数据的互联互通,该平台在分析预测天津市总体空气质量状况的同时还可以实时显示全市的AQI指数;IBM中国研究院基于认知计算模型,实现了对我国367个城市的精细化监管,可以分析预测长达7—10 d、城市细粒度1 km×1 km范围的空气质量。
《方案》实施两年来,我国生态环境大数据建设在数据资源整合共享上实现了突破,各级环保部门逐渐整合了大气、水、土壤、核与辐射、建设项目环境影响评价、生态、监察执法、应急等业务数据,另外国家层面也已出台数据交换规范和数据资源目录标准体系,打破数据孤岛不再是纸上谈兵,但我国生态环境大数据建设还尚在起步阶段,在管理与应用等方面存在很多不足,具体表现在如下几个方面:
(1)生态环境大数据建设在各地不同步,空间上存在较大不平衡。总的来说,贵州、吉林、江苏、内蒙古自治区、武汉和绍兴环境保护厅/局作为我国首批6个生态环境大数据建设试点单位在生态环境大数据建设上(制度建设、数据公开、环保云平台建设等方面)要领先于其他环保厅/局,与此同时东部沿海地区要好于西部地区,特别是数据公开平台建设方面,这说明了发达地区和落后地区在技术和资金支持方面存在差别。
(2)机构设置不完善。环境保护厅/局没有专门负责数据搜集、处理的部门和制度,环境信息中心定位仅仅是管理规划和技术支持,没有达到环境数据搜集-处理-公开-技术支持一体化管理的要求。
(3)数据共享程度不高,数据公开范围较窄。虽然环保部门逐步整合了环保领域内的生态环境数据,但只有很少的环境保护厅/局整合了气象、国土、水利、农业、交通等其他部门产生的生态环境数据,没有完全实现数据共享,数据资源得不到充分利用。另外,风险源、自然生态等数据没有完全向公众开放,数据公开范围较窄,涉及到军方的一些生态环境数据由于担心信息安全问题也无法向公众开放。
(4)大数据应用活力不足。政府运用生态环境大数据的能力较低,虽然很多环境保护厅/局建成了数据资源中心,但这些数据只是用来做一些简单的统计和报表,数据没有真正“开口说话”。与此同时,生态环境大数据的应用目前只在空气质量预测方面取得进展,而在农业、交通、水利、国土等各部门的应用才刚刚起步,跨领域的应用更是寥寥无几。
鉴于我国生态环境大数据在建设过程中存在的不足之处,未来几年生态环境大数据建设迫切需要开展以下研究:
(1)建立支撑生态环境大数据发展的组织机构,实施环境数据搜集-处理-公开-技术支持一体化管理,扩充环境信息中心的相关职能,除信息化规划、环境信息网络的建设和维护外,还应纳入数据收集、处理、传输、存储、加工和共享等职能。
(2)加快建设生态环境大数据平台,按照大数据管理及标准,继续整合环保系统各业务领域的数据资源,并通过共享协议的方式推动与水利、国土、气象、电力、规划等相关部门的数据共享,实现生态环境数据的互联互通。
(3)加强国际交流,使我国生态环境大数据建设与国际接轨。美国作为生态环境大数据建设的领航者,其环境应急处置、生态环境数据管理制度、监测预警、环境数据分析模型等方面的先进技术值得借鉴,建议借助国际环境合作平台,开展生态环境大数据合作,实现我国生态环境大数据与国际同类生态环境大数据平台的对接。
(4)全面推进大数据共享与应用,梳理大数据重点发展和应用领域,加快环评、监测、应急、执法和网站等5个领域的大数据共享与应用,充分发挥大数据的潜在价值。