刘菊
摘 要:山西森林生态科学数据共享服务平台,主要以全省范围内10个森林生态定位研究站监测数据为对象,通过资源整合,实现山西省森林生态科学数据的规范化加工处理、分类存储与管理及在线服务。在介绍平台建设目标以及平台系统内容的基础上, 结合森林生态信息采集和利用需求以及数据库技术、信息技术的发展, 对数据库系统架构设计、数据库构建进行了研究。并提出了建立山西森林生态科技数据共享服务平台下一步工作重点构想。
关键词:森林生态;数据;服务平台;山西省
中图分类号:S575 文献标志码:A
森林生态科学数据是林业科技创新的重要基础资源,也是政府部门制定政策、科技管理决策的支撑和保障。实施生态战略以来,林业生态建设迅速发展,森林资源数据、监测数据、科研数据逐级递增。但是由于监测目标、内容、技术和方法的不同,数据多样、异构、多源,不能共享和贯通,形成“山药蛋”式信息孤岛,信息共享和综合分析能力仍然很弱。为了有效地存储、组织、应用、处理、查询、分析、管理、输出、远程发布与共享这些海量数据,需要建立森林生态科学数据共享服务平台。
科学数据共享工程是山西省科技创新体系建设的重要内容之一。山西省森林生态科学数据共享服务平台不仅是山西省大数据战略的组成部分,更是山西森林生态体系建设的重要基础,其对于提高科学数据资源的共享率和利用率,促进社会和经济发展都有重要作用。
1 平台建设概况
1.1 基本原则
平台建设的基本原则是“协作共享,创新机制;强化服务,推动发展;整体规划,分步实施;政府引导,社会参与”。坚持多方共建,利益共享。立足于全社会的科技创新意识和需求,立足于为创新人才服务,运用高效、便捷、经济的多种服务方式和手段,让社会公众都能分享科技进步的成果,为所有从事科技创新活动的人员提供开放和公平的环境。
1.2 建设目标
山西省森林生态科学数据共享服务平台建设的主要目标是:通过专项的稳定投入和支持,使山西省森林生态科学数据共享率和利用率显著提高,推动科技发展,使经济持续增长。解决森林生态科学数据资源的广泛社会共享问题,建设从事平台建设、管理和技术服务的专业化人才团队,构筑促进山西省自主创新的公共研发支撑体系。
2 平台系统
2.1 数据库系统架构设计
2.1.1 系统架构
系统运用面向对象软件编程技术、信息安全与加密技术;系统平台采用B/S构架模式、基于浏览器端的操作方式,实现面向公共数据业务管理、网络协作与信息实时共享;实现电子信息化办公、包括实时发布最新数据信息、推广介绍新技术、智能查询等功能。系统架构如图1所示。
2.1.2 系统分层体系结构
系统总体框架设计自底向上划分为5层,分别為物理层、网络层、数据层、逻辑层和业务应用层。
第一层物理层是整个开放系统的基础。主要是由传感器、移动设备等智能终端支撑的,并采集数据。物理层为数据通信提供传输媒体及设备,为数据传输提供可靠的环境。
第二层网络层负责为分组交换网上的不同主机提供通信。主要是由硬件设备、操作系统、网络环境、系统软件和平台软件等基础设施支撑的。
第三层数据层用于后端数据层的集成。主要包括森林生态数据库(山西省森林生态系统数据库和森林资源数据库)、其他文献资料数据库等数据。海量数据存储于关系数据库中,数据安全性和用户权限控制等功能都凭借其所具备的安全保护机制实现,通过标准SQL语句实现查询。
第四层逻辑层主要包括数据应用引擎、多媒体文件服务引擎等技术支撑环境。该层实现数据库与用户UI界面的连接交互工作。
第五层业务应用层适用于前端用户界面的集成,直接为用户的应用进程提供服务,是体系结构中的最高层。系统采用Web交互模式,主要包括以各种数据为基础的森林生态科学数据平台各个模块功能业务应用实现。组件式结构,互不影响,可插拔。
2.1.3 系统技术及路线
系统采用B/S构架,Web Server采用IIS7.0,中间层采用ASP.NET、分布式关系型数据库、分布式文件存储等技术,数据库平台采用Microsoft SQL Server 2014。
引进了基于云计算的操作系统,极大地改善了应用程序的可靠性和可扩展性,性价比高,开发难度低,对大型Web应用有很好的支持。
2.1.4 云计算
系统服务器采用云服务器Elastic Compute Service(ECS)。云服务器是一种基础云计算服务。使用云服务器ECS便捷、高效。既可以随时扩容磁盘、增加带宽,也能随时释放资源,节省费用。与普通IDC机房相比,其具有以下优势:①可用性。由于其使用的IDC标准、服务器准入标准以及运维标准更加严格,所以可用性很高。②安全性。选择云计算,最关心的问题就是云计算的安全与稳定。云服务器对于用户数据的私密性、用户信息的私密性以及用户隐私的保护有着非常严格的要求。对于原有自建的IDC机房,云服务器专有网络可以拉专线与其连接,形成混合云的架构。③弹性。这是云计算最大的优势。包括计算的弹性、存储的弹性、网络的弹性以及对于业务架构重新规划的弹性,可以使用任意方式去组合自己的业务。
2.2 数据库构建
2.2.1 数据来源
该研究数据资源来源途径主要包括以下3个方面:①已有或调查、监测和实验。象森林生态服务定位站监测数据,生态公益林监测数据,集体林地改革数据。②直接来源于文献资料和国家政府网站。文献资料,指的是象中国(山西)林业统计年鉴、人口统计年鉴等国家机构出版发行的权威文件。国家政府网站,有国家统计局、国家林业局、中国林业信息网等。③专业团队评估、模型预测生成。
将获取数据进行整合、处理和分析,得到3种类型数据:①直接数据。其是指直接可以反应森林生态系统及其服务功能和森林资源状况的数据。包括森林生态系统中水、土、气、生等各类因子的调查、监测和实验数据以及森林资源数据。②间接数据。其是指没有直接体现森林状况,但是与森林有关的数据。人口、社会、经济条件、文化环境(风俗习惯)、政策等都会影响森林发展的方向、规模和质量。这些都属于间接数据。③生成数据。其是指基于直接数据和间接数据,根据国家标准和规范评估生成的数据。此类数据,根据功能不同可分为2类:预测数据和建议数据。预测数据,主要是对森林资源增长的预测、功能、质量的预测等。建议数据,主要是根据评估结果,为政府决策提供数据支撑。
2.2.2 数据特点
①从生态服务功能类型上看。标准数据库除了有涵养水源、保育土壤、固碳释氧、营养物质积累和净化大气环境等多种功能数据,还将有生物多样性保护等相关数据。
②从生态服务功能测算单元看。标准数据库不仅有省级分区数据,还有林分类型数据、林龄组数据、单木数据。
③从尺度上看。现有森林生态服务功能不同时间尺度(按时按日、按周、按月、按年)、不同空间尺度(全省、市、部分县区)的数据,具备了时间和地域的完整性。
④从涉及范围上看。标准数据库不但包括实际数据,还包括生成数据。数据种类,不但包括森林、人口数据,还包括经济、环境、文化数据。不但涉及群体数据,还涉及个体数据。
2.2.3 数据库构建
数据库构建是该平台运行的基础。平台系统采用分布式关系型数据库服务(Distributed Relational Database Service,简称 DRDS)。支持分库分表、平滑扩容、服务升降配、透明读写分离和分布式事务等特性,具备分布式数据库全生命周期的运维管控能力。DRDS的功能概要如下:①分库分表。支持分库分表,在创建分布式数据库后,只需选择拆分键,DRDS就可以按照拆分键生成拆分规则,实现数据水平拆分。②透明读写分离。通过使用 RDS只读实例或者备机实现读写分离,帮助应用解决事务、只读实例或者备机挂掉、指定主备访问等细节问题,对应用无侵入,在 DRDS控制台即可完成读写分离相关操作。③数据存储平滑扩容。当出现数据存储容量和访问量瓶颈时,DRDS支持在线存储容量扩展,扩容无需应用改造,扩容进度支持可视化跟踪。④数据库账号权限体系。DRDS支持类单机账号和权限体系,确保不同角色使用的账号操作安全。⑤分布式事务。DRDS结合分布式事务套件GTS,可以支持分布式事务,保证分布式数据库数据的一致性。⑥监控报警。DRDS支持对核心资源指标和数据库实例指标的实时监控和报警,象实例 CPU、网络 IO、活跃线程等,及时发现资源及其性能的瓶颈。
3 系统功能设计
根据需求分析进行系统功能设计,分为前台在线服务平台门户网站功能设计和后台数据处理功能设计。门户网站的功能设计是面向平台使用或网页浏览者,是用户与平台网站的交互。后台数据处理功能设计的使用者则是平台工作、维护人员,包括数据和数据库的操作和管理、用户管理和数据展示等。
3.1 数据和数据库管理
3.1.1 数据安全管理
数据安全管理主要包括数据共享安全管理、用户安全管理、权限管理和配置管理。
数据共享安全管理,主要是指对数据的保密程度和共享级别进行设置以及对用户的保密协议的制订。
户用安全管理,指对所有用户的分类管理,包括一般用户、注册用户和协议用户,需要强调的是所有用户均需要进行网站注册。统计、分析用户数据资源下载量;对定制定单服务进行统计和管理,对用户进行访问、用户行为进行跟踪和分析。
权限管理的对象是平台管理人员。配置管理主要是指对系统初始值进行设置。
3.1.2 数据(库)管理系统
数据管理系统主要是对数据进行编辑,包括对数据的添加、修改和刪除管理。
数据库管理系统包括数据库存储结构和更新管理、日志管理、数据库备份与恢复等。数据库存储结构管理指对数据库文件(组)的管理。数据库更新管理主要包括数据库的创建、修改和删除。数据的编辑和更改保留于日志里。数据库备份与恢复,包括设计备份和还原策略、管理备份及执行恢复操作。
3.1.3 数据检索查询系统
根据数据信息的检索特点和用户使用习惯,在遵循有关国家标准的基础上,对数据进行分类。该研究可实现以下查询功能:一是森林资源数据查询。提供森林生态系统服务功能数据、森林生物量和生产力数据、森林资源及其空间分布、森林立地条件及其空间分布数据,能够直观地确定森林分布及林分状况。二是生成数据查询:提供森林生态服务功能量化模型库及参数库,选定合适参数通过数值模拟给出模型生成数据,即森林生态数据的拟合或预测、评估数据。根据生成数据,定量评估山西省森林生态服务功能,提供森林生态系统碳汇、森林生物量及生产力数据,为山西林业实现生态效益向经济效益转变提供数据支撑。三是人口、经济、林业政策等数据查询:提供国家林业政策、山西省林业政策信息查询;提供有关于林业发展的人口、经济、环境等数据查询。
3.1.4 平台展示系统
平台展示系统主要包括森林生态数据在门户网站浏览器的分类、分级显示,用户信息统计数据的显示等。
3.1.5 扩展接口系统
扩展接口系统主要为系统扩展或者在接入山西省科技基础平台网站时使用。
3.2 平台功能模块的展现
综合考虑山西省科技数据共享工程的总体要求和山西省森林生态科学数据共享的特点,该研究平台的基本功能包括4个方面,即数据的浏览,数据的检索和查询,数据的发布和数据访问。这些功能主要由前台在线服务平台门户网站和后台功能模块来共同体现,见表1。
4 工作构想与计划
在平台建设过程中,要始终加强网络环境建设。平台研究下一阶段工作重点构想:①对森林生态资源进行资源调查、分析和规划。②组织平台优化设计、建设和运行维护管理所需政策、标准和办法的制定与实施。③对关键技术的研究与开发,相关软件系统或专利的申请。
参考文献
[1]吕岳东.基于本体的科学数据集成与共享方法研究[D].太原科技大学,2010.
[2]邢文明.我国科研数据管理与共享政策保障研究[D].武汉大学,2014.
[3]李明禄.面向TB量级海量空间信息的存储管理系统[J].应用科技,2009(1):6.
[4]张乃静.基于林业科学数据的语义检索研究[D].中国林业科学研究院, 2013.
[5]肖雪葵.关于湖南省科技信息与科学数据共享平台建设的研究报告[J].科技进步与对策,2007,24(2):124-127.
[6]成建国,钱峰,艾萍.国家水利数据中心建设方案研究[J].中国水利,2008(19):32-34.
[7]阿里云.云服务器 ECS -产品简介[DB/OL]. https://help.aliyun.com/document_detail/25367.html?spm=a2c4g.11174283.6.541.773452feZI9mkO., 2018-08-14.
[8]阿里云. 分布式关系型数据库 DRDS-产品简介-DRDS概述[DB/OL].https://help.aliyun.com/document_detail/29659.html?spm=a2c4g.11174283.6.539.eJt3iC., 2017-12-11.
[9]李代平, 章文. SQL SERVER 2000 数据库应用基础教程[M].北京:冶金工业出版社, 2001: 328.
[10]逯燕玲,戴红,李志明.网络数据库技术[M].北京:电子工业出版社,2009:85-104.
[11]魏海林,易宏,吴文文,等.林业科学数据共享湖南分中心平台的设计与实现[J].林业科技通讯,2008(8):33-35.