浅谈大数据分析在生态林业上的运用

2015-03-27 11:25蓝学韦绪覃德文
经济研究导刊 2015年6期
关键词:生态林业大数据

蓝学 韦绪 覃德文

摘 要:随着大数据时代的来临,生态林业、森林培育、森林经营等方面的应用,基于森林资源云计算的数据处理与应用模式,通过数据的整合共享,交叉复用,形成的智力资源和知识服务能力。基于大数据发展动态,大数据的性质和趋势、林业部门的大数据应用三个方面,对大数据、云计算、物联网等进行系统讲解,深入分析当前信息化前沿技术的发展现状与趋势,结合生态林业民生林业的建设目标,阐述如何利用大数据为林业现代化服务。

关键词:大数据;生态林业;民生林业;林业现代化服务

中图分类号:F124.5 文献标志码:A 文章编号:1673-291X(2015)06-0055-02

大数据的兴起(作者是英国《经济学家》杂志数据编辑肯尼思·内尔·丘基尔、牛津大学互联网研究院互联网管理与法规教授维克托·梅耶—舍恩伯洛)[1]。近二年,大数据运用于生态林业风头正劲,一时之间成为生态林业热门主题。什么是大数据生态林业目前还没有统一的定义。但是不能否认的是,互联网和移动互联网使得数据量陡然变大了很多,而云带来的计算能力的变革,使得处理这些大数据成为一种可能,也使得云计算有了新的实用价值,还有更大的市场等着林业工作者去发现。

一、大数据的意义与内涵

每个人都知道互联网改变了企业经营、政府运作以及人们生活的方式。但是一种新的、不那么明显的技术趋势却有着同样巨大的变革能力,那就是“大数据”(BigData)。大数据的趋势发端于下面这个事实:如今到处传播的信息比以往任何时候都多出了许多,而且这一趋势正在应用于非同寻常的新用途。大数据与互联网截然不同,虽然互联网使数据的收集和共享方便了很多。大数据的意义并不仅仅是通信:其本质是我们可以从大量的信息中学习到从较少量的信息中无法获取的东西。

二、国内外发展动态

在公元前3世纪,亚历山大图书馆被认为收藏了全部的人类知识。而如果把今天全世界的信息平分给每一个活着的人,那么每个人拥有的信息量将足足超过当年亚历山大图书馆全部藏书的320倍。如果把所有这些信息刻到光盘上并且分5摞叠起来的话,那么这些光盘可以一直堆到月球。而大数据的特征是它能够用数据来表现世界的众多层面,而这些层面以往从来都没有被量化过—这种特征可以被称为“数据化”[2]。

在国内,第七次全国森林资源清查暴露的问题也令人警惕——清查五年间隔期内,林地转为非林地的面积数字有所上升,形势十分严峻,但这些逆转的林地主要发生在哪些地区?数据之大、复杂性是林业各个岗位上难以完成的严峻工作。但《全国林地保护利用规划纲要(2010—2020年)》提出了大数据分析应用于林业生态统计,是林业有史以来可及时动态监测、及时决策的最全面、最细致、最先进的一项措施。大数据统计了全国林地,归类成为了一张简单的分布地图,是高分辨率的遥感影像,全国林地落界数据、二类调查资料,基础地理信息等多源数据集合,以林地界线为核心内容,构建的全国统一的林地资源管理系统[2]。为国家林业局各业务司局提供数据支撑服务,将推进在森林经营、工程建设、森林防火等业务上的应用提供了便利。

三、林业运用上的特点

大数据分析要求林业工作人员在三个方面彻底改变对数据的态度:第一是收集和使用大量数据,而不是像统计学家们在过去一百多年里所做的那样,只满足于少量的数据或样本。第二是抛弃林业工作者对有条理和纯净的数据的偏爱,转而接受杂乱无章——在越来越多的情形下,少许的不精确是可以容忍的。第三,在许多场合,我们需要放弃对事情原委的追究,而代之以对相关性的接纳。利用大数据,而不是试图弄懂发动机抛锚或药物副作用消失的确切原因,研究人员可以收集和分析大量有关此类事件的信息及一切相关素材,找出可能有助于预测未来事件发生的规律。大数据有助于回答是什么、而不是为什么的问题——通常有这样的回答就足够了。

中国林业大数据处理需要建立完整的数据库整合和新建了林业政策法规库、历年统计数据库、林业年鉴库、林业发展报告库、自然资源和地理空间库、林业档案库等多个专题数据库,内容丰富,查询便捷,是信息化服务林业的又一重要成果。中国林业数字图书馆依托国家林业局内外网平台建设,将为林业行业提供丰富的图书、期刊、论文等信息资源,为林业职工和广大公众提供更好的服务。国家卫星林业遥感数据应用平台作为林业行业提供遥感基础数据、数据处理平台、数据产品发布平台将大幅提高林业遥感应用水平。林业综合办公系统群将把国家林业局机关和直属单位纳入统一的办公平台中,真正实现办公一体化。丰富了林业数据云的内容,增强了林业信息服务能力,将促进林业发展更上一层楼。

四、大数据分析在林业应用上存在的问题

生态林业数据资源和时间、空间资源有很大的不同。如何对林业资源变更数据带来便利,但是数据却不是这样,并不是给你越多的数据对数据统计分析将会增加复杂系数。目前来看,越来越多的大数据分析会给林业生态资源的统计带来越来越大的麻烦。因此我们必须找到一个解决这个问题的办法,一种是统计学的方式,另外一种是计算的方式。统计学方式可能更微妙,所以林业工作者更需要正视大数据分析造成的弊端。

1.现在问题就是我们需要指数级的列和行增长的组合方式,随着行数和列数的线性增长,我们考虑的数据就会呈指数倍的增加。我们来举一个生态林业方面的案例,把列设想成人工林的信息—1是人工林,0是天然林;但是有一些列所描述的情况能够很好地预测人工林的发生。假设如果东北平原地区分布,地势平坦,光照充足,雨水充沛,适合进行人工林种植。如果在青藏高原等地区,由于地势较高,天气温度变动较大,且林地土地瘠薄,适合进行人工林的种植。这当然是个假设。任何指令集里面都需要看这些数据,进行论证,找到有意义的模式。但当数据变得越来越大,找到有意义的模式和信息变得越来越难。所以,大数据并不是非常好的事情,并不是有更多的数据就会获得更多的知识。大数据其实才是最大的麻烦。现在来看数据越来越难转变成知识,如果我们想要获得真正有意义的东西,我们需要采取一些行动。我们生态学家、林学家非常担心:如何区分各个物种间的DNA数据,如何高效对DNA数据进行归类[3]。统计学上的程序和算法,必须运行在计算机上。大的数据会花更多的时间运行,使我们不能快速地做决策了。真正有大问题的时候,我们不知道如何解决和运行统计的程序,做出快速的决策,因此我们发现了第二个解决方案。第一个是统计学上,第二个是计算方面。

2.第二个就是计算方面,算法需要时间运行,还要登录、输出等,需要几秒钟的决策,比如在线的拍卖需要几秒钟做决策,我们还需要给予一些林地种类、生长情况的数据,比如说统计马尾松蓄积量的输出的算法。当数据变多,这种方法可能会完成不了,或者是需要很多的运行时间,这是我们要怎么做?要把舍弃掉四旁树和零散种植树种。还是舍弃会造成怎样的误差。能使我的林业资源数据库空间增加,如果我不断地删除原始的数据,更新林业资源动态数据。我应当让数据运行慢一些,但是这样就会使处理的时间过长。我们面临很大的问题,我们将树木生长时间时间、物种分布空间与数据、不断增长的数据规模结合在一起,如果没有很好地处理这些大数据的扩展算法。这确实是一个存在的问题,我认为这个问题是根本且基础的。

五、大数据分析在林业上应用的措施

林业资源大数据分析的理论核心就是数据挖掘算法,各种林业资源数据挖掘的算法基于不同的物种数据类型和格式才能更加科学地呈现出数据本身具备的特点,也正是因为林业资源变更数据被全世界统计学家所公认的各种统计方法(可以称之为真理)才能深入数据内部,才能体现大数据分析的便利。首先,大数据林业内涵与重要意义,包括大数据林业内涵特征、产生背景、关系分析、关键技术、新观念分析;第二部分是大数据林业总体发展思路,包括大数据林业战略定位、基本思路、基本原则、建设目标、总体架构;第三部分是大数据林业的主要任务与重点工程,包括加快建设大数据林业立体感知体系、大力提升智大数据林业管理协同水平、有效构建大数据林业生态价值体系、全面完善大数据林业民生服务体系、大力构建大数据林业标准及综合管理体系;第四部分是大数据林业推进策略,包括大数据林业推进路线图、保障措施。

数据化是大数据的基础。在生态林业资源动态变化中,数字化和数据化大相径庭。“数字化”指的是将生态林业资源变动中产生的信息、森林演替所产生的资源或环境变化的轨迹转换成电子数据存入数据库的过程;而“数据化”则是指在数字化的基础上,利用数据来对森林变更进行描述,使之能同时被人和计算机所理解的结果[4]。生态林业资源信息大量数据来自于不同来源、数量庞大的结构化与非结构化数据群,大部分都不能直接用于预测和分析。而通过对数据有效的组织,能将大量来自不同源的异构数据量化组合,形成森林资源据化、森林类别数据化、生态资源使用量的数据化、森林属性数据化等在信息化服务中管理者比较关心的数据化形式。数据化是将数据从无序到有序的加工阶段,数据化的最终成果是将森林数据对象属性量化,构建数据挖掘和服务的基本对象,简化数据分析和利用过程。

六、展望大数据分析的应用

大数据是一种资源和一种工具。它的目的是告知,而不是解释;它意在促进理解,但仍然会导致误解——关键在于人们对它的掌握程度。我们必须以一种不仅欣赏其力量,而且承认其局限的态度来接纳这种技术。大数据林业就是在数字林业的基础上,全面应用云计算、物联网、移动互联、大数据等新一代信息技术,使林业实现智慧感知、智慧管理、智慧服务。通过大数据林业建设,形成信息基础条件国际领先、生态管理与民生服务质量明显提高、林业产业结构与创新能力优化发展的现代化模式。

参考文献:

[1] 维克托·迈尔·舍恩伯格.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.

[2] 郭建斌,秦向华,万志红,等.大数据时代林业科普信息化发展研究[J].经济师,2014,(9):40-41.

[3] 覃德文,云朝光,秦武明,等.PCR技术发展状况研究[J].林业实用技术,2013,(6):6-8.

[4] 卢庸,覃德文,韦中绵,等.麻栎人工林经济效益分析[J].南方农业学报,2014,(7).

[责任编辑 刘娇娇]

猜你喜欢
生态林业大数据
大数据环境下基于移动客户端的传统媒体转型思路