大数据环境下对地震科技情报服务工作的思考*

2016-03-16 23:53张晋辉崔秋文
地震科学进展 2016年1期
关键词:情报服务科技情报台网

张晋辉  崔秋文

(中国地震台网中心,北京100045)



大数据环境下对地震科技情报服务工作的思考*

张晋辉※崔秋文

(中国地震台网中心,北京100045)

摘要大数据时代的到来给地震科技情报服务工作带来了机遇和挑战。从大数据的概念和特点入手,分析了这些机遇和挑战,并结合地震科技情报服务工作的现状,从理念、方法、技术、队伍建设等4个角度提出了地震科技情报服务行业的应对措施。

关键词地震科技情报; 大数据; 思考

引言

随着人类社会从信息时代、知识时代向智能时代的迈进,尤其是互联网和数字化技术的飞速发展,大数据强势来到我们身边,大数据正在改变着政府、企业和社会生活的各个方面[1]。在大数据时代,数据的作用将会前所未有地得到凸显,数据将成为国家竞争、科学研究和行业创新的基础,大数据及大数据技术的发展将对人类生活和生产方式的变革产生深远影响。

与其他行业一样,地震科技情报服务行业也要面临大数据时代带来的机遇和挑战。因为地震资料的内涵是数据,通过数据反映地质结构、地层变化,所以大数据的发展对于地震行业还具有特殊意义。那么大数据有哪些特征,还有哪些技术难点? 如何抓住机遇和迎接挑战,驾驭和利用大数据创造更多价值,将成为我们每个地震科技工作者的重要任务和使命。

1大数据的概念和特点

目前,学界对大数据的定义尚未统一,不同学科和研究领域对大数据定义的角度不同。亚马逊大数据科学家John Rauser将大数据定义为: 大数据就是任何超过了1台计算机处理能力的庞大数据量; 维基百科定义为: 大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合[2]。但是,普遍的认同是,大数据指所涉及的数据量规模巨大,无法通过人工或主流软件工具在合理时间内达到收集、管理、处理和整理,使其成为人们所能解读的信息[3]。

大数据同过去的海量数据又有所区别,其基本特征可以用4个V来总结(Volume、Variety、Value和Velocity),即体量大、多样性、价值密度低、速度快[4-5]。

(1) 数据量巨大。从TB级别,跃升到PB级别。

(2) 数据类型繁多,除了传统的文本格式,还包括网络日志、视频、音频、图片和地理位置信息等各种结构的数据。

(3) 价值密度低。如在1小时的视频监控数据中,有用的数据可能仅仅只有1~2 s。

(4) 处理速度快。数据处理遵循 “1秒定律” ,可从各种类型的数据中快速获得高价值的信息[6]。

2大数据对地震科技情报服务的影响

2.1地震科技情报服务工作现状

我国的地震信息化从20世纪60年代开始,包括物理参数、数据传输的效果和数据的分析等,都围绕着数据进行。我国地震监测工作,从单一的观测发展到由测震、电磁、形变和地下流体等多学科、多测项类别的综合观测体系; 观测技术逐步实现了从模拟观测向数字化、智能化、网络化等方式的转变; 逐步建立了基本覆盖全国及重点区域的地震监测台网[7]。这些监测台站和监测设备每天为我们记录了海量的数据信息,这些数据都汇总到中国地震台网中心,用于进行地震预测和科学研究。

在地震信息化建设的基础上,地震科技情报服务工作近几年取得了丰硕的成果。目前,中国地震台网中心(以下简称“台网中心”)已初步建立了地震科研的文献保障服务体系,成为防震减灾基础性工作的重要支撑部分。数字图书馆已拥有40余种外文原版期刊的全文电子版; 480余种中文地学类期刊的全文检索服务及8万多种中文图书; 5万多篇天文学、地球科学类的博硕论文; 维普、超星、万方等中文电子资源数据库镜像站点[8]。“地震科技档案资料查询系统” 通过地震系统各单位的共建共享,目前已拥有25个单位的35000卷科技档案信息,以及14个单位的47000份资料信息,全面记录和反映了地震监测预报、震害防御以及应急救援工作的成果和进展。

利用这些文献资源,台网中心开展了与地震预测预报工作密切相关的咨询和服务。经中国地震局批准(中震科[1999]109号),自1999年起成立了中国地震局地震科技信息查新咨询站。10多年来,该站为地震科研人员开展了卓有成效的服务。情报研究工作不断向深层次、综合性方向发展,先后实施了 “地震科技快讯” 、“国别政策研究” 、“大震应急和快速信息服务” 、“国际地震科技动态跟踪调研” 、“国外主要灾害应急救援机构和管理体系调研” 、“国际应急管理动态” 、“防震减灾十二五规划编制预研究” 、“地震巨灾应对机制研究” 等项目,追踪报道了上百次国内外发生的破坏性地震的应急调研资料,有关情报研究的专辑、报告和综述对中国地震局有关规划的制定和 “三大工作体系” 建设,具有很好的参考和借鉴价值。

2.2大数据为地震科技情报服务行业带来的机遇

大数据技术已被应用于地震速报、地震应急等防震减灾事业,并已取得了一些实效。如自2013年4月起,台网中心利用手机APP、微博、微信、网站等实现了自动地震速报,并于2015年3月份与大数据服务商 “今日头条” 完成了技术对接,地震台网一旦监测到地震,自动触发和实时处理系统就会自动分析并生成地震速报参数,并利用 “今日头条” 的精准推送引擎在第一时间推送给受地震灾害影响的民众。同样,大数据也为地震科技情报服务行业提供了发展和提升的机遇。

首先,大数据时代,科技相关资源逐渐向数字化转变,为科技情报检索提供了基础。随着数字图书馆和机构知识库的发展,图书和期刊等科技文献资源逐渐被数字化并被保存到各种数据库中,这些资源的数字化使原始文献中的字、词、段落、作者信息、关键词和其他相关信息都能够被精准识别,为搜索引擎的检索提供了便利条件,并可提高检索的效率和准确性。信息只有被数字化,才能释放出其潜在的巨大情报价值。

其次,大数据的用户行为分析能力为我们科技情报服务机构了解和把握用户信息行为提供了可能。如今人们已离不开网络和智能手机、ipad、笔记本电脑等移动终端设备,用户的信息行为产生了大量的数据,通过对这些数据的挖掘和分析可以预判用户的信息行为,为科技情报事业提供了精准把握科研人员及科研机构等科技主体信息行为的潜在机会,这有助于我们根据用户需求提供行业领域科技动态情报服务,而且可以根据信息用户的兴趣爱好倾向,探索个性化、智能化和精确化的情报推送服务模式。

再次,大数据具有强大的预测能力,有利于开展更加精准的科技情报服务。高价值的精准情报服务需要大数据和大数据相关技术的支撑。在大数据环境下,我们可以分析与具体现象相关的更为全面的数据,而不仅仅依赖传统的文献数据,这将大大提高情报分析的准确性,尤其是在预测行业动态方面。

2.3大数据为地震科技情报服务行业带来的挑战

首先,在数据采集方面。大数据是包罗万象的数据,其类型繁多,既包括科技文献、科学实验和日常工作数据,又包括网页、图片、视频、图像与位置信息等半结构化和非结构化数据信息。数据源的多样性增加了我们数据采集工作的难度[9]。

其次,在数据的组织和存储方面。海量数据给软硬件处理能力带来巨大压力。海量地震数据的组织、管理和多维度检索愈发困难,同时老机器无法满足海量数据的处理要求,存储设备投资巨大,更重要的是,在大数据的应用中会遇到存储问题和数据安全问题。

再次,在数据的加工分析方面。以往的科技情报工作在做定量分析时,最常用的是基于结构化数据库的文献计量学方法,而在大数据环境下,还需对各种半结构化和非结构化数据进行挖掘和分析。如何对巨量异构数据进行处理并从中获取有价值的情报,是传统地震科技情报行业的软肋。这就要求我们跨越传统思维,将目光从传统的科技文献、监测数据的加工处理转移到云计算等先进的数据处理技术上。

3大数据环境下地震科技情报服务工作的应对措施

3.1变革理念,突破被动的科技情报服务理念

传统的地震科技情报服务工作大都是上级下达或用户发起的情报服务任务,往往是为了满足领导或用户的情报需求。这种服务理念是被动的,已不能满足大数据时代的情报服务需求。大数据环境下,我们必须变被动为主动,鼓励创新与发展,增强自己的信息服务意识,探索主动式情报服务模式,具体到地震科技情报服务领域,就是要求我们必须嵌入到科研人员的科研工作当中,向科研人员提供主动推送式信息服务,以提高用户满意度和科研效率。情报服务工作不能满足于仅为科研人员、各级领导和职能部门提供科技文献服务和防震减灾信息,同时还应拓展为全社会服务的渠道。

3.2创新方法,建立基于大数据的情报服务方法

以往的地震科技情报研究工作主要采用基于文献和外文资料的编译和整理以及提供科技查新等简单的情报服务模式,在大数据时代,我们需要在应用中不断优化和改进现有情报方法; 由于半结构化和非结构化数据开始进入科技情报研究领域,所以我们必须尝试突破和超越文献,探索基于大数据的支撑地震科学研究的新的情报服务模式。例如,机构知识库融合了机构或组织各种类型的知识资源和智力成果,并提供数据分析和统计功能,我们可以建设机构知识库并基于机构知识库的大数据向科研人员及管理部门提供更高层次的情报分析产品; 同时,可以基于大数据中的用户兴趣模型,掌握用户的信息行为偏好和取向,向用户提供定制化的精准科技情报服务。

3.3发展技术,鼓励大数据技术的发展和应用

大数据要求海量的数据存储与智能的加工处理,对现有的信息存储和处理技术提出了更高的要求,这就要求我们广泛应用先进的技术工具和手段。大数据技术是从大量、多样、分散和异构的数据集中提取有用信息的核心技术,包括实时流数据处理及智能分析技术等。美国麦肯锡全球研究所在 “大数据: 创新、竞争和生产力的下一个前沿领域” 的研究报告中讨论了26项适用于众多行业的大数据分析技术[10],北京大学李广建教授将这些技术划分为可视化分析、数据挖掘和语义处理3大类[11]。我们应该根据地震行业自身的特点,引入大数据技术中的适用技术,如可视化技术和云计算等。可视化技术是对非空间的、非数值型的和高维信息进行视觉表现的理论、方法和技术,已被广泛应用于各种学科领域的情报研究工作中[12]。此外,数字图书馆应广泛利用云计算技术,整合丰富的海量信息资源,为用户提供优质而全面的云服务。

3.4加强培训,建设地震科技情报服务队伍

面对大数据时代带来的复杂的数据环境和情报需求,我们必须建立一支具有大数据分析能力的复合型人才队伍。目前,地震科技情报服务人员多来自图书情报学、外语和计算机科学背景,少量来自地球物理和地质学科,而大数据环境要求我们科技情报服务行业引进具有多学科、多专业知识背景的复合型人才,尤其是计算机和网络技术方面的人才; 同时,应积极为现有地震科技情报服务人员提供特定技术培训机会,完善和丰富他们的知识结构,鼓励他们学习信息检索、数据挖掘及大数据分析技术,加强统计学方面的培训,掌握在大数据平台上进行情报分析的方法和工具。鼓励他们参加课题实践,逐步使他们成为地震科技情报服务领域的咨询专家,使其具备完成大数据时代地震科技情报服务任务的各项能力。

参 考 文 献

[1] 杨鸿智. 数据的征服: 读《大数据时代》. (2013-07-13)[2015-07-12] http:∥blog.sina.com.cn/s/blog_43b0f4b301019p5p.html

[2] 董晓婷. 大数据的定义特征及其应用分析. 硅谷, 2013(11): 120

[3] 王丽梅. 大数据时代下高校图书馆信息咨询服务的探讨. 农业网络信息, 2013(12): 85-87

[4] 杨红平. 基于大数据的公安情报研究. 湖北警官学院学报, 2014(2): 6-9

[5] 晋照丽. 大数据技术在高校图书馆服务中的应用. 农业图书情报学刊, 2014,26(11): 149-151

[6] 彭默馨, 张璐. 大数据时代要有大方略. 学习时报, 2012-07-09

[7] 全国地震监测台站. [2015-08-21]. http:∥www.csi.ac.cn/publish/main/631/1118/index.html

[8] 张晋辉. 中国地震台网中心机构知识库构建方案初探. 国际地震动态, 2013(12): 29-36

[9] 刘如, 吴晨生, 李梦辉. 大数据时代科技情报工作的机遇与变革. 情报理论与实践, 2015(6): 35-39

[10] Manyika J,Chui M,Brown B. Big data: The next frontier for innovation, competition, and productivity. Analytics, 2011

[11] 李广建, 杨林. 大数据视角下的情报研究与情报研究技术. 图书与情报, 2012(6): 1-8

[12] 彭愿. 地震数据的可视化技术. 武汉: 中国地震局地震研究所, 2013

Thinking about earthquake science and technical information service under the background of big data

Zhang Jinhui, Cui Qiuwen

(China Earthquake Networks Center,Beijing 100045,China)

AbstractThe arrival of the era of big data has brought opportunities and challenges to the earthquake science and technology information service. In this paper,we discussed the concepts and features of big data,analyzed the opportunities and challenges,and proposed the measures for earthquake science and technology information service based on four perspectives,including ideas,methods,techniques and team building.

Keywordsearthquake science and technology information service; big data; thinking

中图分类号:P315;

文献标识码:A;

doi:10.3969/j.issn.0235-4975.2016.01.006

通讯作者:※张晋辉,e-mail: zhangjh@seis.ac.cn。

* 收稿日期:2015-10-12; 采用日期: 2015-12-23。

猜你喜欢
情报服务科技情报台网
基于数据工程的国防科技情报生态体系构建
大数据环境下基于分工协作的情报系统构建方法研究
地球物理台网仪器维修信息管理的研究与实现
推进报台网深度融合 做强区级融媒体中心
铜陵市科技情报工作存在的问题与发展对策
高校图书馆情报服务策略
加强科技情报档案管理工作的建议
西藏地震应急流动台网浅析
医院罕见病图书情报服务对策研究
MRG9000媒资卫士在市级电视台全台网的应用