周晓英+刘莎+冯向梅
(1.中國人民大学信息资源管理学院 北京 100872)
摘 要:文章从信息-技术-人三个方面分析了大数据对情报学带来的影响,以及数据提取知识的大数据应用目标与建立人与知识间关联的情报学目标之间的关系。通过对美国国立卫生研究院的BD2K大数据项目的案例分析,从信息-技术-人的维度、数据生态系统建设以及数据素养提升三个方面,提出了情报学的大数据应对策略。
关键词:BD2K;大数据;情报学;信息-技术-人;信息链;应对策略
中图分类号:G250.2 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017030
1 引言
大数据是近五年来我国情报学的研究热点,在中国知网的“图书情报与数字图书馆”子库中以“大数据”作为主题搜索,能够检索到2183篇论文,其中2013年之前只有零星的论文,2013年之后每年以约300多篇的速度增加(见表1)。以“大数据+影响”为主题搜索,能够检索到317篇论文,以“大数据+策略”为主题搜索,能够检索到278篇论文(截至时间为2017年2月10日)。可见我国图书情报领域对大数据及其影响和策略的研究成果在短短的五年内增长速度非常快。
尽管大数据对情报学的影响和对策研究论文数量增长很快,但其一,大数据和数据科学的发展本身尚处在起步阶段;其二,相关论文增长的年代还不够五年,历时比较短;其三,大数据的影响和策略研究成果大多从图书馆的角度开展。因此,开展大数据对情报学的影响以及情报学的应对策略,对于情报学在大数据时代的准确定位以及健康发展非常有必要。
本文将从情报学的视角,结合医疗健康领域大数据的国家应对措施的案例分析,研究大数据对情报学的影响,探讨情报学的大数据策略。
2 情报学视角的大数据影响分析
2.1 大数据影响的考察维度
2.1.1 大数据的数据、技术和应用三个维度
考察大数据的影响,我们首先要找到一个全面和客观的考察维度。对于什么是大数据,业界已经存在很多定义以及围绕着定义的质疑,很多学者认同大数据是有着“4V”(即容量(Volume),种类(Variety),速度(Velocity)和价值(Value)) 特征的数据,其数量大、类型多、实效强、价值高。大数据的发展历史并不长,故人们常在不同立场上对其定义进行叙述,因而,不同背景下大数据就有不同的指向,只有站在同样的认知角度上讨论大数据的问题,才能得到解决大数据问题的正确办法。
大数据最先是来自技术领域的术语,它被认为是现有的技术手段难以在短期内处理的数据,2009年美国政府发布了数据网站,率先开始了政府数据开放的历程,到2012年美国政府发布“大数据研究和发展倡议”之后,从决策和应用的角度研究大数据才开始大量出现。大数据之所以受到广泛的关注并不因为它是技术上的新挑战,当前人类科学和技术上的挑战很多,但大多数都只受到科学家或工程师们的关注,而大数据的不同是因为它的应用价值高、影响广泛深刻。
朱扬勇和熊赟[1]论述了大数据的三个要素,即数据、技术和应用,是对大数据比较全面的认识。大数据中隐含了大价值,需要技术支持价值的发掘,需要结合社会应用来实现价值。
2.1.2 情报学的“记录的知识、人、工具”三大内容结构
对于情报学的内容结构,业界同样存在很多不同的认识。2000年,J.M.Griffiths[2]在《回归未来:千禧年的信息科学》一文中将情报科学的基本构成归纳为“人、记录的知识、工具”三个要素,并提出了围绕三个要素的情报学研究内容,对人的研究内容包括:人与信息的关系、人的认知过程和知识结构、人的信息查询行为、人所处的信息环境、人与环境的互动、人际互动;对记录知识的研究内容包括:知识组织与传播、信息管理和知识管理、信息检索设计、信息计量学、网络计量学;对工具的研究内容包括:人在获取、存贮、识别、传播记录的知识中起作用的工具如分类法、标引、主题词表、检索算法、搜索引擎、人工智能等[2]。
而早在1999年,iSchool运动便开始兴起,最早有十多所世界一流的LIS院系参与iSchool联盟,秉承联盟所倡导的在教学和研究中关注“人-信息-技术”以及它们之间的关系的理念。
2.1.3 “信息(数据)-技术-人”的考察维度
从大数据的“数据-技术-应用”视角、到情报学内容结构的“知识-工具-人”视角、以及iSchool的“信息-技术-人”的相互关系视角,虽然它们的思想来源不同,但却是异曲同工。大数据视角中的“数据”,可以看作是信息的一种,或者说是信息的原料;大数据强调的“应用”就是强调大数据对人的作用,强调大数据的人文关怀;大数据视角和iSchool理念强调的“技术”比情报学内容结构中的“工具”范围稍微广泛一些,但是都是围绕信息或者数据的获取、存贮、识别和传播所起作用的技术、工具或者方法。
所以,不管我们是从全面认识大数据本身的角度,还是从情报学内容结构以及iSchool理念的角度分析,从“信息-技术-人”的角度关注大数据带来的影响都是一种可行的、客观的考察模式。
2.2 大数据带来的影响分析
2.2.1 从信息方面看
网络可以留下人类行为的数字化记录,科学仪器采集记录大量的实验和观测数据,可穿戴设备记录人体生理和活动数据,这些逐渐形成了来源多样、数量巨大的大数据;数据的采集、存储、传播技术的发展使数据利用的成本降低、便利程度提高,逐渐造成了当今社会人人生成数据、人人需要数据、人人分析数据、人人理解数据的状况;大数据可以在不经意间自然反映出一些过去无法用科学手段揭示的现象和结果,直接影响人们的决策,因此很快被应用普及。以公共健康为例,集中记录汇总全国或全地区的患者病历数据库、汇总患者的临床记录,形成覆盖全面的大数据,便可以帮助医疗机构快速检测传染病,进行疫情监测、疾病监测,还可以联动公众健康个性化咨询和疾病防控的快速响应程序,从而形成智慧医疗的效果。