李 宏
(张家口市科学技术信息研究所 河北 张家口 075000)
伴随着我国科技的飞速发展,人类开始进入了以云计算、大数据和移动互联网为时代三大主题的大数据时代,推进大数据技术发展作为国家战略选择是全面提升政府治理能力的重要手段。在大数据时代背景下,科技情报工作作为科学技术研究的重要组成部分,关乎着国家重大科技战略的制定和重大核心技术的突破。科技情报工作如何在政府决策中发挥智囊作用,如何将科技情报工作的价值最大化,是广大科技情报工作者所面临的一个重要问题。
“大数据”概念最早源于美国,它是由威睿、思科、甲骨文和IBM等公司联名倡议并发展而来。1998年美国高性能计算公司SGI的首席科学家约翰·马西在一次国际会议中提到:伴随着数据量的飞速增长,会出现4个难题,即数据难理解、难获取、难处理和难组织,并用“Big Data(大数据)”来描述这一挑战,在计算领域引发思考。从2009年开始,“大数据”已成为互联网信息技术行业的流行词语和新型产物。大数据时代这一概念最早是由世界著名咨询公司麦肯锡提出的,2011年麦肯锡在《海量数据、创新、竞争和提高生成率的下一个新领域》一文中指出,数据已渗透到今天的每个行业和业务功能领域,并已成为重要的生产要素。而人们对海量数据的挖掘和使用预示着大数据已经存在于各个学科领域,新一轮生产率增长和消费者盈余浪潮的大数据时代即将到来。
随着信息技术的不断更新,大数据的发展为我国经济发展提供了极大的便利优势,而大数据国家战略也由此而形成。我国2014年3月的《政府工作报告》指出要“设立新兴产业创业创新平台,在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展。”2015年10月在中国共产党第十八届五中全会公报中首次提出“实施国家大数据战略”,为“十三五”发展规划提供了创新理念,大数据已从新兴产业创新平台一跃上升为国家发展战略和行动纲要[1~2]。
大数据时代具有4个显著的特点,简称为4V,为别为:Volume(大量)、Variety(多样)、Velocity(高速)和Value(价值)。①大量。大数据时代的首要特征是大量,主要是指具有海量的、高增长率和多样化特征的信息资产。有资料显示,我国互联网搜索巨头百度公司早在2013年就拥有EB(1 0244MB)级别的数据量。阿里和腾讯目前存储数据总量都达到了100 PB(1 0243MB)以上。淘宝网近4亿的会员每天产生的商品交易数据就有约20 TB(1 0242MB),而脸书近10亿的全球用户一天产生的日志数据总量超过300 TB。全球数据量以每2年翻倍的速度增长,这种背景下迫切需要智能的算法、强大的数据处理平台以及新的数据分析处理技术,来对如此大规模的数据进行统计、分析、预测和实时处理。②多样。数据来源的广泛性决定了大数据的多样性。在当前应用最广泛的当属各种APP,如京东、抖音、快手和今日头条等等。这些APP都会对用户的日志数据进行分析和评判,根据用户的不同爱好从而推送一些用户喜欢的内容。日志数据属于结构化鲜明的数据,其它一些诸如图片、音频和视频等数据结构化不明显,这些数据因果关系比较弱,需要人为的方式对其进行标注。③高速。我们在生活中几乎天天都会产生海量大数据资料。然而对于这些数据来说是需要我们及时处理的,因此,大数据时代对于数据处理速度有着非常严格的要求,谁的处理速度更快,谁就会占得先机。④价值。作为大数据时代的核心,海量的数据中有价值的数据只是很小的一部分。大数据最大的价值体现在通过从大量各种类型的数据中来挖掘、筛选出对客户有价值的数据资源,通过深度分析,总结出规律和特点,运用于各个领域,从而实现改善社会治理、提高生产效率以及推动科学研究发展的目的[3]。
3.1 强化大数据观念,建立良好的信息资源保障体系。在大数据时代背景下,科技情报服务中的信息保障被赋予了新的涵义。和以往对比,大数据技术条件下对于信息资源的利用和保障形式会变得日益便捷和开放。此外,在大数据技术产生和应用之前,各级科技情报服务部门之间的界限和对于信息资源的保护,由此形成的信息资源之间的屏障是难以消除的。在大数据时代,信息资源之间的边界是非常模糊的,在这种情况下,开放性和协作性将逐步成为科技情报服务的主要特点。为了更好的适应发展需求,必须强化大数据发展理念,积极完善信息资源保障体制,从而实现科技情报服务水平的提高[4]。
3.2 科学利用各种数据源。科技情报研究会对社会产生各种深远的影响,因此,确保情报分析结果的准确可靠显得尤为重要。这就需要在源头上做好工作,在数据分析过程中要不断加以补充和完善。科技情报的研究是一项复杂的工作,不同来源的信息特性也各不相同。因此,综合利用各种信息源已成为大数据时代科技情报研究工作的主要趋势。情报分析工作人员需要从问题出发,将全部信息资源进行系统整理,用于情报分析研究。其中,信息源除了有论文、专利等文献信息,还包括图表、文本、数据以及各种正式或者非正式的出版物。
3.3 加强对情报数据的筛选和处理。在大数据时代科技情报研究人员面临着海量的信息数据,这些数据往往良莠不齐,可能会产生错误的分析结果,从而降低决策的准确性。大部分数据库具有动态特征,有些数据是不完整的、冗余的,甚至是错误的,从而给数据分析人员带来识别上的困难。为此,当进行数据分析处理时应先对数据信息进行预处理,也就是数据的筛选和净化,删除无关数据。除此之外,还应对数据质量进行管控,从而提升数据分析处理的准确性,提升政府决策的工作效率[5]。
3.4 强化科技情报研究人才队伍建设。为了更好的加强情报学学科建设,在国内高校和职业院校等增设情报学相关专业,以形成系统化的人才培养体系,为情报行业储备人才。鼓励各级培训机构依据市场导向新加一些产业技术情报等相关课程,对基层科技情报从业者进行理论和实践技能培训,尤其是强化产业战略和前沿技术的跟踪和学习,重点培养一批适应大数据时代产业发展急需的专业情报人才,打造一支“专业知识+技术背景+情报评价”复合型人才队伍。
3.5 加强科技情报研究的国际合作。在当前科学技术日新月异的全球产业一体化时代,科技情报研究也应该打破传统,实行走出去的战略,加强与国外情报研究机构之间的沟通、交流和合作,时刻关注并积极参与科技情报研究领域的国际会议,针对当前一些战略性产业技术发展面临的共性问题,积极开展合作,让中国情报智慧在全球新兴产业技术发展中占据一席之地[6]。