王 晶
(吉林省梨树县科技信息中心,吉林 四平 136500)
当前,大数据技术得到了快速发展,大数据技术在诸多领域起到了十分关键作用。大数据为科技情报研究工作指明了新的方向,应当就大数据的概念与技术手段进行充分研究,基于科技情报研究的需创新大数据技术的应用方式,总结大数据技术用于科技情报研究的有效对策。
目前,有关大数据技术的定义还处在完善阶段,有关大数据的概念还未能形成统的一个标准。通常认为大数据是数量庞大、数据形式多元化和非结构化的数据。运用大数据技术可以在合理时间实现提取、管理、处理数据信息的目标,为实施科学的管理、决策、创新提供必要的依据。大数据技术具有数据容量大,数据类型多、流动速度快和价值密度低等特征。随着数据信息海量增长,数据应用的难度日益提高,数据的流通速度不断加快,有用信息的提取难度不断提高。但是,大数据信息具有无限的应用价值,只有突破传统技术思维应用的局限,能够甄别淹没在海量数据信息中的高价值信息,才能提出更加实用的数据信息,满足科技情报研究的需要。
1)数据挖掘技术。数据挖掘本质上是指知识发现过程,强调从海量的、有噪声的、不完全的数据信息中提取人们不知道的、隐含的数据信息。该过程涉及的领域较多,包括数据库、机器学习、模式识别等技术。数据挖掘与情报研究有密切关系,运用数据挖掘技术可以发现情报研究工作中的转换关系,发挥智能化辅助分析技术的作用,提高数据信息情报分析工作效率,缩短数据信息研究的时间。首先,应当做好数据种类划分,运用识别功能对各种类型的数据信息进行分类整理,优化科技情感研究的适用标准。其次,数据挖掘技术具有多种组合形式,需要根据实际情况优化算法,并且进行适当的修正,同时对数据挖掘进行合理评价,从而提高数据提炼的精准性。
2)智能化研究技术。智能化技术涉及领域较为广泛,是可以代替人工科技情报研究工作,提高科技情报研究工作的效率的方法。智能化技术主要包括了神经网络、网络分析、机器学习、模式识别、遗传算法和预测建模等知识。基于智能化技术可以进行高级、深度、综合科技情报分析,解决了复杂情报信息处理的问题。智能化技术还有乐观于减轻科技情报研究工作强度,促进研究人员专注于优化研究方法与应用研究结果。在信息技术快速发展的背景下,科研情报研究工作不再局限于传统的报纸书籍,还要重视网络信息,包括图片、音频、视频等信息,这样可以拓展研究内容,运用数据信息技术对科技情报进行结构化处理,为智能化的应用科技情报做好准备工作。面对多元化数据信息,智能技术可以根据应用对象数据分析,从语义层次给予数据信息应用支持,适应了海量信息增长的需求,突破了信息识别模式的限制,消除了人为因素的干扰,保证了研究结果的准确性,而且推动科研情报研究工作更好的服务于科学技术的发展需要。
3)可视化技术。科技情报研究工作面对的数据信息具有零散、分散、类型多样、结构复杂等问题。传统的数据研究以人工分析为主,受到各种非结构性和不确定性因素干扰,很难形成标准化、流程化与规模化的分析研究模式,增大了科技情报研究工作的难度。大数据技术背景下可以采用可视化分析方法,构建完整的可视化图表,通过图表了解全部数据信息,并且可以看到数据分析的过程与数据链走向,这样便于研究人员进行关联性分析,再辅助开展人工研究。可视化工具有多种视图,不同视图的数据显示功能不同,研究人员可以基于大数据技术进行网络分析、空间分析与信息分析,并且可以实现人机交换,便于分析人员充分理解与运用数据信息。
1)强化大数据技术观念。科技情报研究工作日益具有立体化、广泛化、融合化的特征。应当聚焦数据信息综合开展科技情报研究工作,逐步促进科技情报研究的深层次演进。首先,科技情报研究人员应当树立大数据意识,认识到大数据时代科技情感研究工作的机遇与挑战,掌握大数据技术,善于运用多种技术手段来挖掘科技情报信息。科技情报人员还要积极参与教育培训,认真学习大数据技术,了解各种大数据技术的情报分析技术方法,不断提高大数据技术应用水平,依托大数据准确的开展科技情感研究。从大数据技术出发积极引进先进的、专业的工具,强调科技情报研究工作人员具备专业的素养与专业技能,大力运用数据整合、合成、分析与视觉化技术。当代科技情报研究工作人员应当不断提高专业素养,为科技情报产业化开发提供有利的条件。
2)高效利用各种数据资源。科技情报研究工作的成果对社会经济发展产生深远的影响,科技情报研究工作必须保证科技情报的准确性和研究结果的可靠性,做到从源头上控制科技情报研究工作,强调在丰富的数据源基础上开展情报研究工作。首先,综合运用多种科技情报信息,强调依托大数据技术广泛的汲取各方面的数据信息,针对不同的信息源采用不同的信息处理方式,正确对等科技情报研究工作的复杂性。其次,研究人员可以从问题出发,基于解决问题需要将全部信息资源融入到系统当中用于情报研究。学术论文、专利文献,或者各种文献、数据或非正式出版物都应当被广泛涉猎。第三,研究人员还要熟悉各种信息资源的特性,理清不同类型资源的具体表现与不同信息源之间的联系,根据待分析问题选取恰当的信息,研究人员还要将不同信息源分析出的结果进行综合解释,当出现信息矛盾时,能够识别不当结果,从而保证分析的准确性。
3)提高数据信息提取能力。大数据时代的科技情报研究工作应当采用科学的分析方法,运用系统化的工具,高度重视提高科技情报研究工作的质量,重点加强数据的清洗与过滤工作。当代科技情报工作人员面临着海量的数据信息,这些信息良莠不齐,有的数据信息是虚假的,有的数据信息是冗余的,还有些数据信息是不完整的,或者以特殊形式存在的。为了发挥海量数据信息的积极作用,消除不正确信息的影响,保证科技情报分析的准确性,降低决策的风险,还要提高数据信息的提取能力,充分的运用数据挖掘处理技术,扎实做好数据净化与过滤工作,基于精准的运算分析将无关数据删除,提高数据质量的控制,从而为提高数据分析准确性,保证情报研究工作效率奠定基础。数据体量大仅仅是大数据时代科技情报的基本特征,还要把科技情报工作的重要点在挖掘有价值的信息方面,根据科技情报数据信息传播速度快与持续性长的特征开展工作。
大数据时代对科研情报研究工作提出了更高要求,科技情报的呈现形式也更加的复杂,增加了科技情报研究的难度,同时了拓展了科技情报研究工作的路径。科技情报研究人员还要学习新型工作方法,具备较强的大数据意识,围绕着提高科技情报研究工作的准确性、科学性与合理性开展工作,最大限度挖掘科技情报内在价值,促进科技情报研究工作的转型升级。