饶丽琼
摘要:在大数据时代,图书馆服务创新是新技术环境中从传统知识服务向大数据知识过渡的一部分。本文论述了“大数据”技术在图书馆的应用,以及如何深化图书馆信息服务的思路和建议。
关键词:新技术环境 大数据 知识服务 图书馆服务
随着网络和数据库技术的发展,大型数据存储库中数据收集和存储量的迅速增加需要理解和处理。目前,这些数据是依据常规数据分析技术分析的,但目前PB层面大量数据积累、信息稀缺的局面显然不能满足日益增长的社会需求。为了更好地了解和处理这些丰富的数据,并确定指导决策的潜在规则和链接,成为读者改进学校发展的知识库,除了传统的读者服务,只要是方便借阅者的都是研究的方向。
一、高校图书馆服务对数据挖掘的需求
目前,高校图书馆注重借阅者的需求,实施图书馆服务,满足读者的真实需求,实现尽可能低的教学、科研和扎实的支持。高校图书馆根据读者对图书馆服务过程的需要,首先通过多种方式收集读者信息数据,实现读者的有效识别。其次大学图书馆根据信息数据对读者进行排名,以确保完全反映不同用户组之间的差异。第三,大学图书馆分析每个用户组,并揭示每个用户组的特点和需求。最后,高校图书馆结合读者需求,合理利用大数据资源,针对读者提供电子信息供给和目标服务的特点。作为图书馆书籍采购的一部分,用于形成记录业绩信息和最终数据的服务流程,以及上述用户标识、用户分类和其他链接。[ 1 ]
与流程整理结合使用时,每个流程都需要大量数据需求分析才能开始,许多有价值的分析结果都隐藏在需要专家和相关技术才能实现此流程的数据中。然而,结合高校图书馆目前的人员配置结构,很难有条不紊地完成大部分信息数据分析任务。因此,您需要找到一种有效的方法,以便对这些信息数据进行有效的分析。
二、数据挖掘技术的背景与定义
1.数据挖掘的背景
(1)数据挖掘的商业背景。数据挖掘主要是在业务环境中收集大量数据,并且需要知识挖掘。在业务中,数据挖掘用作四种工具:数据挖掘作为搜索工具,数据挖掘作为过程控制,数据挖掘作为营销工具,数据挖掘作为获取知识的渠道。
(2)数据挖掘的社会背景。如果没有数据挖掘的结果,一个人的想象力可能并不完全正确。由于客户的行为与社会环境有关,因此数据挖掘本身受社会环境的影响。
2.数据挖掘的定义
根据相关研究表明:数据挖掘是一个新兴、交叉学科领域,数据挖掘即为从大量的、不完全的,有噪声的、随机的数据中提取含在其中的、人们事先不知道的、有用的信息和知识的过程。
三、大数据时代图书馆面临的机遇和挑战
1.扩大图书馆的服务内容和提高服务质量需要大数据提供支持
目前图书馆行业竞争的关键:图书馆资源、使用空间、大数据所有权、分析各种重要复杂数据的能力、预测和价值发展,图书馆未来的发展战略也基于大数据分析和预测。
2.大数据将是图书馆的主要资源与核心资产
随着人们对大数据技术的理解不断提高,大数据分析技术变得更加成熟,使大家对大数据的价值进行了更深入地探索。
3.大数据时代为图书馆带来了发展机遇和挑战
就目前情况来看,图书馆不仅可以使用结构化数据来理解和控制现有读者接受的服务类型,还可以通过巨大的非结构化或半结构化数据找到更好的服务模型,以应对未来的竞争挑战,并且你必须预测和分析未来。
四、大数据时代图书馆服务创新和发展方向
1.关注和重视大量的图书馆用户的数据和信息
在大数据时代,除了文献数据信息外,其他数据挖掘和利用也是图书馆产业竞争力的重要因素,增加信息资源的收集是大数据时代图书馆资源建设的内容之一。大数据库时代需要大量数据,包括当前正在构建的文献和网络资源,以及无法运行或当前无法运行的非结构数据。
2.着力提升图书馆服务的智能化程度
现代图书馆服务需要高技术要求和先进的智能服务。首先,图书馆需要使用一定程度的智能技术来自动执行复雜的高级数据收集和处理任务,以节省人力和物力资源来解决手动任务。第二个是查看读者的服务内容。智能化手段水平也为图书馆智能决策、改进、社会信息、生活数据等服务工作提供了必要资料的上下文和信息。[ 2 ]第三,智能图书馆服务水平不仅影响知识从单一学科向多学科的传播,而且影响知识的变革,成为知识发现、挖掘和知识组织的基础。
3.深度的参考咨询服务
传统的参考咨询服务主要是利用现有的图书馆参考图书和研究工具书。室外和自建数据库由具有一定专业知识和对大数据时代研究工具熟悉的专业知识的专用参考图书馆员组织,这可以减少咨询图书馆员资源的时间,扩大咨询馆员对资源的获取,大幅度地提高读者满意度,提高阅读者咨询的效率。[ 3 ]
4.充分利用大量的复杂的数据分析技术与工具
图书馆将来对工具应用的需求将更为迫切,这也突出了对提高图书馆技术应用水平的更高要求。
5.数据挖掘相关技术
(1)频繁模式挖掘。频繁模式提取是事务数据库中不同货物之间的连接规则,即数据中频繁发生的模式,包括项目子集、设备和技巧。
(2)聚类。聚类使用多种特征组合将样本分类为组,将个人组分类为组或聚类,特别是基于相似性。因为同一群集中的对象之间的高度相似性以及不同群集中的对象之间具有较大差异。
(3)时间序列分析。时间序列分析是时间序列中发生的一系列事件,研究人员按每个固定间隔的顺序记录事件结果。时间序列数据的最大特征是,每个事件在数据后立即以相同的间隔记录。按时间顺序排列的数据,如图书馆读者的年龄分布、自由阅读时间的波动、每月进出图书馆的人流量和借阅图书的人流量在每个时间段的分布情况。[4]
五、数据挖掘技术在图书馆中的应用
数据挖掘技术在大学图书馆中的应用包括个性服务的优化、内容评估、阅读区的建设、每月借阅量的评估、采购书籍数目的优化(书籍名文档资源构建)、图书馆管理人员工作流程优化、借阅者爱好分析、借阅者对于阅读体验的评价、数据挖掘技术的发现和使用。
1.个性化服务
首先,分析相关规律,找出读者从借阅记录库借阅的图书的相同点,向读者推荐相关图书。其次,当我们做时间序列分析,读者借还一本书籍所需要的时间,我们可以先借一本书给读者,然后深入调查,当我们找出这些借出,还入顺序的特点,我们积极推荐给读者,他们下次借阅方便。
长期以来,图书馆提供的服务主要由图书馆工作人员满足用户需求,在服务期间,服务始终以用户为中心,图书馆不能被动地提供服务。大学图书馆利用数据挖掘技术改进日常管理任务的用户借阅文件的收集和分析,使图书馆管理员能够结合互联网上不同用户的实际特征,将及时有效的信息资源与个性化建议相结合,结合用户的兴趣偏好。它为用户提供有关他们免费需求的信息,并逐渐将其转换为稳定的用户。[5]
2.馆藏维护与采访
您可以使用分组分析来发现不同组之间的不同借阅行为,深入了解每個组之间的常见图书类型,以此作为采购图书的参考。根据当下时间,温度等不同,有不同的借还习惯,取决于一些书籍在领先位置的期限,取决于阅读者的行为习惯,例如到期末考试,你会明显发现这样的规则。
3.离线数据分析中心
进行数据趋势分析:期刊数据,包括在线情况、持续时间分析、关键词分析、在线分析。各种服务系统,定量统计、时间序列分析、系统特征、用户用法、数据对象探索、事实数据、收集分布、人员、资金使用、设备配置等趋势分析。
4.读者数据信息的质量问题
准确收集相关读者数据也是收集读者信息数量时的一个重要问题,例如如何用图片库全脸进行搜索。如果结果不是一个很好的收集对读者的相关数据,那么对读者的需要性服务就不能更好的开展,这项工作是要求图书馆收集读者的信息准确,做各方面的收集准备。我们尽最大努力减少相关数据库设置中的缺陷数量。
六、结语
总体上看,数据挖掘技术作为一种新技术,近年来在许多行业得到了广泛的推广,高校图书馆目前正加快改革步伐,可以大大支持高校图书馆的改革和发展。因此,高校图书馆管理者应创新思路,有效了解高校图书馆部门对数据挖掘的需求,收集资源,建设数据挖掘技术,改进信息资源利用,提高数据挖掘技术水平,提供个性化服务,积极推进高校图书馆健康稳定发展。在研究大量数据和来源之前,很难可靠地预测将形成哪些挖掘结果。首先,根据挖掘要搜索的物理目的可以确认数据,在根据本身数据进行挖掘的过程中,可以在适当的时候在检查部分检查已到达挖掘目标数量作动态状态调整。
(本文系2013年南京铁道职业技术学院的立项课题大数据理论与方法在图书馆工作中的应用研究阶段性成果,项目编号:YQ1309。)
【参?考?文?献】
[1]杨海燕.大数据时代的图书馆服务浅析0.图书与情报,2012.(4):120-122.
[2]孙琳.大数锯时代图书馆服务体系创新研究0.理论观察,2013.(4):99-100.
[3]董云鹏.数据挖掘技术在图书馆中的应用胖现代情报.
[4]晁阳.浅析数据挖掘技术在高校图书馆中的应用[J].科技情报开发与经济,2O16,(1).
[5]郝海涛,马元元.数据挖掘技术在图书馆信息服务中的应用EJ.信息通信,2O16,(8).
(责任编辑:刘占行)