赵志远 孙剑华 汪方正
摘要:随着计算机技术的不断发展,当今社会已经逐渐进入了大数据时代,在大数据时代中,数据挖掘技术也在各个领域使人们的生活更加方便。数据挖掘技术是基于大数据时代下的一种新型数据分析类技术,该技术可以针对不同的用户提供数据分析得出的个性化服务,目前这项技术已经被应用在了许多领域,文章分析了其在网购领域以及许多对用户需求有要求的软件之中得到的应用。
关键词:数字图书馆;数据挖掘技术;大数据;个性化服务
1 数据挖掘技术概念简述
数据挖掘技术是大数据时代下的重要数据分析技术之一,又称为数据处理技术,数据挖掘技术是从数据本身来考虑,通常数据挖掘需要有数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。数据挖掘的具体操作方法有8种,分别为:神经网络、遗传算法、决策树算法、粗集算法、覆盖正例排斥反例方法、统计分析法、模糊集方法以及挖掘对象。一般数据挖掘技术在应用过程中的挖掘对象都是根据信息存储格式,用于挖掘的对象有关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库、空间数据库、时态数据库、异质数据库以及互联网等。
数据挖掘技术简单来讲就是在数据库中发现线索或者知识、进而对这些线索知识进行分析。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标,而数据挖掘技术的研究目的就是出于人们的简单需求,通过用户使用各种软件的需求量以及定向性来进行数据处理以及数据挖掘工作,进而更加方便的挖掘用户的心理及用户的需求信息,以便于进一步为用户提供定向性个性化的服务[1]。目前,数据挖掘技术已经被广泛地应用到人们的生活之中,在零售业以及网购平台中的有效应用也是数据挖掘技术的一个成功案例,因此,在研究数据挖掘技术在高校数字图书馆中的应用時,也可以对该技术的某些其他领域成功案例进行借鉴分析,进一步提高数据挖掘技术在数字图书馆技术中的有效应用。
2 数字图书馆以及其个性化服务中的大数据技术概况
数字图书馆是在新时期计算机技术的硬性下诞生的一种数字处理的网上图书馆。这种图书馆的形式与传统的实体图书馆形式不同,可以更方便的使读者得到想找的信息,也就是说是一种没有围墙的图书馆。这种虚拟的、数据的图书馆形式在目前的许多高校中得到了广泛的应用。
2.1 数字图书馆
数字图书馆是一门全新的科学技术,也是一项全新的社会事业。简而言之,数字图书馆是一种拥有多种媒体内容的数字化信息资源,能够为用户提供方便、快捷、高水平的信息化服务机制[2]。
数字图书馆不是图书馆实体:它对应于各种公共信息管理与传播的现实社会活动,表现为种种新型信息资源组织和信息传播服务。它借鉴图书馆的资源组织模式、借助计算机网络通信等高新技术,以普遍存取人类知识为目标,创造性地运用知识分类和精准检索手段,有效地进行信息整序,使人们获取信息消费不受空间限制,很大程度上也不受时间限制。另外,在高校数字图书馆之中也加入了许多个性化服务,这些个性化服务本身就利用了数据挖掘技术以及大数据技术的理念,这些理念的加入也使得数字图书馆的便利程度加大,在很大程度上解决了学生的读书、找书等问题。
2.2 个性化推荐服务
在一个高校之中,图书馆是重要的学校建筑物之一,因为许多学生为了学习、复习或者提高个人修养都要去图书馆进行读书或查找资料。然而数字图书馆的形式在丰富了学生的读书范围同时,也方便了学生查找文献。在数字图书馆中有一项个性化服务为个性化推荐,个性化推荐的主要目的是为学生提供精准的书目推荐,这也是大数据技术中的重要项目之一。
许多学生在进行学习研究时通常需要找寻特定的文献或者书籍,但在图书馆当中,书籍之多、文献之广常常使学生捉襟见肘。数字图书馆中的个性化推荐就解决了学生的这一问题。数字图书馆在对学生进行推荐书目时,数据挖掘技术就会对学生的图书搜索方向以及图书浏览方向进行专业的测算分析,进而为学生推荐出符合学生需求的书籍名目,以便于学生参考,这种技术就类似于对学生需求书目的预测,其技术核心是对学生的检索以及学生过去使用数字图书馆的浏览记录以及需求方向进行的测算[3]。
2.3 个性化推送
个性化推送也是数字图书馆中的一项个性化服务内容,其含义是通过大数据技术手段向学生推送他们所需求或者所喜爱的内容,进而对学生的需求方向进行分析推送。个性化推送服务有助于学生在进行研究时查找类似文献时使用,由于学生在进行研究或者论文写作时经常出现不知道该查找那些具体文献的情况,因此,在使用数字图书馆时,图书馆会为学生提供个性化推送,进而提高了学生查找文献的效率,还可能为学生带来许多意外的收获,在一定程度上扩大了学生的阅读范围,给学生提供了方便,在一定程度上减少了查找书籍的时间。
2.4 个性化检索服务
个性化检索服务是数字图书馆中的重要个性化服务之一,其主要内容有两方面,一是精准检索,二是模糊检索。个性化检索与传统的图书检索功能不一样,在传统的检索功能中,学生进行图书检索只会搜索出题目名称完全一样或者近乎一样的文献,而在数字图书馆的个性化检索中,学生搜索一本书籍的名称可能会出现许多内容相似但名称不相似的书籍[4]。
3 数据挖掘技术在高校数字图书馆个性化服务中的应用方向
在大数据时代下,数字图书馆要进行更为深入的发展,数据挖掘技术要想在数字图书馆的个性化服务中得到更为有效的应用,就要明确新时期的应用方向。本文从个性化推荐以及个性化检索和推送3个方面具体地对高校数字图书馆个性化服务的应用方向进行了分析。
3.1 数据挖掘技术在个性化推荐中的应用
数据挖掘技术的主要应用方向就是在个性化推荐服务之中,数据挖掘技术可应用在个性化推荐之中可以使学生更好的得到所推荐的书目,在大数据的环境下,数字图书馆的研发人员可以通过数据挖掘技术中的具体算法进行更为深入的研究与发掘,进而提高个性化推荐的精准度,使数据挖掘技术更有效地应用在数字图书馆个性化服务之中。
3.1.1 文献关联算法的应用
在具体的数据挖掘算法应用过程中,研发者可以参考数据挖掘技术在网络零售行业内的成功案例,通过对学生搜索或者使用的文献之间的关联性进行其文献关联算法的应用,并结合学生在最近阶段的浏览历史以及查阅的文献内容类别进行文献关联,进而提高个性化推荐的精准度[5]。
3.1.2 用户评分分析算法的应用
一般每个学生在查阅文献或者寻找书籍时,其大体寻找的文献书籍相似度较高。在进行推荐时对学生进行更为精准的优化推荐,就需要在这些相似文献中进行用户评分分析测算,即通过学生对相似文献的打分情况以及阅读时间进行测算分析,进而为学生提供同类别文献内的最优选项。
3.1.3 自动过滤算法的应用
在个性化推荐服务中,不仅需要通过测算进行文献书籍的推荐,而且还需要通过过滤算法进行文献的过滤工作,通过对学生的需求测算,从学生的历史浏览以及用户评分等方面为学生过滤掉其不喜欢的内容,这样可以提高学生的文献查找精度,并且为学生带来更好的文献查询体验。现阶段,数据挖掘技术的过滤算法有3种,协同过滤推荐、基于物品的协同过滤推荐、基于模型的协同过滤推荐。
3.1.4 混合推荐算法的应用
最后,数据挖掘技术在个性化服务中还有一个研究方向就是混合推荐算法的应用。混合推荐算法是数据挖掘技术中推荐技术内的多种推荐结果合并的算法,这种算法的优点在于可以为学生提供一个全方位的推荐书目,避免了学生出现对文献需求过度的现象。
3.2 数据挖掘在个性化检索和推送中的应用
数据挖掘技术在个性化检索、推送中的应用深度明显要低于在个性化推荐中的应用。在具体的个性化推送以及检索中的应用可以在其检索引擎中进行应用,通过对检索引擎内的各种链接数据以及用户搜索关键字词的分析测算进行检索优化[6]。在推送中可以借鉴个性化推荐中的测算方法进行推送,进而提高推送质量,过滤掉质量较差的推送内容,避免出现推送内容单一的情况。
4 结语
在当今社会的高速发展过程中,大数据时代已经来临,数据挖掘技术也得到了更为深入广泛的应用,本文从多方面对数据挖掘技术在数字图书馆个性化服务中的应用,进行了简要的分析和讨论,数据挖掘技术的深入应用及优化有利于高校师生对数字图书馆的满意程度,进而提高高校师生的文獻查找体验。因此,数据挖掘技术在高校数字图书馆个性化服务中的应用优化不仅有利于大数据技术的优化,更有利于我国高校教育事业的发展。
[参考文献]
[1]郅秀丽.基于信息素质教育视阈下的民族地区高校图书馆个性化服务提升策略——以宁夏大学图书馆为例[J].图书馆理论与实践,2015(12):78-81.
[2]叶春蕾,冯路,冷伏海.数字图书馆个性化服务中用户弱信息需求模型研究[J].图书情报工作,2012(15):25-30.
[3]何胜,熊太纯,周冰,等.高校图书馆大数据服务现实困境与应用模式分析[J].图书情报工作,2015(22):50-55.
[4]李艳,吕鹏,李珑.基于大数据挖掘与决策分析体系的高校图书馆个性化服务研究[J].图书情报知识,2016(2):60-68.
[5]柳益君,何胜,熊太纯,等.大数据挖掘视角下的图书馆智慧服务——模型、技术和服务[J].现代情报,2017(11):81-86.
[6]庄经纬.基于社会网络分析方法和数据挖掘方法的网络论坛定量分析[D].重庆:重庆大学,2010.