基于知识发现的读者信息行为研究

2010-05-04 02:48胡万德王振伟
图书馆学刊 2010年9期
关键词:检索图书馆服务

胡万德 王振伟

(沈阳师范大学图书馆,辽宁 沈阳110034)

随着互联网普及率的稳步上升,互联网的利用使得人们传统的生活和工作方式发生了巨大的改变。图书馆作为蕴藏海量信息资源的知识宝库,是读者获取和利用信息知识的重要场所,而网络的发展使得图书馆的信息组织方式和信息服务系统也发生了翻天覆地的变化,读者信息行为(readers information behavior)也相对于传统的信息行为发生了变化。如何通过对读者信息行为的研究来提高图书馆信息服务系统的合理性,充分发挥信息服务系统的效率,有效行使图书馆为学校教学科研和社会服务的职能,是图书馆研究领域的重要课题。从提高图书馆为教学科研和社会服务效率的角度,运用知识发现技术,对读者的信息行为进行实证分析研究,旨在从中发现科学有用的信息来改善图书馆的有效服务条件和功能,最大限度地满足读者的信息服务需求。

1 读者信息行为研究的理论基础

1.1 读者信息行为的定义

德国心理学家库尔特·卢因提出人类行为(Behavior)是个人(Person)及周围环境(Environment)的函数,简化表示为B=F(P,E),也就是说人的行为是人类个体与周围环境交互作用的综合效应。该函数同样适用于图书馆读者信息行为,即读者信息行为受读者自身因素和信息环境因素的共同影响。[1]

对于信息行为的定义,国内研究人员的观点主要有以下几种:①信息行为是在动机支配下,信息行为主体为了达到某一特定目标而采取的行动过程。②信息行为主要是指人类运用自己的智慧,以信息为劳动对象而展开的各种信息活动,即人类的信息查询、采集、处理、生产、使用、传播等一系列过程。[2]③读者信息行为是在认知思维支配下对外部条件做出的反应,是建立在信息需求和思想动机基础上,历经信息查寻、选择、搜集等过程,并为读者吸收、纳入读者思想库的连续、动态、逐步深入的过程,如明确信息需求实质、选择适当的信息系统、制定正确的检索策略等行为。[3]

尽管以上观点在表述上存在着一定差别,但其核心内容是一致的。根据马费成、胡昌平等学者的研究,我们基本认同如下观点:每位读者都有一定的信息需求,这些需求在一定条件下会激励读者产生获取和利用信息的动机,这也是读者来图书馆和访问图书馆网络信息资源的目的,进而转化为读者的信息行为。因此说,读者信息行为是指读者寻求他所需要的信息时,利用图书馆提供的信息内容和信息服务,进行信息查询、信息选择、信息存储、信息吸收与利用等活动。[4]

1.2 知识发现的相关概念

雅虎首席数据官Fayyad于1989年首先提出了KDD(Knowledge Discovery in Database),即知识发现。他把KDD定义为:“知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。”也就是说知识发现利用技术手段从海量数据库信息中获取人们无法直接获取到的有价值信息,并据此为人们的行为提供必要的决策支持。[5]

知识发现自身决定所要提出的问题,然后对问题进行持续、深入的追踪探索,直到找到读者所感兴趣的知识答案为止。它必须能够从数据库的海量数据中筛选所需信息,在较短时间内找到知识答案,这些知识将用于学习研究或管理决策分析。建立在此种知识发现基础上的读者信息行为才是我们研究的目标。

2 影响读者信息行为的因素

读者信息行为是以读者的信息需求为基础,在各种因素作用下相互联系、相互制约的心理和行为过程,是读者在信息活动中对信息做出的选择,即有意识地查寻文献、捕捉信息、阅读和利用知识的活动,借以实现读者学习、教学、科研等活动中对信息的需求。影响读者信息行为的因素主要有读者主体因素和信息环境因素。

2.1 读者主体因素

读者主体因素主要包括读者心理因素及认知能力,读者的职业和工作任务是决定他们信息需求的最根本的因素。高校图书馆的读者类型主要分为以下几种:新生、本科生、即将毕业的大四学生、研究生、教师等。读者类型不同,其信息行为特点也有一定差别。例如新生读者初入校园,往往只能进行一般性的检索,采用最为基本的检索途径,通常他们尚未具备一定的网络信息资源检索技术,对检索工具各种功能的使用还很陌生,在利用网络查寻信息的过程中,往往会遇到各种各样的困难。即将毕业的大四学生读者往往接受过图书馆组织的读者信息检索培训,具有一定的信息检索技术,能够比较熟练地运用基本的网络检索工具,他们的信息行为目的明确,主要是撰写毕业论文,知道自己所需的信息在何处查寻,采取的信息行为具有直接的目的性。可见,读者自身的需求和技能等因素都会影响其信息行为的发生。

2.2 信息环境因素

影响读者信息行为的外部信息环境因素较多,主要包括图书馆馆藏设备、技术手段、人际关系等。一是读者要从海量的网络信息资源中获取所需的知识,需要投入大量的时间和精力来对信息资源进行检索、选择和过滤,还要根据检索结果不断修正检索方向,缩小检索范围,最后得到所需知识。在这个过程中,容易使读者产生疲倦心理,而信息资源的多寡会影响到读者利用网络信息资源的积极性和效率。二是网络工具的选择,所选网络工具的易用程度直接影响到读者利用它们获取和交流信息的程度。三是网络环境,包括软件环境和硬件环境。计算机配置的高低、网速的快慢、网络费用的高低以及网络的安全程度等,都会影响读者使用网络获取信息资源的积极性。[6]

3 在读者信息行为规律中寻求管理策略

读者信息行为的规律性已被管理科学研究者们予以总结和概括,主要有齐普夫最小努力原则、马太效应与罗宾汉效应、信息吸收极限定律、可近性选择规律等等。在此基础上,图书情报领域的研究者们通过对读者信息行为规律的把握,主要探讨图书馆信息服务中读者行为的共性问题,进而寻求对图书馆信息服务普遍适用的解决方案。在客观环境中,读者信息行为的表现千差万别,就个体而言虽有鲜明的个性特征,但作为某一图书馆的应用群体,总会在信息利用的某方面表现出一些共性特征。[7]这里要论述的即是图书馆在分析读者信息行为规律的共性特征中寻求信息资源优化配置管理方案的一个例证。

以沈阳师范大学图书馆书目检索系统为例,主要从信息查寻的角度,运用知识发现技术对读者信息行为进行研究。我们通过对后台数据库Oracle数据的抽取,选取2010年1~6月份读者书目检索数据,时间跨度为半年,共获得原始数据33983条,数据结构如表1。由于原始数据是从图书馆书目检索系统中导出,因此会产生大量的“噪声”(错误和不规范)数据,要对其进行数据清洗,即清洗消除原始数据中的错误数据和不规范数据,并对数据中缺失的数据域进行处理。将经过规范化处理的数据导入到SQL Server中,形成本次研究的数据集,共有记录31358条。

表1 数据结构

沈阳师范大学图书馆教师读者的证件号为5位,学生读者的证件号为8位,据此编写查询语句“selectsum(decode(length(cert_id),5,1,0)) as CntTeacher,sum (decode (length(cert_id),5,0,1)) as CntStudent,count(*) as CntAll from(select distinct cert_id from search_hist where search_dt<=‘2010-06-27 24:00:00’and search_dt>=‘2010-01-01 00:00:00’)”,得到本次统计数据中共有读者3791人,教师读者228人,学生读者3563人,新生读者769人,即将毕业读者649人。共有检索关键词10563个,检索次数最多的是英语246次。为了使结果更具代表性,在这里使用模糊检索,具体情况分析如表2。

表2 检索关键词统计

运用知识发现技术,通过对读者寻求其所需要的信息时,利用图书馆提供的信息内容和信息服务,进行信息查询、信息选择、信息存储、信息吸收与利用等活动的信息行为进行数据挖掘研究。从表2中可以得出,全校读者对英语类图书的需求量相对较多,考研和考级用书占的比重较大。虽然图书馆一再加大此类图书的复本量和新版本,但是仍然不能满足读者的需求。据此,图书馆为了尽量满足读者的需求,加大了对这类电子图书的投入力度,依托超星数字图书馆,建立了英语类电子书库,准确定位读者所关注的资源,全方位、多角度地为读者学习提供便利。这是我们利用读者信息行为研究成果来完善图书馆服务效率的有效案例,让图书馆服务工作决策有了科学依据。

在网络环境下,图书馆有必要通过对虚拟读者信息进行收集、挖掘,研究他们访问和利用数字资源行为的规律,使其“规律”集约建库,并将其与图书馆各项工作有机结合,通过反馈循环机制形成螺旋上升力量,推动图书馆管理及读者研究向深层次发展。

4 结语

总之,读者信息行为是在认知思维支配下对外部条件做出的反应,是建立在信息需求和思想动机基础上,历经信息查寻、选择、搜集、吸收的连续而深入的过程。对这个过程的研究是读者研究一个极其重要的方面,对于改进图书馆的信息服务工作、建立以读者为中心的服务模式具有突出的作用。分析读者信息行为的影响因素,把握读者信息行为规律,寻找信息服务共性原则,寻找信息服务的最佳切入点,是改善图书馆知识服务的有效途径。只有了解和分析读者信息行为,才能有助于发现读者在利用图书馆信息资源过程中存在的信息获取障碍,科学地预测并有效地控制读者信息行为,更好地进行读者信息素养教育,最终达到为读者提供优质服务,改善图书馆的有效服务功能,最大限度地满足读者知识需求,这是图书馆信息服务工作追求的永恒话题。

[1] 库尔特·卢因(Kurt Lewin).http://baike.baidu.com/view/871352.htm.

[2] 岳剑波.信息管理基础[M].北京:清华大学出版社,1999.

[3] 马费成,胡翠华.信息管理学基础[M].武汉:武汉大学出版社,2002.

[4] 白海燕,赵丽辉.网络环境下的读者信息行为分析[J].燕京大学学报:哲社版,2002(2):88-91.

[5] 尤萨马·菲亚德(Usama Fayyad).http://www.iteer.net/modules/people/singlelink.php?lid=1524.

[6] 李书宁.网络读者信息行为研究[J].图书馆学研究,2004(7):82-84.

[7] 张卫群.图书馆读者信息行为研究综述[J].图书馆学研究,2006(8):87-90.

猜你喜欢
检索图书馆服务
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
图书馆
招行30年:从“满意服务”到“感动服务”
专利检索中“语义”的表现
去图书馆
国际标准检索
国际标准检索