〔摘 要〕低文献利用率一直以来都是高校图书馆难以解决的问题之一。对此,引入web2.0中的重要理论——长尾理论,通过借用形成长尾所需的三个重要力量来分析文献低利用率,即导致文献利用长尾缺失的三方面原因。在此基础上提出利用library2.0技术挖掘图书馆文献利用中的长尾,提高文献利用率,以更好的为用户服务。
〔关键词〕长尾理论;图书馆2.0;文献利用率
〔中图分类号〕G250 〔文献标识码〕A 〔文章编号〕1008-0821(2009)02-0004-04
On the Web 2.0 Technology to Enhance the
Long Tail of the Utilization of LiteratureWang Xuezhen
(Information Science Research Center,Shanghai University,Shanghai 200436,China)
〔Abstract〕Low literature utilization rate is a problem to university library.The introduction of the long tail theory—an important theory in web 2.0,this paper analyzed three reasons in the low utilization rate of literature through borrowing three important force which lead to long tail.Based on the discussed above,it proposed that the library should mine the long tail of the rate of literature utilization to provide users with better service by using library2.0 technology.
〔Key words〕long tail theory;library2.0;literature utilization rate
众所周知,在图书馆流通领域中一直存在文献利用率偏低的问题,而近年来电子资源的普及则进一步恶化了这一问题。由此可见,如何提高文献利用率是图书馆必须面对的一个重要挑战。笔者在此引入长尾理论,希望可以为解决此问题提供一个全新的视角。
1 互联网中的长尾理论
由《连线》杂志主编克里斯•安德森(Chris Anderson)提出的长尾理论实际上是对丰饶经济学的一种阐述:选择源的多样化,充实廉价的传播渠道造就的丰富的无穷无尽的品种造就了人们无限选择的空间,从而使得文化和经济重心从需求曲线头部的少数大热门转向需求曲线尾部的大量利基产品和市场。在数学上,我们把序号(r)的某一幂次(rβ)乘以相关数量(g(r))为一常数(c)的对应关系称为长尾分布,也就是
g(r)=cr-β,c>0,β>0。
容易看到,β取值越小,g(r)趋向于零的速度越慢,画出来的曲线就越是拖曳着一条长长的尾巴。根据克里斯•安德森的观点,要形成这条长尾需要依靠3种力量。
1.1 第一个力量是生产工具的普及
这种力量使得过去单一行业(专业者负责生产,业余者只管消费)变成了双向市场,令许多消费者作为业余生产者加入生产者队伍中。他们为市场贡献存在于尾部曲线中的无数的多样化品种,这就促使长尾向右延伸,形成供给长尾。
1.2 第二种力量是传播工具的普及
这种力量可以降低市场的进入门槛,允许越来越多的产品找到属于自己的顾客群,从而降低了产品接触更多人的成本,有效地提高了长尾市场的流动性。这种流动性继而带来了更多的消费,有效地抬高了长尾曲线,扩大了曲线之下的面积。
1.3 第三种力量就是推荐系统的普及
推荐系统,通过疏导和放大消费者行为来细查各种选择,最终把最适合你的那一个摆在你的前面。因此,这种力量的普及可以连接供给与需求,将供求匹配服务做好。
从图书馆学角度进行分析,可以发现上述长尾现象的3个力量与印度图书馆学家阮冈纳赞提出的图书馆职业五法则中的第2,3,4法则相对应。这三条法则分别是:每位读者有其书(every reader has his books);每本书有其读者(every book has its reader);节省读者的时间(save the reader's time)。借用长尾现象的3个力量来解释这三法则,即:图书馆里的馆藏资源必须是容易获取的(形成资源供应的聚合);必须能够被对其有潜在兴趣的读者知道(形成用户需求的聚合);必须有效率的连接供给与需求(形成很好的供求匹配服务)。在下面的篇幅中,笔者将从这种对应关系出发,分析高校图书馆文献利用长尾缺失的原因并试图利用图书馆2.0技术构建高校图书馆文献利用的长尾。
2 高校图书馆文献利用中缺失的长尾
在此章节,笔者将借助文献利用长尾形成所需的3个力量分析其长尾缺失的原因。
2.1 资源供应的长尾
远在互联网产生之前,图书馆便开始构建资源供应的长尾,从自身馆藏,到各种级别的联合目录,其目的都是为了进行资源最大范围的聚合和揭示。互联网产生以后,图书馆不仅将目录由原先的印本形式转化为数字形式,还利用互联网来链接电子资源,馆际互借和其他数字图书馆资源,通过资源共享的方式来不断延伸资源供应的长尾。特别是高校图书馆,它们的用户主要包括本科生、研究生、研究人员和教师,他们对专业知识需求强烈,本馆馆藏往往无法满足其需求,因此高校图书馆一直积极开展馆际互借或文献转递服务,可惜最近的几次调察结果表明,用户对这两项服务的满意度并不高。笔者认为,导致这种情况的原因主要在于:高校图书馆之间的资源共享多数停留在建立联合目录这一层面上,缺乏深层无缝链接;同时图书馆缺少专业化检索工具的现象也造成用户难以对馆外资源进行一站式检索,为用户利用文献造成了不便。可见,虽然高校图书馆从整个图书馆系统而言可以形成资源供应的长尾,但因馆际之间资源共享过程中出现的种种限制使得高校图书馆一直无法形成真正意义上的资源长尾。
2.2 用户需求的聚合
所谓聚合用户需求,就是为每一本书寻找读者,也就是我们前面提到过的将资源供应长尾变得人尽可得。在这一点上,高校图书馆面临两个问题。一是对于馆内资源,图书馆只是被动的等待读者来寻找所需要的图书,并没有主动将馆藏资源介绍给用户,特别是那些潜在用户。目前,大多数高校图书馆都没有将馆藏信息、IPAC等嵌入用户日常学习环境中,因而无法对用户产生潜移默化的影响;而且,有些高校图书馆的网站构架设计及内容安排不够合理,重点不够突出,无形中增加了用户查询、检索的难度。另外,国内高校图书馆经常会忽视指导用户如何检索及获取馆藏资源,这就会造成用户对图书馆资源利用的放弃,特别是在文献传递及馆际互借方面,这种现象更加明显,如上海某大学调查结果显示,在参与调查的用户当中有30.56%的用户因为不明白馆际互借的具体内容而不使用该项服务。二是对于馆际资源,目前相对于免费使用的本馆资源,获取馆外资源的成本过高,这里的成本包括时间和相关费用。一般而言从提出申请到获取文献,电子版文献至少需要2天,纸版文献因牵扯到复印、邮寄等问题,获取周期会更长;而获取的费用也由几元到上百元不等,如浙江某大学规定获取国外文献的费用为150~200元。可见,用户往往会因为使用长尾资源而支付更高的成本。上述的两个问题造成了馆藏资源只能被那些有毅力、有耐心的用户找到,但不能到达那些对资源有潜在需求的用户的手中。
2.3 高效的供需匹配
对于图书馆而言,提供高效的供需匹配服务就是帮助用户在最短的时间里找到最符合其需要的图书资源。这是长尾理论中最重要的一部分,同时阻碍图书馆造就文献资源利用长尾的最大因素。现在,图书馆用户在不知道确切的作者,书名等诸如此类的关键信息的情况下寻找某一类感兴趣的图书时,往往利用IPCA中的题名关键词进行检索。但是,用户往往会碰到以下2种情况:(1)搜索到的信息中掺杂着无用信息。例如,以金融学作为题名关键词在某大学图书馆的IPCA中进行搜索,得到451条相关信息,每页罗列10条书目信息。在第1页中,第1条是“经贸英语最低限量词汇手册;华东理工大学经贸英语系编”、其余9条除第5条外也皆为无用信息,之所以会列出是因为在它们在题名中有“中国金融学院法学教研室编”字样。在这451条信息当中将近1/3的信息是无用的,当然这种情况随着关键词的限定程度的加深而得以改进,如以金融工程为关键词进行检索,便只得到69条信息,其中10条为无用信息。但是当信息量变小时,读者用户又会担心有遗漏,如某些书同样是接受金融工程的,却因为书名中没有出现“金融工程”这几个字而未被列入其中,这就是典型的查全率与查准率之间的矛盾。(2)书目信息过于简单。目前通过IPAC获得的书目数据实质上只是对文献实体特征的描述。它提供的信息量只包括了文献生产过程的特征以及文献的状态特征,缺少对文献主题内容的揭示,根本不能帮助用户进行选择。以《图书馆学导论》(黄宗忠编著)为例,它的书目数据在服务器终端上显示为:
图书馆学导论;黄宗忠编著
著者黄宗忠
武汉大学出版社?1988.3
主题标目 图书馆学
国际标准书号:7-307-00211-6
索书号: G250?H79
馆藏信息:SULZ
因此,当用户面对类似这种少则几十多则数百甚至上千条信息中,往往无从下手,不知道该如何找到最符合自己需要的那一本或那几本书。例如,对于同样介绍金融学的图书,对于专业人士可能需要精深的或有特色但非主流的,而对于非专业人士而言,他们很可能需要浅显易懂的,比较大众化的。ネü以上分析,笔者认为图书馆无法有效构筑文献利用长尾的原因主要在于馆际资源共享困难、文献信息没有得到充分的揭示以及图书馆缺少帮助人们进行选择的过滤器。
3 利用图书馆2.0技术构筑长尾
图书馆2.0主要涉及到的技术包括:RSS/ATOM、Blog/Podcasting、Wiki、Instant Message(IM)、Collective Intelligence、Tagging/ Folksonomy、Mashup以及学术搜索引擎。对于图书馆而言,如何恰当的应用这些技术是其构筑文献利用长尾的关键所在。
3.1 利用图书馆2.0技术聚合资源长尾
如何形成资源长尾,笔者认为高校图书馆应该利用学术搜索引擎作为一站式检索文献资源的替代方案。学术搜索引擎以学术资源为对象,一般涵盖互联网上的免费学术资源和以深层网页形式存在的学术资源,通过对这类资源的抓取、索引,以统一的接口向用户提供服务。以Google Scholar为例,它除了支持布尔逻辑、短语检索、时间限定等基本检索功能外,还允许通过作者,资源来源等字段限定来进行检索。另外,它还提供了一些特色功能,如“Library Search”:搜索拥有该图书的图书馆;“Library Links”:链接到用户所属图书馆的资源,如果用户处于校园网中,该链接自动显示。Google Scholar源自世界最大的搜索引擎Google,对用户有着极强的号召力,加之它使用便捷、搜索范围广泛,因此高校图书馆引入Google Scholar具有可操作性。
3.2 利用图书馆2.0技术聚合用户需求
对此,我们一方面可以利用RSS、Mashup、Blog等技术主动向用户推送信息、服务,并选择一些网站开展合作,建立相关连接。另一方面我们可以利用IM为用户提供实时咨询。
(1)RSS可以帮助用户在不打开网站内容页面的情况下阅读支持RSS输出的网站内容,因此对于时效性比较强的内容特别适用。图书馆可以利用RSS提供诸如最新消息/公告、新进馆藏、各种主题活动等信息的推送。此外,也可应用于书目或其它数据的定题查询定制等方面。
(2)Blog实质上就是网络日记,通常由简短且经常更新的帖子所构成,它可以提供的内容与RSS极为类似,但鉴于它的构成模式,图书馆可以将其内容侧重于现有馆藏的介绍。
(3)Mashup是一种交互式Web应用程序,它使多个源站点无缝合并而成一个web站点。在图书馆,Mashup常见的应用有:①将图书馆信息以图形化方式呈现出来。②将图书馆的书目信息嵌入图书销售网站或者将RSS内容显示在用户常登陆的网站上。
(4)IM即所谓的“即时通信”,它包括文字、语音、视频等各种方式。使用IM进行虚拟参考服务可以消除用户寻求帮助过程中的空间障碍,节省用户解决问题的时间和程序,该技术特别适用于对常见问题的解答。
3.3 利用图书馆2.0技术帮助用户选择
图书馆利用推荐工具帮助用户进行选择是图书馆文献利用长尾形成的一个重要因素。之所以如此重要的原因在于:虽然在长尾曲线头部的热门资源能够吸引大多数用户,但文献长尾中的尾部资源针对的就是独特的个人需求。因此,相比头部的热门资源,它们往往更有可能为用户找到更合适他们的文献资源,从而提高用户的满意程度。
3.3.1 利用Mashup、Tag等技术大幅度增加书目数据的信息量
利用Mashup可以聚合文献的相关版本、书评,耦合类似文献(如图2);利用Collective Intelligence(集体智慧),通过挖掘用户使用图书馆时提供或创造的数据形成图书和信息资源的推荐清单(图3)。利用Tag/Folksonomy,实际上就是允许用户自发的用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果(如图4),这种加标签行为往往可以形成多种分类火聚类规则并更切合用户的需要。
3.3.2 利用Blog、SNS等技术加强用户之间的互动及分享
借助用户的集体智慧,这对于帮助用户进行选择是至关重要的。对于那些无从选择的用户来说,其他用户的行动往往是最有用的指示信号,因为他们之间的动机最为统一。当个别用户贴出评论或表达自己的喜恶时,他们也扮演了指导者的角色,而对于这类基层参考信息的获取将极大节省用户进行选择的时间。所以,我们可以通过提供Blog/Podcasting,wiki空间来吸纳用户的评论、推荐。 特别值得一提的是,教师在推荐文献方面起着重要作用。这不仅是因为教师在其专业领域中的学术背景造就所推荐的文献的高含金量,同时也是因为他们对于学生的强大影响力。这一点在本科生身上体现得非常明显,他们的需求一般是在主讲老师引导下形成的目标明确的需求。因而,在笔者看来从专业角度进行分类并邀请相关教师撰写书评及推荐书目是一项非常值得开展的服务。
此外,我们还可以提供SNS功能(Social network server,社会性网络服务),以此帮助用户建立人际关系网络,满足各种需求。这种网络服务会将读者社区同文献内容有效的结合起来,并最终会在广大用户之间创造出一条强大的社交纽带。通过这条纽带,用户能够找到他们原先找不到的文献资源。
参考文献
[1]周军兰.长尾理论与图书馆[J].图书情报工作,2007,(4):30-33.
[2]王益明.长尾理论和图书馆服务的变革[J].数字图书馆论坛,2007,(4):15-19.
[3]林泰宏.台湾地区大学图书馆web2.0技术应用探讨[J].数字图书馆论坛,2007,(4):8-14.
[4]图谋.图书馆2.0简明问答[J].数字图书馆论坛,2007,(4):25-29.
[5]刘炜.建设2.0版的图书馆集成管理系统[J].数字图书馆论坛,2007,(4):1-7.
[6]Lorcan Dempsey.Libraries and the Long Tail[EB].http:∥www.qiantu.org/liblog/?p=50,2007-07-13.
[7]胡小菁.LIB2.0应用与国内外现状[C].上海地区图书馆2.0应用与实践研讨会PPT.
[8]克里斯•安德森.长尾理论[M].北京:中信出版社,2006:33-40.
[9]山石,王雪珍.互联网上的长尾分布[J].研究与管理发展,2007,(3):261-265.
[10]于良芝.图书馆学导论[M].北京:科学出版社,2003:177.
[11]常唯.综合性学术搜索引擎研究[J].大学图书馆学报,2007,(2):73-78.
[12]孙博阳.Google学术搜索工具及其在我馆的应用[J].大学图书馆学报,2007,(2):79-82.
[13]cat wizard.你们馆加入Google学术搜索的“图书馆链接计划”吗?[EB].http:∥catwizard.blogbus.com/logs/5753477.html,2007-06-28.