论标签云在高校图书馆学科知识服务中的应用❋

2013-08-15 00:49
图书馆 2013年6期
关键词:标签分类图书馆

(南京邮电大学图书馆 江苏南京 210003)

1 引言

Web2.0时代,网络信息组织正发生深刻变革,社会化标注逐渐成为一种广泛流行的资源自组织方式。一些基于大量用户参与的应用型网站被人们广泛使用,如豆瓣网、flicker、CiteUlike等。这些网站允许用户根据自己的需要使用不同的自然语言对资源进行标注,并提供分享与交流的平台。〔1〕在这一背景下,Thomas Vander Wal提出了“分众分类”(folksonomy)的概念。“folksonomy”一词由“folk”与“taxonomy”复合而成,前者表达的是“人们、种族”的意思,而后者反映的是“分类”的概念。由于参与分类的不是专业人员,而是用户自发提交,强调的是一种自下而上的、社会性的、用户共同创造的自由分类,因此也称为“自下而上的社会化分类方法”或“自由分类法”。分众分类的实现过程中需要用户自由选择关键词对网站进行协作分类,这些关键词一般被称为“标签”。标签云是一组具有可视权重的标签的集合,它的出现为读者参与文献信息的知识组织提供了一种新的渠道,也为促进知识共享起到了一定的推动作用。未来图书馆的发展必然将核心能力定位于知识服务,〔2〕将标签云引入图书馆知识服务,一方面促进了图书馆信息组织的发展,另一方面对于推动图书馆学科服务的创新,也具有一定的借鉴价值。

2 标签云

2.1 标签云的提出

标签本质上作为一些相互独立的关键词出现,一般按照字母顺序排列,其重要程度又能通过改变字体大小或颜色来表现。〔3〕标签云是对这些关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容,也是分众分类法中一种常见的显示方式,其特色是可以用来描述网站的内容。它将标签以云状显示输出,通过清晰的视觉化效果展现标签的使用情况,利用大小、权重、颜色等文字属性作为相关字词的特征进行排列。例如,对使用较为频繁的标签设置较大字体等。通过标签云,用户可以灵活地依照字序或热门程度来检索一个标签,而大多数标签本身就是超链接,直接指向与标签相关联的一系列条目。

标签云以字体的颜色、大小、权重来表现数值的思想雏形来源于传统纸质地图使用不同大小或粗细的字体来表示城镇的相对面积或重要性。标签云的概念首次以“潜意识文档”(subconscious files)的名字出现在1995年出版的道格拉斯·柯普兰的《微软信徒》一书中。〔4〕照片分享网站Flickr是率先使用标签云的知名网站,网站创立者斯图尔特·巴特菲尔德设计了一个分析整理网站参考日志(HTTP referrer)的可视化应用,Del.icio.us和 Technorati等网站也为标签云的普及起到了推动作用。

2.2 标签云的分类

根据标签云在实际应用中所起的作用可以分为三种类型,第一类用于单独描述网站中的各个独立条目,第二类用于从整体上刻画网站的所有条目,第三类则用于网站条目的分类。〔5〕

①个别标签云。即每个条目都有自己独立的标签云,标签字体越大,表示该条目中用户使用过这个标签的次数越多。这类标签云在页面公开统计点击率,并且不要求精准数据的情况下十分适用。使用这类标签云的代表性网站有Last.fm与LibraryThing等。②全球性标签云。为聚集所有条目与其使用者所产生的一种标签云,通过标签字体表现其被使用的次数与热门程度。该类网站一般会有一个超大型标签云,标签字体越大,网站里使用过这个标签的条目数量就越多。由于全球性标签云可以体现出标签的热门程度,因此在实际应用中更为常见,具体的应用实例有Flicker、Technorati、DeeperWeb等。③分类标签云。这类标签云通常作为一个数据项目的工具,用于表示在整个集合中各个项目的数据量,再依照其大小指出子分类,一般应用于文字云或者数据云的描述上。

2.3 标签云的创建

标签云一般由三种方式产生:专业人士生成、自动生成或者用户生成。典型的标签云创建过程为:使用与用户关联的内容,如用户访问、订阅的内容等,得到组合的单词向量,然后把结果显示给用户。〔6〕该过程也反映了标签云本质上是单词向量的一种可视化表示。

3 标签云应用于学科知识服务的意义

标签云作为Web2.0一项具体的应用服务,为人们提供了一种新的信息资源描述与组织的方式。近年来对标签云的研究大多局限于网站应用,但笔者认为标签云完全有理由应用于图书馆,因为馆员对信息的理解和搜寻习惯同用户自身的理解与习惯是不同的,用户自己标注的标签才能代表自己的需求。〔7〕学科服务作为高校图书馆肩负的重要使命之一,正逐步从信息服务向知识服务转变。将标签云技术整合到高校图书馆知识服务中,并引入社群分享,让读者有机会参与图书馆的知识组织,才能真正实现以用户为中心的服务理念,达到改善与促进学科服务的目的。

3.1 充分挖掘隐性知识

根据英国科学家、哲学家波兰尼的观点,知识可以分为显性知识和隐性知识两类。通常以书面文字、图表和数学公式加以表述的知识,称为显性知识,如图书馆馆藏中传统印刷型文献和电子文献。在行动中所蕴含的未被表述的知识,称为隐性知识。图书馆对显性知识的管理、传播,以及在为读者提供的各种服务中都包含着大量的隐性知识。〔8〕标签云技术允许用户添加描述性关键词标签,利用专家的集体智慧实现信息资源的分众分类。当这些标签被其他用户检索和访问后,可以利用RSS技术对用户添加的数据进行聚合和行为数据的收集,实现集体智慧的汇聚。通过用户之间的相互交流、相互激发,最大限度地对知识主体头脑中尚未表达出来的隐含知识进行挖掘,通过隐性知识的不断传递,不断转化,形成知识螺旋,促进知识的转化。〔9〕

3.2 创建知识共享空间

知识共享空间是基于个性化的一种学习型知识服务,是建立在IC/LC基础之上的能够满足创新社群研究与创新需要的一种服务模式。〔10〕标签云有利于具有不同知识背景的用户群体、相同知识背景的用户群体以及馆员内部知识共享空间的构建。Thomas Vander Wal将标签区分为宽型和窄型两类〔11〕,前者被标注的对象是来自不同知识背景的用户和社群,对相同标签的标引能够反映不同社群对相同事物的不同认识,从而建立不同知识体系间的联系。对后者进行标注的是来自同一知识领域的小规模用户群体,他们在知识结构和兴趣领域上具有很大的同质性,在标引的过程中体现了同质化的特点,标签云的出现为这些同一知识领域或专业范围内的用户提供了知识交流与共享的平台。标签云也可以很直观地反映馆员自身对于一些热点问题的观点,馆员从不同角度对共同感兴趣的话题提出自己的见解,并添加相应的标签,在这一知识共同化的过程中也实现了馆员内部隐性知识的交流与共享。

4 标签云应用于学科知识服务的设想

目前国内外图书馆界对标签云的应用主要集中在OPAC检索系统、参考咨询和数字资源建设等方面。在学科知识服务方面的研究和相关实践较少,笔者由此提出以下几点设想。

4.1 基于标签聚类的可视化知识导航

高校图书馆学科知识服务的对象主要是高校教师、研究生和高年级本科生,标签云提供了一种可视化的关系呈现方式,有助于师生关注知识之间的内在联系,并发现新知识。传统的知识导航方式通常基于中图法和十进制分类法,专业性较强,但缺乏灵活性,无法对网络信息进行有效的组织,不能更好地满足开放网络环境下读者的需求和对知识的有效揭示。将聚类标签运用到可视化知识导航的具体实现方式有:(1)将语义相关的标签在同一行内显示;(2)对具有相同标签的所有文章进行聚类;(3)利用标签将用户关心的同类信息自动聚合在一起。以上方法可以对读者浏览行为产生一定的导向作用,便于读者获取主题相同或者相近的知识信息,并进一步发现隐性知识。

4.2 知识内容比较与新兴知识发现

标签云可用于知识内容的比较。以图书内容的比较为例,可以借鉴Google Book的书籍内容分析技术〔12〕,针对图书各章节文本内容筛选一些常见术语和短语,生成与内容主题概念相关的标签云,显示在该书的总览页面,让读者能够在最短的时间内了解这本书的重点内容。如果一本图书的不同版本的标签云发生变化,如增加了若干全新的标签,或者标签大小有所改变,那么很有可能是产生了学科新兴知识或者知识重心发生了转变,通过标签云可以让读者很直观地了解到这一点。例如,对胡冠章等编著的《应用近世代数》一书的2006年版本与1999年版本的标签云进行观察和比较,发现增加了“根式”标签,因为新版本增加了根式求解问题,之前的版本虽然提及了这个著名的问题,但是未作出完整回答,由此可以窥探出该领域知识的新发展。另外“映射”标签比重减小,“向量空间”标签取消,也反映了学科发展的一些变化。图书馆可以考虑引入这类型标签云,用于引导读者发现学科知识的发展与知识内容的比较。

4.3 用户兴趣发现与个性化知识推荐

一般来说,读者的兴趣与偏好会在其信息行为中表现出来。他们所自主收藏的资源,以及标引、推荐的信息往往都与他们的研究兴趣密切相关。标签云作为上述信息行为的结果,揭示了读者的个性化偏好信息。Scott采用模型和图表的方式,研究了用户使用标签的行为特点,证实了标签能够反映用户的兴趣发展变化。〔13〕因此对标签进行统计分析,就可以把握读者的兴趣点。图书馆传统的个性化推荐服务,如个性化定制、RSS推送、个性化检索等服务,主要是基于读者的浏览和检索记录等信息进行的,忽视了对读者动态信息需求的跟踪,因而推荐结果难免会有偏差。〔14〕将标签云嵌入个性化推荐机制中,对读者标注的标签进行实时抓取和分类,并采用词频统计的方法进行分析,有助于图书馆更加准确地了解读者的知识需求,更有针对性地找出与读者需求相匹配的知识信息,消除推荐结果偏差。

5 结语

标签云这一Web2.0下的新生事物,为图书馆开展学科知识服务提供了新思路。标签作为一种非受控语言,本身也有其先天缺陷,如,随意性较大、缺乏等级控制,容易造成信息分散等,图书馆在应用时如果能够选择好组织方式和组织架构,并结合不同学科群体的特点进行改进和完善,毋庸置疑将会给自身的发展带来新的契机。

1.李亚婷,马费成.基于标签共现的社会网络分析研究.情报杂志,2012(7):103-109

2.张晓林.走向知识服务.中国图书馆学报,2000(5):32-37

3,4,5.维基百科.标签云.〔2012-12-10〕.http://zh.wikipedia.org/wiki/%E6%A0%87%E7%AD%BE%E4%BA%91

6.(美)Satnma Alag.Collective Intelligence 实战.北京:清华大学出版社,2010

7.徐志玮,陈定权.Web2.0在高校图书馆学科信息服务中的实现.图书与情报,2010(4):83-86

8.梅群.浅议Human Library对高校图书馆读者服务创新的启示.图书馆工作与研究,2011(2):99-101

9.孟凡静.隐性知识转移困境及其克服途径.《图书情报工作》杂志社、图书情报工作研究会第22次图书馆学情报学学术研讨会论文集.南昌:《图书情报工作》杂志社,2010:468-470

10.李铮,盛兴军.知识共享空间:为创新社群构建协同式知识共享研究环境.上海高校图书情报工作研究,2011(2):22-27

11,14.关云楠.Tag在图书馆中的应用研究.长春:东北师范大学,2011

12.林倩妏,卜小蝶.标签云在图书资讯服务之应用初探.2010海峡两岸图书资讯学学术研讨会论文集B辑.南京:南京大学信息管理系,2010:117-132

13.林鑫,胡昌平.基于标签词频统计的科研用户兴趣分析.2009信息化与信息资源管理学术研讨会论文集.武汉:武汉大学出版社,2009:84-91

猜你喜欢
标签分类图书馆
分类算一算
分类讨论求坐标
无惧标签 Alfa Romeo Giulia 200HP
数据分析中的分类讨论
图书馆
不害怕撕掉标签的人,都活出了真正的漂亮
教你一招:数的分类
让衣柜摆脱“杂乱无章”的标签
科学家的标签
去图书馆