Wiki在图书馆知识服务系统中的应用

2013-05-08 09:40李连喜
图书馆学刊 2013年9期
关键词:知识库馆员关联

李连喜

(朝阳师范高等专科学校图书馆,辽宁 朝阳 122000)

Wiki技术是由Ward Cunningham在1995年创立的一种开放的、面向社群的超文本协作编辑系统,具有协同修订、开放编辑的功能。利用这种网络化写作工具和协作创作方式,任何人都可以创建、编辑文本,系统具有对版本内容的保存、控制、管理、回溯机制[1]。

图书馆界对Wiki的应用可分为3大领域,一是以OCLC的Wiki联合目录OWC为代表的互联网联合编目;二是与Wikipedia模式一致的图书情报领域的百科站点,如Library and Information ScienceWiki、Library Success等;三是应用于图书馆知识服务系统/数字图书馆中知识库构建与相关服务。知识服务系统指一种面向特定主题领域的集采集、加工、服务等功能于一体的知识级信息服务系统,可作为数字图书馆知识服务的重要形式。笔者关注的重点是最后一种应用方式。图书馆应用Wiki技术架构自己的服务器,一般可通过基于Perl/PHP/Python等语言的Wiki引擎进行配置,版本控制通过数据库实现[2]。

目前,国内外图书馆对Wiki技术的利用都有了一定基础,如馆内知识库构建、学科信息库建设、信息资源传递与导航、馆员与用户双向交流平台、数字参考咨询、专题指南汇编等[3],利用Wiki加强了图书馆不同主体间的沟通和信息资源建设。但在通过Wiki促进协作与集成、获得显性化的新知识后,大多数停留在资源集成与知识库构建的层面,Wiki没有与其他知识技术有效结合,实现对新知识的深层利用。知识间的联系广泛而隐性地存在,但未能结合Wiki的特点和用户需要利用相关知识技术有效发挥其价值。针对这一现状,笔者主要围绕以下两个问题展开研究:首先,图书馆如何利用人的知识增加信息资源的实用性、异质性和动态性;更重要的是,如何通过知识服务系统中的相关知识技术将显性化后的知识加以深层利用,挖掘更多的隐性知识,并与对原有资源的利用相结合,向用户提供增值的知识服务。

1 应用W iki的图书馆知识服务系统

从底层的资源基础到上层的技术应用,引入Wiki技术的图书馆知识服务系统在结构上可以主要分为资源内容与组织建设、对Wiki新知识和数字化馆藏以及外部资源的整合与关联、Wiki的知识协作创造与交互功能的实现以及基于Wiki特点运用相关知识技术实现的增值功能,如图1所示。

图1 应用W iki的图书馆知识服务系统结构

2 W iki对图书馆资源的优化

2.1 资源内容

2.1.1 资源的多元化与动态性

图书馆知识服务系统的信息源包括各类传统馆藏资源的数字化、多媒体资源、联机数据库、互联网资源等,而基于Wiki创造的新知识与已有资源相比特殊价值较为明显,增加了系统资源的多元性,扩充了图书馆提供信息服务和知识服务的范围和能力。首先,基于Wiki形成的是知识,而原有馆藏更多的是数据和信息。一方面,与离散化和形式化的数据与信息相比,知识的意义关联性更强,在内化过程中加工程度更深,更具有创新潜力,经验性和实践性使其指导人们行动的价值更高。另一方面,通过形成百科式的按条目组织的文章,特定主题的知识为其他作为整体知识单元的文献资源提供了粒度更为细化的补充。其次,用户知识与馆员知识是异质的,Wiki的引入扩大了用户的参与,释放了读者的智慧,使图书馆的知识资源不再限于馆员和馆藏。在提升知识多元性和实用性的同时,协作创建的过程和版本控制机制在一定程度上有利于维护系统资源保持较高的质量。

从而,基于Wiki形成馆内知识库,将协作创建的知识资源、相关用户操作和用户与馆员的交互行为作为一个子系统,内嵌于图书馆知识服务系统中,成为一个与其他资源相比异质性、灵活性和独立性较强的模块;内容可以随时更新,动态性强,不断演变和优化。馆员和读者合作,共同承担知识库的构建、管理与维护工作。同时,该子系统在内容和组织上与系统其他模块密切联系,并通过相关技术实现集成的接口。

2.1.2 隐性知识的显性化和社会化

Wiki技术保障了多人协作式的写作和知识存量的保留,Wiki理念则促进了知识的贡献、共享和创新。嵌入Wiki模块的知识服务系统向馆员和用户开放,在Wiki平台上,读者和馆员共同参与内容创作和修改维护,将各自长期积淀而内化的专业知识与职业技能经过筛选和整合表达出来,并与他人交流互动,相互获得借鉴启发,在吸收新信息的同时转化为新的隐性知识。而这也是一种对信息贡献和知识分享的激励机制。利用Wiki模式,人们的知识得以实现野中郁次郎在SECI模型中描述的外化、融合、内化过程,不断创造和积累新知识,实现知识从个人到社群和组织层面的社会化过程。

2.1.3 人的主动性与控制力

传统意义上的图书馆管理主体限于馆员,主要工作限于对资源形式的描述和组织;利用Wiki技术和平台来创建、完善和积累知识,构建内部关联紧密的知识库、内嵌于图书馆知识服务系统并在知识技术的辅助下发挥更大作用,体现了人对图书馆资源在内容上加以创造、控制与管理的能动性,并且大大增加了读者的参与度和积极性,扩大了知识的来源。

读者和馆员的高度参与为系统分析用户行为,发现用户需求,从而开展更有针对性的服务提供了基础。

2.2 资源组织

2.2.1 自主性强的动态汇聚与内外部链接

Wiki具有高度开放性和自组织性。在资源组织上的价值在于用户创建和编辑内容时可自主地对文章进行归类,并提供相关的内部链接和外部链接。不仅用户对页面的归类可以修改,系统内多个同类页面也可被汇聚在同一页面;系统提供的分类体系本身也非固定,用户可进行编辑修改[1]。随着内容组织结构的变化,链接关系可随之不断修改优化,这就使得Wiki知识库中的资源始终处在紧密、动态、多层次的有机联系中。和内容一样,系统资源的组织体系也会随着使用的扩展和修改的增加逐渐稳定。

内部链接和外部链接的创建与管理是集成化检索功能的基础。Wiki允许用户创建与内容相关的有意义的内部链接,也能够将内部知识与有关的外部资源建立链接。这一方面有利于揭示知识之间的语义关联,另一方面能够继承内部和外部多种来源和载体的信息。从而以用户利用Wiki技术对知识加以自主控制为基础,结合相关的语义网和搜索技术,在知识服务系统中提供一体化检索功能。

2.2.2 非结构化动态信息的整序与控制

知识的隐性形态往往是模糊的、动态的、非结构化或半结构化的。在将隐性知识表达出来的过程中人会对知识进行筛选、条理化和模块化,进行第一次控制;形成文本后,知识的结构化程度有所增加;在Wiki中对知识进行自主归类则是第二次控制;在后续的不断修改过程中,文本的内容、结构和类别在持续不断地变化。对计算机和用户来说,利用Wiki创建的知识内容的高度动态性和结构的不稳定性增加了理解和利用的难度,这也凸显了在将Wiki技术整合进图书馆知识服务系统之后,结合一定的文本分析与数据挖掘技术将资源进行进一步的整序、提取有价值知识的重要性。

3 利用W iki等技术挖掘信息资源

3.1 知识的动态利用

3.1.1 版本管理与知识追踪

利用Wiki协同创作和开放编辑的功能,馆员和读者能够充分表达个人见解,对知识的内容和结构进行修订,这是知识在社会化和融合的过程中,人们在相互影响、交流甚至冲突中逐渐达成共识,形成可靠性较高的知识成果的连续过程;而被修改和覆盖的知识不一定是错误的、无价值的,相反,人们对特定领域知识的不同见解,体现了异质个人背景、经历和环境对思维结构和认知体系的作用,不同见解对不同人、在不同场合价值不同,对知识集合的积累和拓展也有重大意义。而Wiki对编辑历史的保存和版本管理功能记录了每一次修改变动后的知识存量。

Wiki在用户对内容进行的每次编辑、修订甚至删除操作时,都将之前的版本内容、修订者、修订带来的差异全部保存在数据库中。用户可查看所有历史版本,选择其中某个版本进行修改或恢复操作。系统也允许用户查看最近一段时间几个版本所更新的内容[4]。而集成检索系统的范围也可扩展至所有版本,在横向上跨主题领域、跨资源载体进行检索的同时,实现纵向的对历史版本的追踪,不仅提高了服务的集成性,也保证了知识价值的识别和发挥,满足不同用户的特定需求。

3.1.2 RSS

由于Wiki模式下知识创建和修改是随时进行的,其高度的动态性使用户产生对个性化信息跟踪获取的需求,而Wiki知识库的摘要订阅功能(RSS)能够解决这一问题。对所需内容进行订阅后,新增和修订内容将被主动推送到用户使用的阅读器中,人们可在对用户有特定价值的知识领域中产生的新见解进行及时的监控,也方便用户随时参与到进一步的完善过程中。

RSS提高了用户对知识生成的参与度和积极性,刺激了知识服务系统的活跃程度,有利于优化信息资源结构,并增加馆员、读者和资源之间的互动频率与深度。另一作用在于,用户行为分析工具也能够根据用户订阅的信息类别和反馈频率推测用户的专长和兴趣,不断完善user profile并为专家定位积累数据,以便提供更为适合的推荐知识和服务。

3.2新知识与已有资源的集成与融合——知识关联

知识关联是指知识单元(包括文献、人脑等知识载体和概念、词语等知识内容)之间存在的各种关系的总和[5],即知识之间客观存在或主观建立的那些隐藏的、可理解的、有价值的序化联系。Wiki知识是基于读者和馆员的隐性知识不断动态生成的,而数字化馆藏资源相对稳定,有自己的概念逻辑和相对固定的静态关系,因而二者的关联尽管有一些人为设定,但通常是潜在的、间接的,需要利用相关知识工具对这些隐性的知识关联加以识别,发现新知识存在的可能性。这些关联可能包括作者、机构等形式层面的关联、关键词等概念层面的相关性、引文链与引文网络、通过分类体系和主题词体现出来的关联、多媒体资源中的内容关联等等。发掘文本之间的隐性关联可将数据库、搜索引擎、知识仓库、人工智能等技术与信息计量相关方法相结合,利用引文分析、共现分析、知识地图、语义网、多媒体内容挖掘等途径进行。对关联强度的测度方法包括相关度、耦合强度、共现频次、知识关联广度与深度测量等[5]。

通过测量Wiki知识与原有馆藏资源之间的知识关联及其强度,可运用可视化工具向用户展现其中存在的关系网络,为用户利用不同资源,学习不同知识提供导航、建议和推荐,从而发挥知识服务系统的智能化作用,帮助用户更有效地理解、消化和运用知识。

3.3 基于新知识提供增值服务

基于Wiki形成的新知识是馆员和用户的隐性知识经过外化、社会化和融合转化而来的,具有以下特点:与用户的知识积累、专业技能和兴趣偏好联系紧密;主题领域丰富,多细节,解决现实问题的实用价值高;存在多维关联;知识的内容和结构不稳定,具有一定的冗余度。其优点可结合一定的知识工具加以应用,其不足也应利用相关技术加以弥补,从而尽可能发挥新知识的效用,为用户提供增值的知识服务。

3.3.1 用户行为特征分析与推荐

由于在知识服务系统中运用了Wiki技术,用户行为与其知识能力和偏好的紧密联系得以被充分利用,对用户的分析主要关注以下行为或特征:①用户对知识内容的创建、编辑、删除等行为;②用户的检索与筛选行为;③用户对知识资源的满意度反馈,即评分和评价;④用户订阅RSS的内容、订阅后受其影响再次参与编辑的频率;⑤用户在讨论平台上的发言内容与行为偏好;⑥用户个人信息,包括年龄、性别、地域、教育程度、职业、图书馆使用情况等。知识服务系统可结合用户行为涉及的内容展现出的用户偏好与能力为其推荐知识,包括有可能解决用户问题、满足用户需求的知识,以及建议用户参与修订的知识;也可结合用户行为本身向其推荐某种服务,如向经过分析发现的倾向于创建某类文章的用户发出新建词条的邀请等。

用户行为分析可利用联机分析处理技术(OLAP)和数据挖掘技术的辅助。OLAP以海量数据为基础,支持管理人员从不同角度对数据进行复杂查询与多维分析,对多维立方体的操作包括切片、切块、旋转、向上综合、向下钻取等,了解用户行为、知识积累和选择取向的关系内涵[9]。数据挖掘从已有的大量数据中提取隐含的有价值信息,通过潜在的关联要素对未来趋势及行为进行预测。数据挖掘涉及数据库、人工智能、机器学习、统计分析等多种技术,能够在没有明确假设的情况下进行自动分析和归纳推理,发掘数据间的潜在模式,是识别用户和资源之间发生作用的最好方式[6]。例如,利用概念描述功能,可归纳出用户行为和身份的某些特征与其技能和偏好的关系;利用分类与预测技术,可根据参与知识创建的读者身份及其创建内容主题领域的大量数据构造决策树,根据结果判断新用户是否会对参与创建某类知识有兴趣;基于满意度反馈评分,利用协同过滤技术,根据与特定用户偏好类似的用户评价生成推荐或主题指引;利用趋势和演变分析功能,描述用户不同行为之间的关系规律并根据对其下一步行为的趋势推断提供相应推荐服务等。

3.3.2 专家定位

图书馆是一个开放的知识交流空间,知识服务系统的Wiki应用由于其用户协作参与和交流机制,能够很好地在虚拟环境下实现知识共享,而旨在促进知识共享和提高知识重用能力的专家定位技术可以实现与Wiki思想和技术相契合的增值功能。专家定位技术帮助用户定位并利用集体经验,提高组织整体的学习效率与学习能力。专家定位的实现需要综合运用大量知识工具与管理技术,如知识搜索、知识分类、场所定位、知识评估等,涉及的关键问题包括系统对用户需求情境的考虑、用户对需求的有效表达、系统对查询条件的准确理解、专家技能的准确评估等[7]。

在现代汉语中,我们可以发现有“A了个B”这种框架构式的存在。现代汉语中词的定义是语言中最小的能够独立运用的语言单位。词一般不能扩展,词的两个或多个语素中不能插入其他成分,但有一些词如“洗澡”“理发”“过来”“睡觉”“留神”“帮忙”“出丑”“道歉”“吵嘴”“吃亏”等可以加入一些其他成分,成为:

当前,找到与用户需求匹配程度较高的专家并有效排序仍然面临一定的技术难题,返回结果往往需要用户进一步的比对筛选,影响了该技术的应用价值[7]。但Wiki知识库的技术原理在一定程度上有利于增加专家技能评估的有效性。首先,知识库支持传统的基于文档的分析,可以从馆员和读者参与创建的知识内容文档中发现个人技能并进行评估,生成个人在不同领域中的专业程度;个人隐性知识显性化和社群共同维护文档的过程能够在一定程度上提高知识内容的结构化和模块化程度,而通过概念抽取和语义标引能够减少文档内容的模糊性和歧义性,有利于提高专家技能值计算的可信度。除了基于文档的评估方法,Wiki知识库也提供了一些直观的社会化因素进行辅助,如用户对参与编辑的文档的选定、用户创建的知识条目得到的打分与评价、用户在交流平台中获得的威望等等。知识服务系统可根据Wiki平台中的各类数据和线索,设定各种因素的重要性及其不同值反映的技能程度,构造专家技能计算公式,最后得到专家在特定领域的技能专业程度量化值并加以排序,为用户提供排在前列的专家,推动经验的共享和特定问题的解决。

3.3.3 语义化、集成化知识检索

在集成了Wiki知识库、各类馆藏资源和外部数据的图书馆知识服务系统中,知识具有多层次的内容丰富性、较高的来源异质性和内容与结构的不稳定性,用户在寻找有价值的知识时可能面临困难,从而体现了一站式集成化检索的必要性,而较强的知识关联则提供了资源整合的可行性。基于Wikipedia的Dbpedia是一个将前者涉及的所有条目和具体知识加以抽取、描述概念和定义关系后形成的本体,为知识服务系统中的知识集成管理提供了启发。

以本体作为工具构建知识网络和一站式的知识管理平台,在明确本体领域与范围的基础上,列举重要概念与术语,将各个文档、具体资源或其中的知识单元在概念认知上转化为特定的对象,给予唯一的标识和清晰的概念描述,从而减少定义的重复和歧义;然后构建概念之间的层次关系,并通过谓词确定知识概念和对象间的关系,通过三元组的形式揭示其间的语义关联;还可通过规则的构建支持推理,生成新的知识对象;最后,在系统中形成知识及其语义联系的抽象模型,将具体资源作为实例不断添加。语义网为异构资源的开放集成和访问共享提供了规范的定义和统一的标准,能够适应Wiki知识库的动态性;而对语义的描述则有效揭示了知识之间的网状联系,并通过这些联系进一步提供相关资源,从而能够将不同形式的相关知识加以汇聚和融合,一站式地满足用户对特定知识主题在来源和形式上的多元需求。

3.3.4 问答系统

问答系统(Question and Answering,QA)也是对传统搜索引擎缺陷的一种改进,允许用户用自然语言提问,更好地表达信息或知识需求,并直接为用户返回所需答案而非文档或网页,减少用户在对结果筛选定位上的负担,更有效地满足需求。QA的一般处理流程是,首先对问题进行分析,根据问题分析得到的句子成分、所属类别和潜在答案类型等信息在数据集中查找可能含有答案的文档和段落,在缩小的范围中进一步采用各种技术提取答案,最后将答案返回给用户[8]。

在嵌入了Wiki知识库的知识服务系统中运用的QA是基于自由文本的。其价值在于,首先,由于检索的数据集中融入了由人们的隐性知识经过协作和人工控制而转化生成的、百科式条目化组织的知识,在问题分析后进行检索时,文档的范围和异构程度大大增强,有利于提高查全率;同时文档内部并非完全不具有结构性,并且相对于文献信息和数据,知识具有更好的可理解性、关联性和经验性,有助于提高查准率的实际效用。

第二,问答系统需要处理更多的语法、语义信息,而在知识服务系统中已经将知识资源转换为三元组、进行概念化处理和语义标引后,得以丰富传统索引的意义关联,在进行答案抽取时通过关系而非仅仅是表层特征来进行,从而检索效果得以改善。

第三,Wiki知识库也十分适合引入CQA(基于社区问答的QA系统)这类Web2.0类型的服务形式,基于社会网络和群体智慧提高QA系统的性能。由于Wiki技术支持下的知识库服务往往附带沟通交流平台,作为一种基于问题—答案的QA系统,对CQA来说,已经有了问题和对应的答案,可以在交流平台上找到类似问题,返回相应答案。

QA作为自然语言处理和人工智能领域中一个很有前景的方向,对其研究已经取得了较大进展,但仍有诸如语义处理等问题有待进一步解决,随着技术的发展,其性能将不断改善,相信能够更好地应用到基于Wiki的图书馆知识服务系统中。

4 案例

“一把刀人工搜索系统”(www.18dao.cn)[4]创建于 2007年,是一个以“分享知识、协作互助”为主旨的基于Wiki的知识服务系统和网络知识社区。它并不是基于图书馆知识服务系统的应用,但可作为数字图书馆的一个方向,且体现了笔者对于在图书馆知识服务系统中应用Wiki技术的主张,即不仅停留在合作写作与知识集成,更应利用丰富的知识技术针对Wiki知识实现增值功能。

该系统的架构分为知识库、知识处理系统、公共服务系统以及用户参与平台4部分。①知识库中存储的知识包括文本、图片、视频、超链接等形式,同时通过搜索引擎自动匹配或人工方式获取了其他知识平台的资源,将来源不同的、形式各样的知识不断纳入知识库,使得知识的集合体不断完善。②知识处理系统包括自动分类、知识匹配、知识反馈和知识更新系统,为用户添加和修订知识条目提供了保障。③公共服务系统即系统的用户接口,提供了联机检索、知识交流、反馈评价、知识推荐、个性定制等服务。保证了用户对知识条目的交流探讨,也实现了系统的特色功能。④在用户参与平台上,分高级用户、注册用户和匿名用户3个等级,在知识创建和维护过程中分别对应提出主题、编辑修改和浏览讨论的权限。

系统实现主要利用MediaWiki开源软件。该软件运行于PHP+MySQL环境,功能丰富、架设简单、建站方便,能够实现Wiki的主要特色功能,如历史版本管理、根据分类在信息之间产生自动关联等,而且开放源码,是建立Wiki网站的首选程序。系统运用的关键技术包括RSS、Google AJAX Search API、Google AJAX Feed API以及分类等知识组织技术。

作为特色功能,系统能够对同一主题知识集成多种载体形式,形成“全面系统的知识提供服务”。进行关键词搜索后,系统在同一页面中一站式地返回了相关知识介绍、背景、新闻、网站、评论、论坛、博客、图片、视频等模块,将Wiki知识与系统外部信息相整合,并经过组织提高了系统性,有助于用户对知识的深入理解。

但该系统未实现基于用户分析的推荐(只实现对最新信息的自动推荐)、运用语义网揭示资源之间关联等功能。

5 结语

知识服务系统的Wiki应用及其与知识技术的结合对图书馆有巨大价值。首先,体现在对馆员和读者上,Wiki技术的应用提升了人的隐性知识的价值。通过开放和协作的知识创建方式,人的潜能和创造力被激发,沉淀的个人隐性知识得以贡献出来,在社会化、融合和内化的螺旋上升过程中发挥更大价值。而读者在系统中的地位得到提升是Wiki的另一大价值,图书馆的知识不应局限于馆藏和馆员,读者不仅得以贡献自己有特殊价值的知识,也提高参与图书馆活动的积极性和深度,推动其对图书馆资源更深层次的利用。

应用Wiki的知识服务系统对图书馆资源建设价值显著,不仅知识库的容量增加,而且发生质的改变。多元异构、动态更新、优化组织的知识为馆藏资源提高了生命力,也为资源的关联、集成与共享奠定了基础。

最后,在图书馆知识服务系统中对Wiki技术与其他知识技术加以对接与实践,对互联网时代图书馆的理念与服务模式是一种变革。图书馆在知识的积累、传播与共享功能上,通过知识服务系统,特别是Wiki技术及相关知识技术的应用,提高了知识资源的加工深度、馆员与读者的主动介入程度,以及知识发挥增值效益的广度和灵活度;通过技术先进性与人的能动性相结合,基于图书馆主体的利益和资源的价值,图书馆的平等开放、知识共享与文化传承的功能与理念得以更好地实现,知识服务系统引领了对传统图书馆服务的超越。

[1] 李瀚瀛.Wiki作为知识组织工具的应用初探[J].国家图书馆学刊,2007(3).

[2] 王健.利用Wiki技术提高图书馆信息服务水平[J].图书馆学研究,2006(10).

[3] 陆泉,邓晶,胡慧丽.基于Wiki的数字图书馆信息服务平台研究[J].图书馆论坛,2010(2).

[4] 王伟军,等.基于Wiki的知识服务系统研究[J].情报科学,2008(9).

[5] 刘晓英.知识关联及其应用研究[D].湘潭:湘潭大学,2010.

[6] 李大伟.数据挖掘在用户行为分析中的研究与应用[D].北京:北京邮电大学,2009.

[7] 钱国青,李旸.基于关系网络的专家技能评估方法[J].微型电脑应用,2005(11).

[8] 毛先领,李晓明.问答系统研究综述[J].计算机科学与探索,2012(3).

[9] 王珊.萨师煊.数据库系统概论[M].北京:高等教育出版社,2006.

猜你喜欢
知识库馆员关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
“一带一路”递进,关联民生更紧
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
勘误
奇趣搭配
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
智趣
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究