图书馆参考咨询系统开发环境和技术分析

2012-10-23 05:32陈冬梅
图书馆学刊 2012年3期
关键词:咨询检索服务器

陈冬梅

(广西民族师范学院图书馆,广西 崇左 532200)

1 引言

数字参考咨询服务在现代参考咨询中的地位越来越重要,图书馆咨询员可以与读者通过网上参考咨询系统进行交流,接受提问并给出问题的解决办法。它突破了用户与咨询员在时间和空间上的界限,提供了网上咨询和交流的渠道。系统还建立了问答数据库,将所有问题进行整理保存,为以后进行相似问题的咨询积累经验,不仅有助于图书馆员对咨询问题和答案的管理,而且有利于读者对咨询系统的利用。国外典型的参考咨询系统主要有英国公共图书馆的Ask A Librarian、美国的虚拟咨询台系统(Virtual Reference Desk)等,国内有国家科学数字图书馆数字参考咨询系统、CALIS分布式联合虚拟参考咨询系统等[1]。笔者主要对参考咨询系统的设计模式及开发技术进行分析,为图书馆的信息化建设提供一些参考依据。

2 参考咨询系统用户及其需求分析

参考咨询服务首先由用户提出问题,图书馆工作人员收到咨询问题后,对问题进行分析和判断,剔除不当问题并给出拒绝回答的理由,将表达不够清楚的问题重新发给用户确认,问题明确后对其进行分类,然后将问题分别发送给相应解答人员或者咨询专家,收到提交的答案后要进行检查,如果答案不合格,应发回相关人员进行修改,直到读者对答案感到满意为止。

从图1可以知道系统主要包括3类用户:参考咨询员(咨询专家)、读者和系统管理员。参考咨询员主要的工作就是接受用户的咨询请求,倾听并理解用户的提问,与之进行交流,通过交流对用户问题有更清晰的理解,掌握用户的真正目的,回答问题后及时将答案发送给用户并询问用户是否满意。保存和整理已结束的咨询记录,对常见问题库(FAQ)进行分类整理,以方便用户查找所需问题的答案。

读者主要指登录到系统,使用系统中咨询功能浏览问题、查询答案、利用咨询软件咨询问题的个人。读者利用系统提供的手段,例如咨询表单、实时咨询等方式提出问题,与咨询馆员进行交流和探讨。进行咨询的用户最大的特点就是无论何时何地,只要有网络连接的地方,登录系统就可以进行咨询,不受时空限制。

图1 咨询业务过程

管理员主要的工作就是对系统的日常维护和管理,包括读者用户的管理、专家管理、个人信息管理等。

3 系统开发环境分析

软件体系结构主要有客户机/服务器模式(C/S模式)和浏览器/服务器模式(B/S模式)。客户机/服务器结构主要包括一个客户机(或称前端)和一个服务器(或称后端),客户机的作用是访问和处理远程服务器上的数据,服务器的作用是接收和处理客户机的数据请求。B/S模式主要包括表示层(Presentation)、功能层(Business)、数据层(Data Service)。表示层主要为Web浏览器,用户通过浏览器网页输入信息提交与系统交互,也可通过网页浏览相关信息。功能层是具有应用程序扩展功能的Web服务器,主要响应浏览器的请求,启动相应的程序并处理请求,然后将处理的结果返回给客户端浏览器。数据层是数据库服务器,主要接受Web服务器的数据库操作请求,实现对数据库更删改查等功能,然后将结果提交给Web服务器。图2为基于Web访问数据库过程。与C/S模式相比,采用3层的B/S模式具有分布灵活、伸缩性好、管理能力强的特点。

系统开发环境包括硬件环境和软件环境两部分,硬件环境要根据图书馆自身的经费来确定购买什么样的计算机,配置什么样的设备。笔者重点分析系统的软件环境,主要的软件开发环境可分为商业软件和开源软件两种,商业软件大多是以微软服务器技术IIS、SQLserver及ASP、.NET技术为开发环境;开源软件是以服务器技术Tomcat、Ecilicpse、MySQL为开发环境,主要以J2EE(JSP、JavaBean、Sevlet)、SSH(Struts、Spring、Hibernate)为核心技术框架。

按技术开发环境可分为结构化开发技术和面向对象开发技术,如ASP和JSP技术主要用于结构化开发,.NET和SSH技术主要用于面向对象开发。系统分析也可分为结构化分析和面向对象分析,面向对象分析是现在比较流行的系统开发方法,利用UML语言(Unified Modeling Language,统一建模语言)对系统模型进行分析设计,UML是运用统一的、标准化的标记和概念来实现对软件的面向对象分析和设计,它主要由一系列的图以及定义的各种关系组成,综合了软件工程领域的最新的思想和技术,是一种占主导地位、功能强大、使用广泛的建模语言。

由于开发时的要求不同,我们可以选择不同的开发方法,对于比较简单的参考咨询系统我们可用结构化分析方法对系统进行需求分析及详细设计,在开发上可采用ASP+Access开发环境或Tomcat+JSP环境;如果是较大型的系统我们可采用面向对象分析技术,采用ASP.NET+SQLserver或SSH+MySQL等,在实际开发中可以根据自身的条件灵活选择。笔者建议使用面向对象分析方法及成熟的开源组合SSH进行系统开发,这些软件一方面应用比较广泛,另外它们还属于开源软件,在经济和技术上有着独到的优势。

4 系统应用技术分析

随着互联网技术的发展,读者的许多问题可通过网络搜索引擎找到答案;另外还出现了百度知道、新浪爱问等网络问答系统,这些都影响了参考咨询系统的发展,也为咨询系统提高自身服务水平提供了借鉴。

4.1 信息分类浏览导航技术

许多网站有自己的网络导航功能,如分类导航系统,现在流行的网址导航便是其中的代表,导航系统主要是通过对本地资源分类展示,由用户进入相关类目进行浏览和检索。参考咨询系统一般都有一个FAQ浏览系统,按照一定的分类体系对问题和答案进行分类,用户则根据给定的分类界面选择所问问题的类别进行浏览。文献[2]中的技术就是一种导航帮助系统,其主要特点是,把问题类型分成咨询问题类型、已知条件类型、信息资源类型和检索技巧类型4个大类,每一分支又细分为更小的若干类型。系统通过用户选择查询目的、已知条件类型、答案的信息资源类型、具体检索工具等,判断提供各种检索技巧知识,帮助用户通过学习来寻找答案。这种导航系统的特点是将检索技巧作为系统知识库的一个分支类型,让用户通过学习和掌握检索技巧来达到自己解决问题的目标,提高其信息素养。

4.2 信息检索技术

信息检索技术主要包括自然语言分词技术、索引技术、检索技术3方面。部分FAQ库使用一些简单的数据库搜索技术,如通过关键词进行搜索。用户可通过咨询系统的搜索入口提交问题关键词,系统先对问题进行分析,然后搜索本地资源给出相关的检索信息。关系数据库检索主要适合结构化数据,全文检索技术适用于非结构化数据如文本数据、图像声音等多媒体数据,Lucene全文搜索技术就是其中一个典型代表。Lucene是一个纯Java实现的成熟、自由、开源的软件项目,是一个高性能的、可扩展的全文索引工具包。它可以方便地嵌入到各种应用,实现针对应用的全文索引检索功能。基于Lucene可建立数据库、文档、网页、图片等多数据源搜索引擎,这非常适合咨询系统,因为咨询系统的问答库资料往往比较复杂,包含各种格式和内容的数据信息。

Lucene提供中文分词扩展功能来提高中文分析能力,对中文文本进行分词,然后再由Lucene进行索引,如图3,Lucene主要通过文档索引和数据检索两项来实现其搜索功能。Lucene最核心的特征是通过特殊的索引结构,实现传统数据库不擅长的全文索引机制,并提供扩展接口以方便不同应用的定制,Lucene在维护索引文件方面也有其独到之处。lucene建立索引的过程有4步:提取、构建、分析、建立索引。Lucene检索可以分为两大部分:计算查询语句与文档的相似度,计算检索排序得分返回结果文档。Lucene的检索方法是基于向量空间模型的,查询语句和文档都被表示成向量[3]。

4.3 用户建模及分析技术

参考咨询系统的另一发展方向是智能化,其功能主要包括当用户提出问题后,系统会搜索与此问题相似的已答问题供用户参考;当回答某问题后,系统会向相关专家推荐与其相似且有待解决的问题来帮助回答;还可通过系统直接向读者推荐一些其感兴趣的问题,或向读者推荐咨询员。这些功能和方法有利于调动相关用户参与回答问题,增加系统的主动性和智能化,对提高问题的回答率有益。根据不同的推荐机制形成不同的推荐方法,目前主要包括基于内容的推荐机制、基于协同过滤的推荐机制以及结合型推荐机制3种。基于内容的推荐机制就是分析问题本身的各项信息与被推荐用户兴趣的相关度来推荐问题;基于协同过滤的推荐机制是比较提问用户兴趣和被推荐用户兴趣,并找出与提问用户最为相近的人来回答推荐问题;结合型推荐机制是将以上两种方法相结合来推荐问题,不但要考虑待推荐问题与用户兴趣的相关性,还要考虑该问题的提出者与每个用户兴趣的相关度,然后通过一种加权算法来推荐问题。

图3 Lucene索引和检索流程

文献[4]提出了基于负载平衡的问题推荐方法,在推荐时通过抽取问题相关的知识领域以及学习用户的知识模型来进行分析和比较,通过用户对各个领域的兴趣度和权威性来推荐相关问题,提高了问题的回答率以及答案的准确率。同时还利用负载平衡技术分析用户负载能力以控制某个专家被推荐的问题数量,以便将问题尽量推荐给兴趣相近的不同用户,挖掘出潜在专家。文献[5]提出了基于层次分析方法(AHP)解决高校虚拟参考咨询系统中的专家调度问题,按照层次结构模型通过综合运算,计算出各专家的调度综合评分,根据评分的高低为提问者分配一位最适合的专家来回答问题,加强系统的辅助决策功能。

[1] 张智雄,等.国家科学数字图书馆数字参考咨询系统的设计与实现[J].大学图书馆学报,2003(5):14-17.

[2] 周群芳,吴云标.自助式咨询知识库的组织设计[J].图书情报工作,2008(3):80-83.

[3] 索红光,孙鑫.针对中文检索的Lucene改进策略[J].计算机应用与软件,2009(6):175-177.

[4] 呼大为,陈恩红,刘文印.即时交互式问答系统的设计与实现[J].小型微型计算机系统,2009(9):1761-1766.

[5] 廖黎莉,等.高校参考咨询系统中专家调度模式的研究[J].计算机工程,2007(4):272-275.

猜你喜欢
咨询检索服务器
通信控制服务器(CCS)维护终端的设计与实现
瑞典专利数据库的检索技巧
PowerTCP Server Tool
一种基于Python的音乐检索方法的研究
咨询联盟大有可为
得形忘意的服务器标准
计算机网络安全服务器入侵与防御
专利检索中“语义”的表现
健康咨询
健康咨询