聂珍 王华秋 唐中军
〔摘 要〕本文提出了一种图书馆读者信息服务的详细解决方案——面向读者的信息服务多代理专家系统,该系统采用了虚拟专用网技术,提供了一种通过公用网络安全地对图书馆内部专家系统和数据仓库进行远程访问的连接方式,从而大幅度降低了通信费用。内部的专家系统则以〣/S网站软件的形式出现,图书馆管理人员可以通过访问网站实时了解读者的借阅状况,并利用系统的图书推荐提示可以对潜在流失的读者实施挽留,将有助于提高图书馆的信息服务质量。
〔关键词〕虚拟专用网;专家系统;多代理;图书馆信息服务
DOI:10.3969/j.issn.1008-0821.20.01.017
〔中图分类号〕G250.71 〔文献标识码〕A 〔文章编号〕1008-0821(20)01-0067-04
A Multi-Agent Expert System of Library Service
Through Virtual Private NetworkNie Zhen1 Wang Huaqiu2 Tang Zhongjun1
(1.Library,Chongqing University of Technology,Chongqing 400054,China;
2.Computer Science College,Chongqing University of Technology,Chongqing 400054,China)
〔Abstract〕The paper presented a detail solution of library reader information service by the name of multi-agent expert system oriented reader information service.Virtual private network technology was adopted into the system to provide a remoting connect method of library internal expert system and data warehouse through common network so that the communication cost has been reduced.Internal expert system was shown by the form of 〣/S website in order that library officers real-time understand reader conditions through the website conveniently.Consequently,the potential loss readers were retained by the books recommendation of the system so as to enhance the information service quality of library.
〔Keywords〕virtual private network;expert system;multi-agent;information service of library
对于图书馆来说,无论图书馆规模多大,或者馆藏多少,读者才是图书馆生存和发展的根基,而保持读者、吸引读者和充分发掘读者的借阅潜力是图书馆提高核心竞争力的关键。如何通过提高读者的满意度及忠诚度,已成为各类图书馆关注的焦点课题[1]。图书宣传是图书馆常用的方式。图书馆纷纷推出各类畅销图书的介绍。图书宣传激励了读者的阅读兴趣,但很难满足不同层次的读者需求,由于背景、收入、年龄、教育程度、行为特征等的不同,对图书馆服务的需求也呈现多层次、个性化、差异化的趋势。单一的图书宣传无法满足众多读者的独特需求,个性化服务和实时推荐将是未来图书馆竞争的主要内容。
如今的数字图书馆几乎都利用高端服务器、多类网络通信技术和智能存储系统,将面向对象的软件技术、人工智能技术与先进的知识组织和调度系统相结合,建立具有很好的可扩展性、易用性、可管理性和高可用性以及较强的可持续发展能力的数字图书馆系统和群体。其代表项目的主要功能概述如下:
哥伦比亚大学开发了一项“新书通知服务”,每周向用户提供E-mail通知,通知的内容既包括新编目的图书,又包括电子资源以及和用户的研究学习兴趣相匹配的其他媒体。美国RICE大学的Information Session,也可以按照教师和学生的个人需求定做不同的信息服务。UKE大学的End Note Bolographic Software,则可以帮助用户建立一个个人化图书馆[2-3]。
北京大学开发了一个用户信息模块,为用于提供个人查询信息的窗口,用户可以向图书馆提出服务请求和建议。清华大学图书馆也研制了“快捷图书馆——读者的个性化图书馆”,提供了个人信息查询、书目追踪、定制服务等功能,但是仍有待继续开发。浙江大学图书馆研制了“我的图书馆”,采用了〣/S访问模式,读者通过浏览器进入系统,根据自己的知识结构和信息需求对图书馆数字资源进行利用。中国人民大学图书馆和信息学院共同推出了“Digital Personal Service System”,包括了数字图书资源检索、个性化推荐、在线咨询3个子系统,该系统根据读者的专业特点和兴趣爱好,向读者提供和推荐教学科研所需的资料和信息,还能实现在线咨询服务,实现了图书馆异构数字资源的共享[4-5]。
由此可见,数字图书馆的建设是以不断改善读者服务为最终目标。为读者在知识发现与利用上提供高效方便的工具,并且使得读者可方便地透过数字图书馆的多个资源库无缝获取所需的知识。以人为中心的数字图书馆研究试图进一步了解数字图书馆在增强人类在创造、探索、使用信息方面的活动中的影响和潜力,并促进为这些活动设计的技术的研究。
随着各国图书馆数字化程度与数字图书馆的建设不断发展,图书馆要处理和提供的信息更多、更新、更广泛和更复杂。在图书馆现有的数字化系统中每年、每月、每天产生着大量的统计数据和表单,它们对图书馆馆藏建设等业务有着很强的指导作用[6]。因此,如何获取知识便成为广大研究者和工程人员关注和研究的重点。利用数据挖掘为基础的专家系统可以从大量的数据中所取隐含在其中的、人们事先不知道的、潜在的、有用的知识,必将为图书馆事业的发展提供有力的支持[7-8]。
总之,图书馆服务多代理专家系统可实现信息服务质量的提升和业务的拓展。这样构成的数字图书馆借助现代信息技术,其意义不仅在于服务媒体和时空的转变,更重要的是能够借助专家系统技术,完善其服务结构和提升服务水平。
在这种背景下,本文提出了一种基于全新的基于信息技术的管理理念——面向读者的信息服务多代理专家系统(Orientation Reader Multi-Agent Expert System)。其最终目标在于图书馆与读者建立一种长期的借阅关系,能使图书馆赢得竞争优势。下面我们来解释一下系统的定义。
系统的设计思路
众所周知,专家系统体现了人的思维能力。将这种思维能力和系统的物理规律、数学模型有机地结合,更灵活地表征系统各个状态,而多代理专家系统软件正是力图在得到足够好的专家知识的基础上,依靠优化和学习,调整专家知识、调整推理结构并对图书馆系统运行状态给出相关的判断。
所谓多代理,是指实现手段有很多,包括读者细分、读者忠诚度分析、读者流失分析、读者图书推荐这四大推理引擎。多代理既是专家系统的重要理论组成部分,又是其重要管理工具,是分门别类研究读者、进行有效读者评估、合理分配服务资源、成功实施读者策略的技术保障,为图书馆充分获取读者特征、制定图书推荐策略提供理论和方法指导。
多代理专家系统包括了4种推理引擎:(1)读者细分引擎;(2)读者忠诚度分析引擎;(3)读者流失分析引擎;(4)读者图书推荐引擎。
这4种推理引擎同时存在、各尽其责(如图1所示)。这些引擎是通过图书馆历史数据和在线强化学习达到。
图1 系统组成结构
在对4种引擎结论的优化决策中,采用如下方法:
在引擎推理融合中,将各推理引擎的决策uj综合,产生最后决策u,最后决策取决于概率比值:
其中U=(u1,u2,…,un)是输入矢量。
在多代理专家系统中,读者细分推理机、读者忠诚度分析推理机、读者流失分析推理机和读者图书推荐推理机均靠图书馆实时流通业务数据库的触发器启动,它们的计算工作流程图如图2所示。
不同的决策概率可能会造成不同的结论,这往往需要实践加经验来决定,能否有一种自适应的方法或者模糊的方法来解决该问题也是系统的难点之一。
2 系统实施方案
对于图书馆信息系统提供基于Web的读者基本数据、读者借阅记录等信息,进行读者细分,分析读者忠诚度,研究已经流失的读者,从中寻找出先前未知的、对图书馆决策有潜在价值的知识和规则,发掘潜在流失的读者,让图2 推理引擎工作流程图
图书馆实时把握读者动向,掌握读者流失的规律,及时对潜在流失的读者提供感兴趣的图书推荐,从而达到提高图书馆服务质量的目的。
针对上述目标,本文着手从以下几个方面开展实施:
2.1 数据仓库的设计与实施
这方面的内容包括建立实时数据库,设计多维立方体,建立OLAP分析模型等内容。
2.2 建立四大推理引擎
(1)读者细分引擎:根据读者的基本信息,如年龄、性别、专业、年级、学历等,利用系统聚类算法,把读者分割成不同的群体。
(2)读者忠诚度分析引擎:根据读者的借阅习惯,利用决策树算法将读者分为偶然读者、一般读者和忠实读者三类。
(3)读者流失引擎:根据读者资料和借阅行为及其相关数据等历史信息,将神经网络应用于读者流失分析中,针对目前图书借阅中存在的问题,给出了读者流失预测模型,利用训练后的模型对读者的流失率进行预测并生成读者列表。
(4)读者图书推荐引擎:利用关联规则挖掘算法分析读者和图书之间的关联,进而向读者推荐其它可能感兴趣的图书。
对于不同的引擎,可能需要采用不同的人工智能算法加以分析,而这些算法用于分析图书馆信息服务数据的准确性和实时性恰恰是本文的难点。四大推理引擎是形成知识的必要条件,我们初步考虑如下算法这些推理引擎:
读者细分引擎:采用层次聚类算法实现。
读者忠诚度分析引擎:采用决策树分类算法实现。
读者流失引擎:采用神经网络预测算法实现。
读者图书推荐引擎:采用关联规则和序列分析算法实现。这里需要解释一下为什么要用两种方法实现图书推荐,关联规则模型分析的是读者的个人信息,并由此预测该读者最有可能借阅其它图书,这种模型适合于经常借书或正在借书的读者,当他们借阅书籍时可以及时向他们推荐其它图书,序列分析模型分析的是图书借阅信息,并由此预测借阅了某图书的读者还可能借阅其它哪些图书,这种模型适合于不经常借书或没借书的读者,当他们借了某图书后,可以通过电子邮件或者其它方式告知他们图书馆有他们感兴趣的图书,激发他们的借书读书的热情。
2.3 将推理引擎集成到专家系统中
专家系统由四大主要部件:知识库、推理机、用户接口、动态库。将四大推理引擎的知识集成,基于一种特有的图形化专家知识组建方式,可以很方便地任意增加、修改、存储专家知识,使专家知识能不断地积累、丰富和完善。其推理过程如图3所示:
图3 模糊推理过程框图
采用这样的方式进行知识融合,形成关于读者的完整认识,应用心理学有关方法,对读者实施必要的针对性图书信息推荐。
在进行模糊诊断之前首先要设法建立读者状态与引擎结论之间的模糊关系矩阵玆,也叫隶属度矩阵。首先测取读者的待检状态的征兆参数向量矩阵玐;然后求解关系矩阵方程玒=X甊,得到待检状态的向量玒,据此即可得出合理的结论。
2.4 专家系统的评估与动态优化
由于图书馆的书籍不断增加,书籍对于读者的吸引了会发生变化,而读者由于自身的发展需要,对于图书的渴求程度也会发生变化。因此上述形成的对读者的全面认识可能会变成一种历史经验,而缺乏现实的指导意义。
专家系统的动态优化和推理引擎的实时自修正问题关系到系统的准确性和有效性。这就需要决定何时进行系统更新或者引擎自修正,如何时机不对,既有可能造成误报也有可能造成漏报,反而造成图书馆管理的混乱。根据不同情况而定做的界面,可使图书馆管理人员能很便捷地观察读者变化趋势和推理过程。当知识和现实发生矛盾时,需要定期地启动推理引擎进行新的推理,重新融合成新的专家知识,对专家系统的动态优化才能让其具有生命力,持续地为图书馆信息服务提供作用。
2.5 虚拟专用网VPN的建立和安全性设置
虚拟专用网VPN的建立原本是成熟技术,但是由于涉及图书馆内部信息,于是VPN的安全性配置成为了需要关注的内容。
在以上理论研究的基础上,实现专家系统Expert System,结合数据仓库Data Warehouse和虚拟专用网Virtual Private Network技术构建系统的实施图,如图4所示。其中虚线框中的内容是本文需要完成的内容。图4 系统实施图
3 结 论
本文利用智能技术中的专家系统实现智能信息推送。既有图书馆服务信息管理功能,也有用于推理引擎的数据挖掘算法理论研究,还有信息集成和知识融合功能,可以说是比较全面的图书馆信息服务智能分析系统,该系统最终以知识的方式展示出来,从而构建了图书馆智能信息共享平台。
参考文献
[1]於坚秋.公共图书馆读者信息需求与服务对策浅析[J].国家图书馆学刊,2007,(1):85-88.
[2]马建玲,史风.国外图书馆MyLibrary个性化服务系统比较研究[J].现代图书情报技术,2004,(10):70-73.
[3]季晓林.MyLibrary用户模型功能设计——泰达数字化图书馆个性化服务的实践[J].现代情报,2005,(10):85-87.
[4]何平,陈有志,廖红四.数字图书馆信息门户的个性化服务模式[J].中国信息导报,2006,(8):27-29.
[5]曹作华.论图书馆信息资源建设的综合评价[J].图书情报工作,2002,(5):45-49.
[6]王居平.图书馆学和情报学中的量化分析和预测方法初探[J].情报杂志,2007,(1):105-106.
[7]赵嘉凌,蔡文伟.基于数据仓库和OLAP的图书借阅分析系统的设计[J].图书馆学研究,2008,(3):36-39.
[8]李璐璐.基于数据挖掘技术的信息服务研究及系统模型设计[J].大学图书情报学刊,2008,26(4):46-48.