陈少华?董琪?熊强
【摘 要】专业知识库的应用广泛,涉及科学研究、工程技术、社会管理和文化创意等多个方面,是专业出版社数字化转型升级、政府部门管理信息化创新的新领域。建设专业知识库,应以应用和服务为导向,在数据、知识之间建立精准的、完备的、可靠的信息关联。实践表明,专业知识库研发应建设与应用并重,以事件案例为中心,将知识综合管理、知识应用服务与知识评估维护等功能集成化,解决需求提取、知识表达框架、知识关联、知识库体系、技术选型和开发模式等问题,选取和设计科学的知识描述方法及知识管理体系。
【关 键 词】数字出版;专业知识库;网络舆情;知识服务;案例知识
【作者单位】陈少华,华中科技大学;董琪,华中科技大学;熊强,华中科技大学。
【基金项目】教育部人文社会科学研究项目《基于知识管理的网络舆情监测与应用研究》(规划基金项目,批准号:11YJA86
0004);中央高校基本科研专项/华中科技大学自主创新研究基金项目《基于社会风险控制的网络舆情监测知识库开发及应用研究》(批准号:2011WA007)。
【中图分类号】 G230.7 【文献标识码】A
无论是技术研究、设备维修、疾病诊断与产品设计,还是社会舆情管理和政务决策,都属于专业知识应用和知识服务的范畴,需要充分的专业知识来支撑。出版社曾编辑出版了大量专业图书,但与实际工作需要相比,这些专业书刊承载的知识量有限,查找费时费力,利用率低。虽然电子文献数据库和电子书库提高了文献信息查找的速度和效率,也能提供一定的知识服务,但基本服务于研究和探索领域,没能实现提供精准、全面和实用的知识服务。这对专业出版机构、专业技术服务机构和社会管理部门而言,既是一个巨大的挑战,也是一次改革和创新的机会。专业出版社可以由此开展知识服务业务,实现从文本传播向知识服务的转型;专业技术机构可以建立支撑与企业业务相关的专业知识库,提高竞争力;社会管理部门可以借助知识库实现社会管理的信息化、智能化。因此,建立面向服务和应用的专业知识库及管理服务平台是有意义的、基础性的知识工程。文章主要探讨专业知识服务的特点及其对知识组织的要求,分析专业知识库建设中需要解决的关键问题,并以舆情知识库为例,讨论以案例知识为核心的专业知识库逻辑结构、知识框架及建设方法,实现知识和服务的有效整合,满足不同用户的服务需求。
一、专业知识服务的特征及对知识组织的要求
专业领域的知识服务类型很多,比如科学研究、工程技术、社会管理等,都需要专业知识和知识服务做支撑。提供专业知识服务的不仅有出版社、科技企业,还有高校和科研院所,甚至政府部门因工作需要也要建设专业知识库。专业知识服务对知识信息的选择和组织有很高的要求,要在众多数据、知识之间建立精准的、完备的、可靠的信息关联。
知识库的构建是在使用中逐步积累完善起来的。一方面,随着时间推移,事件知识、策略知识、报道信息在不断增加,知识的数量也在增加,用户的知识选用和评价信息也在不断增加。比如,一个注册用户数超过1万的舆情知识库,可能产生几十万甚至几百万个评价数据,根据这些评价数据,我们可以筛选优化策略,优化知识库本身。另一方面,随着知识服务要求的不断提高,知识库中的知识要不断更新,有的知识可能被淘汰,有的需要更新应用场景,有的需要调整价值系数,还可能需要增减知识标注或标签。同时,知识库的结构也需要改造,要增加一些知识描述项,或屏蔽一些知识描述项等。
可见,在专业知识服务的过程中,知识库既要进行知识服务,自身也要进行及时的充实、更新和优化。同时,我们也要注意到,科学合理的知识库逻辑结构对知识服务的能力提升具有很大的推动作用[1] 。在知识库建设实践中,我们常常将知识库分为事实知识库和执行知识库两部分,在层次上分为知识库构建层、知识库层、应用层[2]。 因此,在专业知识库的建设过程中,我们首先要对大量类似故障记录、舆情事件记录的数据整理分析,其次要使專业领域的知识表示方法能正确反映特定领域的知识特征。这些都是传统书刊出版做不到的,只有在数字出版和网络出版平台中才能实现。
在信息化环境下,专业的知识服务体系大多由知识数据库、应用软件和人机交互等部分组成。知识库存储有充分的以适当形式表示的领域知识集合, 包括常识的、书本的和经验的。大型复杂设备(如飞机)的故障诊断所需要的知识数量多、涉及面广,包括故障现象、故障原因、故障诊断结论、处置策略、处置效果等信息,这些单靠人脑记忆和自身所具备的经验是不够的,需要专业知识库来支撑[3]。农作物病虫害防治知识库也是如此,需要用合理的格式对问题进行描述[4]。专业知识服务应用到生活上,会出现贴近民生的服务知识库,如菜谱知识库,以及菜谱推荐系统,能直观地为用户推荐相似度较高的菜谱[5]。因此,构造高效、 完善的知识库管理系统会起到非常重要的作用。不同领域的专业知识库组成存在一定差异,具体如表1所示。
二、专业知识库平台建设需要解决的关键问题
知识库建设的难点之一就是知识库平台建设。根据相关理论和作者的知识库研发实践,专业知识库平台建设重点要解决需求提取、知识表达、知识之间关联、知识库体系结构、技术选型和开发模式等问题。
第一,专业知识库建设是从需求分析开始的。不同的任务,对知识的数量和精度及组织体系的要求有很大差别。我们需要通过需求分析确定知识库用户的知识需求、功能需求。本文提到的机电故障诊断知识库、农作物病虫害防治知识库以及作者研发的舆情知识库,都是从需求出发的。
第二,专业知识库建设需要选择合适的表示方法,做好知识单元的描述。不同领域的知识信息,其特征要素及描述结构差别很大,需要专门的描述结构和知识库结构。与案例性知识不同,模型性知识大多可以抽象表达为数学模型,符号性知识多以规则、框架等形式表示。就舆情知识库而言,舆情事件描述是基础,甚至常涉及突发事件的表示。借鉴层次网络表示方法,可将突发事件模型分为框架模型层、筛选模型层、属性模型层,有助于实现模型的动态组合和决策优化[6]。endprint
第三,专业知识库建设需要解决知识之间的关联問题。知识库是结构化、有组织的知识集群,需要在近似碎片化的知识之间建立精准的关联关系,构建知识索引表、关联表、详细标注体系等。
第四,专业知识库建设需要解决知识库体系结构问题。专业知识库服务范围广,是一个完整的知识体系,既要有科学的知识表达体系,又要有完整的知识库管理体系,既要对知识库中的知识进行管理,也要对知识表示模型进行分类归纳[7]。因此,机电故障诊断知识库包括故障事件、故障现象、故障原因分析、故障诊断结论、处置策略、处置效果等信息,农作物病虫害防治知识库也有类似的描述结构。此外,专业知识库的建设是动态的,我们不仅要搭建合理的知识库架构,还要让其具有知识的动态维护和优化功能。
第五,专业知识库建设需要解决技术选型和开发模式问题。数据库技术、数据挖掘等技术工具的选择,需要经过定性归纳、关联规则分析等加工处理, 使信息上升为知识,成为有指导作用的决策支持系统。同时,我们要重视建设方式,即使是委托开发,也需要建立自己的知识库分析、设计和运维团队。
三、专业知识库平台建设实例探讨——以舆情知识库为例
舆情知识库属于专业知识库,是面向舆情监测和管理服务的,舆情知识库建设要从需求分析开始,包括知识需求、功能需求和应用场景需求。舆情知识库承担着对事件、策略等知识的综合管理、应用服务、评估维护责任,在确定需求的基础上,舆情知识库建设要做好总体设计、知识表示和功能设计,以及知识描述、知识之间关联设计。作者研发的舆情案例知识库数据表体系如表2所示。限于篇幅,本文主要讨论舆情事件描述框架、舆情策略知识描述框架和服务功能设计。
舆情知识库是以案例为中心的专业知识库,事件描述是基础。舆情事件一般分为三个方面描述。一是网络舆情事件基本构成属性描述,比如事件名称、起因、经过、结果等;二是网络舆情事件传播特征描述,比如舆情热度、舆情强度等;三是舆情事件专项特征描述,比如社会影响、社会风险等。据此,我们可以建构舆情事件描述框架(见表3)。
事件舆情演化情况也是舆情知识库的重要组成部分,包括社会关注度、网站分布、地区分布、发布者影响、主题扩散度、主题敏感度、主题重要度、回帖频率、转载频率、网民态度倾向分布、舆论领袖态度倾向分布、媒体态度倾向分布、焦点状态值、拐点状态值、舆情时效值等信息。
策略知识是专业知识库的重要内容。就舆情知识库而言,一个网络舆情事件中可能会使用多种策略,而某种策略又可以应用于多个网络舆情事件中。因此,对策略的描述有多种方式。考虑到本网络舆情事件案例库的建设,我们采取的是以事件为主的描述,如表4所示。此舆情策略描述框架体现了以事件案例为中心,以及事件与策略之间的关联。其他专业领域(比如机电故障诊断、农作物病虫害防治)的策略描述框架也有类似结构。
专业知识库的编辑、分析、查询应用服务功能十分重要。作者研发的网络舆情知识库管理平台(实验版),以应用为导向,以舆论事件案例为中心,实现知识关联,如图1、图2、图3所示。此网络舆情知识库的主要用户是专业研究人员或舆情管理人员,知识库管理维护人员主要是对事件及事件相关新闻报道进行添加和修改,包括信息录入、信息编辑、信息浏览、信息分析、信息审核、信息下载等(如图4所示)。此外,该网络舆情知识库还能按知识类别、事件名称、舆情主题、发布时间段等某项或者多项组合进行知识检索查询,进行单项或者组合式的统计和分析,在基本统计的基础上,还可以实现单一或组合分析、静态分析和动态分析相结合。
综上所述,建设面向服务的专业知识库,应以应用和服务为导向。由于专业知识库对知识的选择和组织有很高要求,需要在众多的数据、知识之间建立精准、完备、可靠的信息关联,因此是一个长期不断积累的工程。与机电故障诊断知识库、农作物病虫害防治知识库类似,舆情知识库属于社会管理类专业知识库,是面向问题的专业知识库,应以事件案例为中心,对事件信息进行分析、归纳、整理,为用户提供知识支持。根据作者的知识库研究和开发实践,专业知识库平台建设重点要解决好需求提取、知识表达、知识之间关联、知识库体系结构、技术选型和开发模式等问题,选取和设计科学的知识描述方法、框架以及知识管理体系。在具体的知识生产过程中,还需要保证优质知识生产,依靠具有专业知识生产资源的专业出版社和具有优质知识生产资源的领域专家[8]。
|参考文献|
[1]蒋勋,徐绪堪. 向知识服务的知识库逻辑结构模型[J]. 图书与情报,2013(6).
[2] 王志,夏士雄等. 基于本体的矿井电机故障知识库构建[J]. 计算机工程,2010(10).
[3]陈璐璐等. 基于数据库技术的故障诊断知识库管理系统设计[J]. 航天控制,2007(4).
[4]刚勇,张红燕等. 面向服务型烟草病虫害知识库系统的研制[J]. 电脑知识与技术,2011(2).
[5]吴珊燕,许鑫. 基于案例推理的菜谱推荐系统研究[J]. 现代图书情报技术,2013 (12).
[6]邵荃等. 突发事件模型库中模型的层次网络表示方法[J]. 清华大学学报,2009(5).
[7]许洁. 试论知识库与知识库管理系统的关系[J]. 武汉工业学院学报,2004(23).
[8]王炎龙,邱子昊. 知识生产视域下出版业的知识服务模式[J]. 出版广角,2017 (13).endprint