刘同磊,曹云峰,庄丽葵
(1.南京航空航天大学 自动化学院,江苏 南京 210016;2.南京航空航天大学 航天学院,江苏 南京210016)
基于设计人员需求的知识推送技术研究
刘同磊1,曹云峰2,庄丽葵2
(1.南京航空航天大学 自动化学院,江苏 南京 210016;2.南京航空航天大学 航天学院,江苏 南京210016)
为了提高飞行控制系统(简称飞控系统)的设计效率,提出了一种基于飞控系统设计人员需求的知识推送方法。建立了设计任务的功能模型和包含领域属性及操作日志的设计人员兴趣模型,并设计了兴趣模型中个兴趣项的计分方法和设计人员隐性信息提取算法。依据设计人员兴趣模型给出了设计人员兴趣模型的更新原理,设计了基于本体的语义相似度知识匹配求解算法。开发了面向飞控系统设计的知识推送原型系统。通过一个实例验证了本文提出方法的有效性。
飞控系统;知识推送;设计任务;功能模型;兴趣模型
随着航空技术的快速发展,飞行器承担的任务逐步增加,飞行控制系统正向着航空综合化方向发展,与此相对应,飞控系统的规模越来越大,系统结构、功能、行为及数据交联关系越来越复杂。这意味着飞控系统设计人员在设计的过程中需要的知识量越来越大,种类越来越多[1]。目前的知识管理系统提供的是一种以查询为主的拉动式服务方式,即设计人员在获得自己需要知识前首先要明确自己的知识需求,通过检索词检索来获得相应的知识。在这种服务方式下,检索的结果包含大量的“垃圾知识”,出现信息冗余,设计人员的大量时间都耗费在知识的查询中,严重影响飞控系统的设计效率。因此,快速准确地向设计人员推送所需知识,对提高飞控系统的设计效率有重要的意义。
知识推送最早由美国《信息周刊》主编Ricadela[2]提出,并将其定义为一种网络化的知识服务方式。知识推送的本质是在适当的时间将适当的知识推送给正确的人。知识推送一经提出便得到了国内外学者的广泛关注,石美红等[3]在研究工作流引擎和知识引擎双驱动的知识主动推送实现机制的基础上,提出一种集设计人员、过程和知识为一体的知识主动推送服务的方法;蒋翠清等[4]研究了面向产品设计人员需求的知识推送服务,提出一种知识服务层次模型和需求驱动的产品设计知识服务运行模式;JUNG J J[5]研究了电子商务领域用户的知识推送,构建了知识推送框架;项兴彬[6]研究了基于本体的知识推送系统,提出了基于本体的用户模型,给出了用户模型的构建方法,最后对知识系统进行了实现;蒋翠清等[7]研究了知识推送在产品协同设计中的应用,提出设计过程知识需求模型的更新方法,设计了一种面向协同的产品设计知识推送模型;吉祥等[8]在建立设计任务和设计知识本体模型的基础上利用粗糙集和信息技术从知识使用日志中抽取了知识推送规则,进而实现了产品设计知识的推送;王世凯等[9]建立了领域知识与情境知识本体模型,在此基础上研究了基于情境的知识推送技术;王占松等[10]提出了一种基于机械设计意图建模的知识主动推送服务方法,开发了相应的原型系统;张艳等[11]在金字塔式技术状态知识管理体制研究的基础上,提出了一种基于知识地图的航天技术状态知识推送方法,并通过建立面向航天领域特点的分层立体知识地图和单层知识地图,实现面向空间和时间的双维度知识推送。
综合上述文献可以看出知识推送已经得到了广泛的研究,但是在这些研究中,缺乏对设计任务知识需求的研究。同时,在对设计人员进行知识推送时,没有充分考虑到设计人员的个性化知识需求,导致他们很难获取所需知识。针对这些不足,本文研究了面向飞控系统设计人员知识需求的知识推送技术,综合考虑设计任务知识需求和设计人员的个性化知识需求,基于此可使推送的知识更加符合设计人员的需求。
文中的知识推送是在飞控系统设计过程中,根据设计人员的知识需求 (包括设计任务知识需求和设计人员的个性化知识需求),系统自动地检索知识并向设计人员主动提供所需要的知识。文中基于设计人员需求的知识推送框架如图1所示。
图1 基于设计人员需求的知识推送框架
整个推送框架分为两层:
第一层,需求捕获和知识推送,当设计人员在进行飞控系统设计时,设计人员根据自己的设计经验和能力对设计任务进行分解,分解为不同的设计子任务,然后构建设计任务的功能模型,按照匹配方法进行知识匹配,得到设计任务需求知识集合;同时构建设计人员的兴趣模型,并计算操作行为中各个兴趣项的权值,按权值的高低排序;然后将设计人员的领域属性所对应的知识从设计人员需求知识集合中剔除。在自己熟悉的领域,设计人员基本能够掌握该领域的知识,所以在设计任务需求知识集合中剔除了设计人员熟悉的知识,这样处理也符合将最需要的知识推送给设计人员的原则;然后将剩余的设计任务需求集合按照设计人员兴趣项权值高低进行排序,形成设计人员需求知识集合,最后将知识推送给设计人员。
第二层,设计人员知识需求更新,根据当前用户的操作行为和推送决策,更新设计人员兴趣模型,更新设计人员的个性化知识需求,从而使得下次推送时获得准确的设计人员个性化知识需求。
2.1 设计任务知识需求获取
在飞控系统的设计过程中,设计人员在接到设计任务后,会根据目前所具有的设计经验和设计资源将设计任务进行相应的分解,设计任务的分解有利于知识需求的确定,综合这些设计子任务的知识需求成整个设计任务知识需求集合。在设计任务知识需求获得的过程中起到关键作用的是设计任务的预期功能这一属性,为了与知识库中的知识更容易的匹配,需要对预期功能进行一个形式化的表达。飞控系统的设计任务多为求解型,即从已知情况出发,通过计算、推断等,找出一个合适系统的最佳配置,其预期功能表达的形式从语法上多为动词和名词相结合的特点,如飞控计算机模块,其在飞控系统中的功能主要有两个:1)解算控制律;2)控制模态转换。其中的动词为“解算”、“转换”,名词为“控制律”、“控制模态”。所以本文采用“名词+动词”的形式来对功能模型进行表达,同时这些名词和动词经过语义标注可以在飞控系统知识本体找到相应的概念实体,方便了后面知识匹过程中相似度的计算。功能模型如图2所示。
图2 设计任务的功能模型
2.2 设计人员个性化知识需求获取
1)设计人员的兴趣模型
设计人员的兴趣模型包含两方面:设计人员熟悉领域和通过分析设计人员的历史操作日志获取的设计人员的兴趣特征。其中设计人员熟悉领域的信息为显性信息,比较容易从用户的注册信息中获得,如设计人员主要从事控制律的设计,则其熟悉的领域为控制律设计,一个设计人员熟悉的领域可以不止于一个。文中设计领域依据飞控系统的系统组成来划分领域模块。操作日志记录的兴趣特征为隐性信息,设计人员在搜寻资料、浏览文档、检索知识、及推送决策等会留下操作痕迹和信息,这些信息从某种程度上会暗示用户的兴趣。
根据以上分析建立设计人员的用户兴趣模型,如图3所示。
图3 用户兴趣模型
对于用户兴趣模型中的领域属性本文用一组关键词集合来表示。操作日志中包含多个兴趣项,这些兴趣项由检索记录、浏览记录、推送决策、反馈评价等组成。这些兴趣项和领域属性在用户的兴趣模型中都有相应的权值,但这些权值不是一成不变的,权值的高低设计人员对该领域的熟悉程度或是对某方面的操作频繁程度,权值的改变也是设计人员兴趣模型更新的依据。
2)设计人员隐性信息提取算法
设计人员在知识服务的过程中会进行浏览知识、检索知识、对推送的知识做出决策、对知识进行反馈评价等行为。为了确定操作日志中各个信息对设计人员兴趣模型的影响程度,对操作日志中的兴趣模型项设置了兴趣分。通过计算操作日志中各个项的分数来确定兴趣模型。隐性知识的获取主要包括浏览记录、推送决策、反馈评价、检索记录等。
文中将隐性信息分为两类:检索行为和另外3种操作行为,其中浏览行为、推送决策、反馈评价等经过算法计算后,如果满足要求,则得到是兴趣文档,然后从兴趣文档中抽取知识概念,并将知识概念载入到兴趣模型相对应的兴趣项中;而检索行为反映的是历史查询记录可以直接从数据库中获取。为了描述方便本文将浏览行为、推送决策、反馈评价统称为知识行为。
①知识行为
对以上的不同操作行为设计了不同的兴趣分计算方法。具体如下:
a)浏览行为计分如下,R为某篇知识文档,S为该篇知识文档要成为设计人员兴趣文档所要被至少浏览的次数,规定文档被浏览一次计1分,当计分达到S时,则说明该知识文档可以成为兴趣文档,然后可以从该文档中抽取知识概念,生成设计人员兴趣模型中的兴趣项,否则该知识文档不能成为兴趣文档,直到其计分达到S。如公式(1),当Sscan≥S时,为兴趣文档,否则不是兴趣文档。
b)推送决策计分如下,对于系统推送给设计人员的信息,设计人员有阅读和不阅读两种处理方式,不阅读这种处理方式决策结果为无用;经过设计人员阅读后的推送知识有两种结果,一种是设计人员认为该推送知识对目前的设计任务没有作用,则该推送知识被标定为无用,另一种设计人员认为对其设计任务有帮助,决策结果为有用,那么可以抽取知识中的知识概念集合组成本体的概念集合,载入设计人员实例的对应兴趣项中。
c)反馈评价计分如下,设MS为反馈评价的标准分数,m为设计人员对知识的反馈评分。当设计人员评分高于MS时,说明设计人员对该部分知识有一定的兴趣,计1分,然后抽取其中的知识概念组成概念集合,载入设计人员对应实例兴趣项中;如果评分未达到MS,则说明设计人员对该知识评价较差,对目前的设计任务没有帮助,如公式(2)所示。
以上3种操作行为的兴趣信息提取算法流程如图4所示。
图4 兴趣信息提取算法
②检索行为
文中的检索行为指的是设计人员历史检索行为,对检索行为的分析主要是针对设计人员在系统搜索引擎上检索记录进行兴趣信息挖掘。设计人员在通过关键词检索的过程中会留下检索信息,这信息被记录在用户相应的检索日志中。
检索日志中历史检索关键词的兴趣提取规则为:首先,获取一个历史检索关键词(i=1,2…n),然后遍历其余历史检索关键词,并与相比较,如果和相同则检索次数加1,并判定检索词此时是否大于设定的阈值,当检索次数超过阈值时,将该检索词加入到兴趣模型相应的兴趣项中,并对该词计1分;如果没有与相同的检索词,则检索次数定为1;根据此方法判定下一个历史检索关键词。
检索行为的兴趣提取算法流程如图5所示。
图5 检索行为兴趣信息提取算法
设计人员兴趣模型的更新原理:首先确定操作日志和领域属性的权值,操作日志和领域属性之间通过权值的变化可以相互转化,对于达到领域属性权值的操作日志信息可以转化为领域属性,而由于时间变化设计人员以前熟悉的领域会出现遗忘等情况,相应领域属性的权值就会下降,对于遗忘的领域属性由设计人员手动进行删除更新。
领域属性和操作日志中的兴趣项都有相应的权值,由于领域属性是设计人员在注册时提供的信息或是通过操作日志中的兴趣项转化而来,所以其优先级较高,初始权值将大于操作日志中的兴趣项。规定在新注册时领域属性的权值为W(W为一个具体的分数值),而操作日志中的兴趣项对兴趣模型的影响不可能完全相同,所以文中根据各自兴趣项对兴趣模型的影响程度设定了不同的权值因子,具体如表1所示。在模型更新过程中根据兴趣项的权值因子和上一节的计分方法来对其权值进行计算,当其权值达到为W时兴趣项可以加入到领域属性中,实现兴趣模型的更新。
通常飞控系统设计人员的设计任务是通过项目管理系统及产品数据管理系统进行发放和审核的。设计人员接受到设计任务后:
表1 操作日志各兴趣项的权值因子
1)根据自己的设计经验、资源配置等因素对设计任务进行分解,得到多个设计子任务;
2)针对每个设计任务建立其相对应的设计任务模型,根据设计任务模型捕获对应的预期功能并对预期功能进行分解,得到底层的功能单元;
3)对功能单元进行表达,综合所有形式化的功能单元;
4)通过匹配得到设计任务的需求知识集合TR,文中功能模型采用的是“名词+动词”的表达方式,所以知识的匹配采用基于本体的语义计算相似度来实现。功能模型语义相似度是功能模型中的功能项与知识库中表达知识的功能项在概念层的语义相似度的度量。
文中语义相似度的计算采用基于语义距离的方法。在一个本体中,两个概念间的相似度可以用概念节点之间的语义距离来计算[12],两个概念之间节点语义距离越近,表明两者之间的相似度越高,反之相似度越低。两个概念节点语义距离的公式如公式(3)。
M、N为两个概念节点,n表示最短路径的边数,i表示最短路径的第i条边,di表示第i条边的长度,wi为第i条边所占的权重,如果M、N之间不存在路径,则二者的相似度为0。在本文中为了计算方便,规定每条边的长度为1,所占权重为1,公式(1)可以简化为:Distance(M,N)=n。相似度的计算的算法采用基于语义的经典算法——WordNet的WP[13-15]算法,因此概念M、N相似度算法为公式(4)。
由于文中预期功能采用的是“名词+动词”的表达方式,所以在匹配的过程中要分别计算“名词”和“动词”的语义相似度,二者的乘积便为两个功能项的语义相似度。假设A、B分别为设计任务的功能模型中的一个功能单元,B为知识库中的有一对名词概念实例和动词概念实例组成的一对功能描述。Av、Bv为功能项中的动词,Av、Bv为功能项中的名词,根据公式4,A、B的语义相似度如公式(5)。
5)从设计任务需求知识集合TR中剔除设计人员兴趣模型中领域属性对应的领域知识;
6)然后将设计任务需求知识集合TR中剩余的内容按照设计人员操作日志兴趣项的权值高低进行排序,得到最终的知识推送项。知识匹配求解算法如图6所示。
图6 知识匹配求解算法流程图
文中采用B/S(Browser/Server,浏览器/服务器模式)模式构建了知识推送系统,采用Java语言作为服务器端的开发语言,系统由客户端软件(Browser)、Web服务器和数据库服务器DS(Database Server)组成。选择MySQL Server7.5作为关系数据库服务器,Apache Tomcat 7.0作为Web服务器,利用Eclipse集成开发环境进行系统的开发。系统由用户层、处理层、功能层及数据资源层组成,其中功能层为系统的核心,包括用户服务、知识服务和基本服务3个模块。
下面以飞控计算机架构设计这一设计任务为例,验证知识推送系统的有效性。首先系统捕获当前设计人员浏览行为、反馈评价、推送决策及检索行为等相关信息,根据这些信息构建设计人员的兴趣模型,系统根据以上信息为当前设计人员进行了知识推送,推送结果如图7所示:
图7 知识推送的结果
从图7可看出系统向该设计人员推送了8篇知识文档,并按照相似度进行了排序,从知识概念的内容:余度、飞控计算机、架构、可靠性等来看,推送的知识文档与设计人员的设计任务 “飞控计算机余度架构设计”相关性很大,从而说明该系统能够较准确的根据设计人员的知识需求进行知识推送,同时表明本文开发的系统很好的实现了知识服务的功能。
文中在知识推送的过程中综合考虑设计任务知识需求和设计人员的个性化知识需求,使设计人员知识需求更全面;同时通过用户兴趣模型的更新实现了知识需求的实时性,提高了知识推送的准确性。能够为飞控系统设计人员及时推送需求的知识,减少设计人员花费在知识查询方面的时间,在提高飞控系统的设计效率上具有一定的意义。
[1]刘兴华.飞行控制系统数字化设计技术研究[D].南京:南京航空航天大学,2011.
[2]RICADELA A.Microsoft’s knowledge push[J]. Information Week,2000(805):151.
[3]石美红,王婷,陈永当,等.基于业务过程和知识需求的知识推送系统[J].计算机集成制造系统,2011,17(4):882-887.
[4]蒋翠清,高家飞,李斌生.面向产品设计人员的知识推送服务研究[J].合肥工业大学学报:自然科学版,2012,35(3):392-397.
[5]JUNG J J.Attribute selection-based recommendation framework for short-head user group:an empirical study by MovieLens and IMDB[J].Expert Systems with Applications,2012,39 (4):4049-4054.
[6]项兴彬.基于本体的知识推送系统研究[J].信息系统工程,2012,20(1):30-32.
[7]蒋翠清,李斌生,高家飞,等.面向协同的产品设计知识推送研究[J].中国机械工程,23(16):1972-1977.
[8]吉祥,顾新建,代风,等.基于本体和粗糙集的产品设计知识推送技术[J].计算机集成制造系统,2013,19(1):7-20.
[9]王士凯,王力,江萍,等.基于情境的知识推送技术研究[J].计算机技术与发展,2013,23(2):131-134.
[10]王占松,田凌,段文睿.基于设计意图建模的知识推送技术[J].计算机集成制造系统,2015,21(3):606-617.
[11]张艳,梁欣欣,张耐民,等.基于知识地图的航天知识推送方法研究 [J].航天工业管理,2015(5): 35-37.
[12]CROSS V.Fuzzy semantic distance measures between ontological concepts[C]//Processing NAFIPS'04 :IEEE Annual Meeting of the Fuzzy Information Washington,DC:IEEE Press,2004.
[13]Michael S Lew,Nicu Sebe,Chabane Djeraba,et al. Content-Based Multimedia Information Retrieval: State of the Art and Challenges[J].ACM Transactions on Multimedia Computing,Communications,and Applications(TOMCCAP),2006(2):1-19.
[14]Michael S Lew,Nicu Sebe,Chabane Djeraba,et al. Content-Based Multimedia Information Retrieval: State of the Art and Challenges[J].ACM Transactions on Multimedia Computing,Communications,and Applications(TOMCCAP),2006(2):1-19.
[15]Li Lei,Zhou Guo-min.Personalized search engine based on Ajax and VSM[J].Computer Engineering and Applications,2007,43(19):89-91.
Knowledge push technology research based on the design personnel requirement
LIU Tong-lei1,CAO Yun-feng2,ZHUANG Li-kui2
(1.College of Automation Engineering,Nanjing University of Aeronautics&Astronautics,Nanjing 210016,China;2.College of Astronautics,Nanjing University of Aeronautics&Astronautics Nanjing 210016,China)
In order to improve the design efficiency of the flight control system,this paper proposes a knowledge push method based on flight control system designpersonnel requirement.It establishs the function modelof the design task and researchers interest model contained attributes and operations log. It also designsthe scoring method of interest in an item of interest model and extraction algorithm for information.On the basis of interest model,it offers updating mechanism researchers interest model.It design knowledge matching algorithmbased on ontology semantic similarityand develops prototype system of knowledge pushfor flight control system design.The effectiveness of the proposed method is verified by examples.
flight control system;knowledge push;design task;functional model;interestmodel
TN01
:A
:1674-6236(2017)02-0031-06
2016-01-30稿件编号:201601293
刘同磊(1990—),男,山东临沂人,硕士。研究方向:飞控系统数字化设计。