姜凯曦
(河海大学商学院,江苏 南京,210098)
科学技术的发展往往依赖于知识创新,知识创新的前提是有一个完美的知识共享和传播平台,机构知识库应运而生。机构知识库 (Institutional Repository, IR)就是一种基于机构的系统和服务,用以收集、组织、存储、分享本机构的知识资产。
基于社会网络模型的专家推荐系统就是要通过构建专家之间的关系网络图,分析用户与专家之间的最短距离,并构建相应的推荐指标,来满足用户的多样化需求。
通过以上的分析,针对传统专家推荐系统的不足,在继续选择常用的专家推荐技术,比如基于内容的推荐等,作为推荐的基础,除此之外,本文构建的系统具有更强的目的性,更全面的信息,以及以社会关系和专家作为推荐的依据,使用户更容易联系到适合自己的专家。
首先,本文中用到的基础数据库包括,专家的Tag、专家文档的Tag、专家自我描述信息、专家文档信息。
专家的匹配是推荐的基础,本系统中,拟用“相关性”来作为专家匹配的度量,采用基于内容的推荐技术,并结合重名消歧算法,解决专家姓名非完全匹配和专家重名带来的错误,取出相关性最高的N个专家作为推荐的备选。本文在进行相似度计算时,借鉴了传统的计算方法,套用传统的公式,进行了特征向量与输入信息的相似度计算,得到所匹配的Tag的关联Tag,以此扩充所需要查询的Tag。
但是,传统的计算方法,在计算文本特征项权重的时候,有不足之处——没有考虑词条位置对权重的影响。针对这个不足,本文在计算文本特征项权值时,改进了原有的计算公式,得到新的文本特征项权值计算公式如下:
上面已经得到匹配的专家信息,进一步进行专家推荐时,主要是计算匹配专家的质量指标:权威程度、互补程度、活跃程度,还有结构指标:位置特征、可达性、亲疏程度。这边的研究比较成熟,比如亲疏程度用六度空间理论可以分析,所以本文就不再多说。
首先,基于师生关系的网络模型和基于同事关系的网络模型,都很简单,因为就两种情况,要不有这层关系,要不就没有,所以对这两个关系的关联强度的设置是:有这层关系,对应位置上矩阵元素值为1;没有关系,则值为0。
其次,基于合作关系的网络模型,在对专家之间的合作关系强度值进行量化处理时,本文采用了论文贡献因子合成法。假设每位专家对论文的贡献都是相同的,那么两位专家合作完成一篇论文的关系强度小于两位专家合作完成多篇论文的关系强度,并且两位专家合作完成一篇论文的关系强度大于多位专家合作完成一篇论文的关系强度。基于以上的一个假设,可以得到两个专家之间的合作关系强度计算公式:
最后,基于多重关系的网络模型,多重关系包括上述的三类关系,此网络模型的作用就是辅助专家推荐中的专家序列的形成,在通过相似度计算得到匹配专家集后,再按照专家的多重关系,将其他与某一位专家相关的专家的相似度分值按照某一设定规则传递给该专家,从而改变该专家的相似度值,对专家序列重新排序,最终使真正与该学科领域高度相关的专家排在前面。在处理这三种关系的关联强度值时,要充分考虑三个关系的权重分配,还需要注意,在合并时,三个关系的关联强度值必须处于同一数量级,计算公式如下:
在上一章,本文已经对专家推荐系统构建的目的和方案进行了说明,并依据专家推荐系统推荐专家的流程构建了专家推荐系统的指标体系和社会网络,在这个基础上,我们对专家推荐系统的原型系统进行了总体设计。首先,根据Web应用程序的特点,将专家推荐系统分为三层结构:用户界面层、业务逻辑层和数据访问层。其次,为满足系统对可扩展性、可移植性和安全性等方面的要求,本系统采用J2EE构架的核心思想,即MVC设计模式,将系统分为视图、模型和控制器3个核心模块,每个模块的功能及系统的工作流程见图4-1
图4-1
在以上叙述的基础上,下面可以设计出如下原型系统的功能模块:
这个原型系统中,核心模块为专家推荐模块和社会网络模块。专家推荐模块主要实现基于分类的专家推荐,基于主体的专家推荐,专家关系查找,专家信息查找这四个功能;社会网络模块,这个模块的实现是基于Applet与Servlet技术的。Applet程序是一个经过编译的Java程序 ,它运行于客户端的网页之中,一般情况下以GUI的形式展现出来,能过完成接收用户输入、图形显示、声音演奏等工作。Servlet是与Applet相对应的技术,只不过它运行在服务器端,本文将两者结合,采用Http协议的通信方式,实现社会网络的动态结构。实现的社会网络结构包括以下四个方面:通用类库、数据处理类库、JUNG社会网络图类库以及社会网络控制类库。其中,JUNG社会网络图类库 ,负责接收到数据进行视图映射、视觉转化和视觉渲染,并实现最终社会关系网络图形的绘制。
到这里,我们可以说基于社会网络模型的专家推荐系统的基础工作已经完成,下面是按照设计,运用计算机语言来实现这个系统,所以下面就不再做过多的叙述。
针对机构知识库构建过程中存在的问题,特别是隐性知识共享这个瓶颈问题,本文提出了基于社会网络模型的专家推荐系统的构建,重点研究了专家推荐指标体系的构建和社会网络模型的简历,这为专家推荐原型系统的设计与实现,奠定了基础。希望本文的研究成果对机构知识库的研究能有所帮助。
[1]Raym Crow.The Case for Institutional Repositories:A SPARC Position Paper[J].ARL Bimonthly Report,2002(8)
[2]CARL.Institutional Repositories:Innovation in Scholarly Publishing,[2007-04-15].http://www.carlabrc.ca/projects
[3]朱丽雪.基于Dspace的机构知识库构建[D].天津:天津师范大学,2010
[4]王众托.知识系统工程[M].北京:科学出版社,2004
[5]张星星,陈雪琼.基于SNA的企业内部团队隐性知识共享的实证研究—以酒店业为例[J].北京第二外国语学院学报,2011,(7):51-57