杨金峰 陶以政 梁燕 李龚亮 唐定勇
摘要:近年来,随着互联网数字经济的飞速发展,企事业单位为了降本增效和扩大市场占有率,纷纷向数字化转型。传统信息系统已不能满足数字化转型要求,以传统信息管理系统为基础,面向知识管理系统(KMS)转型成为一种趋势。然而,组织中各种高价值专业知识如何被需要的员工高效利用,已成为组织面临的主要问题之一。知识推荐是解决知识有效利用的最有效方法。本文首先对知识管理系统和推荐算法的相关研究进行介绍;然后对知识管理中的推荐算法进行分析讨论和比较,最后探讨了知识推荐算法的发展方向。
关键词:知识管理;推荐算法;个性化服务
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)26-0217-04
Abstract:In recent years, with the rapid development of the Internet digital economy, enterprises and institutions have turned to digitalization to reduce costs and increase efficiency and expand market share. Traditional information systems can no longer meet the requirements of digital transformation. Based on traditional information management systems, the transformation of knowledge management systems (KMS) has become a trend. However, how to effectively utilize various high-value expertise in the organization to the employees who need it has become one of the main problems facing the organization. Knowledge recommendation is the most effective way to solve the effective use of knowledge. This paper first introduces the related research of knowledge management systems and recommendation algorithms; then analyzes, discusses, and compares the recommendation algorithms in knowledge management, and finally discusses the development direction of knowledge recommendation algorithms.
Key words:knowledge management;recommendation algorithm;personalized service
1引言
近年來,随着互联网业务复杂度的提高,企业与科研单位产生的信息量呈指数化增长。因此,我们的需求已经不能局限于将实体数据信息化,而是将信息化的数据知识化,形成易于管理、存储、应用的知识。鉴于此需要一个平台对知识进行操作管理,知识管理(KM)就应运而生。KM是收集、处理、分享一个组织内全部知识的方式,利用软件平台和开发技术对某一组织内大量有价值的方案、策划、成果、经验等知识进行分类存储和管理,积累知识资产,发挥其深层次的作用。主要功能集中在实现有效的知识存储,高效的知识发现、流转和共享。鉴于KM中的知识错综复杂,将需求知识通过检索技术呈现给用户复杂且耗时。如何在海量知识资源中,将恰当的知识在恰当的时间以恰当的方式呈现给恰当的人,从而做出恰当的决策,成为关注热点[1]。为解决此问题相关工作者提出将合适的推荐算法应用到KMS中,与此同时取得了显著成果。本文就近几年关于面向知识管理的推荐算法的相关研究分析、总结、对比和展望。
2知识管理
知识管理是一个较早提出的管理学概念,已二十年有余。随着信息化的发展,KM从模型走向应用,已有许多IT从业者对其进行研究和实现,研发了如Kmaster、WCP等产品。本章主要讨论KM的含义和常见模型。KM主要利用系统内的群体智慧来提高系统的可用性和创造性,为企业实现隐性知识显性化、显性知识共享化的功能。KM是一个在大量数据中挖掘、管理、应用知识的动态系统,包括知识采集和加工、存储和管理、应用和创新等模块。具体使用的技术有搜索引擎、专家系统、知识库、人工智能算法等。
陈兰杰[2]对国内现存知识管理模型做了综述,从管理学的角度对常用的知识管理模型做了介绍和分析。具体包括基于知识、基于知识管理工具等六种模型;其中架构合理、易于实现、应用广泛的是基于知识管理工具的KM模型。关于此姜丹[3]提出一种基于本体的知识管理模型(OBKM模型)、王昊等人[4]提出一种本体驱动的知识管理模型,在工程中得到了较好的使用。上述OBKM模型按如图1所示方式组织知识管理。 贾琨钰[5]提出针对大型企业知识管理的设计,在知识采集、管理、应用的模型上增加了知识评价,系统通过用户对知识的评价数据预估知识质量,从而对其做出优化和改进。
通过赵蓉英[6]总结关于知识管理近十年国内外的发展,发现国内偏重管理学科研究,国外更注重于信息技术。而随着近几年KMS的持续发展,国内研究重视计算机技术的引入,如机器学习、深度学习等技术应用于知识采集发现和知识应用等。因此关于KMS的发展趋势应是大数据相关处理计算、机器学习算法的创新与应用。
3推荐算法
在当前数据量爆炸增长的环境下,信息过滤技术已经成为每一个系统必不可少的成分,而信息过滤主要有分类检索和搜索引擎技术与推荐算法。如果信息分类不够明确或者用户检索关键词过少,则会增加检索时间以及影响到检索效果。而个性化推荐算法为推荐的精准性采集不同维度的信息、深入分析用户偏好。现如今,推荐算法已经分布在各行各业,例如电子商务、新闻、电影、旅游、教育等。
推荐系统作为推荐算法的载体,主要包括用户建模、推荐对象建模、推荐算法三个模块。常见的推荐系统流程[7]如图2所示,推荐算法作为桥梁连接用户和推荐对象,通过相似度计算,将合适的对象推荐给合适的用户。常用的推荐算法有基于内容的推荐、基于协同过滤的推荐、基于知识的推荐、基于社交网络的推荐以及混合推荐算法。下面对各类常用的推荐算法进行讨论。
3.1 基于内容的推荐
基于内容的推荐基本思想[8]:系统为给定的目标用户推荐与其喜欢或浏览对象相似的对象。它无须用户评分只需要根据用户记录学习并抽取用户兴趣偏好,最后将与用户兴趣相似度较大的项目推荐给用户即可。该算法的重心在于用户兴趣偏好和项目特征的相似性计算,式(1)为计算相似性的函数。
3.2基于协同过滤的推荐
协同过滤算法是1992年由Glodberg等[9]提出的,是当前个性化推荐算法中研究和使用最广泛的算法之一。它只需利用用户与项目之间的评分数据,通过相似度分析对用户做出推荐。该算法主要分为基于用戶和基于项目两种。
基于用户的算法依据为用户项目评分,寻找目标用户的近邻集为目标做出推荐。针对用户数量剧增上述算法耗时呈线性增加的问题,Sarwr[10]为改善前者提出基于项目的协同过滤算法,该算法将相似度改为根据评分计算项目间相似度。
3.3基于知识的推荐
基于知识的推荐算法是在传统推荐算法中加入专家知识库,适用于特定领域的推荐,因此推荐的精度也相对较高。该算法主要依赖用户需求和产品间相似度或特定规则做出推荐。基于算法中引入专家知识库的缘由对产品特征进行语义扩展,据此做出推荐,因此可以看作是基于内容的推荐算法的扩展。本算法作为基于内容的扩展,不需要用户评分做支撑,所以不存在冷启动问题。陈洁敏[11]提出该算法可以分为3类:基于约束的推荐、基于实例的推荐和基于知识推理的推荐。
3.4基于社交网络的推荐
基于社交网络的推荐主要是依托近年来社交网络的迅速发展,将社交网络分析理论应用在推荐上的一类方法。它主要依据汇集的不同层次、领域、年龄、地域的人,积累的用户兴趣知识来产生推荐。因此将社交网络分析技术应用在推荐领域成为当前研究热点之一。而基于社交网络的推荐可以分为:基于邻域的社交化推荐和基于网络结构的社交化推荐。
3.5混合推荐
单一的推荐算法在实际应用中的效果总是略显不足,为了取长补短则需要采用混合的手段来设计推荐算法,因此提出混合推荐(Hybrid Recommendation)的方法。混合的原则是混合后提升性能,增强推荐效果。在混合推荐算法的组合方式上,Robin[12]指出以下常用组合思路:加权式、切换式、混杂式、特征组合式、层叠式、特征补充、级联式。虽然理论上可以将任意推荐算法进行混合,但是由于应用场景以及结果的相互影响,常见形式如下。
(1)结果融合:该方式针对多种单一推荐算法的结果进行融合汇总,然后推荐给用户。
(2)过程融合:该方式切入点在于算法内部,以某种推荐算法为依托框架,将另一种或多种推荐算法运用在这个框架上以提高推荐策略的效果。
由于单一推荐算法应用场景有限,效率有很大提升空间,因此关于混合推荐算法仍是推荐算法中的重点研究对象。
4知识推荐算法
4.1 KMS中的知识推荐算法
随着许多企业和科研机构知识的累积,KMS已经初步形成。由于知识结构复杂、数量庞大,造成用户检索时间加长、检索效果不理想等问题。为了使知识得到有效的传播利用,用户得到个性化的体验,并且随着数据挖掘、机器学习技术的成熟与应用,不少学者开始将推荐算法应用在KMS中,使知识得到了广泛传播,发挥了其价值。但相对电子商务、新闻、电影或音乐等推荐场景,知识推荐的研究起步较晚,KMS中的推荐算法多为一些传统推荐算法,表1就近几年应用在KMS中的推荐算法实例进行讨论。
时间 应用场景 核心算法 优点 缺点 基于关联规则的推荐 雷雪[13](2014) 文献知识推荐 运用Apriori算法挖掘文献关键词,通过关键词的关联进行文献推荐 自变量少、易于实现 局限于关键字,影响推荐效果 基于内容的推荐 许冠中[14]
(2014) 特定领域知识(供电局) 通过全文构建知识和记录构建用户模型,
计算相似度做出推荐 结果直观、无冷启动问题、结合性强 只针对特征易抽取的信息、推荐结果时效性差 基于协同过滤的推荐 朱耀磷[15]
(2017) 网络课程知识推荐 建立用户评分向量,根据协同过滤寻找相似用户,挖掘相似课程知识做出推荐 适用于非结构化数据、推荐效果与用户数成正比、推送新颖知识 冷启动问题、数据量越大稀疏性问题越严重 马彩娟[16]
(2013) Java课程知识推荐 将用户聚类,根据协同过滤将聚簇内用户的知识进行相似性计算做出推荐 混合推荐 李瑞金[17]
(2016) 高校知识库推荐 结合基于内容和基于协同过滤的推荐算法,采用切换式混合思路 解决冷启动和数据稀疏性问题 未考虑语义层面相似度 基于社交网络的推荐 Fan B[18]
(2008) KMS中的知识推荐 引入基于社交网络理论的集中化分析和内聚子组分析,集中分析找到关联节点成组,然后寻找组内相似度高的节点进行推荐 推荐效果与用户数成正比、推送新感兴趣的内容 冷启动问题 基于Markov链思想的推荐 李承浩[19]
(2016) 企业知识推荐 通过Markov预测模型得到用户-项目转移矩阵,计算用户相似性矩阵,得到近邻的历史记录进行推荐 降低数据稀疏性、提高推荐质量 冷启动问题 基于上下文模型的推荐 Yan Y[20]
(2016) KMS中的知识推荐 用上下文知识建立知识和用户模型:包括组织、人员、活动和物理环境等,根据上下文相似性进行推荐 考虑知识应用上下文 缺少用户
上表从知识推荐实例的维度对知识推荐算法通过应用领域、算法实现及其优缺点进行详细对比,发现领域知识特点鲜明,算法思路差异化大,优缺点参差不齐;但是在知识推荐算法的优缺点分析上未定位到具体的性能指标。因此,表2从算法类别的角度进一步对各类知识推荐算法在性能指标上定性分析,通过抽取各类知识推荐算法的优势,查找避免知识推荐算法的劣势,有利于进一步寻找知识推荐算法改进之处。
4.2知识推荐算法的改进方向
分析现有推荐算法在KMS中的应用,虽然产生一定的推荐效果,但也存在诸如冷启动、未兼顾知识属性和用户的操作行为、未考虑到知识应用场景等问题。针对此提出两个关于知识推荐算法的改进方向。
4.2.1 多维度自变量
自变量的维度一定程度上决定了知识推荐算法的精度。单一推荐算法大多仅考虑单一的用户输入,例如基于内容的推荐只考虑知识本身的属性,基于协同过滤的推荐只考虑用户操作。对于知识而言,知识应用是整个流程中的重中之重,而知识应用的上下文一定程度上影响了知识推荐的效果。因此为了在海量知识中得到较高精度的推荐可以融合诸如知识内容、知识应用情境及知识评分等多维度自变量。
4.2.2多种推荐算法的混合
在当前知识推荐的应用中,面临的知识量往往都是巨大的,并且不同领域的知识差异化较大,单一推荐算法处理能力就显得吃力。因此,可以根据领域知识的特性和推荐算法的优缺点,选择多种推荐算法进行混合,得到提高知识推荐精准度的目的。
5结束语
随着互联网业务的复杂化以及技术的发展,企事业信息系统逐渐走向知识化应用平台。由于知识量的增长和推荐算法的普及,推荐算法被引入到KMS当中且得到了广泛研究应用。本文通过对KMS的体系结构和常见推荐算法的介绍,以及对当前应用在KMS中的推荐算法的分析,发现针对知识的推荐存在诸如冷启动、未考虑知识应用情境的问题。最后提出两个可改进的方向,如何通过分析结果得到具体算法并提升推荐精度需要进一步的研究和学习。
参考文献:
[1] 王震威.企业知识管理系统[J].计算机工程,2005,31(z1):162-164,166.
[2] 陈兰杰.国内知识管理模型研究综述[J].科学与管理,2010,30(1):9-15.
[3] 姜丹.基于本体的知识管理模型研究[D].西安:西安电子科技大学,2008.
[4] 王昊,谷俊,苏新宁.本体驱动的知识管理系统模型及其應用研究[J].中国图书馆学报,2013,39(2):98-110.
[5] 贾琨钰.大型企业的知识管理系统设计[J].计算机与网络,2018,44(4):60-62.
[6] 赵蓉英,余慧妍,李新来.国内外知识管理系统研究态势(2009-2018)[J].图书馆论坛,2020,40(1):78-86.
[7] 许海玲.互联网推荐系统比较研究[J].软件学报,2009,20(2): 350-362.
[8] BalabanovicM,ShohamY.Fab:content-based,collaborative recommendation[J].Communications of the ACM,1997,40(3):66-72.
[9] GoldbergD,NicholsD,Oki BM,etal.Using collaborative filtering to weave an information tapestry[J].Communications of the ACM,1992,35(12):61-70.
[10] SarwarB,KarypisG,KonstanJ,etal.Item-based collaborative filtering recommendation algorithms[C]//Proceedings of the tenth international conference on World Wide Web - WWW '01.May 1-5,2001.Hong Kong,China.NewYork:ACM Press,2001:285-295.
[11] 陈洁敏,汤庸,李建国,等.个性化推荐算法研究[J].华南师范大学学报(自然科学版),2014,46(5):8-15.
[12] Robin B. Hybrid recommender systems: Survey and experiments[R]. Fullerton: California State University,2003.
[13] 雷雪,侯人华,曾建勋.关联规则在领域知识推荐中的应用研究[J].情报理论与实践,2014,37(12):67-70,66.
[14] 许冠中,宁柏锋,邱海枫,等.基于内容的智能推荐在知识管理中的应用研究[J].电力信息与通信技术, 2014, 12(12):54-47.
[15] 朱耀磷,蔡延光.知识推荐的协同过滤算法[J].软件,2017,38(8):50-53.
[16] 马彩娟, 曹林芬. 协同过滤在知识推荐中的应用[J]. 轻工学报, 2013, 28(5):50-53.
[17] 李瑞金.高校机构知识库个性化文本信息推荐方法研究[D].大连:大连海事大学,2016.
[18] Fan B , Liu L , Li M , et al. Knowledge Recommendation Based on Social Network Theory[C]// Advanced Management of Information for Globalized Enterprises, 2008. AMIGE 2008.IEEE Symposium on.IEEE, 2008.
[19] 李承浩.企业知识个性化推荐方法研究与应用[D].济南:齐鲁工业大学,2016.
[20] Yan Y , Yang N , Hao J , et al. A Context Modeling Method of Knowledge Recommendation forDesigners[C]// 2016 International Conference on Information System and Artificial Intelligence (ISAI). IEEE, 2016.
【通联编辑:唐一东】