于彤 毛郁欣 高宏杰 于琦李敬华 张竹绿
基于移动互联网的中医知识推荐方法初探*
于彤①毛郁欣②高宏杰①于琦①李敬华①张竹绿①
中医药知识服务领域的一个核心问题是:面对海量的中医知识资源,如何根据用户的健康状况和行为信息,从中自动找出用户可能关注或感兴趣的知识,从而实现中医知识的主动推荐。移动互联网因其普及性、便捷性以及强大的个人信息采集和自动感知能力,为解决这一问题提供了理想的平台。本文介绍个性化知识推荐的概念、背景和技术,阐述基于移动互联网的中医知识推荐服务的现状,提出存在的问题和研究思路。
中医药; 知识服务; 知识推荐; 移动互联网; 移动设备
中医药是中华民族优秀文化的一个重要组成部分,它历史悠久,源远流长。数千年来,历代医家在医疗实践中积累了丰富的经验,创立了兼具理论深度和民族特色的中医药知识体系,为中华民放的繁衍昌盛作出了杰出的贡献。随着我国社会从温饱到小康的转型,百姓的生活水平日益提高,开始更加重视生活品质,追求延年益寿,因此对中医养生保健知识产生了日益强烈的兴趣。
近年来,中医药领域的信息化建设取得了长足进展,建设了大量的文献库和数据库,形成了相对完整的中医药科学数据体系[1]。这些数字化资源中,蕴含着丰富的中医药知识。如何将这些知识资源与人民群众分享,使普通人从中受益,是一个非常重要的问题。基于互联网的中医药知识服务系统能够整合中医临床知识、中医药理论知识、中药方剂知识和中医疾病知识等中医药知识资源,面向网络用户提供中医知识或其他的数字化服务,是在人民群众中普及中医药知识的一种有效手段[2]。
中医药知识服务系统一般都实现了知识检索功能,能帮助用户从海量的中医药文献和知识资源中迅速找到有关知识[3]。但知识检索这种服务方式存在固有的局限性。为检出所需的知识,用户必须能够输入正确的检索词。这就要求用户已关注相关主题,并能用正确的医学术语将其表述出来。这对于医学专业人员可能并非难事,但对于普通人往往是一个很大的挑战。普通人很可能忽视了一些与自身健康有关的知识主题,甚至不清楚在网络上存在哪些有用的知识检索服务,因此无法充分获取在知识库中已经存在的知识。
为了弥补知识检索的局限性,可根据用户的特点向其进行主动的知识推送。不同用户对中医药知识的需求不尽相同,但人们往往对与自身体质和健康状况相关的中医药知识更感兴趣。若能根据用户的特点和偏好,向其提供个性化的知识推荐服务,则可更好地满足用户的需要。在下文中,将介绍个性化知识推荐的概念、背景和技术,阐述基于移动互联网的中医知识推荐服务的现状,提出存在的问题和研究思路。
个性化知识推荐,是指根据用户的特点和偏好,向其提供具有针对性的知识服务。以中医为例,系统可根据用户的中医体质类型,向其推荐与该体质相关的知识;若用户患有某种疾病,则系统可优先提供该疾病的相关知识。为实现个性化知识推荐服务,需要搜集用户的个人信息。这些信息可由用户填写或设定,也可由用户使用行为推定。例如,用户可通过表单填写(或勾选)其所感兴趣的疾病;又如,用户输入的检索词,可反映出其所关心的主题。系统会为每个注册用户构建“用户模型”,用于描述用户的特点和偏好,判断用户的需求。
当用户访问系统时,系统会根据该用户的模型以及系统自身的推荐逻辑,确定针对该用户的知识推荐内容。例如,若系统测出用户属于气虚质,则会基于知识库向用户推荐气虚质适宜的饮食(如当季水果等)。个性化知识推荐方法是知识服务系统中的一项核心技术,它一般具有如下特点。
1.1 可定制性 知识服务根据用户的设定来实现。系统采取“量体裁衣”的策略,向用户提供和推荐具有针对性和相关性的知识,以满足用户的需求。
1.2 主动性 系统不仅被动地响应用户的知识请求,而且会“猜测”用户需要什么,并采用推荐、提醒、个性化知识展示界面等方式主动提供知识服务。
1.3 差异化 系统面向各类用户提供差异化的知识内容,满足用户的不同需求。用户会因自身特点和需求不同,得到不同的用户体验。
个性化知识推荐方法能进一步简化用户利用中医知识的方式和途径,降低中医知识普及的门槛,促进中医知识的共享和传播。
个性化知识推荐服务的后台需要推荐系统(亦称推荐引擎或推荐平台等,Recommender System)的支持。推荐系统能推测用户对某一信息条目的偏好程度,从大量信息中过滤出用户想要的信息[4]。近年来,推荐系统在电子书店、视频网站以及搜索引擎等各种网络信息系统中得到了极为广泛的应用,成为一项功能强大、价值巨大的信息服务。
推荐系统的核心是其所使用的推荐方法(或称推荐算法)。目前,推荐方法主要包括“协同过滤”(Collaborative Filtering)和“基于内容的过滤”(Content-based filtering)两大类[5]。协同过滤方法是根据某个用户的行为(对事物的购买、选择或评价等)以及其他用户的类似行为建立模型,再使用该模型预测该用户可能感兴趣的事物[6]。基于内容的过滤方法是根据事物的特征判断事物之间的相似性,从而向用户推荐更多类似的事物[7]。
很多其他的人工智能方法也可被应用于推荐系统。例如,主题模型(Topic Model)是能够从大量离散数据集中挖掘出隐含的主题结构的一类统计模型[8]。这里的“主题”是指由一些语义相关的特征构成的、用来描述一个话题的抽象概念。利用主题模型可以识别一份文档所表达的主题,从而将该文档推荐给对相关主题感兴趣的用户。又如,社会网络分析 通过网络模型体现一类人群中个体之间的多层次交互关系。通过社会网络分析,可以发现人与人之间的爱好、生活习惯等相似关系,以此为基础对用户做相应的个性化推荐[9]。再如,利用关联规则挖掘(Association Rule Mining)算法,可从海量数据中发现事物之间的关联关系,然后据此进行相应的推荐[10]。关联规则是形如X→Y的蕴涵式,具有一定的支持度和信任度。基于关联规则的推荐是以关联规则为基础,若用户特征满足规则头,则将规则体的内容作为推荐对象推荐给用户。
上述推荐方法都是基于统计的,试图从海量数据中挖掘用户的偏好和需求。“基于知识的推荐系统”(knowledge based recommenders)与这些方法不同,它不是基于海量数据分析的结果进行推荐的,而是基于事物分类、用户偏好、推荐原则等方面的显性知识的一种推理技术[11]。基于知识的推荐方法因它们所用的“效用知识”(Functional Knowledge)的不同而有明显区别。效用知识是一种关于一个事物如何满足某一特定用户的知识,因此能解释需要和推荐的关系。效用知识可以是任何能支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表达式。此类方法可以在“协同过滤”和“基于内容的过滤”等方法不适用的领域发挥作用。其优点是不依赖于大量的数据积累,因此容易启动;其缺点是在定义推荐所需知识的过程中可能遇到知识获取瓶颈。
既然推荐系统已被成功应用于商业领域的商品关联推荐,它也就可能被用于中医知识的个性化推荐。可综合利用上述方法,研制面向中医药领域的个性化知识推荐系统,使之能够利用用户个人健康信息、人际网络信息和健康公共信息,向用户提供有用的知识和有效的建议,帮助用户决定应该进行什么有益的饮食规划、生活活动或疾病治疗规划,达到疾病防治和提高生活质量的效果。一个面向中医知识的个性化推荐系统将能够实时利用采集到的数据做出主动推荐,提高用户的疾病防治能力及其对中医知识的信赖度。
近年来,智能手机等移动设备迅速普及,移动互联网取得迅猛发展[12]。移动互联网因其普及性、便捷性以及强大的个人信息采集和自动感知能力,为个性化知识推荐提供了理想的平台。首先,智能终端为用户个人健康信息的采集提供了便捷的手段,可通过规范化的问卷、量表采集用户个人健康数据并判断其健康状况。例如,可以基于中华中医药学会发布的《中医体质分类与判定》等标准,为用户提供“中医体质测试”服务;系统会列出一组与用户近期的体验和感觉相关的问题,根据用户的答案判断出用户的中医体质类型。其次,基于智能终端的传感系统自动采集时间、地域、天气等用户相关数据,这种用户情境感知能力能进一步提升推荐系统的精准性。例如,通过GPS系统,可感知用户的地理位置,据此推荐当地的美食,而无需推荐在当地不存在的食材及相关食谱。最后,智能终端为个性化中医知识推荐提供了移动应用程序、万维网、短信、微信等多种实现途径。
在中医药领域,已出现了过日子、中医养生、健康养生宝典、365健康养生、中华养生、中医美容保健、养生美颜听书等一系列面向社会大众提供知识服务的移动APP。许多产品会收集用户行为信息和健康数据,据此向用户提供知识推荐等个性化服务。例如,“过日子”会提请用户进行注册并填写个人健康信息,并根据用户“中医体质测试”的结果判断用户的中医体质,进而针对用户的体质类型提供个性化的知识推荐服务;“中华养生”以中医理论为依据,实现了养生提醒功能,适时推荐运动、食疗、调神等方面的养生知识,督促用户从事养生保健活动;“中医养生钟(普及版)”根据时辰(时间)与脏器经络的对应关系为用户提供养生提醒服务;“体质养生(食疗)系统”根据用户“中医体质测试”的结果提供个性化知识推荐,帮助用户在选择食物时能根据自身体质去分析营养价值,而不仅根据喜好[13]。上述产品有助于用户获得日常健康维护、疾病预防和生活指导等方面的中医知识,指导并督促用户从事养生保健活动,以达到增强体质、预防疾病、颐养生命之目的。
上述产品已初步实现了个性化中医知识推荐功能,但尚有改进空间。存在的主要问题是知识权威性和用户信任度较低[14]。中医学术界多年来开展了大量的中医药信息化工作,组织全国一流专家进行数据库加工,建设了大量的中医药数据库[1]。通过建立严格数据质量评价标准以及数据审校机制,保证了数据质量[15]。这些数据库具有领域权威性,知识可信度高,为中医知识推荐服务提供了优质资源。需要研究如何对这些知识资源进行有效组织,并与用户对中医知识需求建立关联,使这些知识资源能更有效地支持推荐服务。
另外,上述产品的推荐机制的合理性尚未得到专家的论证,在推荐技术和方法方面尚有进一步研发和改进的空间。可根据个体化健康状态,以实时健康风险评估为基础,研究智能健康信息推荐技术,开发个性化中医知识推荐系统,即时提供满足百姓日常健康维护、疾病预防和生活指导方面的中医知识。其中涉及3项主要的研究内容。
4.1 用户个人健康信息模型的研究与设计 为实现个性化的知识推荐,首先需要设计符合移动互联网技术特点且具有中医特色的用户个人健康信息模型。需要对基于移动互联网的用户个体数据采集手段进行调研,分析现有的个人健康数据的内容、质量和利用价值,对用户的个体特征进行系统梳理和量化建模,形成一个相对完善的、领域相关的用户特征模型。
4.2 个性化中医知识推荐算法研究与实现 首先,可通过文献调研、专家咨询、用户访谈等方法,整理个性化中医药知识推荐的案例,明确知识推荐策略。进而,可采用知识表示技术,构建一个面向中医知识推荐的规则库,将推荐策略表达为形式化的知识推荐规则,从而建立个人健康信息模型与中医药知识资源之间的关联关系,实现基于规则的中医知识推荐。最后,可采用“基于知识的推荐”与“协同过滤”相结合的混合型推荐机制,研究和实现专门针对中医知识的个性化推荐算法。
4.3 中医知识主动推送网络服务的研究与实现 在研究和实现推荐算法的基础之上,需要进一步对该算法进行网络化封装,在万维网(Web)服务器端实现和部署知识推荐的网络服务(Web Service),使得移动客户端和其他信息系统都能动态调用知识推荐算法。该服务能够直接根据用户特征向移动客户端推送中医知识,从而实现基于移动互联网的个性化知识推荐。
知识推荐与知识检索是知识服务的两种基本方式:知识推荐属于系统主动推送,知识检索属于用户主动提取。这两种方式相辅相成,相互融合,可以形成相对完整的中医知识服务技术方案,进一步提升知识服务系统的用户友好性和针对性。移动互联网的发展以及智能终端的迅速普及,使具有用户情境感知能力的个性化推荐系统成为可能。“过日子”等移动应用产品已初步实现了个性化中医知识推荐功能,可根据用户的个人健康信息(如性别、年龄、体质、疾病等)以及时节、地域等环境信息,进行个性化的中医知识推荐,使用户可以随时随地获得针对自己和家人的养生知识和健康提示。需要基于中医药领域现有的优质数据资源,采用移动互联网技术,设计用户个人健康信息模型,研制权威的中医知识库以及智能化的中医知识推荐技术,实现中医知识主动推送网络服务,帮助普通百姓获得精准的个性化中医知识服务,从而提高用户的疾病防治能力以及对中医知识的信赖度。
[1] 崔蒙,尹爱宁,范为宇,等.中医药科学数据建设研究进展[J].中国中医药信息杂志,2006,13(11):104-105.
[2] 高博, 崔蒙, 杨硕,等. 基于数据的中医药知识服务研究[J]. 图书情报工作, 2012, 56(9): 5-9.
[3] 于彤, 苏大明, 尹仁芳, 等. 中医药知识服务平台构建研究[J]. 中国医学创新, 2014, 11(15):120-123.
[4] Francesco Ricci, Lior Rokach, Bracha Shapira. Introduction to recommender systems [M]. Handbook, Recommender Systems Handbook, Springer, 2011:1-35.
[5] Hosein Jafarkarimi, Alex Tze Hiang Sim, Robab Saadatdoost. A Naïve Recommendation Model for Large Databases [J]. International Journal of Information and Education Technology, 2012, 2(3):216-219.
[6] Prem Melville, Vikas Sindhwani. Recommender systems [M]. Encyclopedia of Machine Learning, 2010.
[7] Mooney R J, Roy L. Content-based book recommendation using learning for text categorization [C]. In Workshop Recom. Sys.: Algo. and Evaluation, 1999.
[8] David M Blei. Introduction to probabilistic topic models [J]. Comm. ACM, 2012, 55(4): 77-84.
[9] John P Scott. Social network analysis:a handbook (2nd edition)[M]. Thousand Oaks, CA: Sage Publications, 2000.
[10] Hipp J, Güntzer U, Nakhaeizadeh G. Algorithms for association rule mining - a general survey and comparison [J]. ACM SIGKDD Explorations Newsletter, 2000, 52(2): 58.
[11] Burke R. Knowledge-based recommender systems [J]. Encyclopedia of Library and Information Science, 2000, 69(32):180-200.
[12] 罗军舟,吴文甲,杨明,等. 移动互联网:终端、网络与服务[J].计算机学报,2011,34(11):2029-2051.
[13] 胡奥杰. 基于android的体质养生系统的开发[J]. 电子世界,2014,20(7):112-113.
[14] 朱毓梅. 中医药信息需求的调查分析[J]. 国际中医中药杂志,2014,36(9):830-832.
[15] 胡雪琴,崔蒙,陈兵,等.中医药科学数据的数据质量研究[J].世界科学技术-中医药现代化,2009,11(4):589-592.
Preliminary Research on TCM Knowledge Recommendation Via Mobile Internet
YU Tong, MAO Yu-xin,GAO Hong-jie,et al.//Medical Innovation of China,2015,12(36):115-118
A core problem of knowledge services in Traditional Chinese Medicine (TCM) domain is as follows:in the face of massive knowledge resources, how to automatically find out which ones a user may be interested in so as to realize active knowledge recommendation. Mobile Internet, with its popularity, convenience, and ability to collect personal information, provides an ideal platform to solve this problem. This paper introduced the concept and backgroundof personalized knowledge recommendation, analyzed the current status of TCM knowledge recommendation via mobile Internet, and proposed existing problems and research thoughts.
Traditional Chinese Medicine; Knowledge service; Knowledge recommendation; Mobile internet; Mobile device
10.3969/j.issn.1674-4985.2015.36.038
2015-04-07) (本文编辑:蔡元元)
国家自然科学基金项目(61379121);北京市中医药科技发展资金项目(JJ2014-61);中国中医科学院自主选题项目(ZZ080324,ZZ090305)
①中国中医科学院中医药信息研究所 北京 100700
②浙江工商大学
张竹绿
First-author’s address:Information Institute of Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700,China