黄 炜 程 钰 李岳峰
(湖北工业大学经济与管理学院,湖北 武汉 430064)
伴随着生活水平的不断提高,人们对医疗的需求也日益提升。医疗需求已从疾病治疗向健康维护转移。胡鸿宝等针对南京市居民进行了健康生活方式的知晓现状调查,结果显示居民对健康生活方式的知晓率达78.5%以上[1],说明人们对于健康知识的需求度很高。中医药作为中华民族传统医药,在不断的发展过程中,已经十分贴近国内人群生活,其中养生保健知识由于贴近个人健康更受关注,邱鸿钟等对广东省境内人群中医药消费情况进行调查,其中愿意接受服务意愿的达66.91%,进行养生活动的高达73.1%[2],结果显示人们对于中医药个人健康服务的接受程度很高。但由于中医药知识通常表达晦涩、传承方式传统,人们获取中医药知识难度高。目前,如何针对个人健康提供相应知识服务成为业界和学界的研究重点。
知识服务对数据的组织形式有很高的要求,尤其是在医疗领域中,如何有效地将医疗知识和个人信息结合起来,达到更好的治疗效果,也是目前的研究重点。其中,智慧医疗是实现医疗领域中知识服务的重要途径。智慧医疗是通过物联网、人工智能等技术,实现医疗资源和用户间的互联互通。使得用户可以了解自身健康状况并得到相应的医疗服务。智慧中医是智慧医疗在中医药领域的应用,能够给用户提供可靠的、准确的中医药知识服务。而知识库则是智慧医疗体系下的重要组成部分[3],用来进行知识的存储、组织和推理。
知识库可以将库中储存的知识有机的联系在一起,形成知识集群。通过构建面向个人健康的中医药知识库,可以向用户提供准确的个性化医疗服务。以个人健康为目标,构建结合个人健康信息的中医药知识库,并以此为基础向用户提供知识服务是未来智慧中医领域的研究热点。
在知识服务中,知识库是知识获取、组织的核心[4]。知识库中的知识包括用户个人健康信息及对相关信息类别的描述,以及中医的相关理论、中医概念间的关系及中医概念与个人健康信息形成的个人健康体系。构建的知识库基于个人健康信息和相关中医理论为智慧中医系统提供决策支持。
知识服务的目的是从繁杂的信息中提取有价值的知识,为用户提供问题的解决方案。从该角度出发,中医药知识库在提供决策支持的时候不仅要匹配相关诊疗记录,还需结合用户最新的个人健康信息,推断用户患病状态,生成医疗决策方案。中医药知识库的决策方案可以分为3种类型:疾病说明、治疗方案和疾病预警。在面向决策支持的知识库构建过程中,资源和决策需求需要紧密的联系[5],中医药知识库在构建过程中,要注意个人健康信息的实时感知和生成的决策类型,并将二者结合。并且按照选择的知识表示方法将知识进行逻辑表达[6]。在众多知识表示方法中,本体可以准确地表示资源中的知识单元和知识单元间的关系[7],学者们也纷纷基于本体在管理[8]、航天[9]、反恐[10]等领域构建本体知识库。
在中医药领域,学者们也在知识管理研究中采用基于本体的知识表达方式。但是《伤寒论》方证知识库[11]、中医临床知识库[12]等绝大多数中医药知识库,只提供传统的知识检索和知识存储等功能,并未提供决策支持类型的知识服务。同时,绝大部分中医药知识库并没有与个人健康信息紧密结合,仅有少数关于个人健康知识库的研究:张悦悦等[13]使用主题词表的方法构建了亚健康人群食疗知识库,知识库提供关于食疗的相关服务;肖晓霞等[14]从个人健康方面出发,基于中医治未病理论构建个人健康知识库。但是该知识库只是构建了最基本的知识库框架,并没有涉及知识服务方面。
通过上述梳理可以看出,知识库在中医药领域知识管理中起着重要作用,是知识服务的重要手段。而且在已有的成果的研究中,奠定了中医药领域知识表达的基础环节,一定程度上满足了中医药知识库构建的知识需要。本文研究的中医药个人健康知识库将基于个人健康信息数据库、中医药知识库和推理知识库3个子库,对中医药领域的知识服务进行研究。
本文所构建的中医药个人健康知识库包含两个知识子库和一个数据库:个人健康信息数据库(Personal Health Information Data Base,p-DB)、中医药知识库(Traditional Chinese Medicine Knowledge Base,t-KB)、推理知识库(Reasoning Knowledge Base,r-KB)。3个子库在中医药领域知识服务中起到知识支撑作用,并在个人健康管理中协同运作,发挥不同作用。P-DB存储用户个人健康信息,并与t-KB中中医药相关知识结合,利用r-KB中规则进行最终推理,最终完成用户的个人健康管理,实现中医药领域的知识服务。在这个过程中,知识在库集群之间流转,子库间的相互协作确保知识流的有序传递,并最终完成最后的决策支持。
t-KB是整个知识库群组中的基础部分,不包含隐私信息,公众通过t-KB查询中医药相关知识,并且t-KB根据中医药领域的不同,对中医药知识以主题为特征进行整理。p-DB存储用户的个人健康信息,并结合t-KB中知识形成具体实例,同时按照t-KB中知识组织形式储存实例,补充t-KB。r-KB中存储的是相关算法,对p-DB中形成的实例进行推理演算,借助t-KB中知识,在中医药领域获得相应的决策支持。在此过程中,3个子库协同工作,根据用户具体情况(p-DB),结合相关算法(r-KB),在中医药领域中(t-KB)实现最优方案的选择。3个子库间的关系如图1所示。
图1 知识子库协同关系
从图1中可以看出,中医药个人健康知识库中知识传递是由t-KB流经p-DB,最后流至r-KB,生成医疗方案。同时,由于涉及个人信息问题,不同的子库的面向对象也不同:t-KB面向公众,公众可以在t-KB中查询中医药知识和相关医案;而p-DB负责存储个人健康信息,个人用户可查询自身历史健康信息;最终,由r-KB推理的方案面向个人用户。3个子库间的协同保证了业务层次上的完整,同时也确保知识库中个人信息不会泄露。
在整个流程中,首先在中医药领域知识下进行诊断,同时结合个人健康信息,如性别、年龄、体质等因素,最后经由推理算法做出决策。整个过程中,t-KB首先与p-DB协同,p-DB中的数据通过t-KB中的接口映射到t-KB中,与t-KB知识相结合。数据库中的关系表与知识库中的知识节点一一对应,通过映射,将数据库中存储数据转换成知识库中的知识。
在p-DB的个人信息与t-KB中的中医药知识结合后,由r-KB中的相关算法提供演算,最终生成医疗决策方案,2个知识子库和1个数据子库的结构确保了知识在知识库集群中的有序传递,同时,子库的设计让知识库拥有分级层次,不同的子库面向不同的对象,保障知识库集群中的信息安全,加强其知识处理的效率。
中医药个人健康知识库包含3个子库,本章分别描述3个子库的具体构建方法。
中医药知识库是整个知识库集群中的关键,划定了知识库集群所处知识领域。同时,由于中医药知识库面向公众,知识库在构建的过程中要注意公众的非专业习惯[15],加强知识的可传播性。因此,构建中医药知识库的第一步是构建相关本体,阐述中医概念间的关系,之后基于本体构建中医药知识库。
3.1.1 中医药本体构建
国内关于中医药本体的研究已经日趋成熟,已有较为成熟的中医药本体,即中医药学语言系统(Traditional Chinese Medicine Language System,TCMLS)[16]。TCMLS中主要包含两大部分:语义类型和语义关系,对中医药领域中的知识进行了定义和限定。但是其面向的对象多是中医药领域从业人员,在考虑到大多数用户的非专业情况,本文基于TCMLS构建中医药本体。中医药本体如图2所示。
论文所建中医药本体将中医药领域知识分为两类,一为疾病知识,一为相关知识。疾病知识中包含病因病机、中医诊断和中医治疗。相关知识中包含药用物质和中医人体基础知识。中医药本体呈树状结构,每一个节点代表一类概念实体,上层节点是下层节点的父类,子类节点继承父类节点属性并扩展相关属性。
每一个节点J按照RDF三元组来进行组织:
J=(R,A,V)
其中,R是该节点所代表的概念及其名称,为主语;A表示概念的属性,为谓语;V表示具体的属性值,为宾语。
图2 中医药本体
该节点的宾语可以作为某一节点的主语来继续扩展中医药本体,这样便保证了中医药本体的可扩展性,中医药本体可得到不断地完善。
中医药本体划定了知识库所处知识领域,并提供了中医药领域知识的统一框架,同时在编制过程中照顾了公众的非专业习惯,能够有效地减少术语上的歧义,增强中医药知识的可传播性。
3.1.2 t-KB的构建
在构建的中医药本体的基础上,进行t-KB的构建。根据知识库的相关功能和结构,将t-KB从上到下分为4层:服务层、业务层、处理层和数据层。基于中医药本体的中医药知识库的模型如图3所示。
服务层位于知识库的最顶层,为用户提供中医药知识服务。在服务层中,t-KB为用户提供主题导航、知识浏览、知识推理、服务推送等功能。用户在使用知识库的同时,可以选择相应主题来浏览知识。同时结合用户浏览历史和个人健康信息对用户进行个性化推荐。
业务层包含了主题提取、特征提取、关联规则、业务模型和语义化表示。在业务层中,首先将处理层数据按照主题进行抽取,形成不同的主题知识。在不同的主题内,提取这些知识的特征,构建业务模型,使得知识库可以记录用户浏览,并根据用户浏览实现个性化推荐。
处理层的数据来源为数据层,包括中医药知识和个人健康信息知识库里的知识。由于来源不同,首先对这些数据进行知识聚合,消除数据异构,保证知识组织的一致性。为了确保知识表达的一致性,所有数据统一按照3.1.1节中构建的中医药本体进行组织。在本体的约束下,处理数据层的非结构化数据。
数据层的数据包含中医药数据和个人健康信息数据,个人健康信息数据来源于p-DB,t-KB的数据层是p-DB与t-KB的接口,从p-DB导入的数据与t-KB中的知识结合,为用户提供中医药知识服务。
图3 中医药知识库
3.1.3 t-KB的功能
t-KB位于整个知识库集群中的最下层,面向公众,为公众和整个知识库提供中医药领域知识。在中医药本体的约束下,将中医药知识以统一的形式向公众提供,为公众提供更加全面的中医药知识。同时,由于中医药本体的构建,公众可在中医药知识领域的架构下,结合本身具有的中医药知识,对中医药领域有更加清晰的认识。t-KB的主要功能有三:一是向公众提供中医药知识;二是按照中医药本体整理中医药知识,使其有序化;三是结合p-DB中的个人信息为用户提供中医药知识服务。
个人健康知识库的最终目的是紧密结合用户的个人健康信息,向用户提供中医药知识服务。在提供知识服务的过程中,用户的个人健康信息存储在p-DB中,并且基于历史记录提出疾病预警。因此,p-DB以t-KB为基础,对已有的个人信息按照t-KB中知识表达形式重新组织。
同时,在提供知识服务的过程中,个人健康知识库要保持个体特异性,面向不同用户提供相应的服务。个体特异性由p-DB来保证,p-DB中存储用户个人信息,用户根据登录名查看相对应的信息。
3.2.1 p-DB的构建
个人健康信息分为两种[17]:一种是健康记录信息,如日常体检等;一种是中医领域知识,主要包括养生、体质等。个人健康信息以健康记录信息为主,辅以中医知识,最终按t-KB的知识表达形式进行表达。
王琦认为,体质是人体先天遗传和后天环境影响下所形成的人体个性特征[18]。体质的不同也决定了治疗方案的不同,这种体质的中医思想是本文构建个人健康信息数据库的重要原则。
在对各种体质知识进行整理、分析的基础上,本文将p-DB的内容分为体质、情志、行为、病史4大类。具体结构如图4所示。
图4 个人健康信息数据库结构
对于体质类,下位属性包含年龄、性别、体重、血压、四诊、体质,四诊信息为“望闻问切”信息,记录脉搏、面相、舌诊等信息。体质按照中医理论可分为平和质、气虚质等9种[18],体质的确定可以提高知识库检索、匹配效率,相同体质人群的健康信息可以互相作为参考。情志类包含心情和其他两种属性。情志类属性记录个人用户的心理特征,比如慌张、愤怒等。行为类包含饮食、作息和居住环境,行为类记录的是外部环境,包括行为习惯和地域环境因素。病史类属性包含既往病史、家族病史和治疗方案。同时,疾病的发生与季节密切相关,因此在p-DB中增加时间属性,时间属性里包含时间和季节,并且数据库按照时间序化整理个人健康信息,r-KB里的相关规则可根据整理后的数据推断用户的个人健康情况,并根据健康信息,匹配治疗方案。在p-DB中,每一个时间节点的个人健康信息都可以视为一个案例,这些案例可以为后续时间节点的个人健康情况和他人的个人健康情况提供参考。用户根据账户可查询自身信息,个人健康信息表的构建思路如表1所示。
表1 个人健康信息表
表1中属性值一栏记录二级属性的属性值,数据来源记录属性值的来源,如医疗设备录入或医院病历,根据数据来源清洗数据,完成数据映射,解决数据异构。
同时,由于p-DB是按照t-KB的知识表达方式进行知识组织的,因此,p-DB与t-KB的协同在整个知识库集群的工作机制中是极为重要的。根据数据库与知识库的结构特征,两者的映射模型如图5所示。
图5 数据库中关系表与知识库中知识节点的对应
数据库与知识库形成逻辑上的闭环结构,p-DB中的表与知识库中的知识节点一一对应,在映射过程中,先获取数据库中关系表的主键,由主键匹配知识库中的知识节点,得到该关系表在知识库中的位置信息,最终完成数据库与知识库的协同。
p-DB与t-KB之间的映射关系形成了开放、可优化的结构,这样可以保证知识在两者之间的传递,确保知识间的一致性。
3.2.2 数据处理
p-DB中的数据是以用户为中心的个体化、独特化的特征数据集合,符合小数据[19]的特征。在小数据的处理中,一般包括关联、特征、需求三方面处理[20],而p-DB中不涉及推理,因此,p-DB中数据的处理包含关联、特征两个步骤。
因为数据的来源不同,首先进行的是将这些数据关联起来,形成完整的数据集。因此,在关联过程中,首先建立一个统一的标准化数据模型,对数据里的缺失、重复进行处理,进行数据录入。同时,不同数据来源的数据会存在重合,对这部分冗余的数据需要进行过滤操作,提高关联效率。
在数据关联的基础上,以p-DB中的二级属性为特征,提取数据中的相关信息,最终以一级属性为主题将这些数据进行整合和关联,形成最终的个人健康信息表。
3.2.3 p-DB的功能
p-DB记录个人健康信息,主要面向个人,位于个人健康知识库的中间部分。向下由t-KB提供中医领域知识,按照t-KB的知识表示方法完成知识的组织,形成组织好的个人健康信息,全面的展示用户的个人健康状况;向上由r-KB中的规则进行推理,并进行案例匹配,实现对于个人健康信息的实时预警和干预,最终得出治疗方案。
在最终的中医药知识服务阶段,r-KB基于t-KB领域知识和p-DB个人信息以及存储的规则进行治疗方案的推理,得出最优的方案。
3.3.1 推理决策过程
个人健康知识库中采用案例推理和规则推理两者混合的推理机制,混合推理机制能够克服规则推理匹配效率低和案例推理不具有普适性的缺点[21],取得更好的推理效果。
用户的个人信息在每一个时间节点上都可以视为一个案例,这些案例可以作为历史案例为某个时间节点上的某个用户的个人健康提供参考。用户之前的健康信息也可以作为现在节点上的个人健康的参考。同时,在参考历史案例的基础上,引入r-KB中的规则,生成最终的治疗方案。该推理机制下的工作流程如图6所示。
图6 个人健康知识库推理流程
个人健康信息在不断地更新,在更新过程中,时刻t1的个人健康信息形成一个案例,时刻t2的个人健康信息也形成一个案例,这个过程中会形成一个个互相独立的案例。这些案例既可以作为个人健康的动态记录,又可以作为历史案例提供参考。
推理决策是个人健康知识库的核心功能,通过对比以前时间节点的个人健康信息和相同体质的个人健康信息,同时辅以规则进行判断,对用户的个人健康状况提供建议或者生成治疗方案。r-KB将情报和决策结合在一起,形成情报决策一体化,将决策建立在实时信息上,确保了个人健康知识库推理决策的实时性和准确性。
3.3.2 r-KB的构建
r-KB是个人健康知识库的最后一环,知识库的信息、知识最终都传递到r-KB进行处理。由于个人健康是一个不断更新的过程,知识库需自行判断用户的身体状况并及时提供相应建议,因此,知识库需自行从体质、情志、行为和时间判断是否需要提出预警或治疗方案。r-KB的结构如图7所示。
图7 推理知识库
在r-KB中,对个人健康信息中的每一项属性设置一定的阈值。当有属性值超过阈值时,由规则推理模块转为案例推理模块,在案例推理模块中,同样设置相似度阈值,进行案例的匹配。在进行案例匹配时,首先,r-KB进行匹配的是同一用户不同时间节点上的案例,若没有案例大于阈值,则以体质为特征,检索相同体质用户的个人健康信息,从中进行案例匹配。在匹配过程中,若有多个大于阈值的案例,则由用户进行最终的选择;若没有符合条件的案例,则重新进行检索,直至检索出符合条件的案例;若重复检索多次后仍然没有符合条件的案例,则选择相似度最高的案例,推送给用户,并进行说明。若匹配的案例是他人的健康信息,则将二者关联,在该用户的案例匹配过程中,优先匹配。从图7中可以看出,p-DB中的数据由r-KB处理,若有属性值超过阈值,则进行案例推理,这样的流程实现了对于个人健康的实时预警和干涉。
3.3.3 r-KB的功能
r-KB位于个人健康知识库体系结构的顶层,面向最终的决策,处理p-DB中的个人健康信息和t-KB中的知识,分别用于案例推理和规则推理。将个人信息和中医诊断规则于r-KB中结合,最终实现针对个人信息的中医药治疗决策。r-KB首先基于个人信息,通过相关规则判断用户状况;之后,针对用户匹配相似案例,获取相似度高的案例,做出最终决策。
知识库的构建方法有多种,目前主流的方法有两种[22]:一是基于数据库构建知识库;二是从知识表示出发,建立知识库模型,再构建相应的知识库。从功能上比较,第一种方法局限于数据库,知识库的功能是数据库功能的扩展;第二种方法根据知识表示方法建立知识库模型,可构建更具开放性的知识库。本文将选取第二种方法构建中医药个人健康知识库。
作为向用户提供知识服务的服务平台,在构建中医药个人健康知识库的过程中,需要明确知识库系统的系统结构和功能模块,保证知识库的正常运行和功能服务。
根据论文第3节中论述的各知识子库的功能和结构,中医药个人健康知识库的系统结构如图8所示。
图8 中医药个人健康知识库系统结构
知识库是利用知识来解决用户的问题,满足用户需要。从图8可以看出,用户获得知识库知识服务的方法有两种途径:一是通过知识库管理系统,直接进行知识查询;二是通过推理知识库中的推理引擎实现的疾病预警、诊治功能而达到的知识服务。
第一种途径中,知识库管理系统通过确定知识表示方式,即中医药本体,保证知识库中的知识一致性。对于新添加的中医药知识,按照规定的知识表示方式,与已有的知识进行检验,检验是否存在等价、重叠等多种关系:若是等价关系,则直接舍弃;若是重叠关系,由专家确定融合原则,完成知识的融合,并更新知识。同时,知识库管理系统保证3个子库间的协同运作。
第二种途径中,推理机基于获得的中医药知识和个人健康信息实现健康预警和治疗的功能。推理产生的知识,是基于实时用户个人健康信息所形成的动态性知识,能够更加准确地辅助用户决策。在构建知识库的过程中,推理机需要实现:
1)基于中医药个人健康知识库挖掘更深层次的知识,基于新知识实现预警、诊治功能;
2)在推理过程中,能够处理出现的推理错误。
知识库的功能依赖于功能模块实现,中医药个人健康知识库的功能模块如图9所示。
资源管理主要实现数据的收集、预处理、存储等功能。同时,资源管理也提供与外部数据库、知识库、信息系统的接口,实现资源间的共享,提高资源的利用效率。
图9 中医药个人健康知识库功能模块
知识库管理的功能是保证整个知识库体系的正常运作:首先是对资源进行进一步的处理,按照各个子库的要求处理、存储数据;其次是保证3个子库的系统运作;最后是对知识单元进行操作时,保证知识的一致性。
知识检索为用户提供检索入口。通过检索入口,用户可对相关知识进行检索、查询。检索方式包括主题、关键词、来源等方式。同时,根据用户日常浏览、检索记录,对用户进行有针对性的推送。
决策支持是知识库的核心功能,也是区别于传统中医药知识库的关键功能。该模块基于用户的个人健康信息,向用户提供预警和治疗方案。当用户的健康信息发生变化时,系统根据相关规则判断用户是否患病,并根据中医药知识结合以往类似案例,形成新的解决方案,即治疗方案,为用户提供决策支持。
系统管理主要实现用户权限管理、系统安全管理和系统的日常维护。系统根据用户的注册信息,赋予不同的权限功能。如普通用户只能进行常规操作,专家用户则可对系统里规则、数据处理等提供建议,经确认后进行修改。同传统中医药知识库相比,中医药个人健康知识库涉及个人健康信息,对安全性要求更高,因此要通过用户权限保障系统安全。同时,中医药个人健康知识库的子库结构,也能保障系统的安全。
当前社会医疗资源紧张,传统中医药知识库不能满足人们对医疗资源的需求,需要从知识服务的视角出发,重新构建中医药知识库。
本文所构建的中医药个人健康知识库包含t-KB、p-DB、r-KB,分别面向公众、个人和决策。t-KB面向公众,用户可通过t-KB获取中医药知识。通过中医药本体,统一知识的表达形式,消除概念歧义,保证知识的一致性;p-DB面向个人,用来收集、处理、存储用户的个人健康信息,并基于时间序化个人健康信息,形成一个个案例;r-KB最终面向决策,通过确定规则推理和案例推理的混合推理模式,构建了中医药个人健康的推理知识库,实现预警和诊治功能。
为了加快中医药知识服务的研究进展,建立更加完善的中医药个人健康知识库,未来应从以下几个方面开展研究:第一,各个中医药医疗机构之间应设立统一的数据规范,提高资源的利用效率;第二,加强物联网方面的研究,使得个人健康信息的收集更为准确、实时;第三,完善推理知识库,研究新的推理模式和算法,提高推理的准确性和效率。