袁芳
摘要:本文分析了知识服务的内涵,论述了现阶段国内外各类医学知识服务系统的特点和发展趋势。包括循证医学数据库、基于补充计量学的知识服务系统,基于本体和语义网的知识服务系统、基于大数据分析的知识服务系统。
关键词:知识服务;知识服务系统;医学知识;语义网;大数据;补充计量
中图分类号:G25
Development Trend of Medical Knowledge Service System
YUAN Fang
(Nanchang University Library,Nanchang 330031,Jiangxi,China)
Abstract:This paper analyzes the characteristics of knowledge service, and discusses the characteristics and development trend of the domestic and foreign medical knowledge service system. Knowledge service system based on ontology and semantic web, which is based on ontology and semantic web
Key words:Knowledge service;Knowledge service system;Medical knowledge;Semantic web;Altmetrics
1 前言
在知识医学时代,知识成为疾病的主要敌人,医学知识正以惊人的速度增长[1],全球每年有超过17000种生物医学图书面世,现有生物医学期刊超过30000种,且以每年7%的速度递增。临床医生要在本领域跟上发展,平均每天需要阅读19篇原始文献[2]。从工作环境方面看,医务人员不同于一般的科研人员,尤其是在三甲医院,医务人员除了承担繁重的临床工作外,大部分还进行医学教育及科研工作。材料显示,我国医生在科研中用于获取专业信息的时间比美国等国家少得多,美日等国为30%~50%,而我国仅为15%~30%[3],知识无限膨胀和有限使用的矛盾,促使我们寻找更好的方法来缩短从研究到实践的距离。
2 知识服务
知识服务是以信息知识的搜寻、组织、分析、重组为基础, 向用户提供知识信息、知识挖掘手段及问题解决方案的服务。它有下面几个特点。
2.1知识服务是用户目标驱动的。传统信息服务的基点、重点和终点是信息资源的获取和传递,而知识服务的评价是"是否能够解决问题"。
2.2知识服务面向特定用户,是定制式,必须重视用户问题和问题环境。在服务过程中,强调专业人员和用户的共同参与,关注的重点是服务的全过程。
2.3知识服务的核心是知识创新。知识服务是在显性知识的加工中融入了对隐形知识的挖掘和共享,将显、隐性知识集成,形成新的知识产品。
2.4知识服务必须依靠集成的现代化手段。知识服务技术分为三大类,即基础网络技术(Internet),知识挖掘技术(数据挖掘与人工智能)和知识存储与传播技术(数据库和搜索引擎)。近年来,KDD(Knowledge discovery database)的出现为人们提供了一种解决"数据丰富而知识贫乏"困境的有效途径。
就医学知识体而言,可划分为疾病信息,药品信息,辅助检查信息,手术信息,医学基础知识,与医学相关的静态和动态信息等;就医学知识需求而言,用户群体分为临床、教学、研究、药学和患者等类型。每个群体所需的相关知识有所不同,但这些知识相互关联,不可分割[4]。在传统的信息服务中,这些知识体分散在不同的文献载体,用户检索得到的只是孤立的知识点。在以数字化、网络化为特征的现代社会信息环境下,这些知识单元按照一定的结构被整合成有序的,相互关联的、完整的网络知识体,这种网络知识体就是医学知识服务系统的核心,进入21世纪以来得到了迅猛发展。
3 医学知识服务系统的发展趋势
3.1循证医学数据库 循证医学(Evidence-based medicine,缩写为EBM),又称实证医学,其核心思想是医疗决策(即患者的处理,治疗指南和医疗政策的制定等)应在现有的最好的临床研究依据基础上作出,同时也重视结合个人的临床经验。作为代表当前医学实践的主流方法学, 循证医学不仅对临床思维模式、临床实践产生了重要影响, 而且对临床研究、预防医学、药学、护理学以及辅助临床科室的发展也产生了不容忽视的影响。现代社会计算机技术、信息通讯技术以及互联网技术的不断进步,为循证医学及其实践提供了强大的技术支撑,面向循证医学的知识服务系统也得到了迅速的发展Clinical Evidence、DynaMed、Essential Evidence Plus、MD Consult、UpToDate等已经成为欧美各大医疗机构必备的知识服务平台,向全球的广大医师提供实时、可靠的知识服务,为循证医学的实现奠定了信息和知识的基础[5]。这些平台一般具有以下4 个特点:权威性;最佳临床证据的精炼概况;定期更新;易于查询和阅读。它们能有效满足医学工作者对医学证据和知识的需求,协助他们迅速解决临床问题,做出准确的临床决策[6]。
3.2基于补充计量的知识服务系统 自2010年Preim提出 "Altmetrics"这个术语以后,有关补充计量的研究在全球方兴未艾。传统的以引文为评价工具的计量方法因其滞后严重而为人诟病。据统计,一篇物理学论文一般需要在发表5年以后才能获得一半的引文参考信息。伴随着社交网络的发展,当前学术交流环境正在发生巨大变化,越来越多的科研工作者通过Twitter和Facebook与同行探讨,利用Mendeley、CiteULike管理工作流程。补充计量学利用工具收割文献管理系统和社交网络中涉及某一成果的相关信息(下载量、引用次数、浏览次数、评论、转发等),对这些数据进行分类聚合计算,进而评价这些研究成果。常用的补充计量工具有Altmetric.com、Impactstory、Plum Analytics、PlosALMs等。Altmetric.com具有挑选新文章( Pick new article)的功能,用户可按照文章提到的时间、关键词、期刊、标签、出版商、处理前缀、MEDLINE 主题词、匹配PubMed 的提问、基金等条件快速地挑选所需的文章,并可按照Altmentric.com 打分的高低排序。还可通过MEDLINE 主题词、匹配PubMed 提问等条件进行设置。生物医学文献数据库的文献可通过社交媒体快速传播到用户,医学研究人员可通过替代计量工具揭示生物医学领域的技术热点、发现新的研究内容,为用户提供个性化的信息推送服务[7]。
3.3基于本体和语义网的知识服务系统
3.3.1本体和语义网 本体最初是一个表示真实世界的结构和性质的哲学概念。近年来,本体越来越多地出现在知识工程等研究领域。而在计算机科学中,本体是一种特殊的信息对象或计算组件。目前,由于本体能够表示知识的结构和模型,本体在知识建模与表示领域具有重要的地位,本体能够用于定义某一领域的概念、属性及其关系,并帮助进行隐含知识的发现和推理。
语义网被视为互联网的扩展和发展方向,旨在对互联网内容的含义进行智能搜索、整合与推理,方便人们进行知识共享。为了实现上述目标,仅使用机器可读的语言来存储数据是不够的,还需要赋予数据形式化的、明确的语义信息。因此语义网的开发可以看做是一种把知识建模与表示和自动推理融入互联网的方法。语义网体系结构主要包括数据资源层、XML/XMLSchema层、RDF/RDFSchema层、本体层。
3.3.2领域建模与知识表示 领域建模的研究和应用在人工智能和知识工程及其相关领域有着悠久的历史。在过去几十年里,领域建模已经成为自然语言处理、信息检索和人工智能等研究领域中一个有用的工具。目前,领域建模已经处于各种目的和需求在各种各样的研究中逐渐发展起来。因此,许多术语都用于代指领域建模或领域模型的概念。包括:本体、语义网、概念图、概念图表、分类和术语关联图等。虽然这些术语表达的概念不尽相同,但他们在用法方面相互重叠,都被用来代指一个类似的概念或结构,也就是领域建模或领域模型。由于网络上存在的海量医学信息资源大多是非结构化或半结构化的,使得自动化的概念和关系的抽取以及知识建模的自动化方法呈现出复杂性和多样性,因此,如何用一种较为通用的方法或框架对异构数据源中的信息进行处理是研究人员迫切需要解决的问题。
3.3.3基于本体的中医药知识服务平台 章太炎先生曾经指出:"中医之成绩,医案最著。欲求前人之经验心得,医案最有线索可寻。循此钻研,事半功倍。"中医医案是中医文献的重要组成部分,是一代又一代医家通过不断的临床实践,逐步总结出来的宝贵经验。近代以来,医案分析研究层出不穷,是中医理论不断发展的摇篮。中国工程院和浙江大学计算机学院联合打造的《中医药知识服务系统》就是将中医医案中非结构化或者半结构化的资源分拆并整合,综合应用语义网、网络、搜索和数据挖掘等信息技术,通过关联分析和主体分析挖掘其中隐含的知识和关系,根据挖掘结果分析推理,为用户提供知识服务。
3.4基于大数据分析的知识服务系统 以基因数据为代表的现代生物医疗信息的不断创新,正不断产生海量的生物研究数据。作为现代医学研究的核心和基础,海量的数据在带来新的研究价值的同时,从另一方面也不断产生困扰。如何从如此海量的数据中发掘出最有研究和利用价值的生物医学数据正成为现代生物信息学的下一个关注重点。解放军第307医院细胞与基因治疗中心开发的《疾病遗传变异关系数据库》聚焦于基因变异和疾病的相关性,以及疾病和针对性药物的相关性,以患者基因信息为基础,为现代医疗的诊断提供了最有价值的针对性数据。该数据库一方面收集整理了国内外最新的基因变异和疾病治疗数据,从科研的角度为医疗专家提供国内外最新的疾病相关数据和治疗方法;另一方面该数据库对临床疾病和治疗进行实时地跟踪和检测,通过最新的生物信息处理方式,对过往的研究数据进行实际补充和持续更新。因此以患者基因信息为中心,该数据库发掘整理了过往历史研究数据,融合更新了实时检测病例数据,从而能更好地诊断相关疾病并提供最佳治疗方案,而且能预测潜在的疾病威胁。
该系统存储两类信息。一类信息为个性化癌症诊断和与之相匹配治疗方案提供临床数据支持,另一类为基于全基因组测序的高端健康风险评估提供信息支持。所采集的数据都得到过医学和临床试验的验证,并最终由专家审定收录,并对数据库不断更新。目前该数据库涵盖我国发病率前30 名癌症及其他100 种疾病。
4 结语
纵观国内外医学知识服务系统的建设和发展,我们不难看到,为缓解海量医学信息资源和医务人员接收能力之间的矛盾,医学知识服务系统的研究备受关注。随着我国数字图书馆知识组织与知识服务研究理念的不断深入,如何借鉴国外经验,推动我国高水平的医学知识服务系统建设是下一步急需解决的问题。
参考文献:
[1]Bartels EM. How to keep up with medical literature[J].Best Pract Res ClinRheumatol,2009, 23 (2):81-90.
[2]陈敏.王全林.王飞.循证医学与知识转化[J].华西医学.2014,29(1):179-180
[3]李彬,倪荣丽,张晓苗,等.临床医生信息负担调查研究[J].医学信息学杂志,2011,32(5):49-53.
[4]张文举.李娜.基于知识服务的医学知识服务系统研究[J].中华医学图书情报杂志,2007,16(5):1-3.
[5]AlperBS.Practical evidence-based internet resources[J].Family practice management,2003,10(7):49-52.
[6]于彤张.竹绿.贾李蓉.面向循证医学的知识服务平台概述[J].中国中医药图书情报杂志,2014,38(4):55-56.
[7]黄芳.补充计量学及其在生物医学领域的应用[J].中华医学图书情报杂志,2014,23(7):16-18.
编辑/金昊天