高质量循证医学证据获取与应用研究

2023-04-06 09:42范美玉
协和医学杂志 2023年1期
关键词:真实世界循证证据

范美玉

广州中医药大学第二附属医院 广东省中医院信息管理办公室,广州 510120

循证医学是以研究证据、基于证据进行决策为核心的一门学科,在临床决策、医院管理、医学信息服务等多个领域得到了良好的应用[1-2]。近年来,随着医疗环境由数字化向智慧化转型发展以及新型医学模式的出现,循证医学信息的来源逐步扩大,类型也多种多样,更新频率逐渐缩短,分布范围更加分散,对原有的证据收集、总结、加工和整合方法提出了更高要求。新一代健康信息技术、情报学方法、统计学方法的出现及在循证医学领域的成功应用[3-4],为更快获取更多准确可信的证据提供了可能。本文从剖析数据驱动的循证医学思维出发,探讨医疗大数据时代如何借助智慧化手段寻找更精准、更丰富的高质量循证医学证据,并对证据形成过程中的影响因素进行思考与总结。

1 数据驱动的循证医学思维

1.1 定义

数据驱动的循证医学是该学科在大数据时代创新发展的新形态,它紧紧围绕循证医学核心思想,借助新一代健康信息技术、数据科学方法、情报学方法、统计学方法、数学方法及其工具,能够更加系统全面地、精准高效地检索、评价当前临床试验和真实世界观察性研究中的高质量科学证据,并以此作为临床决策的依据[5-8]。

1.2 数据驱动为循证医学带来的变化

随着新型医疗服务模式的推广应用,个性化诊疗决策需求越来越迫切[9]。数据驱动思维开始影响循证医学领域,形成了新兴交叉研究模式,在一定程度上或可为目前循证医学研究困境提供潜在出口。这两个领域的交叉内容体现在核心思想、中心概念、数据来源、研究方法等方面,如核心思想均是依靠证据进行决策,数据均可来源于临床,研究方法均可使用Meta分析等。然而,真正能够让两个领域相互交融在一起的关键原因是其相异的部分。循证医学吸收了个体化数据作为证据生产资源的重要组成部分,使得数据资源更全面更真实,表现出高价值(value)、量大(volume)、多样性(variety)、准确性(veracity)和时效性(velocity)五大新特点[4];为从新生成的数据中得出有价值的推断作为证据,引入基于人工智能(artificial intelligence,AI)的数据采集、处理、整合、分析、评价的方法和工具提高自动化水平,在提高查全率和查准率的同时,可更加快速精准地提取数据集包含的证据,缩短指南的制作周期,增强证据和指南的可解释性;数据之间的相关性可满足循证医学不同的研究需求,而数据驱动方法是挖掘相关性的利器。

2 智慧化循证医学证据的获取与应用

2.1 更加科学的原始证据来源

继往的循证医学原始证据来源主要局限于现有的可用文献库和手工收集的临床数据,面临如何选择合适的样本、样本数量是否足够等挑战。数据驱动的循证医学研究扩大了原始证据的来源范围,有效弥补了上述不足。

随着个性化医疗、精准医疗的兴起,纳入真实世界样本已是循证医学高质量发展的必由之路[6,10]。日常诊疗活动中产生的大数据和个体化数据主要来自医院信息系统、实验室信息系统、医学影像存档与通讯系统、放射信息系统、电子病历等。随着云计算、大数据、物联网、移动互联网、AI、区块链等新技术在医疗领域的应用,个体数据亦不再局限于医疗机构内与就医过程中,而是线上线下实时客观存在,更新频率变成了即时更新,整合应用更加便捷,有利于生成更加真实可靠的高质量证据。

循证医学队列研究的规模也越来越大,出现了跨区域、跨地区合作项目,如北京大学、中国医学科学院与英国牛津大学联合开展中国慢性病前瞻性研究项目(China Kadoorie Biobank,CKB)[11],欧盟第七框架计划内的欧洲儿童队列研究发展策略项目[12]等。这些大型队列研究可获取队列人群的特定疾病事件,构建真实世界健康医疗大数据库,实现解析全生命周期影响重大疾病发生发展的因素及其致病机制,推动疾病风险预测,实现精准预防、探索大数据驱动的医学科研范式等目标[3]。

2.2 循证医学文献信息智能化提取

用于检索和筛选的循证医学信息资源越来越多,医学科研人员和临床医生在检索和找寻证据的同时,面临搜索时间长、检索主题修改、检索策略如何最优、获得证据的时间不确定、检索的查全率和查准率低等各种挑战[13]。智慧医疗带动了循证医学信息提取的智能化,可在一定程度上应对上述挑战。卢延鑫[13]研究了AI如何从流行病学文献或生物医学文献中自动提取流行病学致病因素和疾病相关信息的方案。北京大学第三医院研发了EBM AI-Reviewer系统,基于AI实现了快速精确地检索和筛选循证医学文献,平均节省系统评价人员工作量达85%,极大提高了循证研究的效率[7]。陈池梅等[14]探索了掌上医院APP的循证医学信息服务方式,利用移动互联网、云计算等技术,使经过安全认证的医护人员可随时随地访问医院图书馆循证信息资源和其他开放的医疗健康数据,便捷、高效检索到循证医学证据,辅助临床决策。

2.3 基于AI的真实世界健康医疗数据分析

近年来,基于AI的真实世界数据分析案例越来越多,对疾病管理研究起到了一定的推动作用[6]。徐雅蕾等[15]讨论了机器学习技术应用于脑电波数据的预处理和特征提取,从而实现癫痫分类预测。Wang等[16]基于公开数据库20年的健康大数据,借助AI技术,完成了挖掘分析和疾病风险评估,实现了针对糖尿病人群的饮食、药物、生活方式等多维度干预和精准健康管理。袁术鹏等[17]认为真实世界临床研究方法在中医药研究领域表现出非常好的相适性,通过AI和数据挖掘等方法,对某些疾病、证候和处方分析,可验证其辨证用药的规律和特点,通过总结某一类疾病治疗方剂的组方用药规律,还可发现潜在的药物组合和候选新方。吴秋硕等[18]系统评价了基于机器学习的心脏骤停早期临床预测模型,发现在特定情况下,机器学习预测心脏骤停的性能优于传统的统计学模型。

2.4 临床科研专病数据库

随着以电子病历为核心的医院信息化建设的发展和完善,基于大数据和真实世界的临床研究逐渐开展,推动了临床科研专病数据库从孤立系统向平台化方向发展,实现了原始病例数据库与电子病历数据进行对接抽取,未来甚至可与院后随访系统进行整合[19-20]。如用于临床试验和调查研究项目的电子化数据采集系统(research electronic data capture,REDCap)、医院一体化科研专病数据库系统平台等,大部分数据平台支持数据项定义、病例表单定义、病例录入、病例检索、病例数据统计,可为产出高质量证据提供良好的数据基础。

2.5 证据库信息系统

虽然目前循证医学数据库在文献范围、检索与筛选、纳入标准等方面逐渐完善,但仍面临证据生产过程低效与决策需求紧急冲突等问题。因此,循证医学领域内出现了一些新的证据库形式,如支持自动Meta分析的元数据库[21]、综合性循证医学证据库等。中医药循证研究证据库系统(evidence database system,EVDS)是我国具有代表性的综合性循证医学证据库,包括证据库和指南数据库,借助大数据和AI技术,能够实现数据清洗、证据检索与筛选、证据录入、证据转化应用,为解决中医药疗效评价难提供了有效方案[22]。

2.6 基于AI的临床实践指南

随着精准医学时代的到来,原有的循证医学指南模式面临证据强调个体化、临床指征更加精准、临床风险由多主体承担、更新频率加快等各类挑战[23-24]。为应对上述挑战,AI开始被引入临床实践指南的制订、实施、自动更新等环节[7]。如AI技术可快速分析数据库或网络上已有的与研究主题相关的临床问题,节省人工筛选确定研究主题的时间;AI技术也可对已有的指南、系统评价及医学文献进行快速全面扫描,发现与研究主题相关的信息,可快速提取,为研究人员和临床医生提供决策证据;还可将文献指南、电子病历数据、医院智能辅助诊疗自然语言模型的训练数据融合在一起,开展多源智能服务[25]。AI在临床实践指南领域的应用得益于政策的支持和信息技术与医学的深度融合,虽仍处于起步阶段,但未来可期。

3 循证医学证据质量的影响因素

3.1 数据集成

电子病历是真实世界证据的重要来源,但碎片化特征显著。虽然国家及地方对健康医疗大数据、互联网、云计算、智慧医院、电子病历等的建设与完善给予了政策引导和支持,部分三级甲等医院也着手开展建设临床医学研究大型数据中心,致力于不同类型不同来源数据的收集、管理、分析与应用,大力推动临床科研和成果转化[26-27],但受限于资金、技术等现实条件,医疗机构仅起到主导、管理作用,而其余方面仍依托于市场化资源[4],导致数据的集成整合度较低。

3.2 数据质量

不均衡的医疗信息化发展、不统一的信息标准等因素可能为真实世界研究带来大量低质量的证据,进而产生研究结果的虚假关联[3],从而得出不科学不合理的结论。主要表现:(1)数据完整性低:医疗信息系统孤岛问题仍存在,区域卫生信息平台覆盖度不够[28],社会、自然属性的数据开放共享度低[29],信息广度上并不能保证数据完整;医疗信息化建设水平仍需提高,临床医疗数据收集粒度粗,数据填写过程中的缺失遗漏,在信息维度上也影响数据的完整性。(2)数据一致性差:虽然我国全民健康信息标准体系不断健全[30],但操作性仍需提高,加上目前医院大多自主招标建设信息系统,不同厂商采用的数据接口和数据格式不统一,系统间兼容性差,元数据采集易重复,数据颗粒度不一致。(3)数据准确度不足:人工填写的医疗过程数据可能存在错漏、不真实、不准确等问题;便携体征采集设备等医用数字化设备可能缺乏统一度量及验证,或由于现场环境的干扰,导致数据采集存在偏差、数据冗余、数据缺失、数据错误等问题。因此,开发健康医疗大数据的质量评估方法[31],强化循证医学证据等级意识[32-33],优化基于诊疗大数据研究的设计,应用系统严格的数据管理和治理流程等措施非常必要。2021年4月,国家药品监督管理局药品审评中心发布了《用于产生真实世界证据的真实世界数据指导原则(试行)》,给出了真实世界数据治理的主要流程和关键思考,为获取高质量证据提供了参考[34]。

3.3 技术工具

机器学习、深度学习等先进分析工具和软件能够处理和分析复杂多样的循证医学数据,从而节约临床医生和研究人员的时间和精力,提高循证决策精度。但整个研究过程也因模型脆弱而获得不准确或不合理的结果,且在建模过程中存在机器学习陷阱,如模型本身缺陷、模型选择不当和模型对抗性攻击,也会带来结果偏差,而增强模型和保证模型可解释性等措施可在一定程度上应对这样的“数据欺骗”[35]。

3.4 数据安全和伦理

在循证医学研究中,医学数据涉及个人识别信息、检查检验、诊疗、用药等大量敏感、隐私信息,甚至含有人类遗传资源信息。因此,相对于其他数据研究,健康医疗数据的安全和伦理问题更为突出。然而,由于数据管理规范体系的不健全,个人信息的不当收集、滥用、误用、泄露等数据安全问题[36]频频发生,不仅对个体和群体造成身心伤害,也危及社会公信力,甚至国家安全。随着我国数据安全法、个人信息保护法的颁布,个人信息的全面保护将越来越完善。

3.5 人才队伍

数据驱动的循证医学研究离不开临床医生、生物统计学家、数据处理专家、卫生决策者等多学科复合型人才团队的支撑。患者参与临床诊疗评价不仅有助于提高医学证据的可靠度与可信度,而且反馈至临床诊疗时,还能够提高患者的体验感和满意度。因此,搭建多学科人才队伍梯队、吸引患者积极参与循证医学研究是一项重要任务。循证医学和群体医学均为实现更优质的健康目标,具有统计学、AI等共同的学科基础和技术支撑,共享跨学科研究团队或许是完成上述任务的优良方案[37]。

4 小结与展望

医疗大数据时代,循证医学的证据来源复杂、规模巨大、类型多样,导致循证医学方法深陷统计分析能力不足的困境,却因此推动了数据科学在循证医学研究中的应用,形成了数据驱动的循证医学新形态,为循证医学的智能化转型提供了有力的技术支撑[10]。为促进循证医学与数据科学的深度融合,一方面数据驱动的循证医学证据生产和决策应以循证医学宗旨为标准;另一方面循证医学方法体系需不断更新和完善,增加机器学习等数据科学方法作为关键工具。同时,需临床医生和研究人员掌握更多先进的数据科学知识和技能,以及高信息素养的患者主动了解循证精准医学,参与证据生产与决策。

利益冲突:作者声明不存在利益冲突

猜你喜欢
真实世界循证证据
多替拉韦联合拉米夫定简化方案治疗初治HIV感染者真实世界研究
参麦宁肺方治疗223例新冠病毒感染者的真实世界研究
基于真实世界证据的人工髋关节假体临床使用研究
《循证护理》稿约
位置大数据侦查循证研究
虚拟世界和真实世界的纽带
对于家庭暴力应当如何搜集证据
手上的证据
手上的证据
循证医学的人文精神