王 斌,白如健,谢 琪,陈 迪,曹馨宇,周洪伟,史华新,张妮楠
(1.中国中医科学院中医临床基础医学研究所 北京 100700;2.山东中医药大学附属医院医务处 济南 250011;3.中国中医科学院中医药数据中心 北京 100700;4.中国中医科学院广安门医院医保办 北京 100053)
以随机对照临床试验(randomized clinical trial,RCT)为代表的传统临床研究,为获得较高的内部真实性,纳入人群限制较多,干预条件控制严格,使得研究结果的外部真实性却较差,研究结果的实际应用推广受限[1]。针对这样的问题,1993年Kaplan等首次在论文中使用了真实世界研究(real world study,RWS)方法[2]。RWS通过“真实世界样本”来反映真实世界总体,广泛应用于药物临床不良反应的监测,上市药物有效性和安全性再评价及临床干预措施的评价,近年真实世界研究日益成为医疗卫生领域关注的焦点之一。真实世界证据(real world evidence,RWE)也成为医疗卫生决策者、执业者、研究者、医药企业共同关注的对象[3]。
中医临床科研的特征是以人为中心,以数据为导向,以问题为驱动,医疗实践与科学计算交替,从临床中来到临床中去[4]。由于真实世界研究可以根据患者的实际病情和意愿选择治疗措施开展长期评价,能够评价综合效应,适应中医整体观念和辨证论治的特点,在中医领域开展日益广泛[5]。如何将健康相关的数据转化为RWE,这需要从数据的可及性、数据的安全性以及伦理学问题等多方位的思考。本文仅从数据可及性相关的角度阐述真实世界研究中的数据采集方法。
随着信息技术的发展,利用计算机和其他电子工具收集和存储大量与健康有关的数据一直在增加。构成RWE的数据内容丰富,种类繁多,数据量巨大,这为真实世界研究的可行性提供保障[6]。真实世界数据(real world data,RWD)主要包括来自电子健康记录(electronic health records,EHR)、社会保障或医疗保险数据库、疾病登记数据库、家庭监护设备数据、健康移动设备的监护数据以及生物样本检测的各类组学数据等[6]。中医RWS中的数据主要来源于以电子病历为核心的医疗卫生服务记录,以门诊病历或者住院病历的形式存储于医院信息系统的数据库中,不仅包括一般人口学信息,诊断记录,处方,医嘱,检查检验报告以及健康移动设备的监护数据等;还包括中医的四诊信息,中医症候等。
中医药的数据资源具有典型的大数据特征[7]。一是数据量巨大,中国中医科学院2012年4所医院全年的门诊量达到698万,仅广安门医院1天的门诊量就超过1万人次。然而,由于门诊诊疗服务的时效性要求极高,信息采集也仅是局限于基本是诊断信息、处方,而信息量更丰富,更有价值的诊疗过程的记录相对不够完整与全面。为此,我们优化门诊诊疗流程,充分利用病人候诊的大块时间,开发门诊预诊系统用于门诊病历的采集[8]。中医门诊预诊系统的实施进一步丰富了中医真实世界数据采集的手段,提升医院病历数据化的水平和临床数据的利用能力。
RWS最本质的特征并不是其研究方法和试验设计的特殊性,而是构成RWE的数据来源于医疗机构、家庭和社区,而非存在诸多严格限制的科研场所。根据RWD采集地点的不同,可以分为医疗机构内部和医疗机构外部的采集。
目前,医院的信息系统(hospital information system,HIS)已经覆盖从社区医疗服务站到3甲医院的各个医疗服务机构,医疗大数据的概念在业内也得到广泛认可。以电子病历为核心的医院信息数据库已经为真实世界研究提供了很好的技术支撑[9]。
患者基本信息的采集包括一般人口学信息:姓名、性别、出生日期、民族、婚姻状况、职业、工作单位等。该部分信息一般由HIS的身份登记子系统或者预约挂号子系统在患者初次就诊时生成,采集对象为患者本人或家属。
诊疗信息的采集包括:主诉、现病史、既往史、过敏史、个人史、家族史等一般信息;中医四诊信息;中医诊断;西医诊断;药物与非药物治疗方案;检查检验结果;中医特色量表。该部分信息一般由电子病历系统生成,采集对象为患者本人。
RWD的构成极为广泛,医疗机构以外的数据采集也是其重要的数据来源,包括区域医疗健康数据库、个人健康信息采集终端、社会保障或医疗保险数据库、公共卫生调查与公共健康监测、出生/死亡登记项目、随访系统等提供的数据。外部数据可通过电子数据上传或数据直接对接的方式获取。
及时、准确、完整、规范、真实是临床试验数据“采集记录”的管理遵循的规范。RWD的采集也同样适用与该规范,为保证从各类健康相关数据库中采集的数据更好的转换为RWE,在开展数据采集时应保证:每一条记录都应有唯一标识码,确保主记录与明细记录关联对应;诊疗数据应有生成时间;实验室检查结果应附标准值;中成药记录应附生产厂家及批号;隐私数据应依据伦理要求进行匿名化处理。
由于目前各医疗机构间尚未实现数据的互联互通,为保证各数据采集点数据的关联性和完整性,需要在制定数据采集方案时,设计患者主索引。患者主索引主要用途是在一个复杂的医疗体系内,通过唯一的患者标识将多个医疗信息系统有效地关联在一起。以实现各个系统之间的互联互通,保证对同一个患者,分布在不同系统中的个人信息采集的完整性和准确性[10]。
RWS中,从数据采集到数据分析,数据要在数据采集者、数据管理者、数据利用者等不同的角色中传递、交换。每一次的传递、交换都可能对数据的质量造成影响,因此数据描述与质量评价说明尤为重要。
数据特征描述:数据来源、数据量。
数据库描述:数据表的定义规则、变量定义规则、隐私保护需要、共享要求。
数据文件描述:文件格式、存储方式、备份策略、保存时限、数据库说明文档。
数据用户描述:临床数据采集者、质量控制人员、数据分析人员。
真实、准确、完整和可靠是保证临床试验数据质量的基本原则。数据核查包括以下内容:违背方案核查、时间窗核查、逻辑核查、阈值范围核查、一致性核查、数据完整性核查等。数据核查后产生的质疑需要反馈给临床监查员或研究者。研究者对质疑做出回答后,数据管理员根据返回质疑答复对数据进行修改。
面对中医临床研究缺少广泛认可的研究范式这一难题,刘保延等提出了基于真实世界研究的中医科研范式[4]。中医临床数据凝聚了临床经验与科技创新活动的成果,是传播卫生科学技术知识的重要载体,也是国家宝贵的知识财富,中医真实世界研究是实施循证医学研究方法,转化临床数据为可靠的临床证据的有效途径。基于中医药的临床数据,通过可靠地数据分析工具,能够为疾病发现、诊断治疗、药物开发、医药管理等方面提供科学的决策支持,对疾病的预防和卫生资源的合理配置也发挥了积极作用[11]。基于中医专家知识、中医临床信息的海量数据,通过有效的算法,为疾病症状学研究、证候要素研究、证候分类及证候分布规律研究、治则治法研究、方药研究、方药配伍规律研究、证效关系、量效关系、时效关系、治疗方案的筛选与优化研究、诊疗指南规范与标准的研究、中医量表的研究等提供信息数据资料和技术支持,促进中医基础理论的发展和进步[12]。
证、治、效的有机结合,使得中医理论和临床实践不断循环进化发展的过程体现了中医诊疗的复杂性。这是因为,中医临床数据是结构化数据(处方、检验结果)、半结构化数据(病历数据)和非结构化数据(图像、信号等)混杂的。然而,从数据挖掘和知识发现的角度出发,为了能更好的发现数据库中隐藏的信息,作为良性的数据利用者更希望发布的数据集中包含有更精确、更具体的数据信息。在真实世界研究中,数据采集方法将直接影像数据的质量,进而影响临床研究结果的可靠性。可见,规范的数据采集能保证海量的临床数据为基于临床需求的数据分析、挖掘的可行性,也使得真实世界研究方法为真实世界数据转换为可靠的临床证据成为可能。
1 李敏,时景璞,于慧会.真实世界研究与随机对照试验、单病例随机对照试验在临床治疗性研究中的关系比较.中华流行病学杂志,2012,33(3):342-345.
2 Kaplan N M,Sproul L E,Mulcahy W S.Large prospective study of ramipril in patients with hypertension.CARE Investigators..Clin Ther,1993,15(5):810.
3 孙鑫,谭婧,唐立,等.重新认识真实世界研究.中国循证医学杂志,2017(2):126-130..
4 刘保延.真实世界的中医临床科研范式.中医杂志,2013,54(6):451-455.
5 谢琪,江丽杰,刘保延,等.开展真实世界中医药效果比较研究的关键问题及对策的探讨.世界中医药,2014,2014(1):28-31.
6 Sherman R E,Anderson S A,Dal Pan G J,et al.Real-World Evidence-What Is It and What Can It Tell Us?.New Engl J Med,2016,375(23):2293.
7 苏暄.大数据,带来中医个体化诊疗新视域?——访中国中医科学院常务副院长刘保延.中国医药科学,2015(1):1-3.
8 刘婕,刘保延,谢琪,等.服务于研究型医院的门诊病历采集方法研究.中国数字医学,2016,11(6):21-23.
9 王斌,谢琪,史华新,等.真实世界临床科研中电子病历数据的存储.中医杂志,2013,54(20):1736-1739.
10崔泳,金铎.患者主索引(EMPI)是医疗信息系统的连接点.中国信息界:e医疗,2010(12):53-54.
11丁维,蒋永光,宋姚屏,等.数据挖掘及其在中医领域的应用研究.数理医药学杂志,2007,20(3):403-404.
12谢琪,刘保延,李鲲,等.论中医药临床数据的科学价值.国际中医中药杂志,2010,32(5):455-456.