盛 松,黄 烨
随着医学技术日新月异的不断发展,在日常医疗工作中对于循证决策以及个体化诊疗方案的需求持续增加,这种日益增长的需求极大推动了循证医学的发展。真实世界研究(RWS)逐渐成为医学研究人员、药企和医疗决策者关注的重点,尤其是在中医药领域的应用得到广泛重视[1]。2020年国家药监局《真实世界证据支持药物研发与审评的指导原则(试行)》指出RWS是在真实世界环境下收集与研究对象健康有关的真实世界数据或基于这些数据衍生的汇总数据,通过分析获得药物的使用情况及潜在获益-风险真实世界证据的研究过程。RWS的特点是基于大量的具有广泛代表性的样本量,根据病人实际病情和意愿给予干预措施,而不是采用随机分配的方法[2]。
目前开展的中医药临床研究以RCT为主,虽然RCT在牛津循证医学中心制定的证据等级中位于证据强度最高的金字塔顶端[3],但是过去三、四十年间,随着RCT的不断涌现,医学研究者也逐渐认识到其局限性。第一是研究对象代表性的问题,RCT的研究对象需要先通过“精挑细选”,满足一系列严苛的纳入排除标准后方能纳入临床试验,通常在健康志愿者或者病情不严重、无明显合并症、年龄适宜的病人人群中开展研究,因此,RCT的研究对象和临床中真正接受治疗的病人往往不完全一致,无法确定在真实临床实践中的可推广性。第二,RCT实施需要严格随机化、盲法、质控等措施规范研究过程,为了依从研究方案往往采取较多的干预措施,RCT过于严格的设计往往会使研究中病人的治疗过程偏离真实的临床实践,因此,在RCT中获得的有效性和安全性结果在真正的临床诊疗中可能难以重复[4],并且出于严格控制变量的设计,RCT很少获得关于伴随疾病和伴随治疗的信息。RWS是通过使用真实世界中的数据并进行分析,数据来源于医院信息系统数据、登记研究数据、自然人群队列数据等,涉及人群广泛,包括不同年龄、不同教育背景、不同收入、不同种族的人群,因此,RWS衡量的是在实际生活中的效果而非在试验中的疗效,尽管可能因为病人的多样性导致结果准确性降低,但是通过RWS而得出的结论具有更好的外推性。其次,RWS通常是非随机、开放性的,研究的实施地点以及干预条件为真实的临床实践环境,干预措施和临床实际一样,并可由病人和医师进行沟通而改变干预方法,其研究设计控制因素少,因此,结果外推性较好[5]。
在真实世界中研究中医药自古有之,从神农尝百草至今,中医积累了几千年的实践成果,均是在真实世界条件下经过长期大量观察分析,通过不断应用归纳总结的方法发现规律、验证规律,围绕临床实践改善认识、提高认识,最终得出的宝贵经验,因此,采用RWS进行中医药研究是适宜的。中医证候是中医认识和防治疾病的核心,证候具有动态性、复杂性等特点,在疾病不同的时间节点或不同阶段会呈现出不断变化证候表现,因此,中医的干预措施也需要分阶段性地适应证候变化而不断调整策略,此外,中医还强调“三因制宜”“病症结合”,相同证候在不同人群、不同时令季节、不同地域、不同疾病中的表现也是不尽相同的,因此,中医的治疗不主张专病专药、专病专方,而是根据病人的具体情况进行证候辨别,再结合所处的环境、气候等,开具合适的处方,其干预措施必然不是固定的、单一的。然而传统RCT需要严格要求干预措施的同质性,这与中医辨证论治强调的个体化和灵活性的特点相违背,使得传统RCT研究中医药得到的结论缺乏实际应用价值,导致中医药特色淡化,制约了中医药科技成果和证据的推广和应用。而RWS可以让临床医生根据病人病情和病人意愿选择治疗措施,在真实的临床医疗实践中观察疗效等,这非常契合中医辨证论治和个体化治疗的临床特点,因此,RWS的研究方法相比RCT对中医药临床实践特点表现出较好的相适性[6-7]。
中医药临床经验主要来源于长期的临床实践带来的大量临床记录,随着大数据时代的到来和信息技术的飞速发展,医疗行业不断产生海量的数据且呈指数级增长,其中包括中医古籍专著、名老中医医案、病历、文献期刊、临床经验总结等各种中医药电子化临床诊疗数据,其中有价值的医疗信息广泛地分布在真实世界中。因此,按照特定的目的将大数据中病人的信息整理、纳排,充分利用RWS的设计特点和优势,在不违背中医个体化干预的前提下,采用相对宽泛的纳入标准,并加以分析将极大推动中医药学术研究和临床经验总结,成倍提高研究效率。
3.1 数据整合困难 首先,RWS需要以大数据为基础,但是目前医院病历、中医古籍专著、名老中医经验等数据分布散乱,因此,增加了收集的难度。其次,虽然我国是中医药研究的主要国家,且病患人口众多,中医药临床数据极为丰富,但大多以“孤岛”形式存在,海量数据都会由于系统、交通、网络和多部门协作机制不畅等问题没有很好地共享,数据共享亦存在政策障碍,另外,目前缺乏统一的中医药权威数据管理和共享平台,因此,在数据共享方面存在“数据孤岛”现象[8]。第三,建立数据库时数据标准不统一,数据管理技术低下导致数据质量不高,并产生大量无效数据。因此,目前很多研究机构对中医药大数据的研究尚停留在对古籍文献整理的层次,尚未形成真正符合现代大数据意义上的中医药大数据系统,将来源复杂的中医药数据进行收集、整合将会是一项艰巨繁琐的任务。针对数据收集和整合难题,目前的主要应对办法是在研究开始时使用电子化数据录入和管理系统(Electronic Data Capture,EDC),可以多中心、多用户、多端口、多方式实时录入数据,同时实现数据储存、核查、管理、整合、导出等环节[9],有利于降低中医药RWS数据整合难题,提高数据质量。
3.2 中医术语标准化困难 包括病历在内的中医药大数据多属于非结构化数据,无法直接用于数据挖掘和分析,需要将其转换成计算机可以识别理解的语言才能被进一步的使用和分析。在转换的过程中通常需要对医学文本和语义进行识别,但是中医学术语表达方式不尽相同,如腹泻、泄泻、泻下等表达的是同一个疾病,同时中医证候、症状和疾病间的相互联系亦极其复杂,同种症状和证型可能出现在同一种疾病中,同种疾病会有不同证型和症状,不同疾病间也没有清晰的边界,因此,需要大量的人工识别标注,费时费力。让中医理论中术语概念标准化,也是目前开展中医药RWS的根本前提,具有重要的现实意义[10]。近10年来中医术语的标准化工作在逐步深化推进并不断完善,相继实施了大量的以术语为核心的中医药领域标准化研究工作,如2017国家中医药管理局《中医病证分类与代码》《中医临床诊疗术语》标准修订,2020国家哲学社会科学重大项目“中医药基本名词术语挖掘、整理及翻译标准化研究”等,对中医药RWS的发展起到了基础性的支撑作用。
3.3 实施中医药真实世界研究的质量控制困难 在已发表的中医药真实世界研究报道中,几乎没有明确、具体的质量控制措施体现,从而影响了RWS结果的可靠性。实施规范的中医临床研究,获取令人信服的循证医学证据,是中医药临床研究的主要任务[11]。虽然相对于RCT,RWS是相对“自由”的,但是RWS并不等于随意的开展研究。RWS数据异质性强,混杂和干扰因素多,因此,对科研设计和数据管理等要求比RCT更高。在进行RWS过程中需要进行质量控制,尽量减少因此产生的偏倚[12],包括制定和公开研究方案、制定并公开数据分析计划、数据清洗、报告规范和结果解读等。中医药RWS研究计划制定、结果解释等环节应严格遵守RWS的要求。然而中医药临床实践有其自身的特殊性,如医生进行辨证论治的复杂诊疗行为、内治外治复杂干预等,这些都决定了在进行中医药RWS时的特殊性与难度。因此,中医RWS临床规范应有别于西医,必须认真考虑中医药理论的特色,建立具有中医药研究自身特点的RWS研究规范。近年来,由国家层面牵头起草了多部中医药临床研究规范,如中华中医药学会颁布的《中医药真实世界研究技术规范-数据构建和数据预处理》《中医药真实世界研究技术规范-统计分析计划制定》《中医药真实世界研究技术规范-证据质量评价与报告》《中医药真实世界研究技术规范-伦理审查》《中医药真实世界研究技术规范-基于证据的中药有效性及安全性评价》等陆续填补了我国中医药RWS质量控制和质量保证体系的空白,这将更有助于中医药RWS结果被国际同行认可。
3.4 真实世界研究中的混杂控制困难 RWS由于非随机化不可避免地出现大量混杂,混杂的存在可能扭曲暴露与结局间的真实关联。中医药RWS相比西医RWS可能有着更多的混杂,如复杂的辨证论治过程中引入的混杂(证候、证型、辨证用药等),因此,中医药RWS要从大量协变量中考虑可能的混杂因素,对受试者的相关混杂进行广泛和全面的探索性分析是非常必要的。虽然目前从研究设计以及统计分析上可以采用分层、倾向性评分匹配、结构方程模型、广义相加模型等多种方法减少偏倚,但是即使是详细、完整的数据中采用多种设计和分析方法,依然可能无法完全控制潜在的混杂因素。此外,RWS中可能还存在着无法测量的未知混杂,未测量混杂的存在可能推翻结论[13]。虽然可以使用工具变量或者E值处理未测量混杂,但是无论是工具变量还是E值只能间接衡量暴露和结局间的关系。
RWS的推广应用促进了中医药临床研究的发展。RWS与RCT相比,各有优势和不足,RWS和RCT可以构成一个连续、完整的证据链,设计良好的RWS可以对RCT进行补充,有助于评价RCT未能提供的中医药真实世界结果,提供更切合临床真实情况的疗效评价。随着医疗大数据的迅猛发展,大样本的中医药RWS数量急剧增加,未来一定会产生更多的有关中医药的RWS证据指导临床实践。但是如何正确地设计试验和采集、处理数据,提高研究质量是目前中药RWS需要解决的。可以预见的是,随着国内中医药研究者对RWS的研究设计、实施和报告规范的不断重视,国内高质量的中医药RWS证据会不断涌现,推动中医药循证医疗实践和决策的发展。