孙霁雯 沈南平 李祎涵 阮海珊 何梦雪
(1.上海交通大学医学院附属上海儿童医学中心 a.护理部 b.血液肿瘤科,上海 200127;2.上海交通大学中国医院发展研究院儿童健康管理研究所,上海 200127;3.上海交通大学护理学院,上海 200025)
“大数据路线图”(big data road map)中强调需要提高对大数据的认识和理解,建设数据利用能力,促进数据的高价值[1],这同样适用于期待挖掘大数据红利的医疗行业。在“数据驱动假设”的医学范式中,数据的多样性决定了体现真实世界的复杂程度,数据的数量决定了反映真实世界的代表程度,而数据的质量决定了描绘真实世界的精准程度。一方面,临床数据来源包括实验室检查、影像学检查、患者体征等客观指标和患者报告结局(patient-reported outcomes,PROs)等主观指标。但单独使用临床客观指标可能会低估疾病对个体层面的影响,高估医疗干预措施的有效性[2]。故需要纳入直接来自患者个体层面与患者健康状态有关的主观指标——PROs[3]以全面评估干预的有效性和安全性。PROs不仅是疾病影响的独特指标,更是评估药物和医疗设备治疗效果的主要或次要终点指标。然而有研究指出,PROs数据可能在医疗大数据“革命”中没有得到充分体现,呼吁将患者报告的结果放在“大数据路线图”中[4],所形成的PROs大数据可以提供“真实世界”的数据,协助补充或比较研究的有效性和安全性。另一方面,以美国为首的发达国家在PROs研究中占有领先地位,不仅研究数量多且质量高[5],而我国在该领域中高质量的研究较少,可能与对其的关注度不够有关[6]。鉴此,笔者就近年来PROs在医疗大数据中临床应用的价值进行综述,以期为促进我国基于PROs的医疗大数据的发展提供新的思路。
PROs数据在医疗大数据中的应用场景主要在患者照护、人群健康管理和科研3个方面[4],其应用价值可归纳为解释、监测、筛查、预测4个方面。解释,即PROs数据常被当做关键信息(take-home message)[7]为EHR提供了额外的、补充的、专业的源于患者角度的数据,不仅有助于构建大数据决策辅助系统,更有助于进行真实世界的试验[4];监测和筛查,即通过对PROs数据的实时监测,,形成基于自我报告的预警(PRO-alerts)[8],实现了症状的早期识别和干预[3],以指导患者自我照护,改善患者和临床团队之间的沟通,并在必要时快速转诊到适当的专科医疗照护[9];预测,即PROs数据作为预后模型的结局指标[10]和预测指标,用于识别在医疗照护需求上处于优先级的群体和个体[4]。
PROs以患者的角度报告自身状态,可以解释某些无法仅凭临床客观数据判定的疾病进展和疗效信息。Mcnair[7]的系统评价回顾了66篇胃肠癌随机对照试验的文献,发现其中有36篇文献同时报道了PROs和临床客观数据的结果,其余的文献则分别进行了独立报道。PROs作为补充结果而单独发表的文献不仅期刊影响因子远低于有临床结果的文献,而且平均出版时间也相对延后约20个月[7]。从内容报告规范方面,同时报告的文献中有41%未提及PROs的基本原理或假设,且仅有17%详细解释了PROs与临床客观结果的关联[7]。这也提示,一方面,新版的试验报告的统一标准(consolidated standards of reporting trials pro extension,CONSORT PRO extension)[11]规范了PROs的报告格式,故需要严格参照新版CONSORT PRO extension的标准进行报告,以提高PROs相关的研究质量;另一方面,由于没有实证数据表明如何最好地实现PROs与临床客观结果的有效结合[12],故其最佳整合有待进一步探究。Hertz[13]指出,采用患者报告版通用不良事件术语标准(patient-reported outcomescommon terminology criteria adverse events,PRO-CTCAE)报告的化疗不良事件结果和CTCAE报告结果的一致性呈中弱相关(相关系数0.2~0.7)。虽然有限的相关性是否可作为证据来支持PROs数据更敏感或许有待进一步验证,如可能是两者间的结果并非平行对应,但是通过建立数据间的标准转换规则,有助于更好地将PROs数据融合于临床结果,避免相似内容自评后再他评的二次测评。McFatrich等[14]采用专家评议法将PRO-CTCAE的101种标尺组合与CTCAE的5种标尺进行定量对应,但其结果尚未在临床验证其有效性。Basch等[15]构建了PRO-CTCAE和CTCAE结果定量对应的算法模型,以便更好地解释临床结果,并基于历史数据验证了算法的准确度,但目前尚未建立两者间变化度的对应规则。此外,由于不同的报告主体间若存在着结果的不一致性,可能会影响数据对临床的解释,这也意味着在主观体验方面需要倾听和尊重源自患者本人的声音。如林欢等[16]的研究就证实了儿童自我报告结局及其主要照顾者报告结局为弱相关,且主要照顾者容易高估儿童的负性情绪水平。
PROs可早期监测和识别健康状况的变化,尤其是患者症状严重程度上的细微变化[17]。大数据时代健康管理的新思路,即实时监测患者随时间变化的PROs数据,基于大数据发现其时变轨迹和规律,整合循证辅助决策的智能推荐系统,推荐个性化精准干预方案[18]。然而,以往的PROs大多是回顾性评估一段时间内的状况,不可避免地会产生回忆偏倚。因此,生态瞬时评估法(ecological momentary assessment,EMA)应运而生,其自然情境下的实时评估反馈,提高了生态学效度,并通过重复采集数据以凝练典型特征,有助于精准描绘症状变化轨迹和规律[19-20]。Sufrinko等[21]的研究已经证实采用EMA捕获的症状波动有助于医务人员制定完善的针对性的症状管理策略。随着智能手机程序等信息技术的快速发展,依托智能应用程序等不仅为实现个体PROs实时监测提供了便捷,更是整合智能推荐系统的载体,通过主动捕获、实时共享、实时分析和及时指导,实现健康管理的无缝链接,为个性化的精准干预奠定了基础。如Kyte等[22]研制的针对慢性肾脏病患者自我管理的系统,不仅实现了症状的实时监测和个性化自我管理推荐,亦将PROs数据整合到EHR中,实现了慢病全程管理。
采用患者报告结局测量工具(patient-reported outcomes measurements,PROMs)可快速筛查症状,当筛查结果为阳性时,则采用更全面的医学评估,通过最大限度地报告症状减轻医患双方的临床测评负担[23]。如Curtis等[24]的研究指出,相比医生评估的美国国立卫生研究院眼科评分和Schirmer泪液试验,患者报告的Lee眼亚量表是活性眼慢性移植物抗宿主病最强的预测因子(敏感性68.5%,特异性82.6%),有助于症状的早期筛查。然而,亦有研究结果显示PROMs的部分筛查准确度欠佳。如Tuechler等[25]以PROMs(Roland-Morris功能障碍问卷和疼痛残疾指数)和人口学指标(性别和年龄)作为自变量,国际功能、残疾和健康分类(international classification of functioning,disability and health,ICF)中下腰痛核心简表的11个条目分别作为因变量,采用随机森林方法建立了11个下腰痛功能损害的模型,准确度在0.474~0.895。其结果准确度欠佳可能与纳入的PROMs条目未能完全匹配ICF的下腰痛所有条目概念有关。这也提示了,在选择PROMs时,需先进行PROMs条目与结局变量的概念匹配。如Cieza[26]建立的PROMs与ICF定性对应的关联规则,可作为挑选更贴切PROMs的方法。PROMs作为一种便捷的、无创的、低成本的工具,尤其适用于患者的居家症状监测和相关筛查。如De Jong等[27]的研究发现,患者报告的炎症性肠病居家监测问卷联合粪钙卫蛋白居家测试在筛查炎症性肠病活动期的黏膜炎症上显示了较高的精准度(克罗恩的敏感度96.7%和特异度66.7%;溃疡性结肠炎的敏感度88.2%和特异度81.4%)。这也提示,相比依赖于临床测试结果的高准确性,PROs在患者居家时也能捕捉大量的、有用的数据用于早期监测和识别。这不只是倾听患者的声音,更是通过患者自己的声音促使其更多地参与自我健康管理。此外,为了提高监测的效能,需要建立标准化的、有用的数据,并兼顾减少患者的报告负担。通过采用标准化的PROMs,可形成标准化高质量的PROs大数据,助力最大化发挥监测的效能。同时借助计算机自适应系统(computer adaptive testing system,CAT),使得测试者只需完成与其能力水平相当的条目,即完成比传统测量更少的项目,从而提高了报告效率和监测的精确度[28]。
PROs可用于疾病预后的预测,提高监测预警能力和水平。Sharma等[29]的研究发现,癌症和白血病B组(Cancer and leukemia group B,CALGB)经过3个化疗周期后采用癌症治疗功能评估妇科肿瘤组的神经毒性分量表(functional assessment of cancer therapy/gynecologic oncology group-neurotoxicity,FACT/GOG-NTX)的前4个最密切的自我报告症状条目是预测未来神经病变严重程度的最佳早期时间点,且预测6个周期后神经病变的准确性为75%。但是,因PROs报告的主观性而可能导致存在一定的个体差异,故在预测方面效能可能受到部分学者的质疑。如Strassmann等[30]的研究发现,PROs(呼吸困难、疲劳和焦虑、体育活动水平)单独作为COPD加重的预测因子,其预测效能(AUC为0.54~0.65)低于现有的含临床客观指标的预测模型(AUC为0.68~0.72),且在现有的预测模型中加PROs的数据不能优化已有的模型结果。PROs的预测效能有限,一方面,由于症状类的PROs相对于实验指标而言是较为早期的表现,故可能较为泛化,导致预测精准度不高;另一方面,可能采集的PROs数据的时机和频度不够,致使单次的测评结果的代表性不够,影响了预测效能。即便如此,仍有学者认为,PROs的变化值可能会更敏感,能有效预测疾病预后。Toyonaga等[31]学者发现第4周的患者报告结局的变化值最准确地预测了第12周的溃疡性结肠炎的黏膜愈合,优于生物标志物(粪钙卫蛋白)的预测结果。基于PROs的预测预警是一把双刃剑,合理且有效的预测预警可节省医疗成本[4],但过多的预警亦导致医疗保健使用率增加,也可能会造成预警疲乏而反向降低个体对其的重视度。
PROs是医疗大数据中不可或缺的一部分,但我国PROs的研究起步较晚,且高质量的PROs研究较少。PROs在医疗大数据研究中具有补充解释临床结果,实时监测健康状况,尤其适合居家随访监测,并有助于促进症状早期筛查,优化症状精准管理,预测疾病预后等应用价值。但需要采取促进PROs临床大数据高价值应用的系列举措,包括(1)在工具方面:数据标准化是采集大数据的基石,需要使用规范化的PROMs,例如PROMIS。但过多的报告亦会增加患者的报告负担,进而影响了数据的完整性和有效性,故需要考虑工具和测量内容的锲合度。可通过测量概念的匹配等方式挑选合适的疾病或治疗特异性的PROMs并进行工具的测量学研究;也可通过CAT找出PROMs条目池中关联条目,从而形成人群特异性的PROMs。(2)在数据捕获方面:利用EMA联合信息技术可实现PROs实时监测预警,也可为生态瞬时干预(ecological momentary interventions,EMI)提供指引。(3)在分析方法方面:在处理大量敏感性强但特异性弱的PROs数据时,模型的准确度直接影响了其筛查或预测的功效。利用现有的大数据挖掘技术,可从看似“无序”的数据中走向“有序”且有真相解释度的数据。(4)在结果解读方面:建立PROs数据结果与非PROs数据结果的对接或转化规则,可进一步促进PROs数据的效价最大化。同时,通过建立规范使用指引和培训,以提升医护人员对PROs数据的解释能力,有助于进一步促进以患者为中心的多学科合作的照护决策。(5)在科研呈现方面:需要参照CONSORT PRO extension的报告规范,加强相关研究的设计严谨性和报告质量。