中国卒中复发风险预测工具的开发与应用现状*

2021-01-08 18:11:02徐寒莹徐鹏张影张冬梅崔雅斌王健
世界科学技术-中医药现代化 2021年1期
关键词:缺血性工具建模

徐寒莹,徐鹏,张影,张冬梅,崔雅斌,王健**

(1. 长春中医药大学中医学院 长春 130117;2. 长春中医药大学附属医院脑病中心 长春 130021)

卒中作为一种急性脑血管病,具有高发病率、高复发率、高致残率、高死亡率的特点。在中国,卒中是造成我国成年人致死、致残的主要原因。据统计我国卒中的死亡率是欧美国家的4-5倍,甚至远高于日本、印度等邻近的亚洲国家[1]。2017年我国有约196 万人死于脑卒中,首次卒中后1年内复发率高达17.1%[2]。卒中反复发作可加剧神经功能缺损症状及并发症,使治疗更具难度。复发卒中是卒中患者死亡风险加倍的独立因素,同样也是我国残疾调整生命年(Disability-adjusted life years,DALY)水平居高不下的重要原因[3,4]。一项荟萃分析表明,卒中复发的累计风险在首次卒中后30天、1年、5年、10年时分别为3.1%、11.1%、26.4%、39.2%[5]。因此,建立科学精准的风险评估工具,尽早识别卒中复发风险因素对于快速调整可控因素,在卒中复发的防控过程中具有重要意义。早在20 世纪90年代,国外学者已着手建立简易评估工具用于卒中的二级预防风险评估,并在推广应用过程中不断改良,现已形成较为成熟的卒中复发风险评估体系。近年来,我国诸多研究团队也聚焦于卒中复发风险评估工具的研究,致力于创建适合国人的复发风险预测工具为卒中二级预防提供保障。本文即对我国现阶段卒中复发风险预测工具的开发与应用进行概述。

1 工具开发

目前对于复发风险预测工具的构建手段主要划分为2 类,即传统建模方法和机器学习算法。传统建模方式是根据单因素、多因素回归分析疾病的复发概率,建立数学公式以实现预测,此类方法应用广泛,操作简便。机器学习算法得益于计算机技术的快速发展,是人工智能的重要分支,是近年来国内外研究者勇于尝试的新兴技术。下文即围绕2类建模手段展开详细论述。

1.1 基于回归分析的传统建模方法

风险预测模型的实质是探求研究因素与疾病产生的因果关系及关系的强弱程度。疾病的产生可为单因素独立作用或多因素联合作用的结果。回归分析以数据为基础,通过数学模型形式表现因果关系,也是风险预测的常用统计方法。目前,较为经典的风险预测建模方法主要为Cox 比例风险回归和Logistic回归分析。Logictic 回归模型主要探讨事件概率与自变量的关系。Cox 回归模型以生存结局和生存时间为因变量,可同时分析多因素对生存时间的影响。安雅臣等[6]构建了可预测3年内复发风险的Cox 回归模型及个体预后指数方程,结果显示AUC 值为0.817,并计算约登指数最大值为0.483,确定其对应的预后指数(1.248)作为截断点(即最佳阳性判别点),即预后指数≥1.248时3年内复发的可能性大。于莹等[7]建立了缺血性卒中患者阿司匹林治疗后复发风险的Logistic回归模型,AUC值为0.7529,预测准确率为71.36%,提示模型具有较好的预测性能。

1.2 人工智能技术指导下的机器学习建模方法

伴随科技的迅猛发展,人工智能(Artificial Intelligence,AI)得以快速崛起。机器学习(Machine Learning,ML)作为AI 的前沿研究领域和重要分支同样取得了突破性的进展。ML 是计算机通过反复的“训练”(模型学习)数据内规律性的信息,从而获得新的经验和知识,不断优化自身性能的新方法。ML 的基础在于数据样本,关键环节在于模型训练,数据体量的扩充和较好的数据质量可以提升模型的品质,这样的特质也使得ML 在大数据的分析与处理等方面具有显著优势。近年来,ML 与医疗、公共卫生事业的联系日趋密切,由ML 衍生出的各类新型算法在临床数据的挖掘、疾病预测、诊断和治疗等方面发挥着不容忽视的作用,是实现未来智慧医疗的核心技术,为形成科学化医疗决策提供有力支持。研究者们也将ML应用于卒中的风险预测,常见类型包括决策树模型、人工神经网络模型、支持向量机模型(Support vector machines,SVM)等。刘泽文等[8]对657 名卒中患者(按9:1比例划分训练集与测试集)建立支持向量机模型以预测5年卒中复发风险,结果显示模型AUC 值为0.836。潘思行等[9]基于神经网络与支持向量机建立了客观化舌象和形体特征的辅助中医体质识别模型,结果显示融合了舌象和形体特征的2种机器学习模型一定程度上可提高中医体质辨识的准确性。由此可见,机器学习算法在中医药领域有较好的应用价值,为日后建立具有中医特色的卒中风险预测工具提供技术保障。

1.3 传统建模方法与机器学习模型的比较

传统的复发预测工具通过纳入患者入院时的信息与指标进行模拟整合与风险分层,进而评估复发风险,未能考虑基线及随访期间风险因素的变化,在预测精确度上略显不足。ML 可通过数据集快速、准确的识别风险因素,并可应对数量大、高维度、非结构性的复杂数据。相较于传统预测模型,ML 可灵活处理数据缺失值,挖掘潜在风险因素,有较强的的抗干扰能力,可进一步提高了预测模型的准确率。陈思玎等[10]对10645 名缺血性卒中患者分别构建了机器学习模型XGBoost和Logistic回归模型对患者卒中后3个月死亡结局展开预测,两者AUC 分别为0.8539、0.8278,前者显示出较好的预测效能,与此同时,在运算时间成本和预测精准度等方面也更具优势。谭英等[11]对589 名缺血性卒中患者分别构建了BP 神经网络模型和Logistic 回归模型进行复发风险预测,两者AUC 值分别为0.787、0.729,提示前者的预测效能更佳。ML在近年来获得了巨大发展,并逐渐参与卒中决策制定过程。卒中病因的复杂性及ML 对大数据的良好处理能力使得研究者们对运用ML 进行卒中的风险预测产生兴趣,但结合目前国内外的研究现状、相关文献发表数量、文献质量评价结果可知,现阶段国内外研究者构建的卒中预测模型仍多应用传统建模方法,ML在疾病预测领域的发展仍处于初级阶段,尚未实现广泛推广,目前多数研究仅采用内部验证方法,鲜少经过外部验证,而针对于ML 的超参数情况的调整流程也尚未形成标准化的指南或程序报告[12,13]。由此可见,在AL 背景下衍生的新型建模方式仍需要研究者们进一步探索与挖掘,在未来可更好的应用于卒中风险预测的实践中。

2 工具应用

卒中复发风险预测工具是早期识别卒中复发高危人群、明确预防重点的有效措施。我国目前应用的复发预测工具均为国外研究团队所建立,但此类工具并不完全适用于在中国人群。近年来,国内研究者也致力于对传统预测工具的改良与创新,使其更好的适用于国内人群,下文即简要介绍我国对国内外卒中复发预测工具的应用现状。

2.1 国外开发的卒中复发风险预测工具

国外学者对于复发预测工具的研究与开发早于国内。《中国缺血性脑卒中风险评估量表使用专家共识2016》中推荐使用ABCD2 评分或ABCD3-I 评分对短暂性脑缺血发作(TIA)患者进行卒中风险评估,应用Essen 量表(ESRS)或卒中预测工具-Ⅱ(SPI-Ⅱ)评估缺血性卒中患者长期复发风险[14],而以上工具均为西方国家以欧美人群为研究目标所构建。ABCD 评分系统主要用于TIA 后的卒中风险评估,通过不断完善风险参数实现阶段性衍化。ABCD2 因操作便捷且对接诊医师无神经专科知识要求等特点,在临床上使用更为广泛。美国心脏协会(AHA)指南建议使用ABCD2 对TIA 后短期复发的高危人群进行风险识别。ABCD3-I 在ABCD2 的基础上增加了DWI 和颈动脉成像2 个指标,因此预测效果更佳[15]。ESRS 的建立基于阿司匹林与氯吡格雷比较用于缺血事件高危患者试验(CAPRIE)[16],可以合理预测卒中及心血管事件复发的长期风险,并在欧美人群中进行了效度验证[15,17]。ERSR 中缺少反映颅内血管狭窄程度的预测指标,而国内缺血性卒中患者的颅内血管狭窄和大动脉粥样硬化更为多见,因此ERSR 在我国的预测效能低于欧美国家。孟霞等[18]研究表明,ESRS 对大卒中复发/联合血管事件的预测效能最高,其次是小卒中,对TIA的预测效能最低。SPI-Ⅱ与ESRS 在中国人群中对卒中复发的风险预测能力基本一致[19]。近年来,国内学者将以上工具在中国人群中进行验证及横向比较,结果显示在中国人群中的预测效能尚有不足。

2.2 国内开发的卒中复发风险预测工具

我国对于卒中风险预测工具的建设与开发起步较晚。且相较于初发预测工具,对复发预测工具的研究尤为薄弱,然而因卒中复发引起高致残率、死亡率不容忽视。近年来随着对于卒中复发危险因素的不断深入探索,国内研究者逐步开展了一系列科学研究,构建风险预测模型,应用于卒中复发高危人群的早期识别与防控。

2.2.1 基于经典预测模型优化的卒中复发风险预测工具

卒中二级预防对于降低卒中复发风险、致残率、致死率有重要意义。复发风险预测工具可尽早识别风险因素,提高医生与患者的防范意识,强化二级预防效果。目前国内的复发预测工具多基于小样本量、随访时间较短、地域局限的研究,建模方法相对传统,未能在大范围内得以推广。许多学者以国外经典复发模型为基础,结合国内卒中流行病特征进行改良,并在小范围内得以验证。Ling 等[20]选取高血压病史>15年、糖尿病史>10年、缺血性卒中或TIA 既往史、大动脉粥样硬化亚型作为危险因素,构建了改良ESRS评分,并应用改良ESRS 与原始ESRS 分别对773 名缺血性卒中患者进行评估,结果显示两者AUC 值分别为0.70、0.58,改良ESRS 显示出较好的预测效能且在灵敏度与特异性等方面也优于原始ESRS。此外,将现有复发预测工具联合新的亚临床指标在一定程度上也可提高预测效能,研究者们也积极寻找更有利的独立复发预测因子。魏衡等[21]研究表明超敏-C 反应蛋白与ABCD2 评分联合能提高对脑梗死的预测价值。Liu等[22]研究发现,miR-122rs17669基因型是卒中复发风险的重要预测因子,携带rs17669 多态性CC 基因型的患者与TT/CT 基因型相比,缺血性卒中复发风险增加88%。李菁晶等[23]研究发现DWI 所示多发皮层、皮层下和(或)深部白质病变、多发颅内外动脉狭窄可能是小卒中1年后卒中复发的独立预测因子。

2.2.2 基于中医理论开发的卒中复发风险预测工具

中医“治未病”理论中未病先防、既病防变、病后防复的内容与现代医学倡导的三级预防理念联系密切。目前国内所建立的中医相关卒中复发预测工具主要围绕中医证候要素和中医体质辨识两个角度展开。证候是中医学理论研究的核心内容,是对患者生理、病理状态的概括,其外在表现为具象的症状、体征。体质是在先天与后天共同作用下形成的形态结构、生理功能与心理状态方面长期的、相对稳定的固有特质[24]。体质影响着疾病的易感程度与转归。《中医体质分类与判定》行业标准的颁布及《中医体质量表》的制定,为中医体质辨识及基于体质的疾病预防和管理提供了有效依据,数据挖掘技术的快速发展也为研究者建立中医特色相关的风险预测模型提供了重要技术支撑。张静等[25]对1780 例复发缺血性中风患者进行Logistic 回归分析后发现风痰阻络、气虚血瘀、痰热腑实、痰蒙清窍、痰热内闭证候类型表现可能是缺血性中风复发的危险因素,缺血性中风复发人群显示出特定的中医证候特征。王桂倩等[26]融合常规复发风险因素与体质信息建立了基于体质的缺血性中风复发风险模型,并与西医危险因素的复发风险模型进行对比,两者AUC 值分别为0.766、0.718,前者显示出较好的预测效能。我国现阶段对于中医特色相关的复发预测工具研究较为匮乏,应充分发挥中医药优势与专长,将现代风险因素与中医证候要素、患者体质状态相结合,构建具有中医特色的复发风险预测工具,同时开展中医健康教育,推广中医特色康复诊疗技术,使中医药在卒中疾病全周期发挥作用。

3 问题与建议

3.1 存在的问题

本文应用对比的方式针对我国现阶段卒中复发预测工具的开发技术与国内外预测工具的应用现状分别展开分析,对于现下应用的主要建模方式进行分类概述,并从建模原理、数据处理、模型效能、精准度、发展现状等角度将传统建模方法与机器学习模型进行对比,展开详细论述。通过本研究可知,我国目前对于卒中复发预测工具的研究仍处于初级阶段,所应用的卒中复发预测工具多为发达国家建立,而此类模型在国内人群中预测效果存在局限,因此构建适合国人的复发预测工具是未来卒中预警与防控领域研究的重难点。

3.2 未来的建议

本文通过分析我国现阶段的风险预测现状,总结得出3个目前我国卒中风险预测研究领域面临的瓶颈问题并提出建议:

3.2.1 加强国外模型在国内人群的适应性与预测能力

国内研究者根据我国卒中流行病学特征,在经典模型基础上加入新型预测参数以增强模型的预测效能,但此类工具的开发多基于小样本量、小范围、随访时间短的队列研究,且以回顾性的病历资料研究居多,前瞻性研究较少,多数研究无法代表大范围内卒中患者复发的整体特征,因此亟需构建基于大型临床研究,符合中国人群卒中流行特征的复发预测工具,更好的指导临床实践。

3.2.2 溯源与挖掘传统中医理论中蕴含的“治未病”思想构建中医特色风险预测工具

中医“治未病”思想在慢性病防控管理方面具有丰富的理论与实践经验,《中国防治慢性病中长期规划(2017-2025)》中明确提出要发挥中医药在慢性病防治中的优势与作用。但目前以“证候特征”“体质辨识”为核心的中医健康状态辨识体系在卒中、冠心病等慢性病的风险评估能力与预测精确程度仍有待提高,缺少高级别循证证据,尚未形成完备的卒中防控与评价体系,这也使得具有中医特色的卒中发病、复发防控服务模式的推广进程缓慢,难以落地。对于中医特色风险评估工具未来的建设与发展,需依托大规模人群流调、回顾性研究、队列研究、随机对照研究,建立在以“证候”为核心的卒中风险识别技术的基础上,并可逐步开展中医相关的卒中防控干预技术与推广模式评价研究,形成标准化指南,建设中医防控示范基地,构建中医卒中发病与复发预警防治体系。

3.2.3 推动新型建模技术及数据处理手段与卒中复发风险预测相融合

准确性与科学性是评价预测工具优劣程度的重要指标。充足样本数量、风险因素细化程度、科学的建模方法是提高预测工具准确性与科学性的重要手段。近年来,国内研究团队对于机器学习算法的大胆的应用与尝试也使得新型建模技术在我国卒中风险预测领域获得了巨大发展。目前,各级医院的医疗数据存储水平参差不齐,多样的数据形式使得增加了数据共享的难度。在未来的研究过程中,可引入混杂处理、因果推断、纵向数据处理及分析(重复测量方差分析、分层模型、广义线性模型、混合效应模型、生存分析等)、高维数据分析(稀疏约束、分组最小角回归算法等)及合成分析等方法以适应大数据时代大体量、复杂医疗数据资料的特点,为建立个体精准化卒中风险预测模型提供技术保障,形成科学、实用的卒中二级预防决策提供可靠依据。

4 小结

我国人口占世界人口总量的1/5,是世界范围内卒中负担最重的国家。近年来我国社会经济快速发展,我国卒中危险因素流行特征上虽与发达国家有相似之处,但仍具相对独立性。与西方发达国家相比,中国人群的颅内动脉硬化疾病更多,不同程度的颅内动脉硬化及狭窄也会增加卒中的复发率[27]。此外,我国作为一个人口庞大、幅员辽阔的多民族国家,卒中风险因民族、南北地域、城乡、收入水平不同而具有显著差异。研究表明,我国卒中患病率最高与最低省区之间差异可超过8 倍[28]。与发达国家不同,我国的国民收入水平多以中等收入为主,而收入水平很可能是影响卒中复发的一个更重要指标[29]。我国目前应用的预测工具均建立在发达国家开展的长期、大规模研究为基础,并不完全适用于中国人群。在日后的发展中,研究者们应着手运用科学合理的建模技术,融合更高级的循证证据以建立适合国人的卒中复发风险预测工具,同时充分发挥中医药在人体状态中的评估预警作用,进一步完善卒中防控体系,保障卒中风险筛查工作有序高效运行,以便于实行精准、有效的卒中二级预防,从而进一步遏制卒中的流行上升趋势。

猜你喜欢
缺血性工具建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
波比的工具
波比的工具
缺血性二尖瓣反流的研究进展
针灸在缺血性视神经病变应用
基于PSS/E的风电场建模与动态分析
电子制作(2018年17期)2018-09-28 01:56:44
不对称半桥变换器的建模与仿真
“巧用”工具
读者(2017年18期)2017-08-29 21:22:03
缺血性脑卒中恢复期的中蒙医康复治疗
内皮祖细胞在缺血性脑卒中诊治中的研究进展