王 莹 李莉芳 何航帜 杨青青 张垚烨 张岩波,3,4△ 赵 卉△
【提 要】 目的 应用随机森林模型探讨慢阻肺患者报告结局(COPD-PRO)中各维度与modified Medical Research Council(mMRC)呼吸困难评分一致性评价的效果,以评估COPD-PRO对患者症状判断的准确性。方法 于山西13所医院收集300例慢阻肺患者,以mMRC评分生成的二分类变量为结局变量,COPD-PRO13个维度为预测变量,并纳入人口学特征变量,构建随机森林模型,并与决策树模型进行比较。结果 IND(独立性)、ANX(焦虑)、COG(疾病认知)、DEP(抑郁)等维度对于慢阻肺患者报告结局量表的症状评估的贡献较大。两种模型性能比较结果显示,随机森林的特异度、精准度和AUC和F1值都高于决策树模型。结论 随机森林模型在慢阻肺患者报告结局的症状评估中具有较好的预测效果,并识别影响患者症状的相关因素,为临床治疗与管理提供理论依据。
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一种因气道和/或肺泡异常引起的,常见的、可预防和可治疗的疾病[1]。2017年全球疾病负担研究报告显示,估计2017年全球COPD的时点患病率为3.92%[95%CI(3.52%,4.32%)],COPD导致的病死率估计为42/10万(占所有原因死亡的4.72%),估计伤残调整寿命年(DALYs)率为1068.02/10万[2]。COPD最常见的呼吸症状包括呼吸困难、咳嗽和/或咳痰,患者对这些症状的报告可能不足[1]。
2011年,GOLD指南在对于COPD患者评估分组提出的新方法中[3],增加了患者急性加重的风险和相关临床表现,关于患者临床症状的评估,采用的是modified Medical Research Council(mMRC)呼吸困难等级评分和COPD评估测试(CAT)[4]。在疾病管理的背景下,急性加重是COPD的重要临床事件,在很大程度上导致患者生活质量下降[5],而慢病管理的核心就是提高患者的生命质量。患者报告结局是直接来自患者对自身健康状况和治疗感受的报告。研究表明,关注患者报告结局有助于全面了解患者的情况,并且相关内容已被纳入2020年COPD全球倡议(global initiative for chronic obstructive lung disease,GOLD)中[6]。但此量表无法直观反映出COPD患者的症状严重程度。
因此本研究利用慢阻肺患者报告结局(COPD-PRO)评分结果,采用随机森林模型实现对COPD患者症状严重程度的预测,并与决策树模型的预测性能进行比较,探索出影响患者症状的相关因素,并为患者改善症状提供理论依据,并为患者提供针对性的治疗、干预与管理措施提供科学指导。
本研究分别在山西省山西医科大学附属第一医院、山西医科大学附属第二医院、山西省人民医院、山西中医药大学附属医院等13所医院进行现场调查。每家医院内均有呼吸科医生或护士担任负责人,对其进行简要培训之后,负责患者调查。本研究要求参与者能够独立完成量表填写(老年者询问家属,负责人代理填写)。
纳入标准:(1)确诊为慢性阻塞性肺病的患者;(2)年龄>18岁;(3)同意接受调查者。排除标准:(1)并发精神疾病的患者;(2)由于智力障碍或其他原因导致不能完成问卷者。总计发放340份问卷,最后回收316份,回收率为93.24%,其中有效问卷为300份,有效率为94.94%。
(1)问卷内容
调查问卷由3部分组成,分别为COPD患者人口学特征、COPD-PRO[7]和mMRC量表。
COPD-PRO由四个领域组成,共13个维度57个条目。研究表明,该量表具有较优的信效度[8],量表采用likert式五级记分法。各维度信度系数具体见表1。mMRC是一种呼吸困难量表,较易使用。有研究表明,与客观功能参数相比,呼吸困难与慢阻肺患者生活质量的相关性更好[9-10]。根据呼吸困难程度分为5个等级(0~4级)。0级:剧烈活动时出现呼吸困难;1级:在平地快走或爬缓坡时出现气短或呼吸困难;2级:由于气短或呼吸困难,在平地行走的速度要比同龄人慢或中途需要停下休息;3级:在平地上步行100米左右或数分钟后就需要停下休息;4级:因严重呼吸困难而不能出门或自己穿脱衣服。0~1视为症状少,≥2视为症状多,并将此作为本研究的因变量,自变量包括年龄、性别、收入、吸烟、饮酒、家族史、环境影响(粉尘、油烟)、并发症、医保情况等基本情况和COPD-PRO中的13个维度。
表1 慢阻肺患者报告结局量表及各维度信度系数
(2)统计方法
本研究采用SPSS 22.0对基本情况进行描述性分析,采用R语言“rpart”包构建决策树模型,通过调节maxdepth、minsplit、minbucket、最小代价复杂度参数CP值等参数对决策树进行剪枝;用“randomForest”包构建随机森林模型,通过选择合适的颗数参数(ntree)和随机选择特征数目参数(mtry)构建最优模型。将mMRC评分症状少记为“1”,症状多记为“2”。采用随机抽样的方法,从中抽取70%的数据作为训练集,剩余数据用于测试集,利用特异度、灵敏度、精准度、AUC值来评价两种模型的预测效果。
① 决策树模型
决策树模型是由根节点、分支节点和叶节点构成的树状样结构,反映特征与标签之间的映射关系[11]。与随机森林的“黑箱式”模式相比,决策树模型的原理更加简单易懂[12],它的核心就是通过对数据的学习,选定判断节点,构造一棵合适的树,还可以利用建好的决策树对分类样本集进行分类[13]。这一特点使决策树更加适用于复杂的临床研究环境。
② 随机森林模型
2001年Breiman提出了一种统计模型—随机森林模型[14],它是以CART决策树为基础的Bagging集成算法[15]。随机森林同时训练多个决策树,综合考虑多个结果,同时引入随机特征值的选择与树的完全分裂,使模型更加多样化[16],这也是优于决策树算法的一个特点。它的优势是不易产生过拟合现象,抗噪能力好。
本研究共纳入300例COPD患者,平均年龄为(70.82±10.99)岁,最小年龄为32岁,最大年龄为91岁。mMRC评分为症状少的有113人,症状多的人有187人。其余变量的基本信息及变量赋值见表2。
表2 300例慢阻肺患者人口学特征资料的统计描述及变量赋值
对决策树进行前剪枝发现,限制树生长的最大深度、最小分支节点数及叶节点的最小样本数对决策树准确度的影响并不大。因此,通过选择合适的CP值对决策树进行后剪枝,来确定最终模型。通常是通过模型的预测误差及其标准误来选择合适的CP值[12]。不同CP值对应的误差结果见表3。当分裂次数为2时,决策树模型的验证误差最小,对应的CP值为0.0203;当分裂次数为6时,训练集对应误差最小。因此利用两个CP值分别建立对应的决策树,并在测试集上比较模型的预测性能,发现当CP值为0.01时,决策树的特异度和灵敏度之和最大,精准度最高。决策树可视化如图1,图中数字表示正确分类的数量和节点中的观测值数量,如141/210表示为,节点中观测值数量为210(训练集样本量),正确分类的数量为140。由图可见,最终纳入模型的变量为人口学特征中的饮酒和焦虑、抑郁、满意度等维度。
图1 决策树可视化
表3 不同分裂次数对应的CP值
(1)颗数参数的选择
本研究将ntree分别设置为100、200、300和400,通过比较各个模型的特异度、灵敏度、精准度和AUC值来确定最优颗数。具体结果见表4。由表4中的结果可以看出,当ntree=100时,模型的特异度、精准度和AUC值处于最优水平,因此本研究采用ntree=100的随机森林模型作为最终模型。
表4 不同颗数的随机森林模型性能比较
(2)随机选择特征数目参数的选择
本研究纳入的自变量共有22个,根据随机特征计算公式[log2(p)+1](P为特征变量数)得出本研究的参数应设置为5。将mtry分别设置为3、4、5、6,比较不同特征选择数的模型性能,具体结果如表5所示。当mtry=6时,随机森林模型的特异度、灵敏度和精准度都处于最优水平,因此本研究将mtry设置为6建立最终模型。
表5 不同特征选择数的随机森林模型性能比较
(3)各变量重要性评分
在建立随机森林模型时,随机森林方法计算出了模型中各个变量的重要性评分,具体结果如图2所示。除人口学特征中的饮酒等因素对患者症状有较大影响外,焦虑、独立性、疾病认知、抑郁等维度对随机森林模型准确度和Gini系数的影响较大,说明这些指标对慢阻肺症状等级分类具有较大的贡献。
注:左图横轴表示变量替换后模型准确率的下降,右图横轴表示变量替换后Gini系数的下降,纵轴表示模型中的各个变量。坐标轴从上往下排列的各个变量评分逐渐减小,数值越大表示变量越重要,对模型的影响越大。
将最终的决策树模型和随机森林模型在测试集上进行测试,各个评价指标结果如表6所示。从表中结果可以看出,随机森林模型的特异度、精准度、AUC值和F1值都高于决策树模型。因此,综合来看,随机森林模型在患者报告结局评分对于症状严重程度的预测有较好的表现。
表6 随机森林和决策树模型在测试集中的模型性能比较
本研究在构建决策树和随机森林模型时发现,饮酒对于慢阻肺患者症状影响较大。Ryan Ng等人[17]的研究发现,与轻度饮酒者相比,不饮酒者与六种慢性疾病[充血性心力衰竭(CHF)、COPD、糖尿病、肺癌、心肌梗塞(MI)和中风]任何一种的风险增加都有关。在三个欧洲国家进行的一项为期20年的研究发现,在患有COPD的中年男性中,与轻度至中度饮酒者相比,重度饮酒者的死亡风险增加了一倍以上[18]。在我国,饮酒与COPD的相关性研究较少,未来本研究会将饮酒划分为更详细的标准再次评估。除人口学特征变量外,患者报告结局中包含的部分维度如焦虑、独立性、疾病认知、抑郁等对患者症状严重程度的预测也有较大的影响。
本研究发现,独立性对慢阻肺患者症状的多与少会有较大影响。独立性所对应的问题是(1)您在弯腰、屈膝或下蹲时会出现呼吸困难吗?(2)您在外出活动时,需要经常停下来休息吗?(3)您能打扫卫生、提重物爬楼梯或走有坡度的路吗?(4)早晨穿衣梳洗会花费您很长时间吗?可见独立性与患者日常活动有较大关系。Warz H等人[19]研究发现,与同龄患者相比,COPD患者通常表现为运动减少和久坐的生活方式,这与多种不利的健康结果有关。运动减少是日常生活的一个重要特征。它可以在日常生活中直接和不显眼地测量,是一个相关的以患者为中心的结果[20]。有研究指出,改变COPD患者的身体活动行为需要一种跨学科的方法,将呼吸医学、康复医学、社会科学和行为科学结合起来[21]。因此,临床工作人员应对患者及其家属做好相关健康教育,让患者和家属都能知晓独立性活动的重要性,让患者出院后也能保持有效的活动,从而提升患者的生命质量。
本研究发现,焦虑和抑郁会影响COPD患者症状的严重程度。精神健康相关疾病是全球老年人残疾增多和生活质量降低的主要原因[22]。而COPD患者常见的精神疾病有心境障碍、轻度抑郁和焦虑障碍[23-24]。有证据表明,与常规护理相比,综合肺康复(肺康复、运动加教育)能降低患者短期内的焦虑和抑郁症状水平[25];以及包括认知行为治疗和咨询在内的心理治疗可以改善COPD患者的焦虑和抑郁症状[22-23]。因此,临床工作者在对患者进行临床治疗的同时,也应关注患者的心理健康,帮助患者保持健康的心态,树立战胜疾病的信心。
本研究发现,患者对疾病的认知以及治疗效果、医院服务满意度均会影响到患者症状的数量。这与J W Dodd和Marco Contoli等人[26-27]的研究结果相似。大多数研究表明,COPD患者在整体感知、记忆和运动功能等领域都有明显的认知障碍[28-30]。有研究指出,几乎一半的COPD患者不坚持服药[31]。患者对其药物的满意度会影响与治疗相关的因素,例如他们继续使用药物的可能性、正确使用药物以及对药物治疗方案的依从性[32-33]。因此,医院应建立完善、合理的健康教育体系,加强对COPD患者的健康教育;并提高服务质量,加强医患沟通,建立友好的医患关系,有助于提高患者的疾病认知水平。
PRO对于评估症状、症状对日常生活活动的影响和治疗反应至关重要[34]。但对于测量患者报告结局症状的研究,有研究将圣乔治呼吸问卷(St. George′s Respiratory Questionnaire)纳入分析[35],对于mMRC等级的研究较少,且大多使用多元线性回归,但该方法在处理变量共线性、变量间潜在的交互作用等方面具有一定的局限性[36]。因此本研究采用决策树和随机森林模型,利用COPD-PRO各维度作为自变量进行患者症状多少的预测,评价其预测结果与mMRC呼吸困难评分的一致性,以评估COPD-PRO对患者症状判断的准确性,并探索影响患者症状多少的相关因素,为临床治疗与管理提供理论依据。
本研究还存在一些局限。在修订的GOLD 2011指南中指出,在对COPD患者进行分类时,不仅要考虑患者的功能严重程度,还要考虑患者症状和病情恶化的风险[37],但本研究只考虑到了患者症状的严重程度。另外,本研究的总样本量不够大,所得到的健康状态相对较少。因此,本研究在未来将从以下几个方面进行完善:(1)将电子病历中的功能指标纳入研究,改善模型的预测性能;(2)采用深度机器学习算法,提高模型的灵敏度,提升模型评估效果;(3)对患者追加随访,将数据实时更新,将模型应用于纵向数据。