张洋, 赵化荣, 刘攀, 宿伟鹏, 龚忠诚
(新疆医科大学第一附属医院 1.肿瘤中心, 2.颌面肿瘤外科, 新疆 乌鲁木齐 830054)
舌癌是头颈部恶性肿瘤中最常见的一种,发病率逐年上升,手术和放化疗是舌癌的主要治疗手段[1-2]。放疗可降低舌癌患者局部复发风险,但放疗期间容易发生口腔感染,发生率为19.3%~41.0%。口腔感染可造成患者进食疼痛、体重下降、降低生活质量,严重者导致放疗中断,影响疗效,并增加治疗费用,延长住院时间。如何能降低患者口腔感染风险是治疗过程中医护人员关注的问题之一[3-6],大多数研究探讨口腔肿瘤与口腔感染间的危险因素分析,未能构建有效的预测模型[7-9]。本文拟对舌癌患者放疗期间发生口腔感染的危险因素进行分析,应用R 软件整合相关危险因素,建立最佳预测模型,精准识别舌癌患者放疗期间发生口腔感染的高风险人群,有利于医护人员预见性地采取预防措施。
选取2003 年1 月—2022 年12 月在新疆医科大学第一附属医院接受放疗的舌癌患者431 例。纳入标准:①病理明确诊断为舌恶性肿瘤;②舌癌或舌癌术区第一次接受放疗;③临床资料完整,放疗前无口腔感染。排除标准:①合并第2 原发肿瘤,合并严重的脏器功能不全。②放疗前1 个月内服用糖皮质激素、免疫抑制剂及抗菌药物等影响口腔感染的药物。将入组患者随机分为训练组和预测组,训练组用于构建预测模型,预测组用于模型效果评价。其中训练组288 例,女性138 例,男性150 例;年龄≥60 岁147 例,年龄< 60岁141例;Ⅰ、Ⅱ期124例,Ⅲ、Ⅳ期164例;手术111 例,非手术177例。预测组143例,女性72 例,男性71 例;年龄≥ 60 岁64 例,年龄< 60 岁79 例;Ⅰ、Ⅱ期70 例,Ⅲ、Ⅳ期73 例;手术59 例,非手术84 例。
①放疗:取仰卧位,颈肩架固定,使用CT 模拟机扫描定位,根据CT 扫描图像勾画靶区和危及器官。采用瓦里安直线加速器X 射线照射进行适形或调强放射治疗。②根治性放疗剂量:pGTVp(影像所见大体肿瘤)及pGTVn(转移淋巴结)总剂量66 Gy/2.0 Gy/33 f,PTV1(高危临床靶区)总剂量60.06 Gy/1.82 Gy/33 f,PTV2(低危临床靶区)总剂量54.12 Gy/1.64 Gy/33 f,1 次/d,放疗5 次/周。③术后辅助放疗剂量:PTV1(高危临床靶区)总剂量60 Gy/2.0 Gy/30,PTV2(低危临床靶区)总剂量54 Gy/1.8 Gy/30 f,1 次/d,放疗5 次/周。
当患者放疗期间出现口腔炎症时,取口腔分泌物,完善细菌或真菌涂片,行细菌培养、真菌培养及药敏实验,根据病原学检测结果和临床医师的经验判断患者是否发生口腔感染。根据RTOG 急性放射性损伤分级标准,将放射性口腔黏膜炎分为5 级:0 级,黏膜无变化;1 级,黏膜充血,可有轻度疼痛;2 级,出现片状黏膜炎或者伪膜形成,中度疼痛需止痛治疗;3 级,出现融合的黏膜炎或者伪膜形成,轻度诱发出血;4 级,出现溃疡,出血,坏死,或者危及生命。入组患者放射性口腔黏膜炎发生程度为2~4 级。
根据放疗期间口腔感染与否,将舌癌患者分为口腔感染组与未感染组。对入组患者的指标进行统计学分析,包括:基本信息资料(性别构成、年龄、教育水平、体质量指数、吸烟、饮酒、口腔环境);临床相关资料(肿瘤分期、同步化疗、是否手术,高血压、糖尿病、Kamofsky 评分);实验室相关指标(白细胞计数、中性粒细胞计数、血红蛋白、红细胞计数、血清白蛋白)。
数据分析采用SPSS 和R-Studio 软件(4.2.2 版)。计数资料以构成比或率(%)表示,比较用χ2检验;多因素Logistic 回归分析筛选独立危险因素,并构建Logistic 预测模型;用XGBoost 中“xgb.importance”对预测模型变量进行重要性排序,并构建XGBoost(eXtreme Gradient Boosting)模型;绘制受试者工作特征(receiver operating characteristic, ROC)曲线。P<0.05 为差异有统计学意义。
训练组288 例舌癌患者放疗期间发生口腔感染42 例,发生率为14.58%(42/288),未出现感染246 例。两组性别构成、教育水平、体质量指数、高血压患病率、糖尿病患病率、吸烟率、饮酒率、Kamofsky 评分、白细胞计数比较,经χ2检验,差异均无统计学意义(P>0.05);两组年龄、肿瘤分期、口腔环境、是否手术、同步化疗,中性粒细胞计数,血红蛋白,红细胞计数,血清白蛋白比较,差异均有统计学意义(P<0.05)。见表1。
表1 舌癌患者放疗期间感染组与非感染组不同因素间口腔感染率的比较
将表1 中单因素分析差异有统计学意义(P<0.05)的9 个变量纳入多因素Logistic 回归分析中,结果显示:年龄[=3.250(95% CI:1.476,7.634)]、肿瘤分期[=2.941(95% CI:1.248,7.613)]、口腔环境[=0.210(95% CI:0.079,0.502)]、是否手术[=0.285(95% CI:0.113,0.663)]、血红蛋白[=0.323(95% CI:0.139,0.712)]、血清白蛋白[=0.353,(95% CI:0.148,0.851)]是舌癌患者放疗期间口腔感染的危险因素(见表2)。采用条件Logistic 逐步回归,纳入标准0.05,排除标准0.10。基于多因素Logistic 回归分析差异有统计学意义的6 项独立预测因素建立舌癌患者放疗期间口腔感染的预测模型。Z=-2.566+1.179×(年龄)+1.079×(肿瘤分期)+1.560×(口腔环境)-1.254×(手术)-1.129×(血红蛋白)-1.041×(血清白蛋白),并绘制舌癌患者放疗期间发生口腔感染的列线图(见图1)。风险列线图上方附有比例尺,每个因素对应比例尺得到各自得分,所有预测因素单项评分之和为总分,总分为463分,每位患者各个因素相加总分越高,提示放疗期间发生口腔感染风险的概率越大。
图1 舌癌患者放疗期间发生口腔感染的风险预测列线图
表2 舌癌患者放疗期间口腔感染预测因素的多因素Logistic回归分析参数
将训练集纳入XGBoost 反复训练得到最佳参数(max_depth = 6,eta = 0.3,nthread = -1,objective =binary:Logistic,nrounds = 10),建立模型。用XGBoost算法,最大约登指数= 0.522 时,模型敏感性为82.35%(95% CI:0.642,0.100),特异性为69.84%(95% CI:0.627,0.786),ROC 曲线下面积(area under the curve, AUC)为0.835(95%CI:0.741,0.929)。见图2。纳入XGBoost 模型的所有指标中,按重要程度排列,依次排在前9 位的指标如下图(见图2)。
图2 XGBoost模型中各变量重要性特征排列
采用测试集数据比较2 个模型对舌癌患者放疗期间发生口腔感染风险的预测效果。训练组和预测组数据集之间各项临床指标比较,差异均无统计学意义(P>0.05)(见表3)。XGBoost 预测模型的敏感性、阳性预测值、阴性预测值低于多因素Logistic回归模型,而准确性、特异性高于多因素Logistic 回归模型,XGBoost 模型的AUC 为0.835,大于多因素Logistic 回归模型的0.830,通过PROC 包中的roc.test函数比较,差异无统计学意义(Z=0.136,P=0.892)(见表4)。多因素Logistic 回归模型和XGBoost 模型均有较好的预测准确性,且预测效能相当。见图3。
图3 多因素Logistic回归模型和XGBoost模型的ROC曲线
表3 训练组和预测组两组数据集之间各项临床指标比较
表4 2种模型的预测性效能分析
放疗在有效遏制肿瘤的同时伴随多种并发症[10-12],口腔感染是舌癌放疗过程中常见的并发症[13-14]。口腔癌放疗期间合并口腔感染,随着感染时间延长,癌细胞可能对放疗产生耐受,将影响口腔癌患者放疗效果。如何能降低患者治疗期间不良反应,降低口腔感染的发生率,本文拟构建舌癌患者放疗期间口腔感染的预测模型,评估舌癌患者口腔感染风险,筛选出放疗期间口腔感染易感人群,提早加强护理指导,健康宣教,采取预防措施,降低口腔感染风险。本研究对影响舌癌患者放疗期间口腔感染的主要因素分别进行讨论。年龄:多数人对口腔癌患者放疗期间发生口腔感染的危险因素分析显示,年龄>60 岁是独立危险因素[7-8]。本研究结论与之相同。考虑可能与老年患者机体免疫力低,合并基础疾病风险高,加之舌癌的局部侵袭损害,使口腔癌患者放疗期间更容易出现口腔感染。肿瘤分期:祁颖秋[9]等研究显示,头颈部肿瘤患者T 分期越大,患者放疗期间发生口咽细菌感染风险越大。本研究同样显示口腔癌T3、T4患者放疗期间发生口腔感染风险较T1、T2患者高。考虑可能与肿瘤负荷较大有关。一般肿瘤负荷较大的患者,患者靶区范围就会相应扩大,放射线使患者口腔黏膜屏障受损的范围扩大。并且肿瘤负荷较大的患者更容易出现肿瘤坏死,口腔清洁能力变差,利于细菌真菌的滋生繁殖,出现口腔感染。口腔环境:吴春苏等[15]研究提示,鼻咽癌放疗期间,差的口腔环境是影响患者口腔感染的独立危险因素。本研究同样显示口腔环境能力差的口腔癌患者放疗期间更容易出现口腔感染,与大多数研结果相仿。放疗期间口腔黏膜损伤、口腔黏膜屏障受损、口腔环境改变、进食后未及时进行口腔清洁均易诱发口腔感染[16-17]。手术、同步化疗:王如等[8]对影响口腔癌患者放疗期间发生口腔感染的因素进行分析,同步化疗、未行手术为独立危险性因素。本研究在XGBoost 模型中也提示手术、同步化疗是影响舌癌患者放疗期间口腔感染的重要因素。多因素Logistic 回归模型提示手术是预防口腔感染的保护性因素,手术患者发生口腔感染的风险较未手术患者低。未能行手术患者往往处于疾病晚期,肿瘤本身易出现肿瘤坏死感染,口腔生态环境受肿瘤影响破坏明显,易引起患者口腔感染。考虑同步化疗降低患者免疫力,并且化疗药物对患者口腔黏膜屏障有损害作用,患者口腔黏膜抵抗能力下降,易出现感染。血清白蛋白:多数研究显示[7-8,18],血清白蛋白≤40 g/L 的口腔癌患者放疗期间易出现口腔感染,本研究结果同样显示血清白蛋白降低是发生口腔感染的独立危险性因素。舌癌影响患者进食,加之肿瘤患者慢性消耗,营养缺乏,引起患者血清白蛋白下降,免疫力降低,诱发口腔感染[19]。本研究还显示血红蛋白为舌癌患者放疗期间发生口腔感染预后的独立保护性因素。有学者[20]认为,组织血流灌注和氧合状态是抗感染免疫的重要组成部分,氧气可增强白细胞的有氧代谢,从而促进其杀灭病原体。血红蛋白的重要功能之一是为组织运输氧气,血红蛋白减少将影响组织供氧,机体的抗感染免疫下降。中性粒细胞计数:出现口腔感染的患者多伴有中性粒细胞计数下降[8,18]。本研究在XGBoost 模型中也提示中性粒细胞计数降低患者在放疗期间易出现口腔感染。中性粒细胞作为宿主抵抗入侵病原体的第一道防线,在激活后清除外来病原体,当中心粒细胞缺乏后,机体防御能力下降,出现口腔感染。
多因素Logistic 回归模型和XGBoost 模型比较分析:多因素Logistic 模型是一种回归模型,适用于分类问题,可估计某个事件发生的可能性,也可分析某个问题的影响因素。依据多因素Logistic 回归模型结果,通过nomogram 绘制列线图,可更加直观地观察个体化预测结果[21-22]。XGBoost 能实现准确的分类效果是通过弱分类器的迭代计算实现的。主要是降低偏差,也就是降低模型的误差。因此它是采用多个基学习器,每个基学习器都比较简单,避免过拟合,近年来广泛应用于医学领域[23]。在预测组数据中两种模型的ROC 曲线的AUC 均>0.7,都表现出较好的预测准确性。进一步分析,XGBoost 模型的AUC略高于多因素Logistic 回归模型,两者比较无差异,表明多因素Logistic 回归模型和XGBoost 模型预测效能相当,但XGBoost 模型预测值略高于多因素Logistic 回归模型。多因素Logistic 回归模型与XGBoost 模型的阳性预测值、准确性相近,说明2 个模型正确分类的能力相当。XGBoost 模型的准确性和特异性均高于多因素Logistic 模型,表明XGBoost模型实际预测能力较好,能很好地识别放疗期间发生口腔感染的舌癌患者。多因素Logistic 模型的敏感性和阴性预测值均明显优于XGBoost 模型。总体来说,XGBoost 模型和多因素Logistic 模型均可预测舌癌患者放疗期间口腔感染的发生,2 个模型可取长补短。
XGBoost 模型变量重要性评分结果显示,口腔环境、手术、肿瘤分期、白蛋白、年龄、同步化疗、红细胞计数、血红蛋白、中性粒细胞计数为重要指标。多因素Logistic 回归模型中独立危险因素为年龄、肿瘤分期、口腔环境、手术、血清白蛋白,血红蛋白。以上指标对舌癌患者放疗期间发生口腔感染影响较大,尤其是口腔环境、手术、肿瘤分期、血清白蛋白等交叉指标。本研究可对存在以上因素的舌癌放疗患者发生口腔感染风险预警,对高危患者及早采取预防措施,降低口腔感染发生率,提高患者生活质量。
XGBoost 模型与多因素Logistic 回归模型对舌癌患者放疗期间发生口腔感染的预测均有意义,两者预测能力相当。2 个模型纳入的预测因素均为临床常见指标,有利于在临床工作中开展筛查,积极做好预防口腔感染的工作,降低患者口腔感染的发生率。本研究的不足之处在于为单中心研究,数据量有限,今后尚需进行多中心,大样本的研究分析,以提高模型的预测精准性。