基于Logistic回归模型构建联合检测因子对非小细胞肺癌EGFR突变状态的预测价值

2021-03-18 08:07张明光徐海军施联善张辉
分子诊断与治疗杂志 2021年2期
关键词:肺癌变量因子

张明光 徐海军★ 施联善 张辉

肺癌的发病率及病死率从20世纪70年代明显增加,已成为我国发病率升幅最大的恶性肿瘤之一[1]。非小细胞肺癌是临床常见的肺癌类型。现有研究证实,表皮生长因子受体酪氨酸激酶抑制剂(Epidermal growth factor receptor tyrosine kinase inhibitors,EGFR-TKI)对非小细胞肺癌EGFR敏感者具有良好疗效[2-3],但因EGFR 基因突变比例较低、组织活检要求高等,使其检测率偏低,限制了EGFR-TKI 的临床应用。目前,血清癌胚抗原(carcinoembryonic antigen,CEA)、细胞角蛋白19 片段(CYFRA21-1)、神经特异性烯醇化酶等在非小细胞肺癌诊断及鉴别诊断中具有良好效能[4-5],但各指标均有自身的优势和局限性,且单一指标较难兼顾灵敏度和特异度。因此,本研究以晚期非小细胞肺癌患者为研究对象,借鉴国外对Logistic 回归模型的延伸,建立联合检测因子模型,并探讨该模型对非小细胞肺癌EGFR 突变状态的预测价值。

1 资料与方法

1.1 研究对象

选取本院2019年3月至2020年9月收治的102例晚期非小细胞肺癌患者作为研究对象,其中男性68例,女性34例;年龄55~78 岁,平均年龄(62.77±3.52)岁;吸烟史65例,饮酒史42例;高血压53例,糖尿病38例,高血脂31例。根据患者EGFR突变状态,将71例野生型患者作为野生型组(n=71),31例EGFR 发生19Del、21L858R 等突变状态的患者作为突变型组(n=31)。本研究通过本院伦理委员会批准,所有患者及其家属均知情同意。

纳入标准:①经本院或本院合作的合肥安为康医学检验公司病理或细胞学诊断为非小细胞肺癌;②具有完整的临床病例资料,并进行EGFR 突变分析;③生存期超过3 个月;④临床分期为ⅢB~Ⅳ期;⑤入组前未接受化疗及抗肿瘤药物治疗;⑥有客观性、可评价的病灶;⑦配合治疗者。排除标准:①无病理或细胞学明确诊断证据;②早期非小细胞肺癌;③Karnofsky 评分<60 分;④入组前接受化疗或服用抗肿瘤药物;⑤肠道肿瘤病史;⑥无客观可评价病灶;⑦严重心脑血管疾病患者;⑧免疫缺陷;⑨治疗过程中病情加重转院者,依从性差者等。

1.2 方法

收集患者年龄、性别、吸烟史、TNM 分期、部位、原发灶毛刺、肺内转移、骨转移、血清CEA、CYFRA21-1、肿瘤最大直径等情况。所有患者均于入院后空腹采血5 mL,离心得血清,采用电化学免疫发光法测定血清CEA 及CYFRA21-1 水平,试剂盒由德国罗氏公司提供。通过PCR 法检测患者组织标本中的EGFR 突变状态,组织标本不足者另取患者血浆标本5 mL 请确认样本血浆量,一般需要3~5 mL 患者血浆进行DNA 提取,采用专用的EGFR 提取试剂提取,提取后加入EGFR 的18-21 外显子突变区域引物及扩增试剂,扩增DNA 靶片段,采用荧光检测方法检测EGFR 基因第18-21 外显子的突变情况,操作由本院合作的合肥安为康医学检验公司病理科技师严格按照说明书进行。

1.3 统计学方法

采用SPSS 21.0 软件系统进行数据处理分析。计量资料用(±s)表示,采用t检验,计数资料采用n(%)表示,采用χ2检验,采用Logistic 回归构建非小细胞肺癌EGFR 突变状态的联合检测因子模型,并绘制该模型的受试者工作特征曲线(Receiver operating characteristic,ROC),计算曲线下面积;P<0.05 为差异有统计学意义。

2 结果

2.1 两组基本资料单因素分析

突变型组女性、无吸烟史、周围型肺癌、有原发灶毛刺、有肺内转移、有骨转移、有胸膜凹陷征、血清CEA≥8.05 μg/L、CYFRA21-1<2.72 μg/L 占比高于野生型组,比较差异有统计学意义(P<0.05)。见表1。

表1 两组基本资料单因素分析[n(%)]Table 1 Univariate analysis of 2 groups of basic data[n(%)]

2.2 多因素Logistic 回归分析及联合检测因子方程的构建

经Logistic 回归分析发现,部位、胸膜凹陷征、CYFRA21-1 是影响非小细胞肺癌患者EGFR 突变状态的独立危险因素。将部位、胸膜凹陷征、CYFRA21-1 分别作为协变量X1、X2、X3,得出联合检测因子模型表达式为:Logit(P)=-4.551+1.322X1+2.162X2+0.891X3。见表2、表3。

2.3 联合检测因子方程ROC 曲线

ROC 曲线得出:联合检测灵敏度(81.25%),特异度(92.86%),曲线下面积最大0.847。见表4、图1。

2.4 个体预测

对联合检测因子模型进行变形可得到个体预测概率方程,即P=1/[1+e-(-4.551+1.322X1+2.162X2+0.891X3)]。随机将1 名患者数据代入,该患者各协变量分别为X1=1、X2=1、X3=0,得到P=0.256,小于联合检测因子模型的最佳临界值0.422,表明该患者在联合检测因子模型准确度为89.22%的条件下,该患者不发生EGFR 突变。

表2 多因素赋值表Table 2 Multi factor assignment table

表3 多因素Logistic 回归分析Table 3 Results of multivariate logistic regression analysis

图1 联合检测因子模型的ROC 曲线图Figure 1 ROC curve of joint detection factor model

3 讨论

肺癌是临床常见的肺部癌症之一,由于发病临床表现轻微且不典型,大多数患者确诊往往处于肺癌晚期,导致肺癌致死率在我国恶性疾病中位居第一[6]。EGFR 属于酪氨酸激酶ErbB 家族受体,大量分布于人类等哺乳动物的上皮细胞、成纤维细胞等表面,其发生基因突变和相关信号转导参与了肺癌的侵袭和转移过程,与患者预后密切相关[7]。研究表明,EGFR 基因突变可优化临床治疗方案,提高EGFR-TKI 治疗效果,但因其检测技术要求高、肺癌组织小样本假阴性高等因素导致其检测率较低[8]。近年来,EGFR 基因突变状况引入了血清学、细胞学等相关的新指标,均具有较高的诊断价值,但单一指标难以兼顾灵敏度和特异度,且得出的结果并不一致。本研究借鉴心血管疾病、危重症疾病等联合检测方法,构建Logistic 回归联合检测因子模型,发挥各指标优势,同时对其贡献度进行统计学量化,更为客观的反映疾病变化情况。

表4 联合检测因子模型的ROC 曲线Table 4 ROC curve of joint detection factor model

本研究中,突变型组的周围型、有胸膜凹陷征的患者占比高于野生型组。提示,EGFR 突变更易发生在周围型肺癌和有胸膜凹陷征的患者之中。目前,关于非小细胞肺癌EGFR 突变状态与患者CT 特征之间的关系尚不明确。临床上,肺腺癌多为周围型,常出现腺泡正、毛刺、分叶等影像学特征,且易发生双肺转移和骨转移,而肺鳞癌多为中央型,常伴有肺不张、阻塞性肺炎等临床表现,但是否肺腺癌患者更易发生EGFR 突变仍需多中心、大样本进一步研究[9-10]。本研究结果提示,血清CYFRA21-1 表达水平较低的非小细胞肺癌患者的EGFR 更易发生突变。相关研究表明,血清CYFRA21-1 高表达与非小细胞肺癌患者实施EGFRTKI 治疗后无疾病进展生存期密切相关[11]。另有研究表明,肺鳞癌患者CYFRA21-1 表达水平高于肺腺癌,且其EGFR 突变阳性实施EGFR-TKI 治疗效果低于肺腺癌EGFR 突变阳性患者[12]。

本研究针对Logistic 回归分析得出的独立危险因素,量化各因素的贡献度,最终得出联合检测灵敏度和特异度均高于各协变量单一检测结果。表明,构建的联合检测因子模型能较好的预测非小细胞肺癌患者EGFR 突变状态。采用Logistic 回归构建联合检测因子模型具有以下优势:①Logistic 回归模型对各协变量的混杂因素进行校正,量化各协变量的贡献度,提高该模型的预测效能。②本研究中的变量多为二分类变量,而二分类变量形成ROC 曲线多为一条折线,工作效能较差,采用Logistic 进行校正,拟合多个联合检测因子,可提高ROC 曲线的光滑度[13]。③模型Logit(P)可通过变形公式得到个体预测概率方程,对于具体的病例,可根据患者各协变量情况,带入个体预测概率方程得出概率P,与联合检测因子模型的最佳临界值进行对比,进而判断非小细胞肺癌患者发生EGFR 突变的可能性[14]。这种判断方法基于量化的历史临床数据,更符合循证医学思维,可弥补临床医师在诊断和评估非小细胞肺癌患者EGFR 突变状态方法的不足。

综上所述,基于Logistic 回归模型构建联合检测因子能较好的预测非小细胞肺癌患者EGFR 突变状态。

猜你喜欢
肺癌变量因子
氩氦刀冷冻治疗肺癌80例的临床观察
长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达
抓住不变量解题
近亲得肺癌自己早预防
山药被称“长寿因子”
直径不超过2的无爪图的2—因子
巧解难题二则
北京新发恶性肿瘤 肺癌约占两成
扮靓爱车拒绝潜伏危险因子
分离变量法:常见的通性通法