李文琦,黄水平,李海朋
徐州医学院公共卫生学院流行病与卫生统计学教研室 徐州 221002
BP神经网络和Cox比例风险模型在生存分析应用中的比较*
李文琦,黄水平#,李海朋
徐州医学院公共卫生学院流行病与卫生统计学教研室 徐州 221002
#通讯作者,女,1963年10月生,硕士,教授,研究方向:统计方法在流行病学研究中的应用,E-mail:hsp@xzmc.edu.cn
BP神经网络;Monte Carlo 模拟;生存分析;预测模型;Cox比例风险模型
目的:比较BP神经网络模型和Cox比例风险模型在生存分析中的预测性能,进一步探讨BP神经网络模型在生存分析中的应用。方法采用Monte Carlo模拟数据集,如不同样本量、不同删失比例、不同协变量间关系及是否满足等比例风险假定的理论研究和胃癌根治术患者预后预测的实例分析,分别建立BP神经网络模型和Cox比例风险模型,最终使用一致性指数C对其预测性能进行比较。结果当样本量为100、删失比例为60%、80%及样本量为300、删失比例为80%时,BP神经网络模型的预测性能高于Cox比例风险模型(P<0.05)。协变量不满足等比例风险假定、协变量间存在三维交互作用和非线性关系时,BP神经网络模型的预测性能较Cox比例风险模型好(P<0.05)。实例研究中发现,BP神经网络模型预测的一致性指数C(0.835)高于Cox比例风险模型(t配对=4.311,P<0.001)。结论BP神经网络模型在生存分析的应用中对样本删失比例、是否满足PH假定、协变量间复杂交互作用和非线性关系具有非特异性,对资料限制较少,且预测一致性高,值得在生存分析中进一步推广应用。
目前生存分析最常用的即Cox比例风险模型,但该模型要求资料事先满足2个假定[1]:①比例风险假定(proportional hazard, PH假定)。②对数线性假定。然而当实际资料不能满足或只能近似满足这一假定时,往往会造成模型拟合效果不佳或者根本没有意义,最终还会误导人们对分析结果的判断,而人工神经网络模型恰恰弥补了这方面的不足。近年来,人工神经网络作为一种新兴的信息处理系统,具有自组织、自适应、自学习的能力及高度的非线性和良好的容错性等特点,被广泛地应用于多个领域,特别在流行病学领域也逐渐受到重视[2]。但国内人工神经网络模型的应用尚不成熟,特别是在生存分析领域的应用还比较分散,多用于解决某个具体问题。目前尚缺乏对人工神经网络模型与传统的生存分析方法比较的系统研究,故作者采用Monte Carlo模拟的理论研究和实际资料的应用研究相结合的方法,比较BP神经网络模型和Cox比例风险模型在生存分析中的预测性能,以探讨人工神经网络模型在生存分析领域中的应用,为生存分析领域提供一种不考虑模型具体函数形式的非线性预测手段,以达到较好地解决实际问题的目的。
1.1模拟实验设计模拟数据包括:不同样本量、不同删失比例和不同协变量间的关系及协变量是否满足等比例风险假定等条件。
根据上式可模拟不同分布的生存时间,最终可实现生存数据的产生。
模拟非比例风险假定的数据则采用对数正态回归模型产生生存时间,T=exp(1+βx+ε)。
1.1.2 模拟删失数据 该研究模拟产生右删失数据,删失分布的类型为均匀分布U(0,C)。模拟时首先产生n(n为样本量)个生存时间Ti,根据删失分布U(0,C)及删失比例,通过迭代模拟,计算出C值,再通过SAS的随机数产生程序,产生n个删失时间Li。最后根据右删失的定义,ti=min(Ti,Li),得到n个观测时间。若Ti≤Li,δi=1,否则,即产生含删失的生存数据(ti,δi)[3]。
1.1.3 模拟协变量 用SAS随机数发生器RANNOR(seed)函数产生服从N(0,1)标准正态分布随机变量,用RANBIN(seed,n,p)函数产生服从B(n,p)的伯努利分布随机变量。
1.2模拟评价指标由于该研究2种方法的预测变量不同,且存在删失数据,故采用一致性指数C作为预测准确性评价的指标。一致性指数C是指预测结果和实际结果一致的观察单位对子数占总有用对子数的比例。有用对子数是指可区分危险度大小的2个个体,若两者都达到观察终点,或一个达到终点,而另一个为删失个体,并删失个体的观察时间大于非删失个体的观察时间,以上2种可度量危险度大小关系的情况被认为是有用的观察对子。并用SAS对2种方法的一致性指数C进行配对t检验,检验水准α=0.05。
1.3实例资料
1.3.1 研究对象 选取2004年1月1日至2009年12月30日于徐州医学院附属医院行胃癌根治性切除术且经病理学确诊并有详细联系方式的胃癌患者156例。
1.3.2 随访调查 自2009年12月至2010年5月,采用电话访问及信访的方式追踪研究对象。以患者手术之日为研究起点,因胃癌死亡为研究终点,随访截止时间为2010年5月14日。
1.3.3 调查内容 临床资料包括:研究对象的肿瘤部位、大小、浸润深度、分化程度、组织学分型、是否伴有淋巴结转移、pTNM分期等。生活资料包括:研究对象的饮食、生活行为方式及心理因素等。主要有每天蔬菜水果和肉蛋类的摄入量、是否服用营养补充剂和中草药、体育锻炼频度、睡眠状况、吸烟饮酒习惯等生活行为方式,患者性格、恢复的信心及烦躁、焦虑、恐慌等心理状况和其社会支持等。
2.1不同样本量和删失比例下模型的预测性能比较模拟符合如下条件的生存数据:生存时间服从λ=1的指数分布,协变量x1服从N(0,1)的正态分布、x2服从B(1,0.8)的伯努利分布,样本量为100和300、删失比例分别为20%、40%、60%和80%的数据集。
Cox比例风险模型:设x1、x2回归系数分别为β1=1、β2=1.5,并计算线性预测之和xβ′进行预测;BP神经网络模型:由2个协变量作为BP神经网络模型输入神经元(即n=2),以CSR作为BP神经网络输出神经元(即l=1),选择LM优化算法和适当的隐含层结点数,其余参数均为Matlab软件默认值,最终使网络达到收敛。每种模拟样本重复模拟100次,得一致性指数C的均数和标准差,见表1。
表1 不同样本量和删失比例下两模型一致性指数C的比较
2.2等比例、非等比例风险及不同协变量关系下模型的预测性能比较模拟符合如下条件的生存数据:样本量固定为300,删失比例为40%。生存时间服从l=1的指数分布(满足PH假定)和对数正态分布(不满足PH假定)。分别设计以下几种不同协变量间关系的数据集:
①满足PH假定,协变量间独立:协变量x1服从N(0,1)的正态分布、x2服从B(1,0.8)的伯努利分布,Cox比例风险模型x1、x2的回归系数分别为β1=1和β2=1.5。
②满足PH假定,协变量间存在二维交互:设x1和x2间存在r12=0.2二维交互作用,其余同①。
③满足PH假定,协变量间存在多维交互:模拟4个协变量,协变量x1和x2分别服从B(1,0.25)和B(1,0.5)的伯努利分布,x3和x4均服从N(0,1)的正态分布,设Cox比例风险模型x1、x2、x3、x4的回归系数分别为b1=b2=2、b3=0.5、b4=1.0,二维交互作用,x1和x2及x3和x4的相关系数分别为r12=r34=1.0,其他三维交互r′=0.5。
④满足PH假定,协变量间存在非线性关系:模拟协变量x1服从N(0,1)的正态分布,对x1进行非线性转换得到x2=sigmoid(x1),设Cox模型x1、x2的回归系数分别为b1=1和b2=1.5。
⑤不满足PH假定,协变量间相互独立:协变量设计同①。
每次模拟重复100次,得一致性指数C的均数和标准差,见表2。
表2 不同PH假定及协变量关系下模型一致性指数C的比较
*:h(t/x)=h0(t)exp(1.0x1+1.5x2);#:h(t/x)=h0(t)exp(1.0x1+1.5x2+0.2x1x2);
2.3实例分析结果随机选取100例胃癌根治术患者作为模型的训练样本,建立Cox比例风险模型,首先进行单变量log-rank时序检验,其次将有统计学意义的因素进一步做多因素Cox回归分析,建立胃癌根治术患者预后预测的Cox比例风险模型,其表达式为:h(t,x)=h0(t)exp(0.814 3x1+1.004x2+0.579x3-0.932x4-0.585x5-1.199x6),式中x1、x2、x3、x4、x5、x6分别代表pTNM分期、分化程度、肿瘤大小、是否接受辅助化疗、睡眠状况和术前吸烟术后不吸烟6个因素。最终将其余56例作为预测样本,代入已建立的模型进行预测性能的评价。
选择3层网络结构,将6个对生存时间有影响的因素作为网络输入神经元,以Cox-snell残差为输出神经元,根据试凑法最终确定隐含层结点数为8,隐含层传输函数为tansig,输出层传输函数为purelin。学习率为0.01,网络训练采用LM优化算法,为防止过度拟合,采用早停止策略。2种模型建模重复20次,得一致性指数C的均值、标准差,见表3。配对t检验结果显示,BP神经网络模型的预测一致性指数C高于Cox比例风险模型(t配对=4.311,P<0.001)。
表3 Cox模型和BP模型的预测一致性指数C
有研究[4]表明Cox模型结果的偏倚程度随删失比例的增大而增大,且增大速度和样本量有关。Cox模型准确性也会随着删失比例的增大而减小,且当删失超过70%时,结果变异加速增大。该研究模拟了样本量为100的小样本和样本量为300的大样本2个数据集。选择小样本数据时,当删失比例超过60%时,Cox模型的一致性指数C减小,与BP神经网络模型预测一致性指数C比较差异均有统计学意义;在大样本情况下,当删失比例超过80%时,Cox模型一致性指数C急剧下降,与BP神经网络模型预测一致性指数C比较差异均有统计学意义,进一步说明BP神经网络模型在同等数据的删失比例下预测一致性指数C高于Cox模型。
理论已证明神经网络对变量间关系信息的提取具有非特异性,该模拟试验中对线性和非线性及多维的复杂交互作用进行的模拟研究也说明了这一点,在变量间存在非线性关系时BP神经网络模型预测的一致性指数C高于Cox模型。在Cox模型中对变量有一严格的限制,要求协变量的效应不随时间而改变,即满足等比例风险假定。在不满足假定的条件下使用Cox模型建模得出的结果将让人产生质疑。故作者对是否满足PH假定条件的协变量进行了模拟,分别用BP神经网络模型和Cox模型建模,发现在不满足PH假定时BP神经网络模型预测的一致性指数C要好于Cox模型。由此可以看出,BP神经网络模型克服了传统统计分析方法对数据的严格限制,可以不考虑数据间关系的具体函数形式,任意连续的S型函数理论上都能得到较好的拟合效果。因此,BP神经网络模型与传统的统计方法相比,它不需要精确的数学模型,没有任何对变量的假定要求,能通过模拟人的智能行为处理一些复杂的、不确定的、非线性的问题,且具有一定的容错性。其处理非线性问题的能力一般高于传统的分析方法,并且可以学习目前无法用数学方法描述的模糊评定。它为处理模糊的、数据不完全的、模拟的、不精确的模式的识别提供了一个全新的途径,在医学领域有进一步推广的价值。
[1]王娟.截尾分位数回归模型及其在生存分析中的应用[D].太原:山西医科大学,2009.
[2]高蔚,施侣元.人工神经网络流行病学应用进展[J].中华预防医学杂志,2000,34(6):373
[3]Cox DR,Oakes D. Analysis of survival data[M]. London:Chapman and Hall,1984:201
[4]钱俊.生存分析中删失数据比例对Cox回归模型影响的研究[D].广州:南方医科大学,2009:95
(2014-01-17收稿 责任编辑姜春霞)
Comparison between BP neural network and Cox proportional hazard model in survival analysis
LIWenqi,HUANGShuiping,LIHaipeng
DepartmentofEpidemiologyandMedicalStatistics,SchoolofPublicHealth,XuzhouMedicalCollege,Xuzhou221002
BP neural network; Monte Carlo simulation; survival analysis; forecast model; Cox proportional hazard model
Aim: To compare their prediction performance of BP neural network model and Cox proportion hazard model in survival analysis and to explore the superiority of BP neural network model in survival analysis. Methods: Monte Carlo was used to generate the data sets under the condition of different sample size, different degree of censoring, number of variable and interactions, non-linear effect, distinct distribution of covariate and proportional vs non-proportional hazard. Then BP neural network model and Cox model were built, and their prediction performance was compared using concord ance index C. Results: In the research on simulation data sets, when the sample size of 100, proportion of censoring of 60%, 80%, and sample size of 300, proportion of censoring of 80%, BP neural network model performed superior to Cox model(P<0.05). And when the covariates don′t meet PH assumption and had three-way interaction, non-linear effect, BP neural network performed superior to Cox model(P<0.05). In the real data, BP neural network model′s concordance index was 0.835, which performed superior to Cox model(tpaired=4.311,P<0.001). Conclusion: For the small sample size, high and the covariates don′t meet PH assumption and has three-way interaction, non-linear effect data sets, BP neural network has better advantage than Cox model. It is worth to popularize further in survival analysis.
10.13705/j.issn.1671-6825.2014.06.015
*江苏省科技厅资助项目 BE2011647
R195.1