基于BP神经网络的食管鳞癌预后预测模型

2021-04-01 02:24刘怡文周福有杨海军孔金玉高社干
食管疾病 2021年1期
关键词:神经元神经网络误差

刘怡文,杨 洪,张 灏,周福有,杨海军,孔金玉,孙 蔚,原 翔,高社干

食管癌的发病率及死亡率极高,全世界每年新发的食管癌患者数量约50万例[1],一半以上发生在我国。鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)是食管癌中最常见的组织学类型,约占食管癌总数的95%以上。ESCC预后较差,虽然传统的手术、放化疗以及靶向治疗、免疫治疗等手段在ESCC综合治疗中不断更新应用,但中晚期患者5 a生存率仍低于20%[2]。半个世纪以来,众多从事ESCC防治的工作者锐意创新,在ESCC的流行病学、早期诊断、综合治疗及预防等方面取得了举世瞩目的成绩[3-5],但是ESCC的防治工作异常艰难,总体还未达到令人满意的程度。本研究针对ESCC患者的临床信息,采用BP(Back-Propagation)神经网络建立了患者的预后预测模型,为ESCC的临床治疗提供一种辅助手段。现报道如下。

1 资料与方法

1.1 一般资料

选择2011年1月至2014年12月安阳市肿瘤医院1 091例ESCC患者的临床病理资料及预后随访信息为研究对象。纳入标准:①术后病理诊断明确为ESCC;②患者术前均未接受放射治疗、化学治疗和免疫治疗;③治疗性ESCC切除术后;④病例资料信息全面;⑤术后随访时间为60个月(5 a),生存时间为入院时间至最后一次随访日期或死亡,删失数据为随访至60个月仍存活的患者,未删失数据为由ESCC导致的死亡患者。排除标准:①术后病理诊断非ESCC;②患者术前接受过放射治疗、化学治疗或免疫治疗;③病例资料不完整。本研究经安阳市肿瘤医院伦理委员会审核批准,并获得患者书面知情同意入组参与研究。

1.2 BP神经网络

BP神经网络也叫反向传播神经网络,是神经网络的一种典型形式,在实际应用中非常广泛,并且能够达到较好的应用效果。BP神经网络的结构特点是从输入信息到输出信息具有前向多层网络,其中输入信息联接的是输入层,输出信息联接的是输出层,中间的网络层叫隐含层。BP神经网络的学习过程中包含输入信息的前向传播以及输出与输入信息之间误差的反向传播两个过程。前向传播时,输入信息通过输入层进入网络,经过隐含层的处理后到达输出层,输出层传递了输出信息。当输出信息与输入信息进行比较时,会发现存在一定的误差,为了消除该误差,使输出信息与输入信息保持一致,则需要转向误差反向传播阶段。误差反向传播时是将误差信息通过隐含层从输出一侧逐层传递到输入一侧,在这一过程中不断修改隐含层各个单元的权值属性,从而减小误差。这一学习过程不断在网络中发生,最终达到误差信息在允许阈值之内,输出信息与输入信息接近,或者学习过程的次数达到设定的上限。

1.2.1 神经元模型

从生物学角度出发,神经元细胞的结构包括树突、突触、细胞体和轴突。树突是一个神经元细胞的输入通道,通过各个树突的分支与其他神经元细胞的相连,能够接收其他神经元细胞传递的电信号,在接收到电信号之后传导给细胞体。细胞体是处理电信号的关键,能够通过其他神经元传递的信号量大小以及突触的抑制或者加强来判断是否激活。当神经细胞判定为激活时则会产生电信号,沿着轴突通道到达突触,从而传递给其他神经元。神经元模型就是为了模拟上述过程,典型的神经元模型见图1。

图1 神经元拓扑结构

对于第i个神经元,x1,x2,…,xj是神经元的输入信息,输入信息一般是系统的状态量,能够描述系统的具体情况,w1,w2,…,wj是各输入信息到神经元控制器通道的权重,权重能够随着系统状态的改变而进行调节。各输入信号到神经元控制器的组合方式有多种,一般神经网络算法中选取线性叠加的方式,即取各输入信号的加权求和,可得Netin神经元净输入:

(1)

θi是神经元控制器能否产生输出信号的阈值,表示只有当神经元的净输入Netin大于θi时,神经元的输出信号才会激活。除了比较Netin与θi,还需要通过激活函数最终产生输出信号。

1.2.2 激活函数

常用的激活函数有:

(1)线性函数

f(x)=k·x+c

(2)

(2)斜坡函数

(3)

(3)阈值函数

(4)

(4)S型函数,即Sigmoid函数

(5)

(6)

(5)双极S型函数

(7)

(8)

S型函数和双极S型函数示意图见图2。

图2 S型函数和双极S型函数示意图

神经网络算法中一般采用S型函数,从图2中可以发现,S型函数的自变量范围是正负无穷大,函数值的范围是0到1。对于S型函数,可以得到输出信号的表达式为:

yi=f(Netin-θi)

(9)

1.2.3 BP神经网络结构

本文采用简单的三层神经网络,如图3所示。其中,最下面的是输入层,中间包含一层的隐藏层,最上面是输出层。输入层的输入信息用x1,x2,...,xd表示,代表输入层有d个神经元,隐含层的信息用b1,b2,...,bq表示,代表隐藏层包含q个神经元,输出层信息用y1,y2,...,yl,代表输出层有l个神经元。从输入层到输出层之间的连接用vih表示,从隐藏层到输出层之间的连接用whj表示。隐藏层神经元阈值用γh表示,输出层神经元阈值用θj表示。

图3 BP神经网络模型

其中,βj中的bh=f(αh-θh)。隐藏层和输出层的激活函数都采用S型函数。

那么这次预测结果的误差可以用最小二乘法表示为:

(10)

(11)

权值修正步骤如下:

首先输出层到隐藏层:

(12)

经过隐藏层的激活函数:

bh=f(αh-θh)

(13)

隐藏层到输出层:

(14)

经过输出层的激活函数:

(15)

误差:

(16)

形体训练课以压腿、踢腿、开肩等基本的身体训练为基础,培养良好的站姿、走姿、坐姿及蹲姿,以提高学生形体外在表现力,长期坚持,有利于学生养成正确的身体姿势,塑造健美的形态,使学生获得服务旅游业的身体素质。人际交往礼仪知识可以让学生了解与客人相处之道,同时,形体训练课创造自由的主客情景,让学生角色扮演,学会与客人交流沟通,培养其主动积极、善解人意的待客意识。理论与实践的结合,能有效地提高学生的服务心理素质。

(17)

(18)

由于Sigmod函数的性质如下:

(19)

f′(x)=f(x)(1-f(x))

(20)

所以可以得到:

f′(βj-θj)=f(βj-θj)(1-f(βj-θj))

(21)

综上所述:

(22)

同理,可得:

(23)

对于Δvih:

Δvih=-ηehxi

(24)

Δγh=ηeh

(25)

其中:

(26)

之后设定一个迭代终止条件,可以是误差小于一定值或者达到设定的迭代次数。通过上述设计流程,可以得到性能较好的BP神经网络模型。

2 结果

2.1 食管鳞癌患者临床病理资料一般特征

共纳入ESCC患者1 091例,详细信息见表1。

表1 ESCC患者临床病理资料一般特征 例(%)

2.2 ESCC患者预后预测模型

将BP神经网络的理论应用到数据分析上,将ESCC患者生存期样本信息进行分析,将ESCC患者的各类指标当作输入变量,生存期作为输出变量。采用神经网络的方法获取生存期的预测模型,为临床治疗提供一定的参考依据。

由于ESCC患者的生存样本信息中各类指标的单位不一样,例如年龄信息,吸烟、饮酒的时间信息,浸润范围信息,临床分期以及各类检查信息等。这样的指标信息范围变化太大,给BP神经网络的训练带来严重的挑战,降低了BP神经网络的训练效率。大范围的指标信息相比于小范围的指标信息会对BP神经网络产生更大的影响,但是指标信息范围的大小不代表对ESCC患者生存期影响的大小,直接采用原始指标信息会导致BP神经网络与实际生存期不符。由于S型激活函数自身的特点,函数值限制在(0,1),即输出层的信息也在(0,1)。因此,在进行BP神经网络训练之前需要对指标信息进行归一化处理。

归一化的算法:

(27)

一般在BP神经网络算法中,将学习的数据集划分为训练集、验证集和测试集。通过训练集来获取性能较好的BP神经网络,然后用验证集对BP神经网络进行结构和复杂程度的检验,最后通过测试集来验证BP神经网络的性能是否满足要求。此次训练过程选取ESCC患者信息完善的样本数1 000例,随机选取出训练集、验证集和测试集。通过训练,获得了预测结果较好的BP神经网络,结果见图4。

图4 生存期预测结果对比(R2=0.96632)

3 讨论

ESCC发病率和死亡率高,早期诊断困难,预后极差。因此,建立合理的预后预测模型,寻找有效的预防措施,尤为重要。

人工智能概念诞生于上世纪50年代,由美国学者在达特茅斯会议上形成[6]。之后,人工智能扩展到了更加广泛的学术领域中[7-8],包括规划和决策、专家系统、多智能体系统、模糊逻辑和粗糙集、机器学习、知识表达、推荐系统、机器人和感知等方面[9-13]。在过去的10 a中,随着数据集的不断丰富、计算机能力的飞速提升,以及云计算、软件功能的拓展,人工智能取得了重大的突破,基于人工智能的应用也越来越广泛,作为人工智能其中一个方向的神经网络也有着重大的进展[14-16]。神经网络是机器学习的一种形式,能够将大量的数据信息作为训练样本,由神经网络使用数据信息自动地推断出其中的规则,以此来形成人工智能模型。

随着基础技术的发展,基于神经网络的人工智能系统的性能和实用价值不断提高,在医学领域的应用不断地丰富[17-21]。从30 a前最初在心脏疾病治疗中应用[22-23],到过去10 a里基于神经网络的医学图像识别技术的飞速发展[24-25],神经网络正在更加精确地辅助医生的治疗。神经网络可以应用于流行疾病的预测,通过收集和分析流行疾病中的大数据,形成人群之间流行疾病的发展趋势模型,有助于卫生系统尽早地预测出流行疾病的感染峰值时间和流行趋势,为卫生系统政策的制订提供更好的帮助[26]。神经网络可以应用于疾病的诊断,中山大学与西安电子科技大学的研究小组合作,开发了一种能诊断先天性白内障的人工智能程序CC-Cruiser,利用深度学习神经网络算法,预测疾病的严重程度,并提出治疗决策建议[27]。

基于ESCC患者结构化病历的数据,采用BP神经网络建立了患者预后的预测模型。通过测试集验证了该BP神经网络具有较高的准确度。未来通过进一步完善,可以辅助ESCC的临床治疗。通过BP神经网络预测模型可以对患者的预后进行评估,可以在临床治疗时进行提前干预,进一步提高患者的生存期。

在研究过程中,遇到的实际问题有3个:①BP神经网络的学习需要较为明确的数据输入,但是ESCC患者的病理信息存在着模糊的情况,例如患者的临床分期或者浸润深度,不同的医生按照自身的经验会有不同的判断,尤其是在病理信息两个相邻阶段之间的判断会存在较大的差异,这样会对模型的结果带来很大的影响。②用于学习的样本数据较少,且病理信息的统计存在结构上的差异,需要花费大量的时间对病理信息进行整理和标准化处理,以满足BP神经网络批量学习的要求。③建立的BP神经网络仅仅是从数据的角度对ESCC患者的预后进行了预测,但是其中的因果性难以很好地解释,这就限制了BP神经网络的在医学领域的应用。

之后的研究可以从上述3个问题出发:①在现有电子病历的基础上,建立一个标准化的数据库,按照标准化的结构录入患者的临床信息;②与临床医生进行深入的沟通交流,在临床医生使用该预测模型后,通过搜集反馈信息来不断修正预测模型;③通过采集与ESCC发生、发展密切相关的肿瘤标志物的信息,加入到预测模型的输入信息中,以此来提高预测模型的临床应用价值。

猜你喜欢
神经元神经网络误差
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
北斗导航种萝卜百米误差仅2厘米
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
AI讲座:神经网络的空间对应
基于神经网络的中小学生情感分析
仿生芯片可再现生物神经元行为
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
这个神经元负责改变我们的习惯