赵冠华,刘 涛,吴 丹
(1.天津中医药大学研究生院 301617;2.国家气象中心预报系统开放实验室,北京 100081)
灰色系统理论(grey system theory)的建模法由邓聚龙教授创立,该系统已在社会、经济、农业、事故、生态等许多部门应用,20世纪90年代以来,灰色预测理论在医学中的应用增多,主要是疾病发病率和流行病学等预测的应用[1-7]。
随着人口老龄化的加剧,神经系统疾病已经成为导致人类死亡和残疾的主要原因之一,神经系统疾病有着结构复杂、症状广泛、诊断依赖性强、疾病症状严重、病情难治等特点[8-9]。作者查阅文献发现对我国神经系统疾病的致死情况的预测鲜有研究。为了进一步了解神经系统疾病致死率的现况及对人民生命的威胁程度,本文选取神经系统疾病导致的城市、农村的死亡率及死亡人数占比数据,研究神经系统疾病近10年的发展状况,以及男、女和城、乡不同主体之间的发展差异,同时通过构建灰色残差修正对数据进行拟合,预测未来5年神经系统疾病的粗死亡率走势及占总死亡人数比重,拟对神经系统疾病致死的严峻情况有着更加详细的了解。
本研究数据来源于国家统计局(http://www.stats.gov.cn/tjsj/ndsj/#),查阅2009-2018的中国统计年鉴,获取我国城市神经系统疾病粗死亡率、城市男性神经系统疾病粗死亡率、城市女性神经系统疾病粗死亡率,农村神经系统疾病粗死亡率、农村男性神经系统疾病粗死亡率、农村女性神经系统疾病粗死亡率,城市神经系统疾病死亡人数占总死亡人数的比重、城市男性神经系统疾病死亡人数占总死亡人数的比重、城市女性神经系统疾病死亡人数占总死亡人数的比重,农村神经系统疾病死亡人数占总死亡人数的比重、农村男性神经系统疾病死亡人数占总死亡人数的比重、农村女性神经系统疾病死亡人数占总死亡人数的比重等数据。
1.2.1灰色残差修正预测
本文运用MATLAB软件对上述数据建立灰色预测模型GM(1,1),并参照文献[10-12]利用残差修正对模型的相对误差进行修正。
1.2.1.1灰色预测GM(1,1)模型
X(0)(t)={x(0)(1),x(0)(2),…x(0)(n)}
(1)
对X(0)(t)作一次累加生成,即:
(2)
得一次累加生成数据序列如下:
X(1)(t)={x(1)(1),x(1)(2),…x(1)(n)}
(3)
GM(1,1)模型的白化微分方程为:
(4)
其中a和u参数分别被称为发展中系数和灰色输入,待定常数。
(5)
Yn=(x(0)(2),x(0)(3),…,x(0)(n))T
(6)
运用最小二乘法原理,求出上式中参数a和u,即
(7)
(8)
(9)
1.2.1.2模型精度检验
检验模型精度通常用后验差比值c,小误差频率p等指标,其预测精度等级如表1所示。如果模型精度不高或没有达到预期效果,此时要通过改进模型解决此问题。
表1 预测精度级别
1.2.2灰色残差修正模型
由于神经系统死亡率的各项指标均呈现增长趋势,因此本文选取灰色预测GM(1,1)算法对未来5年的死亡率指标进行预测,同时为了减少误差,消除单个算法拟合性能的局限性,提出了灰色残差修正预测算法。
由于传统的GM(1,1)模型的建立过程可知[13],模型的拟合和预测出的数据精度由参数a和b决定。在传统的建模过程中估计白化微分方程式,是利用最小二乘方法求得参数a和b的。由微分方程的一般解可知,此白化方程的解为指数形式的解。然后再通过累减得到预测的结果。在这个过程中模型很大程度上依赖参数a和b的拟合效果,对于一些误差较大或者异常的点,会对a和b产生重大的影响从而对最终的预测结果产生较大的影响。通过建立灰色残差修正模型,就是对于残差就行拟合,将残差拟合并且准确预测,弥补灰色预测模型本身的缺点从而带来的预测精度低的问题。原始数据和灰色预测模型预测的数据计算公式如下:
x(0)(t)={x(0)(1),x(0)(2),…x(0)(n)}
(10)
(11)
将原始值[公式(10)]和预测值[公式(11)]相减得到残差序列,见公式(12)。先用求得的累加数据通过最小二乘法来进行正弦函数拟合,见公式(13)。通过最小二乘法计算得到参数A,ω,φ的值,然后t计算并对残差进行预测,再将预测的残差加到预测的数据中去即得到修正的预测值,见公式(14)。
(12)
e(t)=A*sin(ω*t+φ)
(13)
(14)
2009-2018年城市和农村神经系统疾病的粗死亡率及死亡人数占总死亡人数的比重,见表2、3。综合2008—2018年的神经系统疾病的死亡率及死亡人数占比,采用线性回归的方法,进行趋势对比分析。一元线性回归算法通过拟合年份与粗死亡率与和死亡占比的回归关系即:y=a+bx,其中x为年份,y为各个指标的值,b为回归系数,a为截距项。通过已有数据x和y经过最小二乘法拟合,便可以得到对应的回归方程a和b的值。进而可以分析近些年的神经系统疾病的发展情况,其中回归系数能够量化时间和神经系统疾病的粗死亡率、死亡占比的相关关系。计算结果见表4。
表2 2009-2018年神经系统疾病粗死亡率(1/10万)
表3 2009—2018年神经系统疾病死亡人数占总死亡人数的比重(%)
表4 各项目线性回归结果
下面以农村神经系统疾病粗死亡率(1/10万)2009-2018年的数据为例,介绍基于灰色残差修正的神经系统疾病粗死亡率预测过程。
首先依据1.2.1.1中介绍的GM(1,1)算法,将农村神经系统疾病粗死亡率(1/10万)2009-2018年的数据代入计算得到a=-0.070 6,b=4.294 5,将拟合的参数代入方程最后得到的预测值,灰色预测结果见表5。对预测结果进行检验其中后验差比值c=0.387,小误差频率p=0.9,预测结果合格。发现残差波动性较大并且波动存在周期性,因此,使用正弦函数对残差进行拟合,并对灰色预测结果进行修正。根据公式(13)对残差进行拟合得到的公式(15)。正弦函数可以很好地拟合残差走势(图1),进而得出最后的残差修正的灰色预测模型,预测结果见图2。灰色预测相对误差及残差修正后的相对误差见表6。按照上述方法,对其他指标进行了拟合,根据表1的检验标准得到表7;发现该模型对于各个指标拟合精度较好,拟合效果可以接受,对各主要项指标后5年(2019—2023年)发展走势进行预测,见表8、9。
表5 灰色预测结果(%)
表6 农村神经系统疾病粗死亡率的灰色残差修正预测误差值与灰色预测误差值对比
表7 各个项目的预测精度
表8 城市和农村神经系统疾病粗死亡率灰色残差修正预测结果(1/10万)
图1 残差拟合图
图2 农村神经系统疾病粗死亡率的预测结果
e(t)=0.553 2*sin(0.994*t+2.792)
(15)
人体内的各器官、系统的功能和各种生理过程都不是孤立进行的,是在神经系统的直接或间接的调节控制下,相互联系、相互影响、密切配合。神经系统的疾病导致一系列感觉运动功能及认知障碍,主要包括神经退行性疾病(如帕金森病、阿尔茨海默病、肌萎缩侧索硬化症等)、脊髓损伤、脑卒中、外周神经损伤等,截止到2015年,成为世界第二大致死原因,因为神经系统疾病是神经系统病变发生后,病变的神经细胞不能有效地进行再生修复,从而导致其高致死率、高致残率。神经系统疾病症状复杂、其确诊对影像学和实验室检查较为依赖,同时很多疾病(如阿尔茨海默病、帕金森病等)并没有特效药,因而导致其粗死亡率及死亡占比逐年升高[8-9]。
根据国家统计局的统计结果显示,城市和农村的神经系统疾病的死亡率位次均从2009年的第11位提高至2018年的第8位。因此,本研究根据2009-2018年神经系统疾病的粗死亡率及死亡占比对未来5年神经系统疾病的粗死亡率和死亡占比进行了预测,对神经系统疾病未来的致死情况有更加详细和深刻的了解。根据表4线性回归的结果,决定系数r2大于0.3即证明该回归拟合效果就可以接受,r2越大拟合效果越好,故除了城市男性粗死亡率其他结果均可以接受,得出的结论是神经系统疾病粗死亡率和死亡占比一直在升高。本文以农村神经系统疾病粗死亡率为例,用灰色预测和残差修正预测分别对其进行建模和计算,通过表6可以看出,残差修正的预测结果明显优于灰色预测的结果。表7显示残差修正预测对各个项目的预测精度均符合要求。表8、表9的灰色残差修正预测结果显示:城市神经系统疾病的粗死亡率5年后会提高将近0.5/10万,农村将近提高2/10万,城市和农村的神经系统疾病死亡占比会逐渐升高约0.2%,这预示着神经系统疾病对人民群众的生命危害程度越来越高。根据本研究的方法,残差修正后模型的后验差比值明显降低,残差修正后模型精确度得到提高,预测值与实际值拟合度更高。但由于本文所使用数据为年数据,同时城市和农村差异较大,可能受到各种因素的影响,使得预测具有一定的局限性,还有待进一步的探索研究。
表9 城市和农村神经系统疾病死亡人数占总死亡人数的比重灰色残差修正预测结果(%)
续表9 城市和农村神经系统疾病死亡人数占总死亡人数的比重灰色残差修正预测结果(%)
随着医学诊断技术的不断发展,对神经系统疾病的诊断、确诊和治疗有着极大的帮助。因此,对神经系统疾病进行有效治疗,防止其死亡率逐年攀升危害生命,迫切需要培养更多的专业人才来进行临床研究。
神经系统疾病现状:(1)城市和农村的神经系统疾病的粗死亡率和死亡占比均逐年升高,并且继续上升的势头可能持续存在,且农村粗死亡率和死亡占比的增长速度明显快于城市,城乡之间的差距正在逐步减小。(2)农村神经系统疾病粗死亡率2011年及2011年之前均低于城市,此后逐年升高,截至2018年与城市的粗死亡率几乎持平;(3)城市在2009-2011年的粗死亡率和死亡占比明显高于农村,可能与城市医疗水平较高因而神经系统疾病的就诊率和确诊率比农村高有关,随后从2012年起,可能由于农村医疗水平有提高,从农村去城市就诊求医数量增多,就诊率和确诊率均有提高,导致农村的神经系统疾病的粗死亡率及死亡占比均升高。
神经系统结构复杂,发病后症状广泛,为其诊断增加了难度,随着医学技术的发展,神经系统疾病的诊断水平也有了明显的提高。神经系统疾病中包括神经变性疾病、运动神经元病等,人口老龄化程度的加重也使得老年性痴呆、帕金森病等神经变性疾病的确诊人数越来越多,在世界范围内的公共卫生领域,都一致认为神经系统疾病将是威胁人类健康的重要原因[14-15]。本预测分析显示,神经系统疾病对人类的健康威胁越来越严重,应予以重视并加快治疗神经系统疾病的相关人才的培养、招聘,增加配套设施,为缓解未来的医疗风险和负担提前做必要的准备工作。