探讨职业病发病率统计预测的两种方式及比较

2018-11-05 09:49孙震朱宝立
健康大视野 2018年16期
关键词:发病率预测

孙震 朱宝立

【摘 要】

目的: 对比灰色预测模型和线性回归模型的特点和各自的优缺点,为职业病发病率预测时选取何种建模方式提供指导。方法::查阅了阐述两种建模的基本原理以及运用两种建模方式进行疾病预测的相关文献,分别摘录和对比了灰色预测模型和线性回归模型的函数表达式,数据的应用范围和适用条件,并参照预测应用案例,与实际数据进行比对,评估其效果。结论: 两种建模方式对假设条件、样本量大小、数据特点均有不同的要求,各自也具有明确的优缺点。在符合其适用范围的模型中均有较高的预测可靠性。因此在实际工作中应根据实际情况,选取合适的建模方法,为工作起到指导作用。

【关键词】 灰色系统;Logistic回归;发病率;预测

【中图分类号】R979.3

【文献标志码】

B 【文章编号】1005-0019(2018)16-242-02

随着经济的快速发展,各种各样的职业危害因素给相关岗位劳动者所带来的职业病也越来越严重。很多职业病已经给劳动者的生命和健康带来了严重的影响。可喜的是,职业病的防治现在越来越受到重视。无论是一线的卫生医疗人员,还是相关专业的专家学者,都积极地参与到其中来,给职业病的防治引入了很多有效的思路和方法。其中对于职业病发病率的调查研究和预测,是近年来发展很快的领域,各种不同的方法分别被应用在相关工作当中,并且给职业病的防治起到了很好的指导作用。本文在对相关文献资料中比较常用的预测方法进行了简单的分析比较,并且讨论在针对某一特定类型的职业病发病例的预测时,应该选取哪一种预测方法,以达到最佳的预测结果,并与实际情况最为吻合。从而可以以此为卫生行政部门以及职业病防治单位的工作起到更好的指导和参考作用。

1 灰色预测模型

1.1 灰色预测模型的概念

灰色系统理论(Grey System Theory)的建模法就是运用数学方法使信息不完全明确的系统经数据处理后能得到较明确的,符合实际情况的结果的数学预测系统。职业病作为一类具有流行病学特征的疾病,其发病率受到多种因素的影响,其中包括明确的影响因素(白色系统)、内容确定不明确的影响因素(黑色系统),以及一些部分信息明确,而部分信息不明确的信息系统。这部分信息系统被称为灰色信息系统。当我们在进行职业病初查时常常收集到的是大量无明显规律的数据,用灰色理论将无规律的原始资料经生成后数据累加的方法,使其变为较有规律的生成数列在建模式,所以灰色模型GM实际上是生成数列模型,从而揭示事物内部的特征与规律,使进一步达到预想目的。

1.2 GM(1,1)模型的建立

依照周霞等[1]推算的计算方法,建立GM(1.1)模型主要包括下列步骤

1.2.1 一次性积加生成

将最初数列X(t)= x(1),x(2),… ,x(n) ,进行一次性累加生成,将削弱为随机性,深化为规律性,使累计生成列Y(t):Y(t)= ∑ti= 1x(i) t= 1,2,… ,n (1)

1.2.2 均值生成

對累计数据列公式(2)作为均值生成,用均值数据列Z(t):Z(t)=12[Y(t)+ Y(t- 1)] t= 2,3,… ,n (2)

1.2.3 创立GM(1.1)模版

创立关于Y(t)的一阶限线性微分方程:dY(t)dt+ aY(t)= u (3)

此式即为GM(1.1)预算模型,解为该变量分离型微分方程得其特释为:Y(t)= x(1)-aue- a(t- 1)+au(4)

1.2.4 使式(4)所得估计值 Y(t)数列作为累减还原生成,得原始

数列X(t)的预算值 X(t)数列: X(t)= Y(t)- Y(t- 1) (5)

1.2.5 对数列 X(t)与X(t)结果的拟合度检查,使盘算结果准确性检验。

若两方结合精度好,但模型可使用于外推推测;若两方结合精度不规范,则不可直接用于外推预算,须经残差修改后,再次进行外推测。确定为灰色数列模型的真实性可用于平均相对差别、后检差比结果和小距差概率来检验。

1.3 灰色预测模型的应用及效果

灰色预测模型已经被研究者应用到了疾病预防当中。比较典型的是史善富[2]选取了 1995~2009 年在南京市职业病防治院检出的尘肺病人数量作为数列进行了灰色模型建模,提示了之后的5年该地区尘肺的发生率呈缓慢下降趋势,并预测了之后5年的发病率,通过对比实际数据,预测基本符合实际状况。

2 一元线性回归模型

2.1 线性回归模型的概念

Logistic回归模型是一种采用多变量分析法的几率性回归模型。可以来用探讨调查过程中分类观察结果和需要探索的影响因素之间的联系。依据设计类型,Logistic回归模型可以分非条件Logistic因归和Logistic条件回归,分别适用于成组设计资料和配对设计资料;其因变量是定性变量,而对于自变量的类型、数目和性质没有特殊的要求,因而其应用范围很广,不仅可以用于流行病学的病因学分析,也可用于临床疗效和试验评价、实验研究中的剣量效应分析、卫生服务领域研究。根据关雪[4]等人的计算,LogiStic回归模型可表示为:

P(X)=1/1+exp[-(α+β1X1+β2X2.......+βpXp)]

Logistic 回归方程中数估计使用最大似然推算法。假如y1,y2,…,yn是从总体中提取 n 本,设 p i=P (y i=11x i)为给用 xi的条件下得到效果y i= 1 的条件几率,那么 yi = 0的条件概率为 P(yi=0|xi)=1-pi.。于是,得到一个观测值的几率为: P(yi)=pyii(1-pi)1-yi。由而可建立样本的似然函数为:

L(θ)=∏ni=1pyii(1-pi)(1-yi)

为了简化计算,通常取似然函数的对数形式,

InL(θ)=∑ni=1[yiInpi+(1-yi)In(1-pi)]

通过解似然方程组:1nL(θ)α=0,1nL(θ)βj=0[4]可以求得其中某一参数的估计值。并且可以通过拟合度检验,来检查所建立模型与所调查实际情况的数据吻合程度。

2.2 线性回归模型的应用效果

刘宝龙[5]等选取了资料可靠的27个单位的粉尘暴露工人以及尘肺病患者作为研究对象,建立工龄,工龄平均浓度和粉尘毒性三个因素和尘肺发病率的回归模型,并且进行了模型拟合度检验,结果显示对人群的符合率较高,对相关单位的尘肺发病率预测有较好的适用性。唐惠红[6]等人在研究青壮年结核病发病率的时候更是用14个变量进行多因素回归分析,依然可以从中筛选出与发病率关系较为密切的影响因素,并对发病率进行可靠的预测。

3 讨论

通过对不同时期应用灰色数列模型对疾病发展趋势研究的文献分析发现,灰色数列模型在样本的概率呈不典型分布时预测效果较佳,GM(1.1)通过对数据进行一次累加加成,形成新数列,可以有效地减少原始数据的随机性,增加数据的稳定性。同时计算方式相对简单,是一种简单、快速且运用广泛的预测方法。同时,灰色数列模型对疾病影响因素的考虑较少,相对比较粗糙,一般只用于较短时期的趋势预测。在做长期预测的时候,需要辅助其他的修正方式,来使结果更加符合实际。

Logistic回归模型对于样本的要求较为简单,实际应用非常广泛。其回归系数具有可解释性,因此在医学研究中研究多个影响因素时,可以用相对危险度(RR)来比较各个因素对于疾病发病率或者死亡率的作用大小。不过该模型对数据要求变量之间相对独立,因变量与 logit P 之间满足线性关系。同时在样本含量方面,Logistic回归方程的样本量不能太少,一般要求样本含量大于因变量的5倍以上。当样本数量太少时,结果的可靠性并不理想。

4 结论

随着职业病防治的深入,很多職业病已经被认为多种因素共同作用所致,如果针对单一因素进行防治,效果可能不甚理想。因此对职业病相关有害因素进行风险评估,开发准确的发病预测和预后预测方法,是有效降低发病率关键。疾病有害因素评估模型是职业病评估的主要工具,建立有效的模型可以指导高危人群的防治工作,进而减小患病风险。目前尚无一种可以适用于任何数据特点的建模方法,包括灰色预测模型和Logistic回归模型在内的统计学常用建模分析方法对于数据的范围,条件,样本量大小及变量之间的关系要求均有差别,并直接影响到结果的适用性。因此,今后我们在进行职业病发病率预测模型的构建工作时中,应根据研究目的、试验设计类型、数据特点及各种建模方法的应用条件等不同情况,选取最合适的建模方法构建疾病模型,如果必要。也可结合不同建模方式,组合构建模型,采取各种方法的长处,从而使构建的模型能够获得较好的可靠性和较高的预测性。

参考文献

[1] 周霞 灰色预测建模方法及在医学中的应用 数理医药学杂志2007.01-0073-03

[2] 史善富,魏春龙 应用灰色数列模型预测南京市尘肺病发病危险度 现代医药卫生 1009-5519(2014)24-3838-03

[3] Hermanlin AI.The multi-level aprroach: Theory and concepts[M].Ann Anbor:Populaiton Study Center,University of Michigan,1986.

[4] 关雪 五种定性资料统计分析方法研究,军事医学科学院 2012

[5] 刘宝龙,樊晶光,陈胜,耿凤,刘铁民,刘占元 Logistic回归模型在尘肺发病预测与控制中的应用研究 中国科学安全学报 2001.2

[6] 唐惠红,何志青,龚芳,胡贵方,资青兰 青壮年肺结核发病影响因素的条件Logistic回归分析 实用预防医学 1006- 3110(2012)06- 0830- 04

猜你喜欢
发病率预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
多晒太阳或可降低结直肠癌发病率
ARIMA模型在肺癌发病率预测中的应用
宫内节育器与宫颈糜烂发病率的临床研究
七招降低新购仔猪发病率