石雷
(辽阳市疾病预防控制中心,辽宁 辽阳 111000)
运用GM(1,1)模型和曲线回归模型预测辽阳市丙肝发病趋势
石雷
(辽阳市疾病预防控制中心,辽宁 辽阳 111000)
目的预测辽阳市丙肝的发病趋势,为制定防控措施提供科学依据。方法利用辽阳市丙肝发病资料,建立GM(1,1)模型和曲线回归模型预测辽阳市丙肝发病趋势。结果辽阳市丙肝发病数的GM (1,1)预测模型为=(123+259.0685/0.1304)e0.1304t-259.0685/0.1304。预测值与实测值偏离较大;曲线回归模型为y=146.134+10.101x+19.234x2-1.466x3,该预测模型的拟合效果较好。结论曲线回归模型可较好地预测辽阳市丙肝发病趋势。
GM(1,1)模型;曲线回归模型;预测
丙型肝炎是一种主要经血液传播的病毒性传染病,丙型肝炎病毒(HCV)慢性感染可导致肝脏慢性炎症坏死和纤维化,部分患者可发展为肝硬化甚至肝细胞癌,对患者的健康和生命危害极大,已成为严重的社会和公共卫生问题。近年来辽阳市丙肝发病呈快速上升的趋势,成为辽阳市重点防制传染病之一。本文应用GM(1,1)和曲线回归模型对2003-2012年辽阳市丙肝发病进行分析,并对2013-2015年丙肝发病进行了预测,为我市丙肝防控工作提供了科学依据和参考。
1.1 资料来源 中国疾病预防控制信息系统报告的2003-2012年辽阳市丙肝发病数。
1.2 模型介绍
1.2.2 回归模型 是分析因变量与自变量之间相互关系,用回归方程表示,根据自变量的数值变化,去预测因变量数值变化的方法。常见的回归类型有直线、二次曲线、三次曲线、指数曲线、对数曲线等。根据丙肝发病趋势的散点图,分析两个变量的曲线相关类型,计算其回归方程系数,假设检验F统计量和对应概率P值以及可决定系数,根据可决定系数判断选取模型。
1.3 统计学方法 采用Excel对数据进行GM (1,1)模型分析[1],采用SPSS17.0软件对数据进行回归分析。
2.1 GM(1,1)模型预测结果
2.1.1 变量计算 计算转换数列Yt,移动平均数Zt,移动平均数的平方Zt2,原始数列和移动数列的乘积XtZt,见表1。根据上述变量的计算,可得到预测方程参数e0.1304t-259.0685/0.1304。
表1 GM(1,1)模型各指标的Excel计算结果
2.1.3 拟合效果评价和预测发病例数 计算后验差比值C和误差概率P值,S1=192.649 4,S2=52.997 3,C=S1/S2=0.275 097。129.942,所以P=1。按照灰色模型精度判断标准:C= 0.275 097<0.35,P=1,因此模型的精确度为1级。根据预测方程,预测2013-2015年辽阳市丙肝发病数分别为950例、1082例、1233例,呈上升趋势。
2.2 回归模型预测结果
2.2.1 绘制散点图 辽阳市丙肝发病与时间存在相关性,若确定何种函数形式,需进一步对其进行拟合确定。
2.2.2 建立回归方程 选择线性、二次曲线、三次曲线和指数曲线对数据进行拟合,结果显示在各模型中,三次曲线模型的决定系数是0.988,高于其他模型的决定系数,故选择三次曲线进行拟合。根据F统计量检验概率P接近0,三次曲线回归方程的显著性检验成立,方程为y=146.134+10.101x+19.234x2-1.466x3,拟合效果较好,见图1。
图1 辽阳市丙肝发病三次曲线拟合图
2.2.3 预测辽阳市丙肝发病例数 预测辽阳市2013-2015年丙肝发病数分别为705例,633例,503例呈下降趋势。
GM(1,1)模型是灰色动态模型中最基本、最常用的一种,由于灰色模型对样本容量和概率分布没有严格的要求,是一种易于在基层推广和应用的预测工具。许多学者应用该模型对疟疾、伤寒副伤寒和细菌性传染病等多种传染病进行了预测[2-4],取得了较好的效果。本研究应用GM(1,1)模型预测辽阳市丙肝发病例数,模型预测精度为1级,发病数呈上升趋势。
曲线拟合被广泛用于研究疾病流行过程中表达两个因素之间关系的规律性,并用于分析传染病感染状况调查,有较强的实用性。本文选择线性、二次曲线、三次曲线和指数曲线对数据进行拟合,以三次多项式曲线拟合效果最好,决定系数是0.988,预测发病数呈下降趋势。
比较两种模型的预测结果发现,虽然两种模型在预测精度和拟合效果上均属优级,但两种模型预测发病趋势相反,三次多项式曲线拟合与实际发病趋势相吻合,究其原因:(1)传染病发病率的变化要受多种因素的影响,如患者就医情况、医疗机构传染病报告情况、自然灾害等。经调查了解自2012年辽阳市加强了对丙肝等重点传染病的报告管理工作,依照丙肝诊断WS213-2008标准,确诊丙肝需经HCV RNA检测,辽阳市具该检测资质的医疗机构较少,导致确诊病例报告下降。再者是对丙肝危害宣传力度的加大,传播各环节管理的加强等对病例的减少亦起到了一定作用。(2)由于GM(1,1)模型自身也存在一定缺陷,如:不能完全反映各种非规律性的社会因素和环境因素对预测数据的影响。因此,如果出现社会、自然因素等的改变,从而出现理论值与实际值发生较大偏离的现象。综上所述,由于病例报告等因素对辽阳市丙肝发病数的影响,在运用GM(1,1)模型进行预测时,理论值与实际值偏离较大,不适宜进行预测。而三次多项式曲线较好的反映了辽阳市丙肝的发病趋势,可用于预测。本次研究得出的预测模型方程式必须根据实际发病率,不断纳入新的数据,重新代入计算,确定新的预测方程式,以保证预测的准确性。
[1]陈青山,王声湧,迟桂波,等.应用EXCEL完成性病GM模型的预测和评价[J].疾病控制杂志,2003,7(5):451-453.
[2]郭海强,丁海龙,曲 波,等.1988-2010年全国疟疾发病率的灰色预测模型研究[J].热带医学杂志,2011,11(6):639-640.
[3]刘志涛,李琼芬,王荣华,等.GM(1,1)灰色模型在云南省伤寒、副伤寒发病率预测中的应用[J].疾病监测,2012,27(6):468-470.
[4]林 玫,李永红,黄 君,等.GM(1,1)灰色模型在广西四种细菌性传染病流行趋势预测[J].中国热带医学,2011,11(6):671-673.
Prediction of the incidence trend of hepatitis C in Liaoyang city by GM(1,1)model and curve regression model.
SHI Lei.Liaoyang Municipal Center for Disease Control and Prevention,Liaoyang 111000,Liaoning,CHINA
ObjectiveTo predict the incidence trend of hepatitis C in Liaoyang,and provide scientific basis for further prevention and control of hepatitis C.MethodsGM(1,1)model and curve regression model were appliedto predict the incidence trend of hepatitis C in Liaoyang.ResultsGM(1,1)model forecast equation was=(123+259.0685/0.1304)e0.1304t-259.0685/0.1304.The predicted values deviated from the measured values seriously.Curve regression model was y=146.134+10.101x+19.234x2-1.466x3,and the model fitted well.ConclusionCurve regression model fits well for predicting the trend of hepatitis C in Liaoyang.
GM(1,1)model;Curve regression model;Prediction
R512.6+3
A
1003—6350(2015)05—0753—03
10.3969/j.issn.1003-6350.2015.05.0269
2014-11-19)
石 雷。E-mail:lycdcsl@126.com