彭振仁 韦洁 黄秀宁 宋鹏书 梁丽芳 黄柏华 何嘉嘉 陈碧艳 丘小霞 何升
广西壮族自治区妇幼保健院,广西出生缺陷预防控制研究所,广西生殖健康与出生缺陷防治重点实验室,广西出生缺陷防治基础研究重点实验室(南宁 530000)
出生缺陷(birth defects,BD)是指在怀孕前或怀孕期间,由遗传和(或)环境、或未知因素引起的胎儿结构或功能异常的疾病[1]。出生缺陷是导致自然流产和死产,以及5 岁以下儿童死亡和致残的重要原因之一,对个人、家庭、社会和卫生保健系统有着很大的负面影响[1]。全世界每年有3%~6%的婴儿出生时伴随着严重的出生缺陷,每年至少有330万5岁以下儿童死于出生缺陷,约320万儿童可能终身残疾,出生缺陷也是造成5 岁以下儿童伤残调整生命年损失及死亡最主要的原因之一[2-7]。我国总出生缺陷发生率约5.6%,每年约有90 万例婴儿出生时被诊断患有出生缺陷疾病,出生缺陷已严重影响我国儿童的生命健康和生活质量[8]。广西是我国出生缺陷的高发地区,围产儿出生缺陷发生率已超1%,防治工作任重而道远[9]。因此,出生缺陷的预防与控制显得极为重要,而模型预测也是一种十分有效的出生缺陷监测方法。然而,目前尚未见有关于广西全区出生缺陷发生率的数学模型预测研究的报道,因此,建立出生缺陷数学预测模型预测广西出生缺陷的发生很有实用性。
目前,出生缺陷的预测模型主要有灰色模型、时间序列ARIMA 模型、Joinpoint regression 模型等[10-15]。在众多的出生缺陷预测模型中,灰色模型GM(1,1)以基于小样本数据进行预测,其所需建模信息少,运算方便、简单,短期预测时其模型拟合精度较好,是处理基于小样本数据进行预测比较常用的模型之一。本研究基于2016-2020年广西出生缺陷监测数据,以年、季度、月共3 个层次构建总出生缺陷发生率及前5 种出生缺陷(先天性心脏病、多指(趾)、马蹄内翻足、外耳其他畸形、并指(趾))的灰色模型GM(1,1),并通过模型综合评价指标(模型精度)对不同层次的灰色模型预测效果进行评估,可为探索合适的出生缺陷预测模型提供一定的科学依据,也可及时填补广西在这方面研究的空白。
1.1 数据来源 出生缺陷数据来源于广西出生缺陷监测网,该监测网以在医院住院分娩的孕28 周至产后7 d 的围产儿为监测对象。出生缺陷数据由各监测医院的专业人员按国际疾病分类标准ICD-10 进行上报,报表包括《围产儿数季报表》和《医疗机构出生缺陷儿登记卡》。本研究数据范围为2016-2020年广西出生缺陷发生率。出生缺陷发生率的定义为:孕周≥28 周的围产儿中被诊断为出生缺陷的围产儿所占的比例。出生缺陷发生率计算公式为:出生缺陷发生率(/万)=(孕周≥28 周围产儿出生缺陷发生数/围产儿数)×10 000/万。
1.2 质量控制 县区级妇幼保健院每季度进行1 次监测数据质量自查,市级妇幼保健院每年对所辖县区内的监测医院数据质量进行1 次抽查,另外,广西妇幼保健院每年组织专家对全区各监测医院进行1 次数据质量抽查,以保证出生缺陷监测数据的准确性和完整性。
1.3 构建出生缺陷灰色模型原理与方法
1.3.1 灰色模型GM(1,1)预测原理 灰色模型GM(1,1)的符号含义为:“G”代表灰色(Gray),“M”代表模型(Model),“(1,”代表1 阶方程,“1)”代表1 个变量。灰色模型GM(1,1)的预测原理为:对某一原始数据序列用累加的方式生成一组趋势明显的新数据序列,以这个新数据序列的增长趋势建立模型从而进行预测,然后再以累减的方法进行逆向计算,进而恢复原始数据序列,最后得到预测结果。
1.3.2 出生缺陷发生率灰色模型GM(1,1)建立方法 本研究基于2016-2020年广西出生缺陷监测数据,以年、季度、月共3 个层次构建总出生缺陷发生率及前5 种出生缺陷(先天性心脏病、多指(趾)、马蹄内翻足、外耳其他畸形、并指(趾))的灰色模型GM(1,1),并通过模型精度对不同层次的灰色模型预测效果进行评估。出生缺陷发生率灰色模型GM(1,1)建立方法具体如下:
本研究中,灰色预测模型GM(1,1)的观察指标为2016-2020年的总出生缺陷发生率及前5种出生缺陷(先天性心脏病、多指(趾)、马蹄内翻足、外耳其他畸形、并指(趾))的发生率,观察指标均分为年度、季度、月份共3 个层次。通过上述建模方法构建灰色预测模型GM(1,1),即可对观察指标(出生缺陷发生率)进行预测,预测范围分别为2021-2025年、2021年1-4 季度、2021年1-12月。
1.3.3 灰色模型GM(1,1)的拟合精度检验 灰色模型GM(1,1)的拟合精度可用后验差比值C 和小误差概率P 来综合判断,当C ≤0.35 且P≥0.95 时表示模型拟合效果好(一级),当0.35 <C ≤0.50 且0.80 ≤P<0.95 时表示模型拟合效果为合格(二级),0.50 <C ≤0.65 且0.70 ≤P<0.80 时表示模型拟合效果为基本合格(三级),当C >0.65且P<0.70时表示模型拟合效果差(四级)。
1.4 统计学方法 利用Excel 建立2016-2020年广西出生缺陷发生率数据库,采用Matlab R2010b软件编程即可建立出生缺陷发生率灰色预测模型GM(1,1)。灰色预测模型GM(1,1)Matlab 编程步骤具体如下:(1)导入原始出生缺陷发生率序列,对原始序列进行累加;(2)构造累加矩阵B与常数向量,计算矩阵参数a(灰色发展系数)和u(灰色作用量),即可构建灰色预测模型GM(1,1)的预测函数;(3)计算出生缺陷发生率预测值(拟合值)、绝对误差、相对误差、平均相对误差;(4)进行拟合精度检验;(5)根据拟合精度检验结果,对未来出生缺陷发生率进行预测。本研究中误差的具体定义如下:(1)绝对误差=预测值—实际值;(2)相对误差(%)=(绝对误差/实际值)×100%;(3)平均相对误差=∑相对误差。
2.1 总出生缺陷年度发生率灰色模型GM(1,1)拟合结果 表1显示的是2016-2020年广西总出生缺陷年度发生率灰色模型拟合结果,包括总出生缺陷年度发生率的实际值、预测值、绝对误差、相对误差。其中,模型的绝对误差最大值为-1.80,相对误差最大值为-1.3%,平均相对误差为-0.12%,后验差比值C 为0.002,小误差概率P 为1。根据灰色模型GM(1,1)拟合精度判断标准,可综合认为该模型拟合效果好(一级),用于外推预测效果好。该模型的发展系数a=-0.129,灰色作用量u=83.889,预测模型为y(k)=769.972e-0.129(k-1)-650.302。
表1 2016-2020年广西总出生缺陷年度发生率灰色模型预测结果Tab.1 Prediction results of gray model for the annual total BD prevalence in Guangxi from 2016 to 2020
2.2 总出生缺陷季度发生率灰色模型GM(1,1)拟合结果 表2 显示的是2016年第1 季度至2020年第4季度广西总出生缺陷季度发生率灰色模型拟合结果,包括总出生缺陷季度发生率的实际值、预测值、绝对误差、相对误差。其中,模型的绝对误差最大值为-18.93,相对误差最大值为16.73%,平均相对误差为0.49%,后验差比值C为0.285,小误差概率P为1。根据灰色模型GM(1,1)拟合精度判断标准,可综合认为该模型拟合效果好(一级),用于外推预测效果好。该模型的发展系数a=-0.023,灰色作用量u=99.578,预测模型为y(k)=4 456.7e-0.023(k-1)-4 329.48。
表2 2016年第1 季度至2020年第4 季度广西总出生缺陷季度发生率灰色模型预测结果Tab.2 Prediction results of gray model for the quarterly total BD prevalence in Guangxi from the first quarter of 2016 to the fourth quarter of 2020
2.3 总出生缺陷月发生率灰色模型GM(1,1)拟合结果 表3 显示的是2016年1月至2020年12月广西总出生缺陷月发生率灰色模型拟合结果,包括总出生缺陷月发生率的实际值、预测值、绝对误差、相对误差。其中,模型的绝对误差最大值为-28.28,相对误差最大值为25.72%,平均相对误差为0.79%,后验差比值C 为0.392,小误差概率P 为1。根据灰色模型GM(1,1)拟合精度判断标准,可综合认为该模型拟合效果为合格(二级),可用于外推预测。该模型的发展系数a=-0.007,灰色作用量u=102.329,预测模型为y(k)=14 753.12e-0.007(k-1)-14 618.43。
表3 2016年1月至2020年12月广西总出生缺陷月发生率灰色模型预测结果Tab.3 Prediction results of gray model for the monthly total BD prevalence in Guangxi from January 2016 to December 2020
2.4 前5 种出生缺陷发生率灰色模型GM(1,1)拟合结果 2016-2020年广西前5 位出生缺陷从多到少依次为先天性心脏病、多指(趾)、马蹄内翻足、外耳其他畸形、并指(趾),分别为11 049 例、8 673 例、2 529 例、2 244 例、2 169 例,发生率分别为30.46/万、23.91/万、6.97/万、6.19/万、5.98/万。表4 显示的是2016-2020年广西前5 位出生缺陷发生率灰色模型拟合结果。模型拟合结果显示,年度出生缺陷发生率的模型拟合效果明显优于季度和月份的,而先天性心脏病的年度、季度、月发生率拟合结果均为好(一级),用于外推预测效果均好。
表4 2016-2020年广西前5 位出生缺陷发生率(1/万)灰色模型预测结果Tab.4 Prediction results of gray model for top five BD in Guangxi from 2016 to 2020
近年来,出生缺陷防控形势日益严峻,有关报道显示全国及其他省市的围产儿出生缺陷发生率总体均呈上升趋势[16-19]。因此,如何构建有效的出生缺陷预测模型显得极为重要。目前,有关出生缺陷发生率的数学模型预测研究相对比较有限。在出生缺陷预测模型研究中,灰色模型和ARIMA 模型比较常见。灰色模型GM(1,1)是一种基于小样本数据来进行预测的模型,其所需建模信息较少,运算方便、简单,建模精度较高,短期预测效果较好,在很多预测领域方面都有着很广泛的应用,是处理小样本预测问题比较有效的工具[20-23]。近年来,国内已有一些学者将灰色模型GM(1,1)应用于出生缺陷发生率的预测,为出生缺陷预防与控制提供科学的数据支持[24-27]。广西是我国出生缺陷的高发地区,围产儿出生缺陷发生率已超1%,围产儿发生率总体呈上升趋势,防治工作任重而道远[9]。另外,本研究数据也显示,2016-2020年广西总出生缺陷年度发生率总体呈上升趋势。因此,如何探索出有效预测广西出生缺陷的合适方法就显得很必要和迫切,而目前尚未见有关广西全区出生缺陷发生率的数学模型预测研究。尽管有研究显示ARIMA 模型预测的准确性比较高[28-29],但也有研究显示在预测出生缺陷发生率时,灰色模型比ARIMA 模型的预测准确度更高[27]。经综合考虑,本研究利用灰色模型GM(1,1)拟合建立广西出生缺陷发生率预测模型,可为探索合适的出生缺陷预测模型提供一定的科学依据,也可及时填补广西在这方面研究的空白。
本研究使用灰色模型GM(1,1)对2016-2020年广西总出生缺陷的年度、季度、月发生率进行拟合之后,其平均相对误差的绝对值均<0.80%,且模型拟合精度检验也显示模型拟合效果从高到低的预测单位依次为年度(一级/好)、季度(一级/好)、月(二级/合格)。因此,当广西总出生缺陷发生率采用灰色模型GM(1,1)进行预测时,年度、季度、月发生率预测模型均可用于外推,但外推效果最好的则是年度发生率预测模型,其后验差比值C 远远低于季度、月发生率预测模型,仅为0.002。与国内其他学者构建的安徽省、西安市出生缺陷发生率灰色模型预测相比[10,24-25,27],本研究中的总出生缺陷年度发生率灰色模型的相对误差及后验差比值C 均更低,表明该模型的预测精度和效果要比预想的更好。
近年来,我国出生缺陷主要病种发生率的排位发生巨大变化,先天性心脏病发生率高达52.06/万,成为我国目前最为突出的出生缺陷疾病[16-17,30]。有报道显示,2018-2019年广西先天性心脏病发生率居出生缺陷疾病首位[9]。本研究数据也显示广西先天性心脏病发生率总体呈上升趋势,先天性心脏病发生率由2016年的23.26/万上升至2020年的53.99/万。导致先天性心脏病发生率上升的原因可能与不断完善的出生缺陷监测机制,不断提高的出生缺陷疾病诊断标准和诊断水平有着一定的关系[9]。因此,本研究也采用灰色模型GM(1,1)对2016-2020年广西前5 种出生缺陷(先天性心脏病、多指(趾)、马蹄内翻足、外耳其他畸形、并指(趾))的发生率进行拟合,结果显示年度发生率的灰色模型预测效果明显好于季度和月份的,这也进一步佐证了用出生缺陷年度发生率灰色模型进行预测时,其外推效果更佳。综上分析,在对广西出生缺陷发生率采用灰色模型GM(1,1)进行预测时,本研究更建议和推荐年度发生率预测模型,但季度、月发生率预测模型的也可适当用于预测研究的补充。
本研究对2021-2025年广西总出生缺陷及先天性心脏病、多指(趾)、马蹄内翻足、外耳其他畸形、并指(趾)的年度发生率进行预测显示,总出生缺陷发生率仍然保持较高水平且每年呈递增趋势。而前5 种出生缺陷的年度发生率灰色模型预测结果中尤以先天性心脏病的发生率波动最大(72.47/万~279.10/万)。这提示,在未来五年中,广西出生缺陷将面临更多挑战,加强出生缺陷防控仍然是提高人口出生质量的重要公共卫生策略,尤其要加强对先天性心脏病等高发出生缺陷疾病的防控和宣传力度,减少或避免出生缺陷疾病特别是先天性心脏病等高发出生缺陷疾病的发生,做到优生优育,提高新生儿人口素质。
灰色模型的预测效果可能与出生缺陷发生率的原始序列数据波动性有关。在本研究中,出生缺陷发生率的预测值是基于灰色模型为基础的理论值,这与实际出生缺陷发生率可能会存在一定的偏差。因此,本研究在不考虑各种影响出生缺陷因素的前提下建立出生缺陷灰色模型,对预测广西出生缺陷仍具有一定的科学价值和参考依据。在未来研究中,本研究将会尝试将可能影响出生缺陷的风险因素纳入出生缺陷发生率预测模型中,构建出生缺陷风险预测模型,评估出生缺陷各种风险因素对出生缺陷发生率的影响,为科学防控出生缺陷提供一定的参考依据。