基于GAMLSS模型的我国3~6岁幼儿BMI百分位数曲线参考标准及超重、肥胖临界值的研制

2021-06-02 11:41涂春景张彦峰武东明张三花江崇民
体育科学 2021年3期
关键词:残差曲线建模

涂春景,张彦峰,武东明,张三花,江崇民*

(1.杭州师范大学 钱江学院,浙江 杭州 310018;2.国家体育总局体育科学研究所,北京 100061;3.杭州师范大学 教育学院,浙江 杭州 311121)

20世纪80年代以来,世界各国儿童超重与肥胖快速增长,且低龄化趋势明显。儿童肥胖问题已成为一个日趋严重的公共卫生问题,且发展中国家儿童超重与肥胖率有赶超发达国家的趋势(赵广高 等,2019;Han et al.,2010;Marie et al.,2014)。20世纪80年代初,我国学龄前儿童单纯性肥胖处于极低水平,1985年我国主要9市0~7岁儿童肥胖检出率男女分别只有0.91%、0.90%(李辉等,2002);2005年调查结果显示,该群体男女肥胖检出率已经升至3.82%和2.48%;2015年调查发现,该群体的体重继续增加(首都儿科研究所等,2018)。国内近5年大量地区性调查研究也说明,3~6岁幼儿超重和肥胖处于较高水平(戎芬 等,2018;徐嘉培,2016;杨洪梅 等,2017)。3~6岁幼儿处于生长发育的敏感期,也是脂肪组织发育活跃期及重聚期(刘迎接等,2010;汪王朝等,2019)。学龄前儿童的体质健康对学龄期乃至成年都具有重要意义(徐亮亮等,2015),因此,将超重、肥胖防治窗口下移至学龄前儿童对遏制我国体重不良上升趋势和降低肥胖相关疾病具有重要意义。而制定科学合理的学龄前儿童体重等级参照标准是科学评价幼儿超重、肥胖的前提,是儿童肥胖防治的一项关键核心技术。

体质指数(body mass index,BMI)作为儿童营养监测和超重、肥胖筛查的重要指标之一,在理论与实践上已达成广泛共识。国外诸多组织和国家都建立了学龄前儿童BMI百分位标准曲线和超重、肥胖筛查临界值,如国际肥胖组织(IOTF)(Cole et al.,2012)、世界卫生组织(WHO)(Mercedes et al.,2007)等。在国内,有基于2005年9个省会城市(或直辖市)7岁以下儿童调查数据建立的婴幼儿BMI参考标准(李辉 等,2009,2010)、上海市0~18岁BMI百分位标准曲线及超重、肥胖界值标准(蒋一方等,2004),以及基于骨龄的我国儿童青少年BMI超重、肥胖百分位曲线及超重、肥胖界值标准(张绍岩等,2009)。这些研究主要基于LMS法或LMSP法构建百分位数曲线,且样本人群多为特殊城市或区域。迄今为止,未见广泛代表全国31个省市3~6岁幼儿的BMI百分位标准曲线和超重、肥胖临界值标准。

基于此,本研究依据2010年和2014年国家国民体质监测中心监测得到的全国除港澳台外31个省(自治区、直辖市)的大样本数据,运用当前国际上最新的GAMLSS(generalized additive model for location,scale and shape)百分位数曲线模型(Papageorghiou et al.,2014;Rigby et al.,2005;Stasinopoulos et al.,2018),建立我国3~6岁幼儿BMI百分位标准曲线,并在此基础上,根据中国肥胖问题工作组(WGOC)推荐的7岁儿童BMI超重、肥胖临界值,运用百分位曲线接轨延伸法划分我国3~6岁幼儿超重、肥胖的临界线和临界值,以期完善我国学龄前儿童体格发育评价体系,为幼儿体质健康水平的提升提供参考标准和依据。

1 研究对象与方法

1.1 研究对象

1.1.1 建模数据来源

建模数据来自国家国民体质监测中心数据库,包括2010年和2014年两次国民体质监测得到的全国除港澳台外的31个省(自治区、直辖市)的全部3~6岁幼儿体质数据。这两次数据均是按照分层随机整群抽样原则进行样本选取①分层方法是在各省(自治区、直辖市)域内按照经济发展水平分为一类、二类和三类地区;每个地区分城、乡两种人群随机抽取若干街道(乡、镇),最后随机选取街道(乡、镇)辖区内的幼儿园进行数据采集。样本人群包含城乡、性别4类样本,共计16个年龄组,每个省(区、市)每一年龄组抽样100人,总样本为1 600人。其中城市幼儿是指父母是城市户口,且本人生活在城市的幼儿;农村幼儿是指父母是农村户口,且本人生活在农村的幼儿。,测试方法依据《国民体质测试方法及判断标准》进行,测试时间为2010年4—6月和2014年4—6月,测试仪器为健民牌Ⅱ型体质测试器材(Jianmin Ⅱ,Beijing)。两次测量采用了相同的测试工作方案,方案详见《国民体质测试方案(幼儿部分)》(国家体育总局群体司,2017)。

1.1.2 建模数据预处理

剔除明显不在总体分布的散在点后,分析样本的特征值发现BMI存在右偏,因此按照[-3S,+4S]的标准,首先删除身高和体重在上述区间外的数据,再删除BMI标准之外的数据。最终确定参与本次建模的样本为:2010年有效样本51 159人,其中男幼儿25 583人、女幼儿25 576人;2014年有效样本50 702人,其中男幼儿25 381人、女幼儿25 321人;建模总人数101 861人。

1.1.3 回代检验数据来源

回代数据采集了云南、四川、浙江和北京等地区代表我国东、西、南、北4个区域的幼儿体质数据,其中,浙江和北京测试时间为2018年4月—2019年6月,云南和四川测试时间为2019年9月—12月。抽样原则、测试仪器和测试方法与历次全国国民体质监测一致。排除异常数据后,4省市分别得到有效样本量为:云南省(昆明市、普洱市和临沧市)2 261人(男1 137人、女1 124人),四川省(成都市、自贡市、广元市)2 286人(男1 140人、女1 146人),浙江省(杭州市、嘉兴市)2 728人(男1 381人、女1 347人),北京市(东城区、丰台区)2 426人(男1 282人、女1 144人),4省市合计9 701人(男4 940人、女4 761人)。

1.2 研究方法

1)百分位标准曲线构建:GAMLSS模型法;2)幼儿超重、肥胖临界线的划分:与7岁儿童超重、肥胖临界值百分位曲线接轨延伸法。运用SPSS软件对样本数据的特征值进行初步处理,建模过程使用R-3.6.2软件编制R语言程序实现。

1.2.1 GAMLSS模型法

1.2.1.1 GAMLSS模型的理论框架

GAMLSS模型是由Rigby等(2004,2005)提出的基于位置、尺度和形状的广义可加模型,该模型以D(μ,σ,v,τ)的特定分布形式呈现,其公式为:

D分布表示BCCG、BCPE或BCT等子分布模型。各子分布模型通常包含4个参数:第1个参数是反映分布位置的参数,如均数、中位数等;第2个参数是反映尺度(即数据离散性)的参数,如标准差、均方差、变异系数等;第3、第4个参数是反映分布的形状,如偏度和峰度。另外,上述公式中的g(·)函数表示适当的链接函数。s(·)表示非参数平滑函数和超级参数ξ,ξ是解释变量x的幂转换指数(xξ),x的幂转换可以扩展x的比例,从而改善光滑曲线的拟合效果。在GAMLSS中BCCGo,BCPEo和BCTo都默认μ的链接函数为log,非参数平滑函数s(·)通常需要由各参数自由度df决定。

1.2.1.2 幂转换系数和优选分布模型

最优模型的选择依据广义最小赤池信息准则(GAIC)判断,即由最小GAIC选择一个最优拟合子分布模型D(BCCGo,BCPEo和BCTo等),以及自变量的幂转换指数ξ和模型拟合曲线 4个参数的初始自由度(dfμ,dfσ,dfv,dfτ)等。评价准则相关公式如下:

其中,lp为最大似然惩罚似然函数,GD(global deviance)全局拟合偏差、AIC(akaike information criterion)为最小赤池信息准则,SBC(schwartz bayes criterion)为贝叶斯准则。当#=2时,为最小赤池信息准则AIC,即AIC=GD+2df;当#=log(n)时,为贝叶斯准则SBC=GD+log(n)df。惩罚系数#的选择对模型有着较大的影响,在实际运用时,n<1 000时,一般通过比较不同模型的AIC最小值而选择最优模型;n≥1 000时,通过比较不同模型的SBC最小值而选择最优模型。

1.2.1.3 模型算法与参数估计

在GAMLSS框架下,有两种基本的算法使边际似然极大化,一种算法是由Cool和Geen创立的CG算法;另一种算法是由Rigby和Stasinopoulos针对均值和散度可加模型而创立的RS算法。GAMLSS软件包默认算法是RS算法,通过模型的算法而得出各参数的估计值。

1.2.1.4 模型的拟合优度诊断与自由度选择

模型的μ,σ,v,τ参数曲线平滑运用3次样条函数进行(Rigby et al.,2014)。具体过程:首先基于初始自由度,得出各参数平滑曲线,然后通过拟合优度诊断方法,比较不同的参数自由度的拟合残差,选择最优拟合效果的参数自由度,进而建立最优自由度下的各参数方程,最终得到研究指标的百分位数曲线参考值。GAMLSS模型提供了多种拟合优度诊断方法:Q-统计检验、蠕虫图、残差核密度估计与残差Q-Q图、残差定量诊断等方法。例如,Q-统计检验(Royston et al.,2001):当模型参数平均数、标准差、偏度和峰度4个参数拟合曲线的残差分布与标准正态分布不一致时,Q-统计值表现为|Z|>1.96时,其差异具有统计学意义(P<0.05),包括汇总Q-统计量,如果出现较差的Q-统计值,则表明需要调整平滑参数的自由度,以期获得更好的拟合优度效果。该检验方法既可用于检验参数的拟合优度,同时可通过改变参数自由度来探求具有更佳拟合效果的参数曲线。

1.2.1.5 建立参数的拟合曲线方程与曲线参考值

基于上述最优分布模型和自由度,建立模型的参数方程,最终构建体质指标的百分位数参考值、Z分参考值,并绘制基于月龄的百分位数曲线图。

1.2.2 超重、肥胖临界线的划分方法

对GAMLSS模型建立的BMI百分位标准曲线延伸,接轨中国肥胖工作组(WGOC)推荐的7岁儿童超重、肥胖临界值对应的百分位数,划定全国3~6岁幼儿超重与肥胖的临界线。

2 建模过程与结果

2.1 研制BMI百分位标准曲线

根据GAMLSS模型框架、最优分布模型的选择、拟合优度检验等公式及方法,BMI百分位标准曲线构建流程如下。

2.1.1 BMI样本特征值分析

我国3~6岁幼儿各年龄组BMI的均值、标准差、偏度和峰度等样本特征值见表1。BMI的分布状况如下:1)男幼儿各组偏度系数区间为1.5~3.1,女幼儿各组偏度系数区间为1.1~2.4,说明男女幼儿每个年龄组BMI均存在右偏。2)男幼儿各组峰度系数区间为4.8~15.4,女幼儿各年龄组峰度系数区间为3.8~16.6,表明男女幼儿BMI峰度普遍很大。由此可知,直接对原始数据排序而制定百分位数参考标准的传统方法不合理,需要对原始数据转换成近似正态分布后再制定该标准。使用GAMLSS法通过Box-Cox幂转换后可以达到此要求。

表1 建模样本人群的BMI均值、偏度和峰度Table 1 The Mean,Skewness,and Kurtosis of BMI in the Modeling Population

2.1.2 BMI幂转换系数和最优模型的选择

根据原始样本数据存在偏度和峰度的非正态分布特征,使用GAMLSS的子分布模型BCCGo(μ,σ,v,τ)、BCTo(μ,σ,v,τ)和BCPEo(μ,σ,v,τ)等分别进行建模运算。本例分布模型中的μ为中位数,σ为标准差,v为偏度,τ为峰度。

鉴于本研究样本量大于n>1 000,依据广义最小赤池信息准则,以SBC的最小值选择最优模型。在SBC=GD+#df中,男幼儿样本量n=50 964,故惩罚#=log(50 964)=10.839;女幼儿样本量n=50 897,故惩罚#=log(50 897)=10.838。通过迭代运算各子分布模型的GD、SBC值见表2,依表可知其中男女幼儿BCTo分布模型的SBC值分别为94 964.8和92 471.3,均小于男女BCCGo和BCPEo模型的SBC值,因此,男女幼儿BMI的最优分布模型均为BCTo分布模型。上述运算同时可得出男女幼儿自变量的幂转换系数ξ分别为0.601 7和0.250 1。男幼儿参数μ、σ、v、τ的3次样条函数拟合曲线建模初始自由度分别为mu.df=4.32,sigma.df=4.81,nu.df=3.87,tau.df=5.11,初始总自由度为18.11;女幼儿BMI的参数μ、σ、v、τ自由度分为mu.df=3.74,sigma.df=5.29,nu.df=2.50,tau.df=4.23,初始总自由度为15.76。

表2 BMI幂转换系数ξ和分布模型逐步选择Table 2 BMI Power Conversion Coefficient and Distribution Model Selection

2.1.3 拟合参数曲线制定

2.1.3.1 拟合参数曲线研制过程

模型中自变量x为年龄,因变量y为BMI,μ,σ,v,和τ是x的非参数函数,各参数公式是:

其中,hk(xi)为任意光滑曲线,ξ为模型的非线性参数。

参数曲线拟合效果调整过程与方法:根据自变量特征,本研究选用Q-统计检验法微调初始自由度大小,以达到更佳拟合效果。Z分值中Z1、Z2、Z3和Z4分别表示参数μ、σ、v和τ的拟合曲线残差,Z值越大,说明曲线光滑但拟合效果不好;反之,曲线拟合效果好但光滑度变差,各参数拟合曲线合格标准是其残差|Z|<1.96(P>0.05)。当某个年龄段对应|Zi|≥1.96时(i=1,2,3,4),以0.5的幅度逐步增大该Z值对应参数的自由度重新建模,直到|Z|符合小于1.96。若有个别|Zi|略大于标准,但总体Q-统计P>0.05,则符合要求。当然,过低的Z值也没有必要,应同时兼顾拟合与光滑效果。上述参数曲线拟合的自由度调整可同时参考Q-统计图,圆的大小与|Z|值成正比。圆心的正方形表示|Z|>1.96,即可能存在失配。

本研究的样本量大,BMI指标初始自由度下的拟合效果已经较为理想,其中男幼儿最终自由度即为原始自由度,最终总自由度为18.11;女幼儿参数μ的自由度mu.df由3.74调整为4.24,最终总自由度由初始15.76调整为16.26。最终各参数拟合结果见表3和图1:1)男幼儿各参数的残差Z值和Q-统计图均符合要求(P>0.05);2)女幼儿,月龄段43.5~48.5月的|Z|=2.39,虽然其>1.96,对应的Q-统计圆形图中内置了正方形,但是其余年龄段的各参数残差的Z值均符合要求,且各参数总体值也符合建模要求(P>0.05),所以拟合效果良好。

表3 拟合模型参数残差的Z分位值Q-统计检验表Table 3 Z Quantile Value Q-statistical Test Table of Parameter Residuals of Fitting Model

图1 拟合模型参数残差的Z分位值的Q--统计检验图Figure 1.Z Quantile Value Q-statistical Test Figure of Parameter Residuals of Fitting Model

2.1.3.2 BMI分布参数拟合曲线方程

根据上述BMI的GAMLSS的分布模型和参数曲线自由度,得出参数拟合曲线方程,其中cs为3次样条函数。

1)男幼儿 BMI分布模型 BCTo,参数μ、σ、v、τ的拟合方程 log(μ)=2.7661-0.0089cs(Age^0.6017,2.32),

log(σ)=-3.3805+0.3576cs(Age^0.6017,2.81),

v=0.6160-1.1151cs(Age^0.6017,1.87),

log(τ)=-0.2591-0.8931cs(Age^0.6017,3.11)。

2)女幼儿 BMI分布模型 BCTo,参数μ、σ、v、τ的参数方程 log(μ)=2.8549-0.0904cs(Age^0.2501,2.24),

log(σ)=-4.057+1.0811cs(Age^0.2501,3.29),

v=4.7644-4.4546cs(Age^0.2501,0.50),

log(τ)=-2.6083+3.2306cs(Age^0.2501,2.23)。

2.1.3.3 BMI百分位数曲线的拟合优度检验

所建BMI百分位曲线的拟合优度可运用残差核密度估计图和残差Q-Q图进行进一步检验,结果如下:

1)模型效果定性诊断:由图2可知,男幼儿所建模型的残差核密度估计图左侧远端尾巴稍长,但整体非常近似正态分布图,女幼儿核密度估计较完整。残差Q-Q图可以看出图上的点近似地在一条直线上(除了远端极少数点离散),样本残差分位数与正态分布理论分位数比较吻合。2)模型效果定量诊断:从残差统计量来看,男女幼儿拟合模型残差平均数(男0.001 3、女0.001 2)、方差(男0.997 2、女 0.998 9)、偏度(男 0.027 3、女 0.014 7)和峰度(男 2.989 6、女 3.011 9)都非常接近标准值 0、1、0、3;且Filliben相关系数均大于0.99。由此可知,无论定性还是定量,进一步验证了所选模型拟合效果优良。

图2 GAMLSS模型拟合曲线残差核密度估计与Q--Q图Figure 2.GAMLSS Model Fitting Curve Residual Kernel Density Estimation and Q-Q Diagram

2.1.4 BMI百分位数和标准差单位的参考标准

基于参数公式,可得出年龄别BMI百分位数曲线、标准差单位的参考标准(表4)以及百分位数曲线图。因篇幅原因,图表中年龄只标注“月龄”为单位的结果。

表4 我国3~6岁幼儿年龄别BMI百分位数曲线参考标准Table 4 Reference Standard for BMI Percentiles Curve of Children Aged 3~6 Years in China

分析上述标准图表可知,男女幼儿共同特征:BMI随年龄增长百分位数图形状基本相似。其中,P50变化幅度小,低位百分位数变化小而高位百分位数变化大;3~4岁C5与C95之间距离逐渐减小,4~6岁C5与C95之间距离逐渐增加,4岁后百分位曲线呈喇叭形,但C50~C5<C90~C50,图形整体向上偏移,且C95、C90等远离C50的高位百分位数值变化幅度大。男女幼儿不同特征:女幼儿C5与C95距离小于男幼儿,尤其是3岁组和6岁组更加明显。比较同年龄组、同百分位数的男女各自BMI值可知,男幼儿BMI值均大于对应女幼儿。

2.1.5 回代检验

建模过程中已对模型拟合优度进行了定性与定量两方面检验,检验结果良好。同时,考虑到参考标准是为了实践应用,所以用最新的2018、2019年数据对百分位标准曲线进行回代检验,比较回代数据在所建百分位标准曲线下的分布与其实际分布的一致性,以验证其有效性。

研究表明,回代检验差异率低于5%为合格,且差异越小一致性越高(练碧贞等,2019;潘云涛,2008;席翼等,2013)。对北京市、浙江省的5 154名幼儿以及四川省、云南省的4 547名幼儿的身高、体重数据进行回代检验,按照已建立的百分位数标准曲线,统计样例在C10、C35、C65和C90曲线下的百分数。回代检验结果显示,百分位标准曲线的理论百分数与样例百分数的差异男幼儿为-1.5%~1.0%、女幼儿-1.1%~1.8%,各年龄组差错率都在2%以下(表5),因此本研究所建的百分位标准曲线下所估计的样本例数与实际例数比接近,模型有效性较高。

表5 BMI百分位标准曲线下的样例百分数与理论百分数的差异Table 5 Difference between Sample and Theoretical Percentages under the Standard Curve of BMI

2.2 超重、肥胖临界值的研制

3~6岁幼儿超重、肥胖临界线运用接轨WGOC推荐的7岁儿童BMI超重、肥胖临界值而制定。WGOC制定的BMI超重、肥胖临界值标准:7岁男幼儿超重、肥胖分别为 17.4 kg/cm2、19.2 kg/cm2,7 岁女幼儿超重、肥胖分别为17.2 kg/cm2、18.9 kg/cm2(中国肥胖问题工作组,2004)。本研究对建立的3~6岁幼儿百分位标准曲线进行延伸,以通过7岁超重、肥胖临界值的百分位数曲线为3~6岁幼儿的超重、肥胖临界线。因建立的曲线是任意百分位曲线,因此存在与7岁超重、肥胖临界值一一对应关系的曲线。最终结果显示,男幼儿超重和临界线对应百分位数曲线分别为C79.6和C91.5,女幼儿超重和临界线分别为C85.4和C94.6。男女幼儿超重与肥胖临界值的百分位数曲线如图3所示。

图3 我国3~6岁幼儿BMI超重、肥胖临界线Figure 3.The Borderline between Overweight and Obesity in Children Aged 3~6 Years in China

因GAMLSS模型参数较为复杂,为了使用的便利性,进一步给出图中超重、肥胖的线性回归函数公式和表格结果。其中,回归函数见下述4个公式(y为“临界值”,x为“月龄”,且36<x<88);表格呈现的超重、肥胖临界值见表6(以0.5岁为区间)。

表6 我国3~7岁幼儿超重、肥胖BMI临界值Table 6 The BMI threshold of overweight and obesity in Children aged 3~7 years in China

3 分析与讨论

3.1 2010年与2014年两次调研数据合并建模的理论与实践依据

为了提高研究结果的可靠性,一般需要大样本量支撑。因此,本研究将2010年和2014年两次数据合在一起作为参照人群建模。这种组合是基于统计学原理和文献两方面原因。1)统计学依据:通过比较2010年与2014年各指标平均值差异的效应量发现,男女幼儿身高、体重和BMI效应量d大小区间分别为0.01~0.09、0.03~0.12和0.01~0.08。按照Cohen(1992)的判断标准:d=0.2为低效果,d=0.5为中等程度效果,d=0.8为高效果。因此,两次数据组合在一起符合统计学要求。2)文献依据:国际上不少标准的制定均采用了时间跨度较大的调查数据。例如,WHO于2006年公布的关于0~5岁儿童生长发育的生长参考标准,其建模数据是基于1997年7月—2003年12月跨度超过6年的监测数据。美国疾病控制与预防中心(CDC)在2000年将1963—1994年收集的5项全国健康检查调查数据和5个增补数据组合,依此建立了一套儿童生长标准图表(Kuczmarski et al.,2000)。中国儿童血压标准制定的数据来源于2000年1月1日—2009年6月30日共10年间11项独立的儿童血压横断面调查数据(范晖等,2017;中国高血压联盟 等,2019)。因此,实践上支持两次数据合并作为建模样本。

3.2 GAMLSS模型在构建生长标准方法学上的优势

国际上生长标准制定方法主要有LMS法和GAMLSS法。LMS法基于中位数、标准差和偏度3个参数建立百分位数的曲线,没有纳入峰度参数,而体质健康指标大都同时存在偏度和峰度的非正态分布的数据。2004年,Rigby和Stasinopoulos(2004)对LMS进行扩展,创立了GAMLSS模型,该模型是由中位数(μ)、标准差(σ)、偏度(v)和峰度(τ)4个参数组成的半参数模型,μ、σ、v、τ曲线平滑后可构建任意百分位数的光滑曲线。该模型不仅可对偏态分布的数据建模,而且也可对峰态分布或同时呈现偏态和峰态分布的数据建模,包括高偏态和高峰度分布。与LMS法相比,该模型制定的百分位数曲线更能体现原始数据的本真。

GAMLSS模型诞生之初,WHO专家组2006年在比较了30多种生长曲线制定方法的基础上,最终选择GAMLSS模型(BCCG分布、BCPE分布)分别制定了0~5岁和5~19岁儿童生长发育百分位数曲线标准图表(Mercedes et al.,2008)。该模型产生至今虽然只有10余年,但因其功能强大得到迅速发展,理论体系日渐完善(Groll et al.,2019),现已广泛应用于时间序列数据的百分位数曲线构建及相关标准的制定。在国外,国际肺功能组织利用GAMLSS模型建立了3~95岁年龄、身高别的肺功能百分位数曲线参考标准(Quanjer et al.,2012);美国学者基于116 383名住院患者建立了儿童心率和呼吸率百分位标准曲线(Bonafide et al.,2013);Yamada等(2019,2020)运用GAMLSS模型建立了秘鲁、哥伦比亚、墨西哥等地育龄妇女的BMI百分位标准曲线;爱尔兰基于5 897名50岁以上中老年人样本而建立的身高、体重、正常行走速度、握力、骨密度等指标的百分位标准曲线(Kenny et al.,2013)等。在国内,GAMLSS模型主要应用在水利领域,散见于体育领域,如张绍岩等(2009)运用GAMLSS模型(BCPE分布)制定了基于骨龄的身高、体重和体质指数等百分位数生长曲线。在医学健康领域,范晖等(2017)研制了我国儿童青少年高血压诊断标准,瞿平等(2020)则构建了儿童维生素A参考标准。

总之,GAMLSS建模效果优于采用离差法、百分位数法、回归法和LMS法等所制定的体质标准。本研究3~6岁男女幼儿BMI指标原始数据都存在偏度现状,同时存在非常明显的尖峰,吻合了GAMLSS模型的建模条件。模型拟合优度诊断结果表明:1)在定性诊断方面,男女幼儿所建模型的残差的核密度估计图、残差Q-Q图等指标与正态分布理论要求比较吻合。2)在定量诊断方面,男女幼儿拟合模型的残差平均数、方差、偏度和峰度均非常接近标准,Filliben相关系数均大于临界值,回代检验显示一致性较高。因此,本研究使用GAMLSS模型构建3~6岁幼儿BMI百分位标准曲线取得了良好的效果。

3.3 超重和肥胖临界值划分依据

BMI是反映体型和营养状况最常用的指标之一。健康成年人BMI随年龄的变化非常小,所以国内外对超重、肥胖进行判定和分级考虑都未考虑年龄因素,如国外以25 kg/m2、30 kg/m2为所有成年人的超重、肥胖临界值。然而幼儿生长发育处于快速变化中,BMI值会随年龄变化而变化,不能像成年人使用一个固定值,因此,必须建立基于年龄的BMI生长标准曲线和超重、肥胖临界线标准值。

国内外制定儿童青少年超重、肥胖BMI临界值主要有两种方法:1)Z分值法或百分位数法,如世界卫生组织(WHO)对5~19岁的儿童青少年BMI的Z分值≥+1S定义为超重,Z分值≥+2S定义为肥胖(Mercedes,2008)。而美国疾病预防控制中心(CDC)将BMI≥C95定义为肥胖,BMI≥C85定义为超重(Ogden et al.,2002)。Z分值法或百分位数法是根据调查数据得出的结果,牵涉参照人群生长的长期变化,需隔5~10年更新1次,故其使用受限。2)百分位数延伸接轨法,如国际肥胖问题工作组(IOTF)运用LMS法建立BMI百分位数曲线标准,并将曲线在18岁时通过成年人临界值25 kg/m2、30 kg/m2所对应的百分位定义为2~18岁儿童青少年的超重、肥胖临界线。该研究结果得到Abrantes等(2003)的验证,并建议2~6岁幼儿超重与肥胖使用该标准。中国肥胖问题工作组(2004)根据全国学生体质健康监测数据,通过比较多种方法并进行交叉验证,最终选择与成年人接轨延续的方法,即以通过18岁时的BMI24 kg/m2、28 kg/m2对应的百分位作为儿童青少年超重、肥胖临界线,制定了我国7~18岁儿童青少年超重与肥胖的临界点。百分位数曲线延伸接轨法无需随调查时间变化而重新制定,因此,本研究运用接轨中国肥胖问题工作组推荐的7岁儿童超重、肥胖临界值的方法研制3~6岁幼儿超重、肥胖临界值。

3.4 本研究超重、肥胖临界值与国内外相关研究对比

国际肥胖问题工作组(IOTF)在肥胖研究领域具有重要影响力,目前已成为肥胖界权威的信息渠道之一。本研究结果与IOTF的标准(Cole et al.,2000)比较,结果显示:1)本研究男女幼儿标准均低于IOTF临界标准,其中男幼儿超重、肥胖BMI临界值分别低于IOTF标准0.44~0.99 kg/m2和 1.21~1.61 kg/m2,平均低 0.72 kg/m2和 1.41 kg/m2;女幼儿超重、肥胖BMI临界值分别低于IOTF标准0.26~0.57 kg/m2和 0.93~1.26 kg/m2,平均低 0.43 kg/m2和 1.17 kg/m2(表 7)。究其原因主要为IOTF幼儿超重与肥胖是接轨国外标准(成人超重25 kg/m2、肥胖30 kg/m2)所得,而本研究是接轨中国肥胖问题工作组(WGOC)推荐的我国标准所得。WGOC超重、肥胖标准适合我国人种特征已经得到普遍共识,鉴于此,运用本土化临界线标准对国内幼儿进行诊断,更有利于将处于临界或边缘状态的超重和肥胖幼儿筛检出来而纳入重点关注人群,更好地促进其生长发育。2)本研究与IOTF推荐的3~6岁幼儿肥胖标准都存在随年龄增加先减少后回升的状况,即年龄维度上存在肥胖反转特征,我国男女幼儿肥胖反转年龄都在4.0岁,而IOTF标准均在4.5岁。

表7 本研究BMI超重、肥胖筛查标准与国际肥胖问题工作组(IOTF)标准对比Table 7 The Comparison of BMI Screening Standards for Overweight and Obesity between this Study and the International Working Group on Obesity(IOTF)

本研究结果与国内学者相关研究比较,结果如下。李辉等(2010)根据2005年中国9个省会城市(含北京、上海两直辖市)7岁以下儿童体格发育调查数据,运用LMS法研制了我国城市儿童BMI标准化生长曲线。本研究研制的3~6岁幼儿各年龄组超重、肥胖标准与该标准比较显示,超重、肥胖临界值十分接近,男幼儿超重略高0.10~0.27 kg/m2,肥胖相差-0.12~0.17 kg/m2,女幼儿超重略高0.03~0.33 kg/m2,肥胖相差-0.21~0.23 kg/m2。另外,蒋一方等(2004)运用LMS法研制了上海市0~18岁儿童青少年BMI百分位曲线及超重、肥胖临界值的标准,本研究与该标准相比差异较大。上述差异原因可能与建模样本人群的选取及建模所用数学模型不同有关。

3.5 局限性

本研究超重、肥胖的参考标准虽然借鉴了当前国外发达国家和重要国际组织对儿童青少年超重、肥胖标准的制定方法,基于大样本人群运用百分位数曲线延伸接轨法而制定。但最理想的超重、肥胖的客观标准应基于对健康可能产生的影响而制定。因此,运用百分位数曲线划分超重、肥胖的方法有其合理性,但也存在一定的局限性。

4 研究结论与展望

4.1 结论

1)本研究基于全国31个省(自治区、直辖市)国民体质监测数据,样本量大、代表性广;建模方法纳入了中位数、标准差、峰度和偏度4个参数的GAMLSS模型,所建百分位标准曲线光滑稳定,检验表明模型的拟合优度较优,应用实践数据进行回代检验也显示所建模型有较高的有效性。2)制定了3~6岁幼儿BMI的超重、肥胖临界值参考标准,提供了公式和表格两种临界值表达形式,公式与表格结果一致性较高,个体或群体可选择使用。

4.2 展望

GAMLSS模型在对横截面存在偏度和峰度的时间序列数据制定百分位数曲线时,具有显著的优越性和普适性,可推广应用于体质系列指标参考标准的制定。未来我们将结合当前5G科技成果,进一步开发智能化在线体质健康监测与健康预警平台。

猜你喜欢
残差曲线建模
多级计分测验中基于残差统计量的被试拟合研究*
未来访谈:出版的第二增长曲线在哪里?
基于残差-注意力和LSTM的心律失常心拍分类方法研究
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
融合上下文的残差门卷积实体抽取
物理建模在教与学实践中的应用
在经历中发现在探究中建模
思维建模在连续型随机变量中的应用
求距求值方程建模
梦寐以求的S曲线