以全基因组关联分析大数据为基础的孟德尔随机化方法探索出生体重与儿童肥胖的关联

2019-06-04 07:23梁颖娜黄宇婷李立新
中国循证儿科杂志 2019年2期
关键词:关联工具体重

梁颖娜 黄宇婷 李立新

传统流行病学研究认为儿童肥胖是成年后发生心血管疾病(CVD)、糖尿病和某些癌症等的危险因素,且这些疾病的风险随着儿童BMI的升高而升高[3]。但由于其固有的混杂或偏倚,是否能够真正反映出生体重与儿童肥胖之间存在因果关联仍不明确,营养与饮食、体力活动等偏倚在传统的观察性研究设计中往往难以控制,且不能被实验研究所证实。

孟德尔随机化(MR) 研究通过引入计量经济学中工具变量的概念,MR研究利用遗传变异作为社会或行为因素的替代指标,对给定的暴露和结局做出因果关系的判断。MR研究过程基于以下假设(图1):①基因工具变量单核苷酸多态性(SNP)与暴露因素相关,此过程一般以GWAS研究为依据,选择合适的SNP作为工具变量;②基因工具变量的形成可看作随机分配的过程,与混杂因素相关独立;③工具变量只能过通过暴露因素作用于结局。在MR研究中,基因与结局的效应关系不会受到出生后社会环境和行为因素等常见的混杂因素和反向因果关联的影响或歪曲,对于暴露因素的因果推断具有独特的优点。全基因组关联分析 (GWAS)的成熟发展,为MR研究的开展奠定了基础,亦为研究复杂疾病的发生发展机制打开了新的大门[8]。

1 方法

1.1 研究设计 本研究采用MR研究方法,以基因工具变量探讨出生体重与儿童肥胖的因果关联。以早期生长遗传学联盟(EGG)公开发表的基因数据为参考依据,筛选出与出生体重的关联有统计学意义的SNP作为工具变量[10-11],借助筛选出的SNP, 通过不同的MR方法来判断出生体重与儿童肥胖的因果关联[12-14]。

图1 孟德尔随机化应用模型示意图

1.2 GWAS相关数据的来源和获取 EGG能够提供全基因组荟萃分析的摘要数据,包括相关染色体、基因组位置、效应等位基因及基因频率、标准误和P值等,超过200万种已经通过质量控制的数据信息。本研究使用的GWAS结局变量的数据来自2012年Bradfield等[10]发表的关于新生儿肥胖与成人肥胖之间的遗传性分析,新生儿体重的相关数据来自2016年Horikoshi等[11]发表的关于新生儿体重的文献。数据获取时间为2018年10月20日。

在数据获取和分析过程中,借助MR-base平台,得以在不直接获取数据的前提下进行MR研究。MR-base平台(http://www.mrbase.org)是由布里斯托大学医学研究理事会(MRC)下属综合流行病学部门开发的关于MR数据库和分析的计算机程序和在线平台[15]。MR-base平台可以使MR研究过程实现自动化,减少人为错误的风险,使得研究结果更为可靠。

1.3 筛选出生体重相关的SNP 参考文献[16],设置筛选参数为P<5×10-8、连锁不平衡r2<0.1,筛选出与出生体重达到基因组显著性相关的SNP,将其作为工具变量代替临床风险暴露因素出生体重。

1.4 儿童肥胖的定义 参考文献[17],儿童肥胖定义为0~18岁按不同性别年龄别BMI≥P95[17]。

1.5 数据分析 ①通过将SNP-出生体重关联与SNP-儿童肥胖关联回归,计算SNP比率估计的IVW均值[12]。②使用加权中值方法估计影响效应,计算出所有被选择的SNP的比率估计的加权经验分布函数[13]。加权中值方法允许效应较强的SNP对因果估计作出更多的贡献,在较少SNP成为有效的工具时也能减少因果效应估计的偏倚。③进行MR-Egger分析[14]。该方法假设水平多变性与SNP暴露效应无关(即Inside假设),允许在所有SNP的回归和不平衡的水平多变性中有1个非零的截距。MR-Egger回归是SNP-儿童肥胖风险与SNP-出生体重效应估计的加权线性回归。MR-Egger能够在所有SNP都是无效的工具时提供有效的因果效果评估。所有结果以OR及其95%CI表示,P<0.05为差异有统计学意义。为了实现统计分析结果的可视化,直观展示每个SNP的统计效应,利用MR-base平台数据分析功能绘制SNP相关的出生体重与儿童肥胖风险的森林图及散点图。

2 结果

2.1 出生体重相关的SNP筛选结果 本研究中新生儿体重的相关数据来自文献[11],包含有26 836名新生儿体重数据[11]。以P<5×10-8、连锁不平衡r2<0.1为筛选参数共筛选到33个SNP,分别为rs2131354、rs13266210、rs10818797、rs2306547、rs72833480、rs17034876、rs12543725、rs2497304、rs35261542、rs6016377、rs134594、rs900399、rs1415701、rs11720108、rs740746、rs2946179、rs1819436、rs854037、rs753381、rs72480273、rs113086489、rs10872678、rs1351394、rs10935733、rs4144829、rs7575873、rs798498、rs3780573、rs1411424、rs2473248、rs7998537、rs11765649和rs7964361。

2.2 出生体重对儿童肥胖的影响效应 共纳入5 530例肥胖儿童和8 318名正常儿童。IVW分析:OR=1.79,95%CI:1.29~2.47,P=4.24×10-4;加权中值法:OR=1.30,95%CI:0.81~2.08,P=0.27);MR-Egger法:OR=1.73,95%CI:0.58~5.20,P=0.36)。

森林图(图2)显示,IVW方法分析时儿童肥胖的遗传易感性与出生体重水平有关。rs7964361、rs11765649、rs3780573和rs1351394的分析均表明出生体重与儿童肥胖的关联有统计学意义。

与出生体重相关的SNP及其儿童肥胖风险的散点图见图3,根据直线斜率判断,IVW法、MR-Egger法和加权中值法的因果关联估计相近。

图2 SNPs与出生体重及新生儿肥胖风险的森林图

注 黑点代表出生体重中标准差(SD)增加的儿童肥胖对数OR,OR是使用每个SNP作为单独工具变量产生的。红点显示不同的MR方法对所有SNP组合的因果估计。水平线段为95%CI

图3 SNPs与出生体重及新生儿肥胖风险的关联及合并效应

注 X轴(SD单位)代表SNP对出生体重的影响,Y轴(log OR)表示SNP对儿童肥胖的影响。每个黑点代表单独的SNP,线段表示95%CI。3条直线的斜率对应于3种MR方法的因果估计,浅蓝线为IVW法,深蓝线为MR-Egger法,绿线为加权中值法

3 讨论

本研究以出生体重相关的SNP为工具变量,代替临床风险暴露因素出生体重,通过MR方法分析了出生体重及儿童肥胖发生风险的关系,共筛选到33个与出生体重相关的SNP,其中4个SNP表明出生体重与儿童肥胖有显著的因果关联。出生体重高的人群发生儿童肥胖的风险较高,每增加1个升高出生体重含量的等位基因,儿童肥胖的发生风险增加79%(OR=1.79)。

以往有多项传统流行病学研究报道了出生体重和儿童肥胖之间的关系,多数都显示出生体重与儿童肥胖风险之间存在显著的正相关。丹麦1项基于人群的队列研究表明,出生体重≥4.0 kg与3.0~3.5 kg相比,6~13岁时儿童发生肥胖的风险增加[18]。1项中国的队列研究发现,出生体重>3 500 g较3 000~3 249 g,3~6岁时超重的比例升高[19]。含26个国家、66项研究的Meta分析表明,与正常出生体重(2 500~4 000 g)相比,高出生体重(>4 000 g)与儿童超重的可能性正相关(OR=1.66; 95%CI:1.55~1.77)[20]。另1项来自中国的研究调查了出生体重与3~6岁儿童肥胖风险之间的关系,当出生体重≥3 000 g时,儿童期超重和肥胖的OR值显著增加[21]。然而,上述研究的结果能否真正反映出生体重与儿童肥胖之间存在因果关联,仍不明确,流行病学研究中固有的偏倚也可能导致这种结果。

近年来,随着MR研究的发展,对于儿童肥胖的危险因素有了进一步认识。Richmond等[22]通过研究4 296名11岁儿童的BMI、活动水平和相关基因型数据,发现儿童肥胖与身体锻炼存在双向的因果关系, 肥胖的增加导致儿童体力活动的减少,较低的体力活动也导致肥胖的增加;Eric等[9]整合4 000多个父母及其后代组成的队列的相关遗传数据,通过MR分析进行因果推断,发现孕妇高血糖可能是后代儿童肥胖的重要危险因素;Censin等[23]通过EEG数据库筛选了与儿童肥胖相关的SNP,并探究其与1型糖尿病的关联。但目前尚无有关出生体重与儿童肥胖的MR研究的文献发表。

本研究分别使用IVW法、加权中值法和MR-Egger法分析了出生体重与儿童肥胖的关联。IVW法分析显示,出生体重与儿童肥胖具有较强的相关性(OR=1.79,95%CI:1.29~2.47,P<0.001),但其他两种方法分析均发现差异无统计学意义(P>0.05)。这3种方法均为MR研究的常用方法,每种方法在因果效应估计的一致性和检验效能各有优劣及无法验证的假设条件[24],发现因果效应的效能亦有所差别。IVW法发现因果效应的效能高于加权中值法和MR-Egger分析,但由于IVW法所依赖的假设条件较强,致使其进行因果效应估计的I类错误率及得到因果效应的估计值的偏倚都有所增加。MR-Egger法受Inside假设的影响较大,当满足其假设时,因果效应估计的I类错误率和基因多效性效应的偏倚都能得到很好的控制;一旦违背Inside假设,其检验效能受到很大的影响[25]。加权中值法相比其他两种方法并无太大的特色,但在违背Inside假设时,如果无效的工具变量不是太多,其表现优于其他两种方法[13]。这3种统计学方法各有优劣,且由于GWAS相关数据的限制,部分假设条件无法验证(如Inside假设)。因此,本研究得到的因果关联还需要进一步的证据支撑。

与其他研究相比,本研究的优势在于:①MR设计可以防止传统观察性研究中因为固有的混杂因素导致的反向因果关系;②研究样本较大,统计效应增加,效果估计相对更准确;本研究的局限性:①使用来自EGG研究的公共数据,纳入的研究人群主要来自欧美国家,研究结论是否适用于中国人群,有待普遍性验证;②无法直接获得患儿所在研究队列的数据,因此无法进行相关的亚组分析研究;③新生儿体重与儿童肥胖之间潜在的生物学机制仍未完全明确,通过MR方法仅能对其因果关系做出初步判断。

猜你喜欢
关联工具体重
给鲸测体重,总共分几步
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
波比的工具
奇妙体验之称体重
波比的工具
称体重
称体重
“一带一路”递进,关联民生更紧
准备工具:步骤:
奇趣搭配