包绮晗,李承圣,王浩桦,丁子琛,周立雯,丛慧文,王廉源,杨 毅,石福艳,潘庆忠,王素珍
1)潍坊医学院公共卫生学院卫生统计学系 山东潍坊 261053 2)潍坊医学院公共卫生学院数学教研室 山东潍坊 261053
我国2型糖尿病(type 2 diabetes mellitus,T2DM)患病人数全球第一,且有患者逐渐年轻化的趋势,T2DM的早期预防极为重要。肥胖被认为是糖尿病、高血压等慢性病的主要危险因素[1]。贺媛等[2]研究发现,BMI每增加一个标准差,糖尿病患病风险增加1.7倍;苏健等[3]的研究得出类似结论,BMI最高分位组(>25.89 kg/m2)糖尿病患病风险是最低分位组(<21.70 kg/m2)的3.09倍。WHO 2016年全球卫生观察站报告显示,我国成年人口BMI超过30 kg/m2的标化率已增至6.4%[4-5],美国、法国、英国、德国、澳大利亚等发达国家分别为36.2%、21.6%、27.8%、22.3%、29.0%;虽然上述五国肥胖率远高于我国,但仅有美国糖尿病患病率与我国相近,其余国家均低于5%[6-7]。
在传统的流行病学研究中,暴露与结局的关联可能受到未测量混杂和反向因果的影响,从而导致因果关系推断时受限。孟德尔随机化(Mendelian randomization,MR)法近年来广泛用于全基因组关联研究(genome-wide association study,GWAS)数据的因果关系研究中。MR法是利用遗传变异配子形成过程中随机分裂与组合的特性对人群重新随机分组,这在理论上避免了混杂因素的影响,同时以遗传变异(暴露的工具变量)所解释的变异也优先结局所解释的变异,由此排除了逆向因果问题[8-10]。本研究采用两样本MR法,以单核苷酸多态性(single nucleotide polymorphism,SNP)作为工具变量,基于GWAS汇总数据,从基因层面分析BMI与T2DM的因果关系。
1.1 数据来源通过IEU OpenGWAS project(mrcieu.ac.uk)网站获得近3 a的、样本量最大的BMI(ieu-b-40)及T2DM(ebi-a-GCST006867)的GWAS数据。网站访问时间为2021-08-15。最终两组数据的人群来源均为欧洲,男女不限。BMI数据集样本量为681 275,SNP数量为2 336 260;T2DM数据集样本量为655 666,SNP数量为5 030 727。
1.2 SNP作为工具变量的条件设定①工具变量与暴露高度相关,以F>10为强相关标准[11-12]。 ②工具变量不与结局直接相关,仅通过暴露影响结局,即不存在基因多效性。本研究以MR-Egger回归模型的截距项非0(P<0.05)表示不存在基因多效性[13-14]。 ③工具变量与未测混杂无关。由于MR方法选择的SNP遵循亲代等位基因随机分配给子代的遗传原则,受到的环境和后天生活的作用很小,即理论上可认为工具变量与社会经济文化等环境因素是相互独立的[15]。
1.3 SNP筛选从BMI的GWAS汇总数据中筛选出有意义的SNP(以P<5×10-8为筛选条件);设定连锁不平衡系数r2为0.001,连锁不平衡区域宽度为10 000 kb,以保证各个SNP相互独立,排除基因多效性对结果的影响[16-17]。从T2DM的GWAS汇总数据中提取上述筛选出的BMI相关SNP;设定最小r2>0.8,缺失的SNP用与其具有高度连锁性的SNP代替,删除无替代位点的SNP[15]。汇总上述两个数据集的信息,同时剔除与T2DM直接相关的SNP(P<5×10-8)[18]。
1.4 因果关系验证方法采用MR-Egger回归、加权中位数法(weight median estimator,WME)、随机效应逆方差加权法(inverse-variance weighted,IVW)、加权模型4种回归模型,以SNP为工具变量,验证暴露(BMI)与结局(T2DM)的因果关系。其中,IVW法不需要个体层面数据,可使用汇总数据直接计算因果效应值。MR-Egger回归通过计算每个SNP与T2DM的相关性(Y)及SNP与BMI的相关性(X),然后拟合线性函数。WME法计算第j个SNP所对应的暴露-结局的因果效应估计值(βj)。应用Cochran's Q检验判断SNP的异质性[19];若存在异质性,则关注IVW模型结果;采用Leave-one-out方法进行敏感性分析。上述方法均使用R 4.0.4软件中的TwoSampleMR包实现,检验水准α=0.05。
2.1 筛选出的SNP信息经过几次筛选,T2DM数据集获得465个SNP,交集情况见图1,经初步敏感性分析后剔除一个离群,同时排除13个模棱两可的SNP,最终纳入451个SNP,部分SNP基本信息见表1。MR-Egger回归截距项为0.000 3(P=0.826 1),提示筛选出的SNP与T2DM不存在基因多效性。
图1 暴露与结局SNP数据交集
表1 最终筛选出的部分SNP的信息
2.2 因果关系验证4种方法的回归结果见表2,均显示BMI为T2DM患病的危险因素,BMI每增加1个标准差,T2DM发病风险约增加2.9倍。
2.3 异质性检验散点图和漏斗图见图2。漏斗图显示纳入的所有SNP基本对称,但MR-Egger回归结果显示统计量Q=1 289.365(P<0.001),提示SNP间存在异质性,故关注随机效应IVW模型。
图2 孟德尔随机化散点图(左)和漏斗图(右)
2.4 敏感性分析经Leave-one-out检验,依次剔除各SNP,余下的450个SNP的β值在1.028~1.055(P<0.001);去除任何一个SNP后,余下450个SNP的结果都在无效线的右侧,并且都与总效应的区间相近;说明无论去除任意一个SNP都不会对结果产生较大影响,表明本研究的MR结果是稳健的。
既往贺媛等[2]的研究发现,在中国全人群中T2DM患病率随BMI的上升而增加,在BMI由正常升至2级肥胖后T2DM患病风险增加了5.9倍。刘俊等[20]一项包含美国45岁以上女性、伊朗和澳大利亚20岁以上全人群、芬兰25岁以上全人群及欧洲中年白人的meta分析结果也表明,超重者T2DM患病风险是体重正常者的2.59倍,而肥胖者是体重正常者的6.28倍。王超等[21]发现在超重和肥胖的中国人群中,肥胖人群患T2DM的风险比超重人群显著增加。Marie-Eve等[23]综述研究结果也表明,丹麦人群和挪威20~61岁人群中肥胖、腰围、腰臀比和BMI等肥胖指标的增加等能够促进T2DM相关指标的增加。Abuyassin等[24]研究发现,阿拉伯人BMI的增加是T2DM发病的危险因素。Mokdad等[25]的研究表明,BMI处于30~35的美国男性T2DM患病风险是BMI正常男性的10倍,而女性则达20倍。但是也有少数研究结果显示BMI与T2DM无关,比如张锐芝等[22]发现中国60岁以上老年人BMI与T2DM的优势比OR为0.992,但是无统计学意义(P=0.761)。
我国肥胖人群比发达国家少,但T2DM患者却比发达国家多,说明BMI是T2DM的一个独立危险因素但可能不是必须因素或最主要因素,而是多种因素共同作用的结果。本研究基于GWAS汇总数据,以BMI高度相关的SNP为工具变量,使用两样本MR法探索BMI与T2DM的因果关系,结果显示:BMI是T2DM患病的危险因素;随机效应模型IVW结果表明,BMI每增加一个单位,人群T2DM患病风险增加2.842倍;提示预防T2DM应更关注通过饮食和生活习惯的调整,控制体重和BMI。
本研究以欧洲人群为例,验证了MR方法应用于慢性病发病风险研究的可行性。探索中国人与欧洲人T2DM相关遗传位点的差异,从微观层面寻找可预防的符合我国人群特征的T2DM关键危险因素,对我国T2DM早期预防也有指导意义。但是,目前亚洲和中国人群GWAS数据较少,而其他数据库的数据又难以获取和整理,所以本研究结果还需结合临床和随机对照试验在中国人群中进行验证。