DNA甲基化在长期空气污染暴露与心血管疾病高危人群血脂水平关系中的中介效应

2021-02-22 03:35庞慧芳陈伯望吴超群侯丽波王思铭王艳萍高岩
环境与职业医学 2021年1期
关键词:甲基化基因组位点

庞慧芳,陈伯望,吴超群,侯丽波,王思铭,王艳萍,高岩

1.国家心血管病中心, 北京 102300

2.中国医学科学院阜外医院国家心血管疾病临床医学研究中心,北京 102300

空气污染已成为全球一个主要公共卫生问题。空气污染的成分包括但不限于颗粒物、臭氧(ozone,O3)、二氧化硫(sulfur dioxide,SO2)、氮氧化物、一氧化碳(carbon monoxide,CO)、苯、炭黑、多环芳烃和有毒金属。暴露于空气污染对人类健康包括心血管系统[1]、呼吸系统[2]和脑血管系统[3]的不良影响已得到充分证明。

血脂异常表现为总胆固醇(total cholesterol,TC)、甘油三酯(triglyceride,TG)和低密度脂蛋白胆固醇(low-density lipoproteincholesterol,LDL-C)水平升高以及高密度脂蛋白胆固醇(high-density lipoproteincholesterol,HDL-C)水平降低,已成为一个公认的心血管疾病危险因素[4]。大量研究证明,血脂水平与总死亡率、心血管疾病死亡率呈正相关[5]。之前也有一些研究已经报道了空气污染物暴露和血脂水平之间的关系[6-9],而且自主功能障碍[10]、炎症[11]、氧化应激[12]、凝血[13]和内皮功能障碍[14]被认为是目前空气污染对心血管产生不良影响的潜在生物学机制。然而,空气污染暴露与血脂水平关系间确切的分子生物学机制目前尚不清楚。

近年来,表观遗传学被认为是环境暴露和疾病发展之间的一个桥梁,可能介导环境与基因之间的相互作用[15]。DNA甲基化作为表观遗传学修饰的一个重要类型,通过一个甲基共价结合在胞嘧啶-腺嘌呤二核苷酸(5'-C-phosphate-G-3',CpG)的胞嘧啶C5上,调控基因转录活性,最终改变生物学功能。许多研究使用全基因组甲基化分析方法,已揭示了长期或短期环境空气污染会导致不同DNA位点的甲基化[16-19]。同时,DNA甲基化与血脂特性之间的相关关系也已经被证实[20-22]。然而,DNA甲基化是否介导了空气污染暴露与血脂水平之间的关系,目前还没有相关的报道。本研究以心血管疾病高危人群为研究对象,通过因果推理检验(causal inference test,CIT)的方法,探讨各项空气污染暴露对血脂[TC、TG、LDL-C、HDL-C和非高密度脂蛋白胆固醇(nHDL-C)]影响的表观遗传学生物机制。

1 对象与方法

1.1 研究人群

该研究样本来源于“冠心病医疗结果评价和临床转化研究-百万人群项目(China Patient-Centered Evaluative Assessment of Cardiac Events Million Persons Project,China PEACE Million Persons Project)[23]。此项目所有高危患者在基线均进行了心电图检测,心脏及颈动脉超声检查,血液和尿液分析以及生活方式和病史的问卷调查。该项目通过了国家心血管病中心伦理委员会的批准(2018-1022)。所有参与者在参与项目前均签署了知情同意书。本研究选择在2016年1月—2017年5月期间入选的高危心血管疾病患者样本,且所有患者均进行了两年的随访。

本研究基于以下入选标准在上述人群中筛选受试者:①有完整的基线期数据,主要包括血脂指标和一些用于调整分析模型的协变量;②在居住地点10 km范围内有空气质量监测站,记录了从患者采集血样至之前1年内的完整环境空气污染数据;③有全基因组甲基化芯片检测数据。

本研究共筛选出176例研究对象符合以上入选标准。研究对象来自15个省(自治区)的61个城市,包括广西壮族自治区、贵州省、河南省、湖北省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、陕西省、四川省、西藏自治区、云南省和浙江省。

1.2 空气污染暴露评估

本研究采用政府气象部门在研究对象居住的县级区域每日发布的细颗粒物(fine particulate matter with median aerodynamic diameter≤2.5 μm,PM2.5)、可吸入颗粒物(particulate matter with median aerodynamic diameter ≤10 μm,PM10)、二氧化氮(nitrogen dioxide,NO2)、SO2、CO及O3数据评价空气污染暴露。每个空气污染监测站距研究对象居住地址在10 km范围以内,每位研究对象从采血日至之前1年的每日空气污染数据的平均值被定义为每个研究对象年均各项污染指数暴露水平。

1.3 生化指标检测和变量定义

所有样本生化指标在国家心血管病中心实验室检测。采用AU680分析仪(Beckman Coulter,美国)测定血脂(TC、LDL-C、HDL-C和TG)和高敏C反应蛋白的水平。心血管疾病高危患者的定义已在以前的文章中报道[23]。本研究高血压定义为收缩压≥140 mmHg,或舒张压≥90 mmHg,或服用抗血压药物。血脂异常定义为TC浓度≥6.2 mmol·L-1,或LDL-C浓度≥4.1 mmol·L-1,或服用降脂药物。糖尿病定义为禁食至少8 h的血糖水平高于 7 mmol·L-1,或随机血糖高于 11.1 mmol·L-1,或服用任何降糖药物。吸烟指数定义为每日吸烟数量乘以吸烟年限。年平均温、湿度是指由距离China PEACE Million Persons Project项目点最近的空气监测站发布的自采血日期至采血前1年的每日温度及湿度的平均值。

1.4 全基因组DNA甲基化评估

采用Chemagic 360全自动DNA提取仪(PerkinElmer,美国)及Chemagic DNA Buffy Coat 200试剂盒(PerkinElmer,美国)提取人基因组DNA。使用 DropSense 96分光光度计(Caliper,美国)对提取的基因组DNA进行定量及质检。采用 Infinium™ Human Methylation EPIC(850K)芯片(Illumina,美国)检测基因组DNA的甲基化状态。甲基化检测首先使用EZ DNA 甲基化试剂盒(zymo Research,美国)对DNA样本(500 ng)进行重亚硫酸化处理,具体步骤遵循Infinium HD甲基化检测说明书。最初的质量控制使用R中的CHAMP包,以下位点的探针将被过滤掉:①检测P> 0.01;②在至少5%的样品中探针数< 3个;③non-CpGs 位点探针;④Multi-hit探针。最终共有814 318个位点通过了质控标准。每个位点的甲基化水平通过β值来反映,并采用BMIQ(beta mixture quantile dilation)方法进行数据的归一化处理。

1.5 统计学分析

连续变量以中位数(第25,75百四分位数)[M(P25,P75)]及均值±标准差(±s)分别表示,分类变量以频数(构成比)表示。

在进行表观基因组关联分析之前,先对176例样本的甲基化数据进行主成分分析,并将前4个方差比例>1%的主成分作为协变量纳入模型进行调整。同时,我们选取表观基因组关联研究中与NO2暴露相关的5 615个DNA甲基化位点(P< 0.01),用于本研究的相关性分析。

本研究采用CIT分析方法[24]来评估DNA甲基化在空气污染暴露与血脂水平之间的中介效应。CIT分析包括4个线性回归模型,当前3个模型满足P< 0.05,并且第4个模型满足P> 0.05时,则表明存在中介效应。具体4个模型如下:模型1评估空气污染物暴露(PM2.5、PM10、NO2、SO2、CO和O3)分别与TC、TG、LDL-C、HDL-C、nHDL-C水平之间的相关性。此模型调整了年龄、性别、体重指数(body mass index,BMI)、目前吸烟情况、饮酒情况、高血压和糖尿病(以下简称通用协变量)。模型2评估空气污染物暴露与全基因组DNA甲基化水平的相关性。此模型除了调整通用协变量,还调整了相应的血脂指标、细胞组分(CD4+ T细胞、CD8+ T细胞、B细胞、NK细胞、单核细胞和嗜中性粒细胞)、4个主成分及年平均温度和湿度。模型3评估DNA甲基化与各项血脂指标(TC、TG、LDL-C、HDL-C和nHDL-C)的相关性。此模型除了调整通用协变量,还调整了空气污染物暴露、细胞组分和4个主成分。模型4在调整通用协变量及相应位点DNA甲基化水平后,评估空气污染物暴露与各项血脂指标是否不具有相关性。在CIT分析的前3个模型中,P< 0.05被认为关联具有统计学意义;第4个模型使用bootstrap方法随机抽样,重复建模1 000次,统计1 000个P值的分布情况,P值的中位数> 0.05被认为是不相关。CpG位点所在基因采用Illumina和加州大学圣克鲁兹分校(University of California Santa Cruz,UCSC)提供的UCSC数据库(GRCh37/hg19)进行注释。使用的统计分析软件为R 3.5。

2 结果

2.1 研究人群的基线期特征

表1显示,176位研究对象的年龄为(61.7±8.1)岁,男性100例(56.8%),血脂异常患者为31例(17.6%)。临床检验结果显示,受试者基线期的血脂TG、HDL-C、TC、LDL-C、nHDL-C平均水平分别为(1.5±0.9)、(0.9±0.3)、(4.6±1.3)、(2.7±0.9)、(3.6±1.2)mmol·L-1。空气污染物NO2、SO2、PM10、PM2.5、O3、CO的 年均暴露质量浓度(后称浓度)分别为(33.2±12.8)、(24.2±10.9)、(98.1±38.9)、(55.4±20.1)、(91.1±14.4)、(1.0±0.3)μg·m-3。

表1 研究人群的基线期特征(n=176)Table 1 Baseline characteristics of study population (n=176)

2.2 CIT分析

2.2.1 空气污染与血脂水平的相关性 模型1在调整通用协变量后,NO2暴露(以每增加10 μg·m-3为1个单位)分别与TC、LDL-C和nHDL-C[估计值(b)=0.259,标准误(Sb)=0.084,P=0.002;b=0.173,Sb=0.059,P=0.004;b=0.227,Sb=0.082,P=0.006)]水平相关(表2)。其他空气污染物(SO2、PM10、PM2.5、O3、CO)与任何血脂指标水平均不具有相关性(P> 0.05)。因此,后续分析仅在NO2暴露与TC、LDL-C、nHDL-C水平之间进行。

表2 NO2暴露与研究人群(n=176)血脂水平的相关性分析Table 2 Correlation between NO2 exposure and blood lipid level in study population (n=176)

2.2.2 NO2暴露与DNA甲基化的相关性 模型2在调整通用协变量、血脂水平(TC、LDL-C、nHDL-C)、细胞组分、4个主成分及年平均温度和湿度后,结果显示,与NO2暴露相关的DNA甲基化位点(P< 0.05)分别有5 570个(调整TC)、5 560个(调整LDL-C)、5 574个(调整nHDL-C)。

2.2.3 DNA甲基化与血脂水平的相关性 模型3在调整通用协变量、NO2暴露、细胞组分和4个主成分后,结果显示,在模型2中与NO2暴露相关的甲基化位点中分别有5 529个、5 506个、5 104个位点与TC、LDL-C、nHDL-C水平相关(P< 0.05)。

2.2.4 NO2暴露与血脂水平的相关性(调整甲基化水平) 在CIT分析的模型1中,NO2与TC、LDL-C和nHDL-C水平具有相关性。在模型4中除了调整通用协变量后,还分别调整了模型3中所有显著位点的DNA甲基化水平,采用bootstrap方法随机抽样,最终在满足P值中位数> 0.05的CpG位点中,介导TC水平的有2个甲基化位点(无注释基因),介导LDL-C的有16个位点(11个有注释基因),介导nHDL-C的有32个位点(23个有注释基因),相关结果见补充材料附表1(www.jeom.org/article/cn/10.13213/j.cnki.jeom.2021.20397)。我们将具有注释基因的CpG位点按照模型4中P值中位数从大到小进行排列,并在表3中列出了介导LDL-C、nHDL-C水平的前10个CpG位点。

表3 DNA甲基化在NO2暴露与LDL-C、nHDL-C水平之间的CIT分析Table 3 CIT analysis on DNA methylation between NO2 exposure and LDL-C and nHDL-C levels

3 讨论

本研究首次探讨了中国心血管疾病高危人群基因组DNA甲基化在空气污染暴露1年与血脂水平之间的中介效应。通过CIT分析发现NO2暴露增加与TC、LDL-C 和nHDL-C水平的升高具有相关性,并且在与NO2暴露相关的5 615个甲基化位点中,分别有2、16、32个CpG位点介导了TC、LDL-C、nHDL-C水平的改变。

关于中国一些地区的空气污染与特定人群血脂之间的相关性研究已有报道。2018年基于中国西北地区金昌前瞻性队列的研究发现,在3 912例Ⅱ型糖尿病人群中,4年时间内NO2日均暴露浓度的增加与LDL-C水平的升高、HDL-C水平的降低具有相关性,SO2、PM10暴露也分别与LDL-C、TC等血脂指标具有相关性[7]。另一则最近的研究报道称,在中国大规模农村人群队列(n=39 057)中,3年时间内NO2平均暴露水平的增加分别与高胆固醇血脂症(TC浓度≥6.22 mmol·L-1)、低α-脂蛋白血症(HDL-C浓度<1.04 mmol·L-1)患病风险增加呈正相关,而PM2.5暴露的增加与TC和LDL-C的升高、TG和HDL-C的降低均具有相关性[9]。但本研究未发现除NO2外的其他空气污染物与血脂水平相关,可能的原因包括:研究样本量少;采用的空气污染暴露是基于1年时间的数据;研究对象为心血管高危人群,相较于健康人有更多的混杂因素。

CIT分析表明 1年时间的NO2暴露会通过特定位点的DNA甲基化作用影响TC、LDL-C和nHDL-C的水平。例如,高甲基化状态的cg23050405(ESR1基因)和去甲基化状态的cg05942334 (FSCN3基因)位点介导了NO2暴露与LDL-C之间的相关性。其中,雌激素受体1(estrogenreceptor1,ESR1)基因位于6号染色体上,可编码雌激素受体α蛋白质,后者已被证明参与调节血脂代谢相关蛋白的表达,例如载脂蛋白E[25]和LDL受体[26]。

研究报道称ESR1对调节糖异生和脂代谢途径至关重要,降低肝脏ESR1的表达可导致糖稳态失衡和血脂异常[27]。在本次研究中,位点cg23050405处于高甲基化的状态,因而阻碍了注释基因ESR1的正常表达,由此可能导致了LDL-C水平的升高。对于FSCN3基因,其编码的束蛋白3(Fascin-3)是保守的肌动蛋白束蛋白家族的成员之一,由498个氨基酸残基组成,可能与其他的束蛋白(Fascin-1、Fascin-2)一样,可以与F-肌动蛋白结合形成紧密稳定的肌动蛋白束,在细胞黏附和细胞迁移方面发挥重要的作用[28]。此外,人的FSCN3蛋白在11—50残基之间具有一段高度保守的区域,并且这个区域可被蛋白激酶C磷酸化[28]。蛋白激酶C通过调控蛋白激酶级联反应等作用机制参与了多种病理过程,包括血管平滑肌的生长/增殖、血管生成和凋亡、血管炎症和再狭窄、氧化应激、冠心病和动脉粥样硬化等[29]。已有的研究表明,蛋白激酶C被激活后,会引起核因子κB(nuclear factor-κB,NF-κB)的高水平表达,从而导致下游炎症反应和脂质代谢紊乱的发生[30]。在我们的研究中,由于受NO2暴露水平的影响,位点cg05942334呈现为低甲基化的状态,有利于其注释基因FSCN3的表达,进而激活了与血脂水平相关的信号通路和生理过程。本研究发现的具有中介效应的其他的甲基化位点,其注释基因与血脂水平相关的功能研究还没有相关的报道,需要在未来的研究中进一步验证。

本研究存在着一定的局限性:第一,研究样本量比较小,且缺少验证人群;第二,采用研究对象所在县级的空气污染物年均数据作为污染物暴露浓度,可能不能够完全反映每个研究对象所处的空气污染环境,同时没有考虑饮食情况对甲基化的影响;第三,并没有对具有中介效应的CpG位点与其注释基因表达之间的相关性进行深入的功能研究;第四,由于DNA样品不足和资金等问题,我们没有对所筛选出的DNA甲基化位点进行甲基化特异位点验证;第五,该研究结果仅针对中国的高危人群,对于正常人群还需要进一步研究。

综上,本研究发现,在中国心血管病高危人群中,长期NO2暴露与血脂水平升高具有相关性,并且在与NO2长期暴露相关的5 615个甲基化位点中,分别有2、16、32个CpG位点在NO2暴露与TC、LDL-C、nHDL-C水平的相关关系中发挥了中介效应。该研究结果有必要在其他大人群中做进一步的验证。本研究为揭示空气污染导致血脂异常的表观遗传学机制提供了研究基础。

猜你喜欢
甲基化基因组位点
镍基单晶高温合金多组元置换的第一性原理研究
牛参考基因组中发现被忽视基因
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
二项式通项公式在遗传学计算中的运用*
鼻咽癌组织中SYK基因启动子区的甲基化分析
胃癌DNA甲基化研究进展
基因组DNA甲基化及组蛋白甲基化
有趣的植物基因组
全甲基化没食子儿茶素没食子酸酯的制备
含内含子的核糖体蛋白基因转录起始位点情况分析