晋静静 陈凤辉 古再努尔·阿迪力 程祖亨 邱长春 玛依拉·吾甫尔
衰老是生物体长期进化的结果,由基因和环境共同作用,揭示衰老调控机制,实现长寿是生命科学的研究热点。研究发现遗传因素影响寿命的决定度占25%,环境因素占70%,但由于环境因素的随机性,且遗传因素差异是造成个体对环境作出不同反应能力的主要因素[1,2]。因此探究遗传因素有助于揭示基因控制长寿表型,阐明长寿调控机制,实现长寿。新疆维吾尔自治区和田地区长寿人群是目前研究长寿的公认群体,本课题组前期研究表明发现载脂蛋白E和糖皮质激素受体等基因与新疆维吾尔自治区和田地区长寿具有显著相关性[3~5]。然而长寿是由多种基因共同作用的复杂性状,故针对该地区长寿群体单核苷酸多态性(single nucleotide polymorphism, SNP)进行全基因组关联分析(genome-wide association study, GWAS),对于筛选长寿相关SNP易感位点具有重要意义。因此本研究针对新疆维吾尔自治区和田地区长寿群体进GWAS,旨在探究长寿强相关基因与健康状况的相关性。
1.一般资料:选择2012年2月~2015年2月新疆维吾尔自治区和田地区维吾尔族长寿人群(纳入标准[6]:年龄≥90岁者)122例为长寿组,同时纳入该地区同期非长寿人群(纳入标准[6]:随访3代以内,家族人群年龄均<90岁者)98例为对照组,两组研究人群的排除标准:①外地迁移至此的人群;②因人口流动或失聪、失明、失语导致无法有效完成随访者;③合并精神疾病或认知障碍者;④未签署知情同意书者。其中长寿组患者年龄为91~109岁,平均年龄为99.74±8.48岁;长寿组中男性55例,女性67例;饮酒者23例,非饮酒者99例;小学及以下学历者99例,初中学历者14例,高中及以上学历者9例。对照组患者年龄为61~73岁,平均年龄为66.35±7.83岁;99例患者中,男性44例,女性54例;饮酒者16例,非饮酒者80例;小学及以下学历者81例,初中学历者11例,高中及以上学历者6例。两组患者性别、是否饮酒以及学历等一般资料比较,差异无统计学意义(P>0.05)。
2.长寿强相关基因的GWAS:为筛选与长寿强相关的SNP位点,本课题组抽取研究对象的静脉血5ml,采用 pooling DNA 杂交对长寿组/对照组的全基因组扫描差异;通过Affymetrix SNP 6.0 芯片杂交技术完成了基于 pooling DNA 的研究人群SNP 分型分析,筛选出可能与长寿相关的SNP位点;同时应用 Sequenom Mass Array 技术平台(Sequenom Chipll-G384芯片)对可能与寿命相关的SNP位点进行分型分析,完成对于长寿强相关基因验证。长寿强相关的SNP的判断标准参考文献[7],应用Logistic分析,以OR≥4.00,P<0.05为强正相关。
3.健康资料统计:测量研究对象的体重指数(body mass index, BMI)、空腹血糖(fasting blood glucose, FBG)水平、收缩压(systolic blood pressure, SBP)和舒张压(diastolic blood pressure, DBP)以及测定血清总胆固醇(total cholesterol, TC)、甘油三酯(triglyceride, TG)、低密度脂蛋白胆固醇(low density lipoprotein cholesterol,LDL-C) 以及高密度脂蛋白胆固醇(high density lipoprotein cholesterol, HDL-C)等血脂水平。
1.长寿强相关基因的GWAS的比较:本研究通过Affymetrix SNP 6.0 芯片对研究对象进行GWAS发现两组之间有42个SNP位点存在差异(P<0.05),随后将这42个SNP位点应用 Sequenom Mass Array 技术平台将进行群体验证发现rs4449651 TT基因型(OR=5.168,P=0.026)、rs1718307 TT基因型(OR=5.469,P=0.002)、rs4316818 TT基因型(OR=4.193,P=0.006)以及rs2834384 GG型(OR=4.744,P=0.025)与长寿呈强相关性,详见表1。
表1 长寿强相关基因的GWAS[n(%)]
LAMA2.层粘连蛋白α2;PAH.苯丙氨酸羟化酶;ACE3.血管紧张素转换酶-3;MRPS6.线粒体核糖体蛋白-S6
2.健康相关指标比较:通过随访调查研究对象的健康相关指标,本研究发现长寿组人群BMI、FBG、TG、TG以及LDL-C水平降低,而HDL-C水平,与对照组比较差异有统计学意义(P<0.05),两组人群SBP及DBP比较,差异无统计学意义(P>0.05),详见表2。
表2 两组研究对象的健康相关指标比较
Δ1mmHg=0.133kPa
3.健康指标与强相关基因多重线性回归:将BMI、FBG、TC、TG、HDL-C以及LDL-C健康相关指标分别作为应变量,将rs4449651(基因型设置哑变量:AA=1,AT=2,TT=3)、rs1718307(基因型设置哑变量:AA=1,AT=2,TT=3)、rs4316818(基因型设置哑变量:CC=1,CT=2,TT=3)以及rs2834384(基因型设置哑变量:TT=1,GT=2,GG=3)作为自变量,采用多重线性回归分析健康相关指标与基因型之间的依存关系。BMI和rs4449651、rs1718307、rs4316818以及rs2834384均具有相关性(P<0.05),FBG水平与rs4449651及rs1718307具有相关性(P<0.05),TC水平则与rs1718307、rs4316818以及rs2834384呈相关性(P<0.05),TG水平与rs2834384呈相关性(P<0.05),而HDL-C以及LDL-C则与ACE基因rs4316818位点以及MRPS6基因rs2834384位点呈相关性(P<0.05),详见表3。
表3 健康指标与强相关基因多重线性回归
揭示长寿基因变异度是目前生命科学研究热点,然而目前有关长寿基因的研究多局限于单一基因的,而长寿是由遗传及环境因素控制的复杂的生物表型,受多基因累积控制,GWAS是在全基因组范围内筛选出与生物表型相关的SNP的检测手段[8]。因此本课题组采用GWAS进行多基因整合研究,探究了健康表型与SNP位点的相关性,揭示了长寿与多基因效应之间的关系。
本研究通过Affymetrix SNP 6.0 芯片杂交技术完成研究对象的可疑长寿相关SNP位点筛选,同时应用 Sequenom Mass Array 技术平台完成验证确定出与研究人群长寿的强相关SNP易感位点,笔者研究发现,LAMA2基因 rs4449651 TT基因型、PAH 基因rs1718307 TT基因型、ACE3基因rs4316818 TT基因型以及MRPS6基因 rs2834384 GG型共4个基因型存在强相关性,这与国外研究者Karimov等[9]的研究结论较为一致。同时笔者查阅相关文献发现LAMA2基因是编码细胞外基质的主要基因,其Alu(I/D) 多态位点变异同样影响人群寿命[8,10]。Szpakowicz等[11]研究则表明MRPS6基因SNP位点与心肌梗死的发生率及预后效果有关,该基因SNP位点变异可导致心肌梗死发生率增加。而PAH基因可表达苯丙氨酸羟化酶,该基因变异是导致苯丙酮尿症的主要原因[12]。但目前有关PAH基因与长寿之间关系的报道较少,仍需进一步探究。
血糖升高是心脑血管疾病的危险因素,本课题组通过采集研究对象的健康相关指标,发现长寿组人群BMI及FBG水平较低,这提示长寿人群健康状况优于对照组人群,同时笔者采用多重线性回归发现上述健康相关指标分别受1种及以上长寿相关基因控制,这不仅提示长寿是多种基因的累积效应,同时也表明GWAS进行多基因整合研究对于揭示长寿机制的重要性。血糖水平升高则引起微血管病变,引起BMI升高,是导致心脑血管及代谢性老年疾病的重要原因[13]。本研究发现BMI与LAMA2、PAH、ACE3及MRPS6基因均具有相关性,同时FBG与LAMA2及PAH具有相关性。查阅文献笔者发现,ACE3可通过减轻胰腺细胞氧化应激以及调节胰岛细胞微环境,达到提高胰岛β细胞功能的作用,而MRPS6则通过调节糖脂代谢达到稳定血糖的效果[14,15]。因此LAMA2及PAH 可能通过调节并优化了体内血糖代谢系统,减少了血糖相关疾病的发生,进而影响了长寿。
血脂代谢紊乱导致心脑血管动脉粥样硬化等疾病,是引起老年群体死亡的重要原因[16,17]。本课题发现长寿组人群TG、TG以及LDL-C水平降低,而HDL-C水平升高,这提示长寿人群的血脂代谢优于对照组,同时本研究结果表明TG、TG、LDL-C以及HDL-C水平与ACE3及MRPS6基因均呈相关性。而国内有研究者同样研究发现,ACE基因SNP位点与长寿现象之间密切相关,与本课题GWAS结果一致。而流行病学研究表明,MRPS6基因可降低心肌梗死等心脏疾病的发生。而本研究表明MRPS6基因可调节血脂系统平衡,这是解释MRPS6基因可降低心脏相关疾病发生,延长寿命的潜在机制。
综上所述,本研究通过GWAS进行多基因整合研究,发现LAMA2基因 rs4449651、PAH 基因rs1718307、ACE3基因rs4316818以及MRPS6基因 rs2834384共4个基因型与长寿呈强相关性,同时与研究人群的BMI、血糖以及血脂等健康指标呈相关性。