基于易感基因的麻风风险预测模型的构建及效能研究

2016-11-10 11:24王真真刘2张福仁
中国麻风皮肤病杂志 2016年10期
关键词:麻风家族史位点

王真真刘 红,2张福仁,2

·论著·

基于易感基因的麻风风险预测模型的构建及效能研究

王真真1刘 红1,2张福仁1,2

目的: 基于麻风全基因组关联研究(GWAS)发现的18个易感位点,联合流行区域及家族史信息,建立中国人群麻风风险预测模型。方法: 通过SNP位点等权重风险评分(GRS)和加权遗传风险评分(wGRS)法对5792例麻风患者和8097名正常对照计算易感位点的联合效应。以不同的方式联合遗传风险评分、地域及家族史信息,构建麻风风险预测模型,并绘制受试者工作曲线来评价模型。结果: wGRS联合地域及家族史信息建立的风险预测模型最佳,其曲线下面积(AUC)为0.758(95%CI: 0.750~0.766)。结论: 麻风易感位点间存在显著的联合作用,wGRS联合地域及家族史信息建立的风险预测模型,能更好地预测麻风发病风险。

麻风; 风险预测模型; 全基因组关联分析

有效的麻风风险预测模型是用于高危个体筛查、实现“精准”化学预防的前提,课题组既往的研究[1-5]使风险预测模型的建立成为可能。本研究旨在利用GWAS发现的中国人群麻风易感位点,联合地域及家族史信息建立麻风风险预测模型,为麻风高危个体的筛查提供依据。

1 对象和方法

1.1研究对象 共纳入13 889人,其中麻风患者5792例,正常对照8097名。病例和对照选取自实验室既往GWAS研究发现及验证阶段的样本[1-5]。实验室共有基因分型样本19 968例,其中麻风患者8313例,正常对照11 655名。为使模型更加准确,本研究剔除地域信息不明确和基因型分型有缺失的样本6079例。最终本研究共纳入麻风患者5792例,正常对照8097名。

1.2麻风易感基因位点的选择 本研究共选择既往报道的18个独立的麻风易感位点[1-5]纳入风险模型。其中OR采用已报道的meta之后最终值(表1)。

1.3SNP位点风险评分(genetic risk score,GRS) 采用两种不同的方法计算SNP位点风险评分。等权重法(count risk alleles,cGRS):在对风险等位基因进行合并时,不考虑SNP位点本身对疾病的单独效应,直接按0,l,2(某个体携带某一SNP风险等位基因的个数)赋值后求和。加权法(weight method,wGRS):在对风险等位基因进行合并时,考虑每个SNP本身对疾病发生的单独效应,假设每个位点对麻风易感性的影响不同,但与其OR值有关,此时wGRS为每个SNPβ值ln(OR)加权后的平均风险等位基因个数[8]。

1.4风险预测模型的构建 本研究利用18个麻风风险位点、样本地域信息和家族史信息分别构建了4种风险模型。模型1 GRS联合地域信息;模型2 GRS联合地域信息及麻风家族史信息;模型3 wGRS联合地域信息;模型4 wGRS联合地域信息及麻风家族史信息。采用Hosmer-Lemeshow拟合优度检验作为评价以上模型拟合优良性的指标。利用受试者特征(ROC)曲线及计算曲线下面积(AUC)评价模型的预测效果。

1.5统计学方法 风险模型的构建、Hosmer-Lemeshow拟合优度检验、ROC曲线以及AUC的计算均采用SPSS 19.0软件完成。

2 结果

2.1麻风风险位点的联合作用 既往报道的18个独立的麻风易感位点[1-5]纳入风险模型。其中OR采用报道的meta之后最终值(表1)。为进一步分析显著位点的联合作用,本研究计算了每个样本18个易感位点的GRS和wGRS。GRS分布显示病例组和对照组GRS分布有很大不同(图1)。相比于对照组,病例组的GRS分布明显偏右,也就是说随着GRS的升高,病例组所占的相对比例也逐渐升高。

图1 麻风病例和正常对照携带风险位点的个数分布图

2.2麻风风险预测模型的构建及模型间的比较 四种风险模型的Hosmer-Lemeshow拟合优度检验均P>0.05,说明四种风险模型都具有一定的拟合效果。四种建模ROC曲线(图2)表示,以wGRS联合地域及家族史信息的风险模型(模型4)最优。如果仅用GRS和地域信息(模型1),模型的AUC为0.666(95%CI: 0.657~0.675)。加入家族史信息(模型2),模型的AUC提高了11.3%(0.666 vs.0.741)。而wGRS联合地域及家族史信息(模型4)的AUC进一步提升至0.758(95%CI:0.750~0.766)(表2)。综合以上结果,wGRS联合地域及家族史的风险模型具有最好的预测结果,因此应以此方法建立麻风的风险预测模型。

表1 18个麻风易感位点以及OR值、β值

图2 四种风险模型的ROC曲线图

表2 四种风险模型的AUC值,P值以及95%的置信区间

3 讨论

遗传流行病学、双生子研究及家族聚集性分析已经证实麻风具有较强的遗传易感性,其遗传度达57%[6,7]。麻风的全基因组关联研究(GWAS),先后定位了18个中国人群的易感基因位点。本文利用这18个易感基因位点计算个体的GRS和wGRS,并联合样本的地域及家族史信息,以4种不同方式建立了麻风风险预测模型。结果表明,基于易感基因计算出的GRS和wGRS与麻风易感性显著相关。联合家族史的风险模型优于不联合家族史的风险模型,利用加权法(wGRS)的风险模型优于等权重法(GRS)的风险模型。利用wGRS联合地域及家族史的风险模型最优。

基于GWAS定位的易感基因位点,以其作为风险因素,建立风险预测模型进行临床风险预测,成为降低复杂疾病发生率、实现其一级预防的新方向。国际上对乳腺癌、II型糖尿病和冠心病等复杂疾病,已成功利用其易感基因及相关SNPs为参数构建了疾病风险预测模型,在临床应用中初见成效[8-10]。本研究基于GWAS的研究结果首次构建了中国人群麻风的风险预测模型,最优模型的AUC为0.758。麻风作为一种复杂性疾病,受遗传因素和环境因素的双重影响。目前已知的GWAS发现的易感位点均为常见变异,对疾病易感性的效应较低(OR均<2.0)仅能解释一小部分的遗传易感性,这可能是预测能力不够高的一个原因。随着中国人群麻风易感基因的进一步发现,模型的预测能力也将随之提高。

本研究的不足之处:本研究是病例对照研究,论证能力不及队列研究强,而且由于实验设计的不同易导致结果出现偏差而影响信息的准确性。并且由于是回顾性研究,样本的疾病史等信息不完善,故无法纳入模型。影响麻风的环境因素多种多样,而本研究只探讨了地域的影响。因此,更多麻风相关遗传位点的发现和更大样本的中国人群前瞻性队列研究,将进一步改善本研究的结果,从而更好地实现在中国人群中进行麻风高危人群的筛查。

[1]Zhang FR,Huang W,Chen S,et al.Genome wide association study of leprosy[J].N Engl J Med,2009,361(27): 2609-2618.

[2]Zhang F,Liu H,Chen S,et al.Identification of two new loci at IL23R and RAB32 that influence susceptibility to leprosy[J].Nat Genet,2011,43(12):1247-1251.

[3]Liu H,Irwanto A,Tian H,et al.Identification of IL18RAP/ IL18R1 and IL12B as leprosy risk genes demonstrates shared pathogenesis between inflammation and infectious diseases[J].Am J Hum Genet,2012,91(5):935-941.

[4]Liu H,Bao F,Irwanto A.Association study of TOLL and CARD with leprosy susceptibility in Chinese population[J]. Hum Mol Genet,2013,22(21):4430-4437.

[5]Liu H,Irwanto A,Fu X,et al.Discovery of six new susceptibility loci and analysis of pleiotropic effects in leprosy[J]. Nature Genet,2015,47(3):267-271.

[6]Casanova JL,Abel L.Genetic dissection of immunity to mycobacteria:the human model[J].Annu Rev Immunol,2002,20:581-620.

[7]Fernando SL,Britton WJ.Genetic susceptibility to mycobacterial disease in humans[J].Immunol Cell Biol,2006,84(2):125-137.

[8]Mealiffe ME,Stokowski RP,Rhees BK,et al.Assessment of clinical validity of a breast cancer risk model combining genetic and clinical information[J].J Natl Cancer Inst,2010,102(21):1618-1627.

[9]de Miguel-Yanes JM,Shrader P,Pencina MJ,et al.MAGIC Investigators;DIAGRAM+Investigators.Genetic risk reclassification for type 2 diabetes by age below or above 50 years using 40 type 2 diabetes risk single nucleotide polymorphisms[J].Diabetes Care,2011,34(1):121-125.

[10]Ripatti S,Tikkanen E,Orho-Melander M,et al.A multilocus genetic risk score for coronary heart disease:case-control and prospective cohort analyses[J].Lancet,2010,376(9750):1393-1400.

(收稿:2016-03-23 修回:2016-06-17)

Risk prediction model of leprosy based on the susceptibility genes and its power study

WANG Zhenzhen1,LIU Hong1,2,ZHANG Furen1,2.
1.Shandong Provincial Institute of Dermatology and Venereology,Academy of Medical Sciences,Jinan 250022,China;2.Shandong Provincial Dermatology Hospital,Shandong University,Jinan 250000,China
Correspondence author:ZHANG Furen,E-mail:zhangfuren@hotmail.com

Objective:To evaluate the risk of leprosy by considering information on epidemic region and family history when combined with the 18 known susceptibility loci identified by genome-wide association studies(GWASs)associated with leprosy.Methods:Genetic risk score(GRS)and weighted genetic risk score(wGRS)were calculated to evaluate the joint effects of 18 susceptibility loci.Multiple models combining genetic loci and region and family history information were established.Receiver operating characteristic curve analysis was used to compare the power of different predictive models.Results:The model incorporating wGRS and information on epidemic region and family history was the best one to predict leprosy risk in Chinese population,with all area under curve of 0.758(95%CI:0.750~0.766).Conclusion:Eighteen known susceptibility loci identified by GWASs jointly influence the risk of leprosy.The combination of 18 known susceptibility loci and information on epidemic region and family history can improve the performance of risk predictive model for the occurrence of leprosy.

leprosy;risk prediction model;GWAS

山东省自然科学基金青年基金(编号:ZR2015PH027)

山东省科技发展计划(编号:2014GSF118001)

山东省自然科学基金三院联合基金重点项目(编号: ZR2014YL044)

1山东省皮肤病性病防治研究所,山东省医学科学院,济南,250022 2山东省皮肤病医院,山东大学,济南,250000

张福仁,E-mail:zhangfuren@hotmail.com

猜你喜欢
麻风家族史位点
郑瑞丹:重视询问慢性乙型肝炎患者的肝癌家族史
携带线粒体12S rRNA基因突变的新生儿母系家族史分析
镍基单晶高温合金多组元置换的第一性原理研究
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
关注麻风,消除歧视, 共同走向文明进步
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
一种改进的多聚腺苷酸化位点提取方法
有家族史与无家族史的强直性脊柱炎临床表现异同的研究
在妈祖的庇佑下:女性家族史与民间信仰
贵阳市边远农村村民麻风健康知识调查与干预