鸡TRAF6基因外显子区功能性SNP预测与分析

2022-01-26 06:29赵采芹王燕碧邢静如石海英段志强
山地农业生物学报 2022年1期
关键词:位点功能性氨基酸

赵采芹,王燕碧,唐 宏,邢静如,石海英,段志强*

(1.贵州大学 高原山地动物遗传育种与繁殖教育部重点实验室,贵州 贵阳 550025;2.贵州大学 贵州省动物遗传育种与繁殖重点实验室,贵州 贵阳 550025)

肿瘤坏死因子受体相关因子6(TRAF6)是肿瘤坏死因子受体相关因子家族(TRAFs)中研究最为广泛的成员之一。与TRAFs家族其他成员不同的是,TRAF6作为胞内重要的多功能衔接分子和E3泛素连接酶,能特异性识别氨基酸序列,从而参与白介素1受体/Toll样受体(IL-1/TLR)和肿瘤坏死因子受体家族等炎症信号通路,通过激活信号通路,对免疫细胞的存活和激活及其重要。此外,TRAF6蛋白在人和不同动物的组织中广泛表达,其中在免疫器官脾脏、胸腺和法氏囊中分布较多,在脑和腿肌中也有表达。研究证实TRAF6蛋白不仅介导信号的传导,还在免疫应答,以及淋巴结、细胞分化与凋亡、多种组织生长发育等过程中也起着关键作用。

大量研究表明,基因多态性与许多疾病的发生相关。Strickson等将小鼠野生型TRAF6的第74位氨基酸L突变为H,小鼠可以存活5周,之后小鼠因为皮肤和器官出现炎症而死亡。与野生型小鼠相比,突变后的L74H没有出现骨质疏松的现象且与野生型的巨噬细胞相比,信号传导和抗炎因子的分泌都减弱了,在TRAF6敲除的小鼠胚胎来源的巨噬细胞中,无法诱导信号传导,也没有细胞因子的产生。陈子文发现,基因多态性位点rs5030411、rs5030416可能参与调节缺血性中风风痰癖阻证的炎性反应过程,从而影响缺血性中风的发病机制。有研究者发现,位于染色体11p12处的基因与类风湿关节炎(RA)和系统性红斑狼疮(SLE)相关,基因内含子处rs540386多态性与自身免疫疾病表型存在关联,基因rs331457多态性可降低皮肤恶性黑色素瘤出现的风险。此外,有研究报道,6基因缺乏会导致胸腺基质异常发育,从而改变免疫耐受性。总之,TRAF6作为一种多功能细胞因子,以上研究表明TRAF6在多种疾病的免疫应答中起着调控作用。

遗传变异可能会改变蛋白质结构,从而导致各种疾病的发生,由此可见,遗传变异与畜禽的抗病育种存在密切关系。而单核苷酸多态性(SNP)是遗传变异的主要形式,预测非同义单核苷酸多态性(nsSNPs)与疾病相关关系的研究在近些年也越来越多。nsSNPs通常被认为是导致畜禽表型和基因型变异的重要因素。nsSNPs又可分两类:若使提前终止蛋白质翻译,而不改变所编码的氨基酸序,则称为无义突变;若导致氨基酸序列发生改变,则称为错义突变,突变位点与疾病的发生相关。

近年来,对的研究多见于人、小鼠和畜禽,此外,也存在于许多非脊椎动物如青蛤以及斑马鱼等鱼类。而目前对于基因的多态性研究大多是其表达对于人类疾病的影响,而对禽类基因nsSNPs的功能研究报道较少。本研究利用生物信息软件对鸡基因编码区nsSNPs进行分析,筛选其中可能具有潜在生物学功能的影响鸡抗病育种的候选功能性错义突变位点,并预测其可能的作用机理。筛选和分析与鸡免疫相关的基因nsSNPs位点,为后续开展鸡抗病育种工作提供理论参考。

1 材料与方法

1.1 鸡TRAF6基因nsSNPs数据的收集

根据基因的序列号(ENSGALT0000010 5433)从Ensembl genome browser(http://asia.ensembl.org)数据库中进行检索。由dbSNP(https://ncbiinsights.ncbi.nlm.nih.gov/tag/dbsnp/)数据库检索的信息收集各SNPs在基因中位置,筛选出位于编码区的nsSNPs;从dbSNP数据库中检索收集nsSNPs(rs IDs);从UniProtKB数据库(http://www.uniprot.org/)检索氨基酸序列;并使用Origin软件绘制基因的SNPs分布图。

1.2 鸡TARF6基因功能性nsSNPs预测

利用SIFT(http://sift.jcvi.org/)、PROV EAN(http://provean.jcvi.org/seq_submit.php)、

PhD-SNP(https://snps.biofold.org/phd-snp/phd-snp.html)、SNAP2(https://www.rostlab.org/services/SNAP/)四种软件预测分析各nsSNPs对鸡TRAF6蛋白功能的影响,运用R语言绘制四种软件预测结果的韦恩图。

SIFT是一种主要利用SIFT算法,基于氨基酸序列同源性预测氨基酸替代是否影响蛋白功能的软件。PROVEAN是一款对单个或多个氨基酸替换、插入和缺失进行预测的开放性工具。PhD-SNP是一种支持向量机的分类器,基于SVM算法,预测分析目标nsSNPs与疾病是否相关。SNAP2是一种识别有影响和中性变异的工具。

1.3 鸡TRAF6蛋白质稳定性分析

利用I-Mutant2.0(https://folding.biofold.org/i-mutant//pages/I-Mutant2.0_TutSeqVal.html)和Mupro(http://mupro.proteomics.ics.uci.edu/)在线软件预测nsSNP引起蛋白质稳定性的改编。I-Mutant2.0是一个基于支持SVM的工具,可以自动预测单点突变时蛋白质稳定性的变化。

1.4 鸡TRAF6氨基酸多序列比对及进化保守位点分析

利用Clustal Omega(https://www.ebi.ac.uk/Tools/msa/clustalo/)对TRAF6的氨基酸序列进行多序列比对,并使用Jalview软件分析TRAF6氨基酸位点的进化保守性。越是保守的位点发生变异,越可能影响蛋白质的功能。

1.5 鸡TRAF6基因与疾病表型相关nsSNPs预测

MutPred2(http://mutpred.mutdb.org/)是一款可以用于预测突变与疾病相关性的在线工具。预测结果有两个重要分值总分数(g)和属性分数(P),其中g表示氨基酸替换是有害或疾病相关的概率,P则表示蛋白结构或功能是否有影响。结合g和P值,预测结果g>0.5且<0.05的被称为中假设可信,g>0.75且<0.05的被称为假设非常可信。

1.6 鸡TRAF6蛋白质二级和三级结构预测

利用Sopma(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)和SWISS-MODEL(https://swissmodel.expasy.org/interactive)在线软件对鸡TRAF6蛋白及其突变体的二级结构和三级结构分别进行预测,进而评估nsSNPs可能造成的影响。

2 结果与分析

2.1 鸡TRAF6基因nsSNPs的筛选

..鸡基因上的SNPs分布

从Ensembl数据库中检索到基因的转录本TRAF6-203(ENSGALT00000105433),检索发现697个SNPs被标记在鸡基因序列中,其中错义突变、同义突变、3′非翻译区(3′UTR)变异和5′非翻译区(5′UTR)变异分别有8个、20个、5个和1个;415(含2个剪接区变异)个变异位于内含子区,位于基因上游和下游的变异分别有120个和128个。SNPs数量百分比如图1所示。

图1 鸡TRAF6基因上的SNPs分布饼图Fig.1 Pie chart of SNPs distribution on chicken TRAF6 gene

..鸡基因编码区nsSNPs的分布

从dbSNP和Ensembl数据库中共筛选出8个(rs733469223、rs736890315、rs734934585、rs735665 981、rs739156253、rs737140963、rs313558769和rs734774178)nsSNPs位于鸡基因的编码区。通过IBS软件绘制该8个nsSNPs的分布情况如图2所示。

图2 鸡TRAF6基因nsSNPs的分布图Fig.2 Distribution map of chicken TRAF6 gene nsSNPs

2.2 鸡TRAF6基因功能性nsSNPs预测

..SIFT预测功能性nsSNPs

预测的得分表示该位点突变对蛋白质序列的影响。得分>0.05,可以耐受;得分≤0.05,有害。结果显示“有害”的nsSNPs有2个,其ID分别为rs734774178、rs736890315;可耐受的nsSNPs有6个,分别为rs313558769、rs737140963、rs7391562 53、rs735665981、rs734934585、rs733469223(表1)。得分越低,说明该nsSNP对蛋白质的功能影响越大。

表1 SIFT预测鸡TRAF6基因功能性nsSNPsTab.1 Prediction of functional nsSNPs of chicken TRAF6 gene by SIFT

..PROVEAN预测功能性nsSNPs

PROVEAN预测结果分为“有害”和“中性”两类。分数值≤-2.5预测为有害,分数值>-2.5预测为中性。在所分析的8个nsSNPs中,“有害”的nsSNPs有1个,其ID是rs734774178,其余的nsSNPs均为中性(表2)。

表2 PROVEAN预测鸡TRAF6基因功能性nsSNPsTab.2 Prediction of functional nsSNPs of chicken TRAF6 gene by PROVEAN

..PhD-SNP预测功能性nsSNPs

PhD-SNP预测结果分为“疾病”和“中性”两类,可靠性指数(RI)在0~9之间。预测的结果中为疾病的nsSNPs有1个,其ID是rs734774178,表明该位点突变可能致病;其余的7个nsSNPs均为中性(表3)。

表3 PhD-SNP预测鸡TRAF6基因功能性nsSNPsTab.3 Prediction of functional nsSNPs of chicken TRAF6 gene by PhD-SNP

..SNAP2预测功能性nsSNPs

SNAP2的预测结果分为“有影响”和“中性”两类,输出分数值0~100预测为有影响,输出分数值-100~0预测为中性。预测的结果如表4所示,其中预测为有影响的有2个,其ID分别是rs734774178和rs734934585,预测为中性的有6个,分别是rs313558769、rs737140963、rs739156253、rs735665981、rs736890315、rs733469223。

..鸡TRAF6基因功能性nsSNPs预测结果

通过R语言的“Venn”package绘制SIFT、PROVEAN、PhD-SNP和SNAP2四种预测方法预测的韦恩图(图3),四种软件功能性nsSNPs预测结果发现,分别预测到2个V472E、S17R、1个V472E、1个V472E和2个V472E、C20G nsSNPs位点,其中V472E有4种方法预测为有害位点。由此推测,V472E位点可能为鸡基因功能性nsSNPs位点。

图3 预测鸡TRAF6基因功能性nsSNPs的韦恩图Fig.3 The Venn diagram of functional nsSNPs prediction of chicken TRAF6 gene

2.3 鸡TRAF6蛋白质稳定性分析

大多数疾病相关的nsSNPs会影响蛋白质的稳定性。利用I-Mutant2.0和Mupro评估氨基酸替代对突变蛋白质稳定性的影响。自由能变化<0,表示此nsSNPs降低了蛋白质的稳定性,自由能变化>0,表示此nsSNPs增加了蛋白质的稳定性。结果如表5所示,所有突变位点均使TRAF6蛋白质稳定性下降。其中V472E为之前预测的功能性突变位点。

2.4 鸡TRAF6蛋白的多序列比对和进化保守性位点预测

在UniProt数据库中检索TRAF6蛋白在原鸡、火鸡、绿头鸭、鸿雁、黑天鹅和日本鹌鹑中的高度同源序列,通过Clustal Omega软件对TRAF6氨基酸序列进行多序列比对,再使用Jalview软件进行作图分析(如图4所示),在不同物种中不保守的nsSNPs有3个,分别是D16G、S17R和A307T;在不同物种中保守的nsSNPs有5个,分别是C20G、S40G、S40R、T42A和V472E。

表4 SNAP预测鸡TRAF6基因功能性nsSNPsTab.4 Prediction of functional nsSNPs of chicken TRAF6 gene by SNAP

表5 TRAF6蛋白质稳定性评估Tab.5 TRAF6 protein stability assessment

图4 多序列比对图Fig.4 Multiple sequence alignment diagram

2.5 TRAF6突变位点可能的功能后果预测

MutPred2在线工具预测与疾病相关的表型。得分(g)>0.5且<0.05,为中度假设可信;g>0.75且<0.05,为假设非常可信。从表6可以看出,V472E位点的突变会导致蛋白质的稳定性改变,且V472E的功能后果预测为中度置信假设,其他位点的突变均无显著影响。

表6 MutPred2预测鸡TRAF6基因功能性nsSNPsTab.6 Prediction of functional nsSNPs of chicken TRAF6 gene by MutPred2

2.6 鸡TRAF6突变体蛋白质二级结构预测

利用在线软件Sopma对鸡TRAF6蛋白的野生型和8种突变体进行二级结构预测,结果见表7。野生型TRAF6的蛋白质二级结构有,α螺旋(39.45%)、延伸链(11.56%)、β转角(2.39%)、无规则卷曲(46.61%)4种结构。其中,C20G位点的突变均造成了TRAF6蛋白质二级结构的改变,导致了α螺旋百分比下降和无规则卷曲百分比的提高,而A307T位点的突变未能影响α螺旋和无规则卷曲的比例;T42A、S40R、S17R、和D16G位点的突变均导致了α螺旋百分比上升和无规则卷曲百分比的下降;除S17R突变未能影响延伸链的比例外,其他7处突变都导致延伸链百分比下降;V472E和T42A突变都导致β转角比例下降,其余6处突变均导致β转角比例上升。二级结构的变化通过影响蛋白的稳定性从而影响蛋白翻译调控过程,其稳定性通过最小自由能表示,最小自由能越低,结构稳定性越高。有研究表明,蛋白疏水性会随着α螺旋比例的降低而随着增大,随β转角和无规卷曲比例的升高而增大。

2.7 鸡TRAF6蛋白质三级结构预测

使用SWISS-MODEL在线软件对鸡TRAF6蛋白的野生型和突变体(V472E)的3D模型进行了预测分析。结果如图5所示,TRAF6蛋白的野生型和突变体(V472E)的三级结构与二级结构预测结果一致,主要结构是α螺旋和无规卷曲。

表7 TRAF6突变体蛋白质二级结构预测Tab.7 Prediction of secondary structure of TRAF6 mutants

注:a为突变前是缬氨酸(Val);b为突变后是谷氨酸(Glu)。图5 鸡TRAF6蛋白质三级结构预测Fig.5 Tertiary structure prediction of chicken TRAF6 protein

3 结论与讨论

nsSNPs是基因编码区可能对蛋白的结构和功能特性产生重大影响的单个氨基酸替换。近年来,随着生物测序技术的发展,对功能型nsSNPs预测,已越来越多地应用于人类医学和畜牧学功能型SNP的研究中。在人类和畜禽生命中,绝大部分nsSNPs会影响人和畜禽的健康,导致许多疾病发生。仅有少部分的nsSNPs不会改变蛋白质的结构和功能表达,不会影响人和畜禽的健康。在家禽中,有研究者发现SNPs位点基因型对三穗鸭的蛋壳品质有影响,此外,SNP位点的突变可能影响动物的表现型。研究报道,在人类大部分遗传病中基因变异是由SNP导致的。例如,Song等通过对人TRAF6 mRNA表达水平与TRAF6内含子SNP(rs4755453)基因型的关联分析发现,rs475545与脓毒症诱导人急性肺损伤的易感性显著相关,这可能是rs4755453通过影响TRAF6 mRNA的表达,来增加炎性细胞因子的产生,从而直接导致肺组织损伤。而少汗型外胚层发育不良(HED)疾病,其特征在于发育不良、汗湿不足。Fujikawa等研究发现突变型TRAF6蛋白抑制了野生型TRAF6蛋白质与外胚层-A相关受体死亡域蛋白(EDARADD)之间的相互作用,在外胚层衍生器官发育过程中潜在地抑制了EDARADD介导的NF-κB的活性,从而导致HED表型。此外,对动物基因的研究发现,TARF6是与生长发育、免疫调控相关的候选基因。研究报道,TRAF6自身泛素化的关键位点K132的突变抑制了NF-κB的活性,随之Li等研究发现,点带石斑鱼TRAF6的第132位氨基酸K突变为R,突变后的K132R通过激活NF-κB下游信号通路,从而在宿主抵御寄生虫感染中起着关键作用。张芷毓等在秦川牛基因第六内含子17 628 bp处检测到的SNP位点形成两种基因型,该突变基因型对肉牛的育种具有显著影响。

本研究利用SIFT、PROVEAN、PhD-SNPB和SNAP2四种生物信息学软件对鸡基因外显子区功能性nsSNPs进行预测。这些方法既是相互独立又是相互补充的,因此,为减少预测结果差异,本研究结合四种预测软件进行预测,筛选出S17R、C20G、V472E这3个nsSNPs,其中V472E是四种软件共同筛选出的nsSNPs。研究发现,保守序列一般是生物体的生命所需,其突变常常致病。蛋白质的稳定性对生物学功能很重要,错义突变会导致蛋白质的稳定性降低,而I-Mutant2.0和Mupro是评估氨基酸替代对突变蛋白质稳定性的影响;MutPred2用于预测疾病表型。本研究通过对不同物种间的多序列比对和保守的多态性位点及其蛋白质的稳定性预测分析发现,V472E为保守的多态性位点且V472E位点的突变会导致蛋白质的稳定性改变,使蛋白质的稳定性下降。此外,MutPred2对氨基酸替代的功能预测与蛋白质二级结构预测结果相同,V472E位点的突变均造成了TRAF6蛋白质的稳定性改变。由此可知,V472E突变位可能严重影响鸡TRAF6蛋白质的结构,而蛋白质的结构改变会导致生物体的性状改变,故推测V472E突变位点可能是影响鸡生长发育和抗病育种的主要功能性SNPs。

本研究预测结果发现:rs734774178(V472E)nsSNPs使缬氨酸(Val)变成谷氨酸(Glu)。Val属于家禽功能性必需支链氨基酸之一,是非极性氨基酸,具有疏水性,在肌肉中氧化代谢。研究发现,Val可以抑制免疫器官的发育及免疫球蛋白的合成,从而影响免疫功能,增加Val含量可以增强机体免疫力和抗氧化能力。王宇波等发现,低含量Val饲粮增加了肥育猪肌内脂肪含量,从而影响肥育猪的生长性能。而Glu是一种带负电荷的极性氨基酸,具有亲水性,与多种疾病相关。一个氨基酸的疏水性和亲水性,极性与非极性都会影响氨基酸侧链基团功能的发挥及其各种酶和抗体、抗原之间的相互作用。因此,本研究对V472E突变位点的二级结构预测发现与三级结构的功能预测相符。综上所述,本研究利用生物信息学软件预测筛选出致病的基因的nsSNPs位点V472E,故推测V472突变位点可能影响鸡抗病表型的形成,但该位点的具体功能与致病表型之间的关系需要进一步研究。

鸡基因的rs734774178(V472E)位点可能是影响鸡抗病育种的重要功能性突变位点,该位点突变可能严重影响鸡TRAF6蛋白质的结构从而发挥蛋白功能。

猜你喜欢
位点功能性氨基酸
多环境下玉米保绿相关性状遗传位点的挖掘
PSORA:一种基于高通量测序的T-DNA插入位点分析方法
饲料氨基酸释放动态对猪氮素利用影响的研究进展
中医外治法治疗功能性消化不良的研究进展
心理干预对学生功能性消化不良的治疗作用分析
相信科学!DNA追凶是如何实现的?
科学解读食物中的蛋白质如何分“优劣”
一种改进的多聚腺苷酸化位点提取方法
亚洲丰系列功能性肥料
补氨基酸不如吃鸡蛋