张小雪 赵利明 刘佳 杨晓斌 李冲
摘要:极长链脂肪酸延伸酶蛋白家族(elongation of very-long-chain fatty acids, ELOVLs)是一类催化脂肪酸合成的限速酶,主要调控血脂、血糖及一些代谢疾病的发生。为探究绵羊ELOVL5基因的结构和功能,本研究对该基因及其编码产物进行了生物信息学分析。结果显示,绵羊 ELOVL5 基因编码737个氨基酸,其编码蛋白分子式为C1656H2448N416O415S16,其分子质量为35 335.39 Daltions,理论等电点为9.47,估计半衰期为30 h,不稳定性指数为33.35。亚细胞定位主要位于内质网中(55.6%),ELOVL5基因编码蛋白没有信号肽序列,不属于分泌蛋白。该蛋白存在多个跨膜区域,属于跨膜蛋白,存在7个保守结构域,并且为亲水性蛋白,二级结构主要以α螺旋和无规则卷曲为主,三级结构主要由α螺旋缠绕折叠而成。
关键词:绵羊;ELOVL5基因;生物信息学
中图分类号:S826 文献标志码:A 文章编号:1001-1463(2022)04-0024-06
doi:10.3969/j.issn.1001-1463.2022.04.005
Bioinformatics Analysis of Sheep ELOVL5 Gene
ZHANG Xiaoxue, ZHAO Liming, LIU Jia, YANG Xiaobin, LI Chong
(College of Animal Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070, China)
Abstract:Very long chain fatty acids extend enzyme protein family (elongation of very long-chain fatty acids, ELOVLs) is a kind of fatty acid catalytic synthesis of speed limit of enzymes. It mainly regulates the occurrence of blood lipid, blood glucose and some metabolic diseases. To explore the structure and function of ELOVL5 gene in sheep. this gene and its encoding protein were analyzed by bioinformatics. The results showed that the sheep ELOVL5 gene encoded 737 amino acids, and the formula was C1656H2448N416O415S16. The molecular weight of the protein was 35 335.39 Daltions, the theoretical isoelectric point was 9.47, the estimated half-life was 30h, and the instability index was 33.35. The subcellular localization was mainly located in the endoplasmic reticulum(55.6%). The protein encoded by ELOVL5 gene had no signal peptide sequence and was not secretory protein. This protein was transmembrane protein with multiple transmembrane regions. had 7 conserved domains, and was hydrophilic. The secondary structure mainly consist of alpha helix and random coil, the tertiary structure is mainly composed of winding and folding of α helix.
Key words:Sheep;ELOVL5 gene;Bioinformatics analysis
极长链脂肪酸延伸酶(Elongase of very long chain fatty acids,ELOVL)基因家族是哺乳动物中一类编码超长链脂肪酸(Very long chain fatty acids,VLCFA)延伸酶的基因家族,在哺乳动物中现已发现7个ELOVL基因家族成员,分别为ELOVL1~7[1 ]。哺乳动物ELOVL基因家族与酵母ELO基因家族是垂直同源关系,ELOVL基因家族是在ELO基因家族的基础上发现的。ELOVL5 与延长单不饱和脂肪酸(C16、C18)及多不饱和脂肪酸(C18、C20、C22)相关[2 ],优先延伸C18和C20这两类多不饱和脂肪酸,在对C22多不饱和脂肪酸作用上活性相对较弱,很难作用于C22以上的多不饱和脂肪酸[3 ]。ELOVL基因家族成員在哺乳动物很多组织中均有表达且存在组织特异性,ELOVL5基因在哺乳动物肝脏、睾丸、大脑中均有表达[2 ],其表达产物多为微粒体酶,在细胞液中、线粒体中和其他微粒体中参与脂肪酸链的延伸反应。酵母ELO基因家族及人类ELOVL5基因家族的编码产物都参与超长链脂肪酸和神经鞘质的形成。ELOVL5参与哺乳动物体内酯类合成和脂肪酸氧化,还能通过调控肝脏脂肪和碳水化合物代谢来影响血糖血脂浓度[3 ]。 ELOVL5基因全长897 bp,定位于人体6号染色体,共编码299个氨基酸。有研究报道称,ELOVL5基因的g-110 T > C 突变位点对日本黑牛的皮下脂肪厚度和产量有显著影响[4 ]。王珍梅[5 ]利用转录组测序技术(RNA- seq)鉴定出ELOVL5基因为藏猪和大约克猪脂肪沉积性状的关键候选基因,而且其表达水平与背膘厚呈极显著正相关。同样的,胡海龙[6 ]采用转录组测序和全长翻译组测序(RNCseq)技术发现,ELOVL5等基因的翻译调控会导致陆川猪与杜洛克猪肌肉组织脂肪含量及肌肉生长速度产生差异。此外,ELOVL5基因与脂肪酸代谢有关,而脂肪酸含量、比例及种类与肉品质及风味有直接的关系[7 ]。因此,了解ELOVL5基因的生物学功能对畜牧业的生产和发展有着极其重要的作用。然而,目前有关绵羊ELOVL5基因的研究较少,其生物学功能尚不明确。我们从生物基因组数据库(GenBank 数据库)中查询绵羊ELOVL5基因的序列,利用生物信息学方法对绵羊ELOVL5基因及其编码产物的理化性质、序列特征、蛋白质结构以及生物学功能进行预测和分析,以期为深入研究绵羊ELOVL5基因相关及其编码产物的功能提供理论基础。
1 材料与方法
1.1 序列来源
所有序列数据均来源于NCBI网站GenBank 数据库,包括鸡(XM_040697306.1)、绵羊(XM_ 012100862.3)、马(NM_023625099.1)、猫(XM_019 80732.2)、牛(NM_001046597.1)、山羊(NM_00128 5628.1)、猪(NM_021098831.1)、人(NM_00124282 8.2)、黑猩猩(XM_024356979.1)等9个物种ELOVL5基因在NCBI网站GenBank 数据库中的mRNA序列。括号内为GenBank 数据库登录号。
1.2 分析方法
分析绵羊ELOVL5基因开放阅读框(Open reading frame,ORF)时,采用NCBI的在线分析程序ORF Finder;预测其编码蛋白质的理化性质时,采用Bioedit软件分析进行预测;采用PSORT预测亚细胞定位;采用分子生物学综合应用软件DNAMAN多序列比对及同源性分析;采用Prot Scale工具分析蛋白质的亲疏水性;采用Smart软件对蛋白质保守结构域分析;采用TMHMM Serverv.2.0进行跨膜螺旋区域的预测;采用Signalp软件进行蛋白质潜在信号肽剪切位点预测;采用Jpred分析预测蛋白质二级结构;采用SWISS-MODEL在线工具进行蛋白三级结构的预测[8 - 16 ]。
2 结果与分析
2.1 绵羊ELOVL5基因开放阅读框分析
由绵羊ELOVL5基因开放阅读框分析结果(图1)可知,绵羊ELOVL5基因序列中最大长度的ORF为900 bp,起始密码子位于156 bp处,终止密码子位于1 845 bp处,推测其编码737个氨基酸残基。
2.2 绵羊ELOVL5基因编码产物理化性质分析
蛋白质的理化性质分析包括对其相对分子质量、氨基酸组成以及等电点的理化性质分析。从ELOVL5基因编码产物的氨基酸组成(图2)可以看出,共编码299个氨基酸残基,分子量为35 335.39 Da。其中Leu(亮氨酸)占比最高,为11.04%;Cys(半胱氨酸)占比最少,为2.01%。
2.3 绵羊ELOVL5基因蛋白亚细胞定位
从绵羊ELOVL5基因蛋白亚细胞定位结果可知,ELOVL5基因编码蛋白分布在内质网上的可能性为55.6% ;分布在浆膜上的可能性次之,为22.2%;分布于液泡膜和高尔基体的可能性均最小,均為11.1%。由此推断,绵羊ELOVL5基因蛋白主要在内质网中发挥作用。
2.4 不同物种ELOVL5基因的多序列比对及同源性分析
在NCBI数据库中找到绵羊、鸡、黑猩猩、马、猫、牛、人、山羊以及狗共9种动物的ELOVL5基因编码的蛋白质序列,通过DNAMAN软件进行分析比对,结果如图3所示,发现其在9种动物中均有表达。通过9种生物ELOVL5基因编码产物序列的同源树(图4)分析发现,绵羊和牛、山羊的同源性较高,达到了98%;与猫、马、鸡的同源性较低,为84%。
2.5 绵羊ELOVL5蛋白潜在信号肽剪切位点预测及蛋白跨膜区预测
由绵羊ELOVL5基因编码产物潜在信号肽剪切位点结果(图5)可知,编码产物的C值、S值、Y值分别为0.103、0.630、0.074,且不存在信号肽序列,因此推断该产物不是分泌蛋白。由跨膜区预测结果(图6)可知,该产物存在7段跨膜区域,是一种跨膜蛋白。
2.6 绵羊ELOVL5蛋白保守结构域分析
由绵羊ELOVL5基因跨膜区结构域结果(图7、图8)得知,该蛋白共有7段跨膜区域,分别为28~50、63~85、110~132、139~158、168~187、207~224、229~251。
2.7 绵羊ELOVL5蛋白亲疏水性分析
通过ProtScale工具分析绵羊ELOVL5蛋白的亲疏水性可得结果(图9),其疏水性最大值为2.878,位于第44位,最小值为-3.811,位于第265位。由此可知,绵羊ELOVL5蛋白是亲水性蛋白。
2.8 绵羊ELOVL5蛋白二级结构预测
由Jpred软件分析结果(图10)可知,绵羊ELOVL5基因的编码产物有186段α螺旋,有7段β折叠,有106段无规则卷曲。
2.9 绵羊ELOVL5蛋白三级结构预测
根据绵羊ELOVL5蛋白三级结构预测结果(图11)可知,该蛋白三级结构主要由α螺旋缠绕折叠而成。
3 小结与讨论
随着科技水平的日益提高,生物信息分析越来越多的应用于现代分子生物学研究[17 ]。ELOVL5是ELO家族的成员,是一种位于内质网的多道膜蛋白。ELOVL5对长链脂肪酸的延伸很重要,在花生四烯酸、油酸、硬脂酸、棕榈酸、亚麻酸和二十碳五烯酸的延伸反应中起限制作用[18 ]。而超长链脂肪酸是脂质介质的前体,也是细胞鞘质、甘油磷脂的组成部分。这些多不饱和脂肪酸参与多种生理过程,不可或缺,还与炎症、过敏反应、免疫系统、心血管系统和皮肤疾病相关的病理过程相关。与超长链脂肪酸代谢相关酶的编码基因发生突变后可能会导致鱼鳞病、脱髓鞘、智力相关遗传病、黄斑变性等,ELOVL5基因编码的组织相容性复合物对免疫反应起到关键作用[19 ]。本研究中序列比对及同源性分析结果表明,绵羊ELOVL5基因同源性在所有分析的9种动物中与牛和山羊的关系最近,同为98%,这可能是由于同为反刍动物的原因。与鸡、马、猫同源性最低,为84%。此外,还发现该蛋白为亲水性蛋白,且有7段跨膜区,为跨膜蛋白,表明该蛋白参与信号转导。蛋白高级结构分析表明,其二级结构和三级结构组成一致,均是由α螺旋组成。许多研究表明,ELOVL5基因对家畜、家禽的脂肪沉积性状起着重要的作用[20 - 24 ],绵羊ELOVL5基因通过影响超长链脂肪酸的代谢进而影响着绵羊的生长发育过程中诸多方面。绵羊ELOVL5基因及其编码蛋白具体的作用机理及作用方式在绵羊中还有待研究。本试验仅对该基因及其编码产物做了生物信息学分析,可为以后深入研究绵羊ELOVL5基因提供一定的基础,但是其生物学功能还需要深入研究。
绵羊ELOVL5基因最长ORF长度为900 bp,起始密码子位于156 bp处,终止密码子位于1 845 bp处;绵羊ELOVL5基因编码蛋白分子式为C1656H2448N416O415S16,分子质量为35 335.39 Da。在氨基酸组成中,亮氨酸在其中所占比率最高(11.04%), 半胱氨酸所占比率最低(2.01%)。理论等电点为9.47,估计半衰期为30 h,不稳定性指数为33.35。ELOVL5基因编码产物潜在信号肽剪切位点预测最大C值为0.103,最大Y值为0.074,最大S值为0.630,无信号肽剪切位点,是一种非分泌蛋白。发现了7段跨膜区,为跨膜蛋白,且该蛋白为亲水性蛋白。其亲水性最大值为2.878,位于第44位;最小值为-3.811,位于第265位。亚细胞定位分布于内质网的可能性最大,为55.6%。该蛋白二级结构主要为α螺旋,三级结构由α螺旋缠绕折叠形成。
参考文献:
[1] 张 娟,母 童,赵 平,等. 静原鸡ELOVL5基因遗传多样性研究[J]. 浙江农业学报,2019,31(2):200-206.
[2] 唐 慧,潘志雄,卢立志,等. 超长链脂肪酸延伸酶家族的功能及表达调控[J]. 生命的化学,2009,29(6):898-901.
[3] 吴晓云,陈叶雨,刘 亚,等. 达氏鲟Elovl4、ELovl5和Elovl7克隆、组织分布及饥饿对其表达的影响[J]. 水生生物学报,2020,44(6):1174-1181.
[4] MATSUMOTO H,SHIMIZU Y,TANAKA A,et al. The SNP in the promoter region of the bovine ELOVL5 gene influences economic traits including subcutaneous fat thickness[J]. Molecular Biology Reports,2013,40(4):3231-3237.
[5] 王珍梅. 藏猪和大约克猪脂肪组织代谢模式探索分析[D]. 拉萨:西藏农牧学院,2021.
[6] 胡海龙. 陆川猪与杜洛克猪背最长肌组织的转录组与翻译组比较分析[D]. 南宁:广西大学,2021.
[7] 王 莹. 调控黄山黑鸡肌肉中多不饱和脂肪比率的关键基因鉴定及功能验证[D]. 合肥:合肥工业大学,2018.
[8] 李 娜,杨健康. SELL基因与蛋白质的生物信息学分析[J]. 生物技术,2020,30(6):549-554;583.
[9] 母 童. 静原鸡ELOVL2和ELOVL5基因组织表达特性及生物信息学分析[D]. 銀川:宁夏大学,2019.
[10] 张司龙,张小雪,宋其志,等. 绵羊RXRG基因的生物信息学分析[J]. 甘肃农业科技,2020(2~3):31-37.
[11] 靳泽希,冯 芬,邓晓银,等. 绵羊NRCAM基因的生物信息学分析[J]. 甘肃农业科技,2020(12):19-24.
[12] 刘 佳,王 祯,代友超,等. 绵羊HTR4基因的生物信息学分析[J]. 甘肃农业科技,2020(10):35-40.
[13] 宋雅萍,李彦霞,郭文婧,等. 绵羊GP5基因的生物信息学分析[J]. 甘肃农业科技,2020(10):54-59.
[14] 王 晨,杨 娟,袁肇方,等. 绵羊ERβ基因的生物信息学分析[J]. 西北民族大学学报(自然科学版),2020,41(1):33-40.
[15] 翟 刚,杜天宁,张天浩,等. 绵羊KAP1.1基因编码蛋白生物信息学分析[J]. 河北科技师范学院学报,2019,33(4):36-41.
[16] 郭丽荣,韩高链,张枫惠,等. 绵羊HADHB基因生物信息学分析及营养应激状态下的表达变化[J]. 中国畜牧杂志,2019,55(5):94-98;162.
[17] 易继财. 生物类专业生物信息学课程教学探索:华南农业大学生物类专业生物信息学课程的教改实践与思考[J]. 安徽农业科学,2018,46(26):231-233.
[18] JAKOBSSON A,WESTERBERG R,JACOBSSON A. Fatty acid elongases in mammals:their regulation and roles in metabolism[J]. Progress in Lipid Research, 2006, 45(3):237-249.
[19] 王海燕,苏玉虹. 编码极长链脂肪酸延长酶基因家族的结构及其产物的功能[J]. 生命的化学,2005(1):29-31.
[20] 张 娟,母 童,虎红红,等. 静原鸡ELOVL5基因功能生物信息学分析[J]. 基因组学与应用生物学,2020,39(12):5432-5441.
[21]母 童,张 娟,赵 平,等. 静原鸡ELOVL2和ELOVL5基因表达的组织特异性研究[J]. 浙江农业学报,2017,29(8):1290-1296.
[22] 郭鹏程,戴珊珊,杨浩然,等. ELOVL5基因遗传变异与中国荷斯坦奶牛乳质性状的关联分析及功能验证[J]. 中国兽医学报,2017,37(4):741-745.
[23] 潘开源,陈建文,陈 真,等. 乳腺特异性共表达4种脂肪酸合成酶载体及其稳转山羊成纤维细胞系的构建[J]. 安徽农业大学学报,2015,42(3):417-423.
[24] 马小娅,庞春英,邓廷贤,等. FADS2基因在奶牛乳腺细胞中的过表达和干扰研究[J]. 中国畜牧兽医,2019,46(3):652-660.
收稿日期:2022 - 02 - 18
基金项目:国家畜禽良种联合攻关计划项目(19210365);甘肃农业大学伏羲青年英才培养计划项目(Gaufx-03Y11)。
作者简介:张小雪(1984 — ),女,湖北武汉人,副教授,主要从事动物遗传育种与繁殖研究及教学工作。联系电话:(0931)7631225。Email:zhangxx@gsau.edu.cn。
通信作者:李 冲(1986 — ),男,甘肃平凉人,副教授,主要从事反刍动物营养研究及教学工作。联系电话:(0931)7631225。Email:lichong@gsau.edu.cn。