荷斯坦奶牛FGFR2基因组织表达及生物信息学分析

2021-01-15 07:44邓惜缘刘丽元周子航高旭红顾亚玲
东北农业大学学报 2020年12期
关键词:奶牛编码蛋白

邓惜缘,刘丽元,周子航,温 万,高旭红,顾亚玲

(1. 宁夏大学农学院,银川 750021;2.宁夏畜牧站,银川 750004)

荷斯坦奶牛原产于荷兰,为一种风土驯化能力极强的品种,适应性强、体型大、产奶量高,是我国存栏量最多品种,全年平均产乳量超7 000 kg。我国荷斯坦奶牛又分为乳用型荷斯坦奶牛和兼用型荷斯坦奶牛。

成纤维细胞生长因子受体家族(Fibroblast growth factor receptor,FGFR)包括5 个基因,其中FGFR1、FGFR2、FGFR3 和FGFR4,为跨膜酪氨酸激酶受体,其胞外区具有2 或3 个免疫球蛋白(Ig)样结构域,而FGFR5 缺乏细胞内蛋白酪氨酸激酶结构域,该结构域被一个短的富含组氨酸基序的胞内尾部取代[1]。FGFR2 全称为成纤维细胞生长因子受体2,位于奶牛第26 号染色体,全长107 412 bp,具有不同亚型,在上皮细胞中编码FGFR2b 亚型,在间质细胞中编码FGFR2c 亚型。FGFR2 基因分别结合不同FGF 激活信号通路,介导FGFs 信号传递入细胞质,为b FGF 最主要受体。b FGF与其结合后可激活细胞内丝裂原活化蛋白激酶、细胞外信号调节激酶(MAPK/ERK)和磷脂酰肌醇-3 激酶和蛋白激酶B(PI3K/AKT)等信号通路调节血管内皮细胞、上皮细胞、成纤维细胞、成骨细胞和神经胶质细胞等多种起源于中胚层、神经外胚层的细胞分化增殖,还参与机体多种生理病理学过程(如胚胎发育、组织愈合、肿瘤发生与转移)[2]。Cunningham 等最新研究扩展FGF 信号已知领域,并为功能研究确定许多新靶点[3]。FGF信号通路结构灵活,在典型的RAF/MAPK/ERK/RSK和PI3K/AKT/PDK/mTOR/S6K 通 路 中,FGFR2 激 酶活性抑制反应被识别。同时观察到磷酸化依赖性负反馈途径被抑制,定义FGFR2 抑制的内在抗性机制。该发现对FGFR 抑制剂治疗应用有指导意义,因FGFR抑制剂识别具有相同遗传损伤和耐药途径细胞的反应。

本课题组以宁夏地区1 280头荷斯坦母牛为研究对象,利用Illumina 牛150K Bovine 全基因组SNP 芯片作基因分型,对5 个泌乳性状(产奶量、乳脂率、乳脂量、乳蛋白率、乳蛋白量)与体细胞评分,运用Farm CPU 统计方法作全基因组关联分析[4]。在奶牛第26号染色体上存在P值4.68×10-8且名为ARS-BFGL-NGS-106897 的SNP 位点与奶牛体细胞数有关,与其相距30 kb即41 956 121 bp存在FGFR2基因且最小等位基因频率为0.55。通过GO分析发现,FGFR2 参与FGF 信号通路(P00021),也参与多种生物学过程,如MAPK 级联、细胞分化、细胞增殖和凋亡过程负调控。因此本研究分析前期GWAS 筛选出的FGFR2 基因不同组织表达量,再分析荷斯坦奶牛FGFR2 基因生物信息学,以期为进一步研究荷斯坦奶牛FGFR2 基因生物学功能提供参考,为后期FGFR2 基因功能验证提供依据。

1 材料与方法

1.1 材料

1.1.1 试验样品

荷斯坦奶牛来自宁夏回族自治银川市贺兰县茂盛奶牛场,选择3头具有相同父本且饲养管理条件相同的荷斯坦奶牛,取屠宰后奶牛组织(肝脏、卵巢、乳腺、肾脏、心脏、子宫),DEPC 水洗净,液氮速冻后送回实验室,-80 ℃保存,备用。

1.1.2 主要试剂与仪器

主要试剂:LA Taq(DRR02AG)(TaKaRa),反转录试剂盒(TUREscript 1st Stand cDNA SYNTHESIS Kit)(艾德来);2×SYBR®Green 预混液(中国DF);pcDNA3.1-EGFP-C 载体(优宝生物);DH5α感受态细胞(天根)。

主要试验仪器:analytikjena-qTOWER 2.2型荧光定量PCR 仪(德国)、SCILOGEX D3024R 离心机(美国)、普通PCR 仪analytikjena-Easycycler(德国)、超微量核酸蛋白测定仪scandrop100(德国)、移液器(美国bio-rad)、U-3010 紫外-可见分光光度计(Hitachi)、凝胶成像系统(Gene Genius)、H6-1微型电泳槽(上海精益有机玻璃制品仪器厂)、SW-CJ-1D 洁净工作台(上海琪特分析仪器有限公司)、DYY-8 型稳压稳流电泳(江苏苏洁净化设备厂)、PCR 反应仪扩增仪(加拿大BBI)、YXJ-2 离心机(湘仪离心机仪器有限公司)。

1.2 方法

1.2.1 总RNA提取及反转录

使用Trizol 提取荷斯坦奶牛不同组织总RNA,通过凝胶电泳试验检测提取效果,超微量核酸蛋白测定仪(scandrop100)检测RNA其OD260/OD280值。

采用Aidlab 公司反转录试剂盒(TUREscript 1st Stand cDNA SYNTHESIS Kit)反转录,采用20 μL 反应体系:总RNA 500 ng、5×RT Reaction Mix 4 μL、Rondam primer/oligodT 0.8 μL、 TUREscript HRTase/RI Mix 0.8 μL、RNase Free dH2O 加至20 μL。反转录反应条件如下:42 ℃40 min,65 ℃10 min反应结束后,得到cDNA,-80 ℃保存。

1.2.2 奶牛FGFR2基因克隆

根据GenBank 中已知牛FGFR2 基因序列(XM_024985484.1)及GADPH 序列(NM_0010 34034.2),利用Primer Premier 5.0 设计特异性荧光定量引物,由陕西致研生物科技有限公司合成。

由于CDS 区序列较长,分六段扩增,由上海生工生物工程股份有限公司合成。具体引物序列如表1所示。

PCR 扩增体系(25 μL):2X GC Buffer I 12.5 μL,上下游引物各0.5 μL,dNTP(10 mmol·L-1)0.2 μL,ddH2O 10.1 μL,Template 1 μL(cDNA)、Taq 酶(5 U·μL-1) 0.2 μL。PCR 反应条件:95 ℃预变性3 min,94 ℃变性30 s,58 ℃退火30 s,72 ℃延伸2 min,72 ℃修复延伸7 min,循环33次。PCR产物用1%琼脂糖凝胶电泳检测,特异性好扩增产物保存于-20 ℃冰箱备用。纯化后产物通过TA 克隆将该序列在16 ℃连接至pcDNA3.1-EGFP-C 载体,转化到大肠杆菌DH5α 感受态细胞,涂板于LB 固体培养基,37 ℃培养12 h,蓝白斑筛选,选择白色菌落菌液送至上海生工生物工程有限公司测序。

1.2.3 组织表达差异分析

根据序列设计实时荧光定量PCR 引物, 检测FGFR2 基因在心脏、肝脏、乳腺、子宫、卵巢和肾脏组织表达量。反应体系(10 μL):2×SYBR®Green Supermix 5 μL,上下游引物各0.5 μL,cDNA 1 μL,ddH2O 3 μL。反应程序:95 ℃PCR 预变性3 min,95 ℃变性10 s,58 ℃组合延伸30 s,循环39 次。共设置3 个生物学重复以及3 个技术学重复,以GAPDH为内参,利用2-△△Ct计算各样品基因相对表达量,利用SPASS 22.0 分析荷斯坦奶牛FGFR2基因不同组织表达量单因素差异。

1.2.4 生物信息学分析

基 本BLAST 检 索(http://www.ncbi.nlm.nih.gov/blast);利用Prot-Param 在线软件分析理化性质(http://web. expasy.org/protparam /);利用DNAMAN比对序列;运用SignalP 4.1 软件分析信号肽(http://www.ebs.dtu.dk/services/SignalP/);运用ProtScale 软件分析亲疏水性(http://web.expasy.org /protscale/);通过在线软件TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)预测蛋白质跨膜结构;保守结构域通过NCBI 上CDD 预测(http://www.ncbi.nlm.nih.gov/cdd);运用Psort 软件分析亚细胞定位(https://www.genscript.com/psort.html);通过在线软件Prabi 服务器SOPMA 程序(https://npsa-prabi.ibcp.fr/)预测蛋白质二级结构,通过在线软件SWISS-MODEL(https://npsa-prabi.ibcp.fr/cgi-bin/npsa-automat.pl)预测蛋白质三级结构,研究确定FGFR2 蛋白质各项生物信息,了解该基因部分功能。

2 结果与分析

2.1 FGFR2基因RNA提取与扩增及克隆测序

不同组织RNA 提取后,用1.5%琼脂糖凝胶电泳,电泳效果见图1,产物用超微量核酸蛋白测定仪(scandrop100)检测RNA OD 值(见表2),可看到明显的28S与18S条带,全部符合RNA要求。以荷斯坦奶牛乳腺组织为模板,分六段扩增,引物特异性较好,六段目的基因片段长度符合要求,结果见图2。

2.2 荷斯坦奶牛FGFR2基因组织表达分析

目的基因FGFR2扩增曲线图3,图4为溶解曲线,产物TM 值为80 ℃。内参基因GAPDH 为扩增曲线图5,图6 为溶解曲线,产物TM 值为83 ℃。综合溶解曲线与扩增曲线图,试验结果可靠。

表2 不同组织RNA提取浓度与纯度检验Table 2 Test of RNA extraction concentration and purity in different tissues

以GAPDH为内参,利用2-△△Ct计算各样品基因相对表达量,利用SPSS 25.0 一般线性模型(GLM)作平均值下单因素方差分析,Duncan's多重检验结果显示,乳腺组织FGFR2 基因mRNA 表达量最高,并极显著高于肝脏、卵巢、子宫和心脏,与肾脏组织mRNA表达量差异不显著(见图7)。

2.3 荷斯坦奶牛FGFR2蛋白理化性质分析

ProtParam 在线服务器分析结果如图8 和表3所示,奶牛FGFR2 基因编码790 个氨基酸,20 种氨基酸中亮氨酸(Leu)数目最多,共64 个,占全部氨基酸8.1%。负电荷残基(Asp+Glu)总数为100,正电荷残基(Arg + Lys)总数为89,分子式为C3923H6159N1067O1190S44,相对分子质量为12 383。半衰期为30 h,脂肪指数为78.71,亲水性平均值为-0.409。基因编码产物不稳定指数为46.09,显示编码产物不稳定。

表3 荷斯坦奶牛FGFR2蛋白氨基酸组成Table 3 Amino acid composition of FGFR2 protein in Holstein cows

2.4 荷斯坦奶牛FGFR2基因序列相似性及系统进化树分析

利用Meg Align 软件将克隆得到的荷斯坦奶牛FGFR2 基因序列与家猫、黄牛、家鸡、猕猴、黑猩猩、野猪、家犬、绵羊、热带爪蟾、苏门答腊猩猩基因序列作相似性比对,其中荷斯坦奶牛与黄牛序列相似性高达100%,与热带爪蟾相似性最低为67.2%(见表4)。基于Tamura-Nei 模型最大似然法推导进化树模型,选择具有最高对数可行性的树(-6 150.52),将Neighbor-Join 和BioNJ算法应用于最大复合似然(MCL)方法估计成对距离矩阵,选择具有优越对数似然值拓扑,最后获得用于启发式搜索的初始树。分析涉及10 个核苷酸序列,所有包含空白和缺失数据的位置均删除,所有进化分析在MEGA7.0 中完成,结果显示荷斯坦奶牛与黄牛亲缘性最近,其次为野猪;而与热带爪蟾较低等脊椎动物相距最远(见图9)。

2.5 荷斯坦奶牛FGFR2蛋白疏水性分析

运用ExPASy 服务器中ProtScale 程序分析奶牛FGFR2 蛋白亲疏水性发现,第358 位丙氨酸(Ala)疏水性最强为3.211,第167 位赖氨酸(Lys)疏水性最弱为-2.622,在负值区域有较多氨基酸(见图10)。

表4 荷斯坦奶牛与其他10 个物种FGFR2基因序列相似性比对Table 4 Sequence similarity comparison of FGFR2 gene between Holstein cows and other 10 species

2.6 荷斯坦奶牛FGFR2蛋白跨膜结构预测及信号肽分析

运用TMHMM 2.0 分析奶牛FGFR2 基因蛋白跨膜结构,预测结果如图11 所示。结果表明,FGFR2 蛋白存在1 个跨膜结构,位于第344~366 氨基酸残基之间。使用SignaIP 4.1在线软件预测蛋白信号肽发现,编码产物C 值为0.112,Y 值为0.107,S 值为0.116,荷斯坦奶牛FGFR2 蛋白不具有信号肽(见图12)。结合软件SecretomeP2.0(http://www.cbs.dtu.dk/services/SecretomeP/)分 析, 得 到SecP score分数高于0.6,则荷斯坦奶牛FGFR2基因编码蛋白属于非经典分泌蛋白。

2.7 荷斯坦奶牛FGFR2蛋白二级结构和三级结构预测

由图13 可知,α-螺旋占23.80%,β-转角占4.18%,无规则卷曲占51.27%, 延伸链占20.76%。由此推测,无规卷曲为荷斯坦奶牛FGFR2 最大量二级结构元件,α-螺旋、β-转角和延伸链散布其中。由图14可知,FGFR2蛋白以无规卷曲和α-螺旋为主,与二级结构分析一致。

2.8 荷斯坦奶牛FGFR2蛋白亚细胞定位分析

运用PSORTⅡ预测FGFR2 编码产物亚细胞分布情况:细胞质21.7%,细胞核43.5%,线粒体17.4%,质膜4.3%,液泡4.3%,过氧化物酶体4.3%,分泌系统小泡4.3%。

2.9 荷斯坦奶牛FGFR2蛋白保守结构域预测

运用NCBI 的CDD 数据库预测荷斯坦奶牛FGFR2 蛋白保守结构域。如图15 所示,荷斯坦奶牛FGFR2蛋白有3个特定匹配和2个匹配的超家族保守结构域。

3 讨 论

FGFR2 基因已确定与胃癌[5-6]、乳腺癌[7-8]、和胆管癌[9]等多种癌症密切相关,且Pemazyre 治疗FGFR2 基因融合型胆管癌已获得美国FDA 首批认证[10-12]。在骨骼发育过程中, FGFR2 基因可调节位于软骨膜、骨膜和颅缝处前骨生成细胞和骨生成细胞增生和分化[13]。Brajadenta 等研究发现FGFR2基因中至少有7 个突变引起Apert(尖头并指综合征)综合征[14]。Kim 等研究发现FGFR2 信号为导致面中部前后向空间异常关键因素,研究结果为预防FGFR2基因突变引起的颅面畸形提供新疗法[15]。为证明FGFR2 主要影响软骨细胞增生和分化,尹良军等应用基因敲入技术建立FGFR2 功能获得型基因突变小鼠模型,研究发现FGFR2 不仅具有调控成骨细胞系发育功能,还具有调控软骨细胞系发育重要功能,从而同时影响膜内成骨和软骨内成骨,在骨骼发育、骨折修复等方面发挥重要作用[16]。可知FGFR2在调节骨相关生长发育中发挥作用。

分析克隆的荷斯坦奶牛FGFR2 基因序列发现,该基因CDS 区序列长2 372 bp,编码790 个氨基酸,其中亮氨酸含量最多,亮氨酸增加蛋白质合成,抑制蛋白质分解。亮氨酸代谢产物α- 酮戊己酸(α-KIC)和β- 羟基-β- 甲基丁酸(HMB)具有调节蛋白质代谢作用。带负电荷残基总数(Asp+Glu)大于带正电荷残基总数(Arg+Lys),故FGFR2基因编码蛋白质带负电荷, 其不稳定指数为46.09,为不稳定蛋白,预测该蛋白为亲水性蛋白。由于具有跨膜结构但无信号肽,则推测为非经典分泌蛋白,与FGF2分泌途径:由质膜直接易位介导,依赖于质膜内磷脂酰肌醇(4,5)二磷酸和质膜外层的硫酸乙酰肝素蛋白多糖结论一致[17-18]。

毕艳楠等研究发现奶牛乳腺炎金黄色葡萄球菌诱导小鼠乳腺组织中FGFR2 表达量显著升高[19],表明FGFR2 基因与奶牛乳腺纤维化分子作用机制关系密切,与前期GWAS 筛选结果一致,且与不同组织表达差异分析得出乳腺组织表达量最高结果也一致。王泽鑫等通过瞬时转染pcDNA3.1-TOPO-FGFR2 真核表达质粒进入人胆管癌Hucct1 和HEK293T 细胞,在细胞水平验证FGFR2基因过表达具有促进细胞生长作用,与GWAS 结论相符[20]。同时,毕艳楠等发现,FGFR2与bFGF共同作用促进奶牛乳腺成纤维细胞中PI3K 和Akt mRNA和蛋白表达[21]。

基于前期GWAS 及不同组织差异分析得出乳腺组织相对表达量高的结果,再结合其他学者研究可推断荷斯坦奶牛FGFR2 基因具有促进乳腺细胞生长作用,后期将开展细胞水平功能验证。

4 结 论

本研究成功克隆荷斯坦奶牛FGFR2基因, 得到2 373 bp 的CDS 区序列,编码790 个氨基酸残基;生物信息学分析结果显示,FGFR2 蛋白为非经典分泌蛋白,编码产物主要分布在细胞核;实时荧光定量PCR 结果显示,荷斯坦奶牛FGFR2 基因在乳腺组织中相对表达量最高。研究结果为荷斯坦奶牛FGFR2 基因在奶牛产奶性状相关调控机制研究提供理论依据。

猜你喜欢
奶牛编码蛋白
乍暖还寒时奶牛注意防冻伤
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
生活中的编码
夏季奶牛如何预防热应激
人工驯养树鼩精子发生过程中MCM7蛋白的表达
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
奶牛吃草
Genome and healthcare
SAK -HV 蛋白通过上调 ABCG5/ABCG8的表达降低胆固醇的吸收