郭 晋,范新浩,杨亚岚,梁国明,唐中林,*
(1.中国农业科学院北京畜牧兽医研究所,北京 100193;2.中国农业科学院农业基因研究所,广东岭南现代农业科学与技术实验室,深圳 518120)
碳酸酐酶(carbonic anhydrase,CAs)是一类可催化二氧化碳和碳酸氢盐的可逆水合金属酶[1],在不同物种的组织和细胞中表达水平不同[2]。由于CAs抑制剂与糖异生、尿素生成、脂肪生成、肿瘤发生等多种生理反应有关[3-4],CAs抑制剂现已成为肥胖和肿瘤等疾病治疗的药物[5-6]。线粒体(mitochrodria, MT)通过它自身表达的DNA、细胞质中核基因编码的蛋白质和酶完成细胞内的生物氧化过程[7]。研究发现,线粒体CA调节葡萄糖的氧化代谢、ROS的产生和氧化应激、线粒体的生物发生[8]。线粒体碳酸酐酶两种同工酶CA5A(carbonic anhydrase,mitochondrial,5A;CA5A)和CA5B(carbonic anhydrase,mitochondrial,5B;CA5B)(以前被称为CAVA和CAVB)在线粒体丙酮酸代谢中发挥关键作用,其通过可逆水合二氧化碳产生HCO3-:CO2+为丙酮酸转化为草酰乙酸提供HCO3-,使草酰乙酸进入三羧酸循环途径,是葡萄糖有氧代谢过程的关键底物。
人源碳酸酐酶(hCAs)参与大量的生理和病理过程,包括糖异生、脂肪生成、尿素生成、致瘤性以及各种病原体的生长和毒性[6, 10],CA5(以前被称为CAV)在糖异生、脂肪生成[6]、代谢调控[8, 11]和疾病发生[6, 8, 11-12]中发挥关键作用。目前,这些hCAs已作为药物靶点被深入研究,几种hCA抑制剂已在临床应用[6]。小鼠线粒体碳酸酐酶CA5B与CA5A具有同源性[13],小鼠CA5B基因在成年皮下脂肪和生殖器脂肪中表达量最高,小鼠胰岛细胞中CA5在功能上可能与调节胰岛素分泌有关[14],此外,小鼠CA5参与调节脂肪细胞的丙酮酸羧化[15]和丙酮酸糖异生[16]。双敲除(double knockout,DKO)CA5A和CA5B使小鼠高氨血症增强和空腹血糖降低,表明CA5A和CA5B有助于尿素生成和调节糖异生[17]。
猪是人类最重要的蛋白来源和生物医学模式动物之一。碳水化合物和脂肪是参与能量代谢的主要物质,因此,研究分析猪代谢相关基因对于肉品质的改良有重要作用。目前,猪CA5B基因还没有注释,其表达及调控机制尚不清楚。本研究利用猪转录组数据分析CA5B基因在发育过程中的表达特征以及组织中的表达情况,为研究CA5B的功能提供依据。
采集240日龄贵州小型猪(公、母各3头)的心、肝、脾、肺、肾、皮下脂肪、背最长肌、睾丸、卵巢组织。此外,采集通城猪和长白猪各27个生长发育时间点(出生前33、40、45、50、55、60、65、70、75、80、85、90、95、100、105 d和出生后0、9、20、30、40、60、80、100、120、140、160、180 d)的骨骼肌,每个品种每个时间点采集3头猪。上述组织样品立即现场液氮快速冻存,然后转移至-80 ℃冰箱保存备用。
台式低温离心机(Ependorff)、样品研磨仪(Tekmar)、制冰机(SANYO)、1.5 mL离心管(AXY-GEN)、总RNA提取试剂盒(天根)。
1.3.1 RNA提取 取低温保存的猪上述各种组织样本提取总RNA,提取流程参照天根试剂盒说明书,提取的总RNA保存在-80 ℃冰箱备用。
1.3.2 RNA转录组测序 取冻存的RNA,根据Illumina®TruSeqTMRNA样品制备流程,构建cDNA 文库,利用Illumina HiSeqTM2500,采用双端测序方法进行转录组测序,测序数据已上传至NCBI数据库(GSE73763和PRJNA488311)。
1.3.3 RNA测序数据处理 用TopHat2[18]将得到的RNA测序数据比对到猪的参考基因组上,经过注释和计算,得到CA5B基因在各个样本中RPKM(每万reads中来自某基因每千碱基长度的reads数)的表达情况。
1.3.4CA5B功能预测 从NCBI数据库下载猪、人、小鼠、猴、牛、马、山羊、绵羊、狗和猫的CA5B基因的蛋白质序列,利用EBI的多序列比对软件Clustal Omega(https://www.ebi.ac.uk/Tools/msa/clustalo/)对不同物种的CA5B进行多序列比对分析,利用STRING数据库(https://string-db.org)分析CA5B与其它蛋白的相互作用,利用DREP[19]数据库(http://www.rnanet.org/editing/)分析CA5B潜在的RNA编辑位点,利用Targetscan、PicTar和miRanda工具预测CA5B基因的 3′UTR区域与miRNA结合位点,用R语言的cor.test()函数计算CA5B基因和miRNA表达量之间的相关系数。
由于小鼠和人CA5B基因功能已有报道研究,为了探究猪CA5B基因功能,首先分析了猪、小鼠与人CA5B基因的保守性。从NCBI数据库下载猪(XP_020935797.1)、人(EAW98898.1)、小鼠(NP_851832.2)、猴、牛、马、山羊、绵羊、狗和猫的CA5B蛋白序列,利用EBI的多序列比对软件Clustal Omega(https://www.ebi.ac.uk/Tools/msa/clustalo/)进行多序列比对分析。图1为10个物种蛋白编码序列的比对结果,在人、猪、小鼠、猴、牛、马、山羊、绵羊、狗和猫中,除小鼠外,其余序列相似性均在90%左右;就猪、人和小鼠的比对结果来看,猪和小鼠CA5B序列一致性为86.4%,而猪和人同源性为90.5%。说明猪CA5B蛋白序列与人相似度更近,与小鼠次之。
为研究CA5B基因在不同物种中的进化关系,利用MEG5软件,以猪、人、小鼠、猴、牛、马、山羊、绵羊、狗和猫的CA5B的蛋白序列构建系统发育树。结果发现,猪、狗与猫CA5B聚为一支,牛、绵羊与山羊CA5B聚为一支,这两支属于同一大分支,与人、猴CA5B具有相同的来源。这8个物种与马聚为一大支,最后与小鼠CA5B聚为一支(图2)。表明,与小鼠相比较,猪与人CA5B在进化上更近。
图2 CA5B序列的系统发育树
利用STRING数据库(https://string-db.org)分析CA5B与其它蛋白的相互作用。结果发现,与CA5B互作的蛋白包括TMEM35、CYP24A1和XPNPEP2等基因编码的蛋白质(图3)。通过在NCBI数据库(https://www.ncbi.nlm.nih.gov)和Uniprot数据库(https://www.uniprot.org/uniprot/)中检索发现,与CA5B蛋白互作的这些基因在猪中的注释较少,在人和小鼠中有较多注释。
图3 CA5B的蛋白互作网络
CA5B互作蛋白功能:跨膜蛋白(transmembrane protein 35A,TMEM35)在细胞的过氧化物酶体中释放的可溶性肽可调节神经元轴突的生长;雄性至死因子3(male-specific lethal 3, MSL3)具有组蛋白乙酰转移酶活性及与甲基化组蛋白结合功能,在染色质重塑和转录调节中发挥作用;溶质载体家族成员(solute carrier family 25 member 30, SLC25A30)为在小鼠和人心肌、骨骼肌中特异性表达的线粒体转运蛋白,完成线粒体内外的物质运输;富含脯氨酸的Gla 1(proline rich Gla 1,PRRG1)可编码跨膜蛋白TMEM171,可与钙离子结合;细胞色素P450(cytochromeP450, family 24, subfamily a, polypeptide 1,CYP24A1)基因编码的蛋白质作用于线粒体,其将骨化三醇降解为骨化醇,在维生素D分解和钙稳态中起关键作用;TXLNG(taxilin gamma, taxilinγ)基因可编码类肌球蛋白卷曲螺旋蛋白,在人和小鼠的细胞内囊泡运输中发挥作用,可能参与调控细胞周期和调节骨密度,该基因的表达可能引起脂多糖的上调;肽酶M20结构域(peptidase M20 domain containing 2,PM20D2)编码氨基酰化酶和氨基水解酶,催化蛋白质水解;X-脯氨酰氨肽酶2(X-prolyl aminopeptidase 2,XPNPEP2)基因编码氨基肽酶,催化邻近脯氨酸残基的N端裂解。
根据CA5B蛋白互作网络关系中互作蛋白的功能,推测CA5B可能参与调节生长和发育,线粒体内物质转运和线粒体外跨膜运输,并且可能与骨骼肌钙稳态调节、细胞蛋白质分解、脂多糖代谢调控有关。
为了研究CA5B在各组织器官中的表达特点,本研究利用已有的贵州小型猪心、肝、脾、肺、肾、皮下脂肪、背最长肌、睾丸、卵巢9种组织的RNA数据[20],分析CA5B在各种组织器官中的表达水平。结果发现,CA5B在成年猪的脂肪、睾丸、卵巢中高表达,在骨骼肌、心肌和肾中表达水平较低(图4)。
图4 CA5B基因在猪中的组织表达谱
为了了解CA5B在骨骼肌生长发育过程中的作用,本研究利用已有的高通量测序数据,首次分析了该基因在通城猪和长白猪27个生长发育时间点(E33-D180)中骨骼肌的动态表达。发现,CA5B的表达水平在通城猪和长白猪的胚胎期高于出生后时期,在胚胎期逐渐升高,出生后降低;并且在胚胎发育后期80 d(E80)到出生0 d(D0)表达水平较高,通城猪在胚胎期80 d(E80)时表达水平最高,而长白猪在胚胎期85 d(E85)时表达水平最高(图5)。可以推断,在通城猪和长白猪骨骼肌生长发育过程中,CA5B基因在胚胎期有重要作用,并且在胚胎骨骼肌发育后期至出生前发挥重要功能。
图5 CA5B在通城猪和长白猪27个生长发育时间点骨骼肌中的动态表达
为探究CA5B的RNA编辑位点,在DREP[19]数据库(http://www.rnanet.org/editing/)中分析CA5B潜在的RNA编辑位点,结果在CA5B基因的内含子区域和3′UTR区域分别找到了1个和2个A-to-G类型的RNA编辑位点,这3个位点均位于重复元件Pre0_SS区域,属于SINE/tRNA家族(表1)。
表1 CA5B的RNA编辑位点信息
为找到可能调节CA5B的miRNA,本研究利用Targetscan、PicTar和miRanda工具预测CA5B基因的 3′UTR区域与miRNA的结合位点,结果发现,ssc-miR-22-5p可以与CA5B基因 3′UTR靶向结合(图6)。通过计算CA5B基因和miRNA表达量之间的相关系数和P值,发现CA5B与ssc-miR-22-5p在猪骨骼肌生长发育过程中的表达呈显著负相关(R=-0.31,P=0.022,图7)。表明CA5B的表达潜在受ssc-miR-22-5p调控。
图6 CA5B与miR-22-5p靶向结合序列
图7 CA5B与miR-22-5p表达相关性
线粒体在细胞和组织代谢中发挥重要作用,CA在线粒体内不可或缺而被广泛研究。CA5B和CA5A是线粒体丙酮酸代谢的重要底物,在葡萄糖有氧代谢过程中发挥关键作用。从组织表达情况来看,小鼠CA5B和CA5A的表达呈现出不同的组织特异性,在大多数组织中都检测到CA5B,而CA5A的表达仅限于肝、骨骼肌和肾[13]。从序列上来看,CA5A基因序列在小鼠和人之间有78%相似性,CA5B基因序列在小鼠和人之间有95%相似性,CA5B的保守性更高[13]。人和小鼠CA同工酶序列之间的系统发育树表明,CA5B和CA5A都是从人和小鼠的祖先基因进化而来,并已经进化出了不同的生理作用[13]。本研究将小鼠CA5B的蛋白结构域序列与人和猪报道的CA5B结构域序列进行比较发现,CA5B结构域在猪和人之间的保守性(90.5%一致性)高于猪和小鼠CA5B保守性(86.4%一致性)。系统发育分析显示,人和猪CA5B在进化树上优先聚为一类,最后与小鼠聚在一起。因此,可以推断CA5B基因在物种间的保守性更高。
根据分析结果发现,CA5B蛋白互作网络中的基因编码肌球蛋白卷曲螺旋蛋白、钙稳态调节蛋白、线粒体跨膜蛋白、线粒体转运蛋白以及氨基水解蛋白。据文献报道,离子通道和代谢底物转运中,人线粒体溶质载体SLC家族与CA5B蛋白表达相关[21],推测CA5B在猪中可能也参与调控线粒体内物质转运过程,在线粒体内能量代谢中发挥重要作用。根据CA5B高表达于猪的脂肪、睾丸和卵巢组织,这些都是ATP合成和利用的重要组织器官。CA5B基因在小鼠成年皮下脂肪和生殖器脂肪表达量最高,其参与调节脂肪丙酮酸羧化[15]、糖异生和尿素生成[17]。因此,推测CA5B在猪中可能也参与调控糖和脂肪的代谢。在猪骨骼肌27个生长发育时间点中,CA5B基因胚胎期表达水平高于出生后时期。推测猪的CA5B与骨骼肌生长发育以及能量储存和利用有密切关系。与此同时,还发现CA5B可能受ssc-miR-22-5p调控。miRNA对机体发育和代谢具有重要的调节作用[22-23],是靶基因表达的关键调节因子[24],参与调节骨骼肌细胞增殖[25-26]、分化[27-28]和再生[29],一些miRNA调节成脂基因的表达、脂肪的形成[30]和分化[31]、白色脂肪棕色化[32]以及棕色脂肪扩张[33]。据研究报道,miR-22-5p是脂肪来源间充质干细胞的的重要参考基因[34],还在骨溶解中发挥重要作用[35]。因而,进一步推测ssc-miR-22-5p可能通过靶向CA5B参与调节猪的体内发育和代谢。最后,本研究分析发现了CA5B基因的3个A-to-G编辑位点。RNA编辑位点可能参与调节基因表达和细胞功能[36]、骨骼肌发育[19]、疾病发生[37]和肿瘤的发展[38],可能对猪基因的表达进行调控。
猪是重要的家畜,为我们的生活提供大量的蛋白质和脂肪。因此,研究分析参与调节猪糖代谢和脂肪生成的CA5B基因对于肉品质的改良有一定的参考作用。但是,现在对猪CA5B的研究较少,因此需要对该基因进行深入的挖掘以及功能验证。
本研究初步探讨了CA5B基因在10个物种间的保守性和进化特征,CA5B蛋白可能参与细胞内线粒体内外ATP的合成、物质转运以及体内氨基酸的分解代谢。ssc-miR-22-5p和3个RNA编辑位点潜在参与调控CA5B基因表达。CA5B可能在猪胚胎期的发育过程中发挥重要功能,在猪出生后能量储存和利用的组织中有关键作用。以上结果为更深入研究猪CA5B的功能提供了重要的信息和奠定了基础。
致谢
感谢北京畜牧兽医研究所猪基因工程与种质创新团队提供的科研平台,感谢实验室师兄、师姐、师弟、师妹在样品采集和数据分析时提供的帮助和支持,感谢团队所有人员的照顾和帮助。