人源OR51E2基因家族全基因组进化和功能分析

2022-02-18 04:14蒙爱魏思昂丁志文冯焱
科学技术与工程 2022年2期
关键词:人源进化树腺癌

蒙爱, 魏思昂,, 丁志文, 冯焱*

(1.山西农业大学生命科学学院, 太谷 030801; 2.复旦大学中山医院心血管病研究所, 上海 200032)

短链脂肪酸 (short chain fatty acids, SCFAs) 是特定结肠厌氧菌发酵膳食纤维后产生的主要细菌代谢产物,主要包括:乙酸、丙酸、丁酸、戊酸和己酸[1],SCFAs 通过扩散或者被结肠上皮细胞主动吸收后进入血液循环系统,一方面大部分的 SCFAs 可作为能量物质参与机体新陈代谢,另一方面作为 HDACi 调控基因的表观遗传[2]。目前大量的研究表明 SCFAs 对机体外周免疫及中枢神经系统 (central nervous systerm, CNS) 免疫反应的调节发挥重要作用。膳食纤维的摄入减少或肠道微生物群的限制与炎性肠疾病和心血管疾病的发展有关[3-6],这强调了SCFAs是重要的免疫调节代谢物。

SCFAs可通过结合SCFAs受体发挥作用。目前,已发现的SCFAs受体主要为G蛋白偶联受体 (G-protein-coupled receptors, GPR),包括GPR41、GPR43和GPR109[7- 8]。GPR41和GPR43又被称为游离脂肪酸受体3 (free fatty acid receptor 3, FFAR3) 和FFAR2,广泛存在于免疫细胞和肠上皮内分泌细胞等多种类型的细胞中。如GPR43可在肠内分泌细胞、免疫细胞、脂肪细胞中大量表达[9];GPR41在平滑肌细胞、肠内分泌细胞、神经细胞等多种细胞中广泛表达;GPR109A可在大肠上皮细胞、结肠细胞、肝细胞、脂肪细胞和免疫细胞中大量表达[10]。其中,GPR43和GPR41可被乙酸、丙酸和丁酸激活,GPR109A可被丁酸激活。通过激活GPCRs受体,SCFAs可激活免疫反应的信号转导途径,在肠黏膜中发挥抗炎作用[11]。乙酸、丙酸和丁酸均可结合并激活GPR41和GPR43,参与调节器官的代谢、免疫和能量稳态。在缺血性脑梗死的研究中表明,梗死降低了 SCFAs 在肠道内的水平[12]。乙酸是消化道内生物代谢的中间产物或最终产物,其浓度对动物的肠道健康发挥着巨大作用[13];与其他种类 SCFAs相比,丙酸可通过血液吸收到达不同器官,作为脂肪生成和糖质新生的底物,并能通过与G蛋白偶联受体GPR41和GPR43结合来调节不同基因的表达;丁酸的脑保护作用最强补充丁酸治疗缺血性模型可以过重塑肠道菌群,丰富有益的乳酸菌,修复肠道屏障,是治疗缺血性脑梗死的有效方法[14]。

嗅觉感受受体 (olfactory receptor, Olfr) 78 (也称为OR51E2) 为一种新发现的SCFAs受体,主要分布于肾脏和血管,参与调节肾素的分泌,可与GPR41、GPR43相互拮抗共同调节机体的血压水平[15]。迄今为止,关于OR51E2基因家族全基因组的分析仍然缺乏。基于此,现采用生物信息学方法对人源OR51E2基因家族基因序列进行分析,进一步比较其蛋白组分、结构、理化特性、系统发育和直肠腺癌关系,以期为OR51E2基因家族在遗传进化过程和疾病治疗研究提供有力的基础支撑。

1 材料和方法

1.1 基因序列获取

从NCBI数据库下载人源OR51E2基因家族序列,主要包括OR51E1、OR51E2。从NCBI数据库下载人、大鼠、小鼠、鸡、蛙和G.bichir(塞内加尔多鳍鱼) 等脊椎动物蛋白序列构建系统进化树。

1.2 人源OR51E2基因家族序列比对和保守基序预测

利用MEGA-X软件对人源OR51E2基因家族蛋白序列比对,首先使用 Blast P 和 T Blast N 算法搜索智人,预测基因的蛋白序列和基因组序列,常数e阈值选择10-5。然后将获得的序列与 Pfam 数据库进行比较, 检测是否存在OR51E2保守结构域。接然后提交到 MEME 在线网站对其保守基序进行分析,参数为默认设置。

1.3 氨基酸组成、结构和理化特性分析

用Expasy 数据库对基因蛋白氨基酸组成和相关理化性质分析获得蛋白的等电点和相对分子质量的信息。采用 Protparam-tool工具对编码氨基酸序列和氨基酸组成分析。采用SWISS-model工具对下载的氨基酸序列预测蛋白二级结构,使用PYMOL软件将OR51E1和OR51E2结构可视化。

1.4 系统发育树构建

采用邻接法 (neighbor-joining, NJ) 构建系统发育树,并对生成的系统发育树进行校正,校验参数 Bootstrap 重复1 000次,得到最终的系统发育树。

1.5 OR51E2生物学作用分析

使用GeneMIANA软件分析OR51E2相关的共表达、相互作用、共定位、共享蛋白结构域网络和信号通路等相关生物学作用。

1.6 OR51E2基因在直肠腺癌中表达和预后分析

通过GEPIA2分析OR51E2在直肠腺癌患者和正常健康人基因表达和预后。设置条件为总体生存,95%置信区间,基于COX PH模型计算危险度。

2 结果分析

2.1 人源OR51E2基因家族鉴定和理化特性分析

人源OR51E2基因家族一共包含两种,即OR51E1和OR51E2。氨基酸组成 (图1) 分析显示含量最高和最低的分别为亮氨酸和色氨酸,但是其他氨基酸在蛋白含量有所差异,如异亮氨酸在OR51E1蛋白中含量 (9.7%) 在第二位,但在OR51E2蛋白中含量第二位的是缬氨酸 (10.6%),序列比对结果 (图2) 显示,二者在整体氨基酸组成上基本保守,为了进一步体现二者在结构域生物学作用的保守性,用MEME软件分析展示了3种基序 (图3)。蛋白结构 (图4) 显示,人源OR51E1、OR51E2为单链结构,且α-螺旋结构占主导地位,OR51E1蛋白N端α-螺旋结构较OR51E2长,表明OR51E1、OR51E2在功能上存在差异。理化特性显示 (表1),OR51E1包含318个氨基酸,分子质量为35 402.40,等电点为8.71,无信号肽;OR51E2包含320个氨基酸,分子质量为35 492.64,等电点为9.16,无信号肽,OR51E1、OR51E2为非分泌蛋白。此外,结构域显示OR51E1、OR51E2均包含一个7tm4功能结构域,分别在氨基酸33~310和30~309区段。

A为丙氨酸;R为精氨酸;N为天冬酰胺;D为天冬氨酸;C为半胱氨酸;Q为谷氨酰胺;E为谷氨酸;G为甘氨酸;H为组氨酸;I为异亮氨酸;L为亮氨酸;K为赖氨酸;M为甲硫氨酸;F为苯丙氨酸;P为脯氨酸;S为丝氨酸;T为苏氨酸;W为色氨酸;Y为酪氨酸; V为颉氨酸图1 人源OR51E1、OR51E2氨基酸组成分析 Fig.1 Amino acid composition analysis of human OR51E1 and OR51E2

图2 人源OR51E1、OR51E2序列比对结果Fig.2 Sequence alignment results of human OR51E1 and OR51E2

图3 人源OR51E1、OR51E2保守基序Fig.3 Conserved motifs of human OR51E1 and OR51E2

图4 人源OR51E1、OR51E2高级结构Fig.4 Advanced structure of human OR51E1 and OR51E2

表1 人源OR51E1、OR51E2理化特性分析Table 1 Analysis of physicochemical properties of human OR51E1 and OR51E2

2.2 OR51E2蛋白家族系统进化树

为了研究OR51E2蛋白家族系统状况,从公共数据库下载了人、大小鼠、鸡、兔、蛙和G.bichir等14条蛋白序列构建OR51E2蛋白家族系统进化树(图5),进化树为有根树,根源动物为G.bichir,进化树主要分为三簇,OR51E1、OR51E2和OR51E2_ (G.bichir的一类蛋白)。OR51E1包含5类:人、兔、狗、牛和蛙,OR51E2包含6类:人、大小鼠、狗、鸡、牛,OR51E2_包含OR51E2三种亚型。在OR51E1簇中人与兔亲缘性最近,OR51E2簇中人与狗亲缘性最近,而大小鼠亲缘性最近。OR51E2_簇中OR51E2_1与OR51E2_2亲缘性最近。从整体进化树来看,OR51E2蛋白家族系统进化树动物亲缘性从水生动物 (G.bichir)-两栖动物 (蛙)-陆生动物 (人)。

M.musculus为小鼠;Rat为大鼠;Dog为狗;H.sapiens为 人;Cattle为 牛; Chichen为 鸡;Frog为蛙;Rabbit为 兔; G.bichir为塞内 加尔多鳍鱼 图5 OR51E2蛋白家族系统进化树Fig.5 Phylogenetic tree of OR51E2 protein family

2.3 OR51E2生物学作用

用Gene MANIA软件分析OR51E2的生物学作用 (图6)。OR51E2共表达基因包含:AKT3、NRL、GNGT1、PRAC1、SLC45A3、ANO7、NKX3-1、KLK4、OR51E1、PAEP、NPY、KLK2、KLK3、TGM4、SEMG2、FAM159A、OR51E2、CPNE4。预测发现OR51E2与AKT3、NRL相互作用,并且AKT3、NRL为OR51E2上下游作用因子。共蛋白结构域和信号通路显示OR51E2与GNB1、GNGT1、GNAL、ARRB2存在同一个群体之中。

图6 OR51E2生物相互作用网络Fig.6 Biological interaction network of OR51E2

2.4 OR51E2基因在直肠腺癌中表达和预后分析

由于OR51E2是一种SCFAs受体蛋白,在肠道的生理功能发挥重要的功能,研究OR51E2基因在直肠腺癌中的表达和预后至关重要。采用GEPIA2软件对OR51E2基因在直肠腺癌患者和健康人的mRNA和预后分析,结果如图7(a)所示,OR51E2mRNA表达量在直肠腺癌患者显著降低,生存曲线分析[图7(b)] 显示OR51E2差异表达对预后有影响,高风险比值为1.5,但是时序检验logrankP=0.38,无生物统计学意义。结肠癌患者共纳入92例,健康患者318例,红色盒子为直肠癌患者OR51E2mRNA表达量;灰色盒子为健康人OR51E2mRNA表达量。

TPM为每百万转录;logrank为时序检验;HR为高风险比值;n为数量图7 OR51E2基因在直肠腺癌中表达和预后分析Fig.7 Expression and prognosis of OR51E2 gene in rectal adenocarcinoma

3 讨论

OR51E2基因家族是动物特有的基因,负责气味信号的识别和G蛋白介导的转导,在免疫、炎症和结直肠癌均起着重要作用[16]。而现今,关于OR51E2基因研究相对较少,现基于生物信息学对人源OR51E2基因家族综合分析,在人源OR51E1、OR51E2基因中包含3个保守基序。基因组的氨基酸组成、结构是展示功能差异的主要区别。人源OR51E2基因家族中OR51E1氨基酸组成和α-螺旋结构较OR51E2存在某些差异,说明这些氨基酸和α-螺旋结构改变了基因的功能,可能在基因的进化过程中将基因序列改变和丢失以产生各种机体需要的功能。OR51E1、OR51E2开放阅读框含有大量相同的保守基序,表明在参与机体的生物学功能中二者存在一定的相似性。

进化树中相同分支的基因可能有相似的功能,OR51E1、OR51E2与嗅觉气味分子相互作用,启动一种神经元反应,触发对气味的感知。同样位于OR51E2_簇中的G.bichir中的 OR51E2基因家族成员,可能也有类似的功能;大小鼠也通过OR51E2蛋白在嗅觉相关功能发挥重要作用。

从拓扑结构进化树可以发现,OR51E2基因家族系统发育树包含三簇,OR51E1簇中人与兔亲缘性最近,OR51E2簇中人与狗亲缘性最近。OR51E2_簇中OR51E2_1与OR51E2_2亲缘性最近。从整体进化树来看,OR51E2蛋白家族系统进化树动物亲缘性从水生动物 (G.bichir)-两栖动物(蛙)-陆生动物 (人)。基因在进化过程中为了更利于生存进化和改变一些原有的功能是普遍现象,可能是自然选择和蛋白质相互作用的结果。

Jovancevic等[17]研究发现OR51E2的活化诱发ERK1/2和AKT的激活,从而激活后视网膜色素上皮细胞细胞迁移和增殖增加。NRL编码Maf亚家族的基本基序-亮氨酸拉链转录因子,编码的蛋白在脊椎动物中是保守的,并且是光感受器发育和功能的关键内在调节剂。临床研究显示布哈拉犹太人NRL突变增加可能增加了眼肌型肌营养不良症患病风险[18]。本文研究中的蛋白相互作用网络显示,OR51E2与AKT3、NRL在同一信号通路发挥生物学功能,暗示 OR51E2可能在肠道细胞的营养代谢和细胞增殖有关。

嗅觉感受器属于G蛋白偶联受体家族,在介导多种细胞功能的非感觉性组织中均有异位表达。Gelis等[19]研究表明OR51E2激活后细胞内Ca2+和cAMP升高,从而介导黑色素合成的增加。抑制肿瘤细胞的OR51E2表达能够有效抑制这种癌细胞增加的转移扩散[20]。先前研究表明OR51E2在前列腺瘤和黑色素瘤中癌细胞增殖和迁移的调控[21-23]。但是关于OR51E2在肠道疾病的报道并不多,Kotlo等[24]研究结果表明Olfr-78基因敲除小鼠感染、免疫、炎症和结直肠癌相关基因发生了显著变化,在葡聚糖硫酸钠和2,4,6-三硝基苯磺酸诱导的结肠炎中表达下调。这与本文研究发现在直肠腺癌患者的OR51E2显著降低相一致。暗示OR51E2可能在肠道炎症中发挥重要作用。需要进一步研究了解OR51E2在人肠道是如何调节肠道的病理生理过程。

4 结论

对人源OR51E2基因家族做了全基因组的生物信息学鉴定和分析,一共发现了OR51E1和OR51E2两个基因。进一步分析人源OR51E2基因家族基因氨基酸组成、结构、保守结构域、理化特性等。系统进化树结构表明OR51E2基因家族经历了自然选择。最后通过基因表达和生存曲线分析显示OR51E2在直肠腺癌的病理学过程中起着重要作用,这为进一步研究OR51E2基因家族的功能和在病理学过程起到的作用奠定了基础。

猜你喜欢
人源进化树腺癌
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
III型重组人源胶原蛋白在生物医药工程中的应用研究
重组人源胶原蛋白制备关键技术研究
全国唯一人源化抗体小鼠 进入药物开发应用阶段
益肺解毒方联合顺铂对人肺腺癌A549细胞的影响
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
小鼠早期肺腺癌模型的建立
高效液相色谱-同位素稀释-串联质谱法测定人源瘦素的含量