韩剑星 杨丽华 赵 华 安 颖 马宇锋
(山西医科大学第二医院口腔科 山西太原 030001)
有研究表明,阻塞性睡眠呼吸暂停综合征(obstructive sleep apnea syndrome,OSAS)高度流行于各年龄段人群[1]。该疾病会因睡眠中上气道阻塞引起呼吸暂停等病征,不仅影响人们的正常睡眠,而且可能因通气量不足而引起或加重心血管疾病[2],造成生命危险。目前OSAS 的具体病因尚不明确,人们普遍认为该疾病是由诸如肥胖、炎症、气道结构异常、中枢及内分泌因素等综合因素引起的,而肥胖则被认为是其中风险最高的因素[3]。FNDC5(fibronectin type Ⅲdomain containing 5)也称鸢尾素(irisin),最早由哺乳动物基因收集(Mammalian Gene Collection,MGC)项目组于2002年报道[4]。2012年,Boström P 等[5]首次 报道了FNDC5 与肥胖的关系。他们的研究表明,血清中的鸢尾素可通过运动进行诱导产生,且血清鸢尾素水平只需轻微地升高便可增加小鼠体内能量的消耗,调节体内葡萄糖稳态的平衡,改善肥胖状况。该发现经报道后受到人们的广泛关注,许多研究者将其视为肥胖临床治疗领域的重大突破。
2016年,Yanli Li 等[6]报道了他们对165 名男性OSAS 患者和98 名健康男性受试者血清鸢尾素浓度进行的横断面研究。结果显示,OSAS 患者血清鸢尾素浓度明显低于对照组,且随着OSAS患者病情严重程度的增加,血清鸢尾素水平显著降低。研究者首先认为鸢尾素通过抑制肥胖发展,可在OSAS 发病机制中对人体产生保护作用,且该结论有丰富的文献资料支持。其次,鸢尾素还被认为与炎症反应有关,可通过降低炎症因子,进而抑制或恢复多种疾病[7-8],而且与其具有高度同源性的FNDC4 同样具有降低炎症趋化因子的功能[9],因此,研究者推测,鸢尾素也可通过抗炎作用参与抑制OSAS 的发生或发展。虽然该研究具有一定的局限性,但仍有理由相信,血清鸢尾素水平与OSAS的发生或发展呈负相关。
本文运用一系列生物信息学工具和方法,对OSAS 相关因子FNDC5 的结构、功能、蛋白相互作用等作出预测和分析,以期得到更为深入的FNDC5 的数据和结论,为将来OSAS 发病机制或治疗方法等领域的研究提供可靠的理论依据。
1.1 材料FNDC5基因与蛋白质的相关数据由美国国立生物技术信息中心(NCBI)获得,网址为https://www.ncbi.nlm.nih.gov/gene/252995。为使结果更加准确、专一,选取了FNDC5 蛋白的第一亚型进行分析,本文统称为FNDC5 蛋白。该亚型在NCBI 的定义为FNDC5 protein [Homo sapiens],其GenBank 登录号为AAH62297.1,网址为https://www.ncbi.nlm.nih.gov/protein/AAH62297.1。
1.2 方法 FNDC5 的基本生物学信息由以下途径获取:SignalP 4.0 Server(http://www.cbs.dtu.dk/services/SignalP-4.0/)分析包括分子量、氨基酸比率、不同电性氨基酸数、理论等电点、理论半衰期、不稳定指数、脂肪指数等在内的多种理化性质;Protscale(http://web.expasy.org/protscale/)对该蛋白进行亲疏水性分析;ProtParam(http://web.expasy.org/protparam/)对该蛋白的信号肽结构进行预测;TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)分析该蛋白是否具有跨膜结构。
FNDC5 的组织表达特异性和亚细胞定位等由以下软件或数据库分析得到:NCBI 相关数据库中查找该蛋白的组织表达特异性;PSORT Ⅱ(https://psort.hgc.jp/form2.html)分析该蛋白的亚细胞定位。
FNDC5 的二、三级结构由以下软件预测:NCBI 相关数据库分析FNDC5 的保守结构域;SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html) 分析该蛋白的二级 结 构;SWISS-MODEL(https://swissmodel.expasy.org/)分析该蛋白的三级结构。
FNDC5 的翻译后修饰情况由以下软件预测:NetNGlyc 1.0 Sever(http://www.cbs.dtu.dk/services/NetNGlyc/) 预测FNDC5 的N-糖基化位点;NetOGlyc 4.0 Server (http://www.cbs.dtu.dk/services/Net OGlyc/) 预测O-糖基化位点;Netphos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)预测磷酸化位点。
FNDC5 的蛋白互作关系由STRING(http://string-db.org/)构建并分析。设置“置信度为0.7,预测所得蛋白数不超过10 个”为条件,进行预测,得到与FNDC5 可产生各类相互作用的蛋白质,并由STRING 对这些蛋白产生的相互作用进行分析,得到KEGG 通路和GO 生物过程等分析报告,为FNDC5 的功能预测提供佐证。
2.1 FNDC5 的基本性质 NCBI 数据库中,FNDC5基因ID 为252995,定位为1p35.1,外显子数为7。FNDC5 蛋白的GenBank 登录号为AAH62297.1,共有153 个氨基酸,分子式为C762H1225N213O229S9,分子量为17.32294×103。经ProtParam 统计,组成该蛋白的氨基酸中谷氨酸(Glu)占比最高,为9.2%,共14 个;组氨酸(His)和酪氨酸(Tyr)占比最低,均为1.3%,分别有2 个。FNDC5 蛋白带负电氨基酸残基(谷氨酸、天冬氨酸)的总数为19,带正电氨基酸残基(赖氨酸、精氨酸)的总数同样为19,理论等电点为6.74,因此该蛋白接近中性。FNDC5 蛋白的N 端氨基酸为甲硫氨酸,因此该蛋白的半衰期较长,在哺乳动物Rtc 中为30 h。FNDC5 蛋白的稳定性较差,其不稳定指数为50.58。此外,经分析FNDC5蛋白的脂肪族氨基酸指数为83.46。
Protscale 对FNDC5 蛋白的亲疏水性分析如图1A 所示(见封四),疏水性得分最高的氨基酸残基是位于84 位的缬氨酸残基(Val),得分为4.022;亲水性得分最高的是位于109 和111 位的脯氨酸残基(Pro)和天冬氨酸残基(Asn),得分均为-3.378。从图中可观察到,组成该蛋白的氨基酸大都分布在亲水区(负值),考虑到ProtParam对FNDC5 的平均亲水性数值(grand average of hydropathicity,GRAVY) 预测结果为-0.370,认为该蛋白应为亲水性蛋白。
FNDC5 的信号肽结构由SignalP 4.0 Server 预测,结果如图1B 所示,图中C、S、Y 值分别反映剪切位点、是否为分泌蛋白及前二者的综合分析。报告显示,C 值最大位于17 位,为0.112;Y 值最大位于5 位,为0.120,由图可知此处讨论S 值的平均值已无意义,且可判断该蛋白无信号肽结构。不仅如此,SecretomeP 2.0a Server(http://www.cbs.dtu.dk/services/SecretomeP/)显示该蛋白的SecP 得分(NN-得分)仅0.096695,远小于判定哺乳动物非经典分泌蛋白应超过的阈值0.6,因此FNDC5 不属于非经典分泌蛋白。
FNDC5 蛋白的跨膜结构由TMHMM Server v.2.0 预测,结果如图1C 所示,该蛋白存在1 个跨膜结构域(图中红色粗线),位于第79~97 位,1~74 位位于膜外,98~153 位位于膜内,是一个典型的跨膜蛋白。
2.2 FNDC5 的组织表达特异性和亚细胞定位 为了找到FNDC5 的组织表达特异性相关信息,笔者查找了NCBI 的2 个数据库:基因库和EST 数据库。NCBI 基因库对代表27 种不同组织的95 个人类组织样本进行RNA-seq,以确定蛋白质编码基因的组织特异性,以RPKM(reads per kilobase per million mapped reads)为单位表示结果,FNDC5在心脏中表达量最高,达到13.532;在胰腺中表达量最低,仅为0.068;其余表达较高的组织有:肝脏(8.587),肾上腺(7.224),唾液腺(6.576),食管(5.168)等。NCBI 的EST 数据库对FNDC5 基因表达量以TPM(transcripts per million)表示,表达量较高的组织有:肌肉131,眼95,肺89,心脏33,脑31,前列腺31,子房19,血管19,胚胎组织18,血液8。
对FNDC5 蛋白的亚细胞定位分析结果显示,43.5%的FNDC5 蛋白定位于线粒体,52.2%分散于其他细胞器,另外4.3%位于细胞核内。
2.3 FNDC5 蛋白的二、三级结构 FNDC5 蛋白的二级结构由SOPMA 预测,如图1D 所示,二级结构中无规卷曲(黄线)为主要结构,占全长的54.25%,α-螺旋(蓝线)占24.18%,延长链(红线)占18.95%,β-转角(绿线)占2.61%,预测结果显示除此之外可能不存在其他类型的二级结构。
为确定FNDC5 蛋白的保守结构域,通过NCBI相关数据库对其进行了同源比对,结果如图2(见封四)所示。FNDC5 蛋白共包含2 个不同的超家族结构域,分别为位于5~49 位的纤连蛋白3型超家族(FN3 superfamily)结构域,以及位于76~109 位的功能尚未明确的DUF4808 超家族(DUF4808 superfamily)结构域。
FNDC5 的三级结构由SWISS-MODEL 预测,该软件共匹配到与FNDC5 相关的8 个模板进行建模,共得到1 个标准模型,结构如图3所示,该模型的GMQE 为0.26,QMEAN 为-1.29,该蛋白不含配体,模型拟合率为100%。因此该模型应为FNDC5 的标准三级结构模型。
图3 FNDC5 蛋白的三维结构预测
2.4 FNDC5 蛋白的翻译后修饰位点 经转录和翻译后形成的原始蛋白质往往不具有生物学功能,或处于无活性状态,它们需要经过多种细胞器的加工和修饰,再经生物酶的催化或变构,才能最终发挥其应有的生物学特性。笔者对FNDC5 的一部分翻译后修饰位点作了初步的预测,包括氧和氮的糖基化位点、蛋白磷酸化位点,这些位点对于蛋白质发挥自身生物学活性普遍起着十分重要的作用,预测这些位点的存在与否及其具体位置对于揭示蛋白质进一步的生物学现象、研发相关药物、发掘相关通路等科研活动均具有重要意义。
O-糖基化位点由NetOGlyc 4.0 Server 预测,共发现2 个O-糖基化位点,分别是位于49 位的苏氨酸(得分0.568393)和位于58 位的丝氨酸(得分0.720518),其中58 位的丝氨酸更有可能是真正的O-糖基化位点。N-糖基化位点由NetNGlyc 1.0 Server 预测,结果仅发现1 个可能的N-糖基化位点,是位于第9 位的天冬氨酸,得分为0.5771。NetPhos 3.1 Server 预测结果显示,FNDC5蛋白可能的磷酸化位点较多,选取了可能性较大的7 个位点,以得分大于0.7 计,分别为:24 位的苏 氨酸(0.744)、26 位的 酪氨 酸(0.949)、42 位的丝氨酸(0.847)、49 位的苏氨酸(0.990)、118位的丝氨酸(0.997)、120 位的丝氨酸(0.994)和123 位的丝氨酸(0.973)。
2.5 FNDC5 蛋白的蛋白互作关系及分析 TRING对与FNDC5 可产生相互作用的蛋白进行了预测,设置置信度为0.7 后,共得出7 个与FNDC5产生相互作用的蛋白,分别为:UCP1(得分0.916)、MSTN(得分0.833)、LEP(得分0.789)、PPARGC1A(得分0.785)、BDNF(得分0.776)、FGF21(0.736)和FNDC9(0.726)。
蛋白互作分析结果中,KEGG 通路的报告结果如表1所示,与FNDC 蛋白相关的蛋白参与的信号通路共有8 种,其中,PPARGC1A 与LEP 共同参与的信号通路有hsa04920(脂肪细胞因子信号通路)及hsa04152(AMPK 信号通路),这2 个信号通路与肥胖及炎症反应的发生、发展都具有重要关系。GO 生物过程分析表明,FNDC5 蛋白在体内参与肌肉活性应答及棕色脂肪细胞分化的调节,与其相关的蛋白也参与多种脂肪细胞生长分化、糖代谢、胰岛素信号通路调节、炎症反应及体内脂质代谢等多种生物学过程。可观察到,FNDC5互作蛋白网络中涉及的信号通路及生物过程,有相当一部分均与OSAS 的病理机制有关,这为本研究及分析提供了有力的理论支持。
表1 FNDC5 蛋白网络中涉及的KEGG 通路分析
通过各种生物信息学工具的预测分析,了解到FNDC5 蛋白是一种亲水的近中性不稳定蛋白,在肌肉组织中的特异性表达较高,在细胞内线粒体中的分布最为广泛。FNDC5 蛋白不属于非经典分泌蛋白,拥有一个跨膜结构域。该蛋白的二级结构中无规卷曲所占比例过半,三级结构现已基本可确定。FNDC5 拥有属于纤连蛋白3 型超家族和功能尚不明确的DUF4808 超家族的结构域,蛋白互作网络中可看到其与肥胖及炎症反应密切相关。经预测,该蛋白共有2 个O-糖基化位点和1个N-糖基化位点,可信度较高的蛋白磷酸化位点在预测中共确定7 个,这些结果表明FNDC5 具有进行进一步结构修饰的潜力。这些结构修饰可能增加鸢尾素促进脂肪代谢的能力,或降低组织对鸢尾素的耐受性,或改善血清鸢尾素的抗炎效果。虽然这些预测需要更深入的在体及体外实验才能验证,但本研究结果将为今后类似的研究及讨论提供重要的有关鸢尾素结构、性质、功能方面的理论依据。
在KEGG 通路分析所提到的信号通路中,脂肪细胞因子信号通路及AMPK 信号通路被认为是与OSAS 密切相关的。由脂肪组织分泌的例如白介素-6、8、10 及TGF-β 等因子,不仅可通过诱导增加葡萄糖的摄取而促进肥胖的发生[10],还与炎症反应有关[11],而脂肪细胞因子信号通路就是这些生物学过程发生的必要条件。AMPK 在能量代谢中意义重大,研究表明该通路可抑制脂肪组织中线粒体的形成,进而控制脂肪组织的生长[12]。此外,这2 条通路并不是相互独立的,研究表明脂肪细胞因子可介导AMPK 信号通路[13-14],因此,这2 条信号通路参与的生物学过程及发挥的生物学作用可能是相互交叉的。值得注意的是,在与FNDC5 产生相互作用关系的7 个蛋白中,LEP 与PPARGC1A 都同时参与了上述2 个信号通路。LEP 也称瘦素,血清瘦素蛋白可与大脑中的相关受体结合并参与相关信号通路,抑制摄食并促进能量消耗。瘦素还具有内分泌功能,参与免疫和炎症反应。PPARGC1A 是一种转录共激活因子,可调节参与能量代谢的基因的表达,还可参与控制血压,调节细胞胆固醇稳态和肥胖的发展。在STRING 的分析报告中还指出,LEP 与PPARGC1A共同参与了白色脂肪细胞分化的转录调节这一反应途径,而FNDC5 则为棕色脂肪生长的刺激因子,因此可推测,这3 种蛋白在脂肪组织的生长与发展过程中起到了十分密切的作用。不仅如此,众多证据也表明,这3 种蛋白同样与炎症反应密切相关。综合考虑OSAS 的发病机制,不难预测,FNDC5、LEP 及PPARGC1A 通过脂肪细胞因子信号通路及AMPK 信号通路,参与脂肪组织的发育并调节炎症反应的发展,以肥胖、炎症反应、内分泌调节等多种形式,诱导OSAS 的发生,并产生包括睡眠呼吸暂停在内的多种病理表现,加重OSAS患者的病情。
自FNDC5 与肥胖的关系被报道后,越来越多的研究人员开始关注由此可能引起的其他疾病,OSAS 就是其中之一[15]。虽然笔者的研究尚未进入实验阶段,研究结果仍具有一定的局限性,但通过可靠的生物信息学分析工具,对FNDC5 相关结构、性质、功能等作出了严谨的预测和分析,使FNDC5与OSAS 发病机制的相关关系得到了进一步揭示。相信在此基础上进行进一步实验探索后,人们对FNDC5 与OSAS 的认识将会有更大的突破。