杨 阳,侯 宇,赵树林,李璐璐,孙小燕,阿迪莱·艾力,赵红琼
(新疆农业大学动物医学学院,乌鲁木齐 830052)
【研究意义】胃泌素-胆囊收缩素家族多肽包括胃泌素(Gastrin, GAS)、胆囊收缩素(Cholecystokinin,CCK)、雨蛙素(Cerulein)和原脊索动物(Proctochordea)神经肽(Cionin)等多肽[1],在哺乳动物胃泌素-胆囊收缩素家族仅有GAS和CCK。GAS主要分泌于胃和十二指肠粘膜G细胞,而CCK主要分泌于十二指肠和空肠黏膜I细胞,它们对于消化液的分泌、消化道的生长发育具有重要的调节作用。在进行多肽功能研究、特异性抗体制备等过程中要注意动物氨基酸序列不同与受体的亲和力可能不同;多肽抗原序列不同,产生的抗体特异性不同,有必要了解目的多肽及其受体在动物种属之间的差异以及进化关系。【前人研究进展】根据氨基酸序列的长短,GAS主要包括具有34和17个氨基酸的GAS-34和GAS-17,CCK主要包括具有58、33和8个氨基酸的CCK-58、CCK-33和CCK-8。根据GAS和CCK羧基端(C-端)分别对应的第6位和第7位酪氨酸(Tyr)是否发生硫酸化,分为非硫酸化(-I)和硫酸化(-II)GAS和CCK,例如含17个氨基酸序列的非硫酸化胃泌素可表示为GAS-17-I,含33个氨基酸序列的硫酸化胆囊收缩素可表示为CCK-33-II。GAS-CCK家族包括CCK-A受体和CCK-B受体,均为7次跨膜(7-Transmembrane,7-TM)受体。7-TM受体一般包括N-端胞外域(含糖基化位点)、跨膜域(含三个细胞外环,三个细胞质环和七个疏水的跨膜片段)和C-端胞浆域(含蛋白激酶硫酸化位点)[3-4]。CCK-A仅同CCK-II结合力强[5],而CCK-B无论GAS和CCK酪氨酸硫酸化的程度如何均可结合,因而CCK-B也称为GAS/CCK-B受体[6-8]。【本研究切入点】目前,针对不同动物GAS和CCK及其受体氨基酸序列信息学的比较分析研究较少。研究对胃泌素和胆囊收缩素及其受体的氨基酸序列信息学进行比较分析。【拟解决的关键问题】研究比较GAS和CCK两种激素及其受体的氨基酸序列在不同动物种间的差异性,特别是羊同其他动物之间的序列差异,并进行生物信息学分析,为GAS-CCK家族多肽或受体对羊生长调控等领域的研究提供参考。
通过UniProt数据库 (https://www.uniprot.org/)用“Gastrin”或“CCK”为关键词检索Gastrin和CCK及其受体的氨基酸序列,在同一种动物有多个数据信息的时候,主要选用Swiss-Prot 标记“引用(Reviewed)”的数据。再用“排列(Align)”功能进行绵羊(Sheep)的某一种GAS和CCK多肽或受体蛋白氨基酸序列(主要为成熟肽或蛋白区域,不包括信号肽和原肽等)与其他动物序列差异进行比较。同时,比对了绵羊CCK-A与CCK-B氨基酸序列,并标明各自7次跨膜区域,为其抗原设计提供膜内外区域参考。
用1.1筛选出的不同动物GAS和CCK全肽或受体蛋白氨基酸,包括信号肽(Signal peptide)、原肽(Propeptide)、成熟肽(Peptide)等所有氨基酸序列,通过DNAstar的Megalign 7.1构建GAS和CCK全肽或受体蛋白氨基酸序列进化树[9]。
研究表明,绵羊(Sheep,UniProt 登录号O02 686,下同)GAS-34氨基酸序列同山羊(Goat,P04 564)、牛(Bovine,P01 352)、人(Human,P01 350)、小鼠(Mouse,P48 757)、大鼠(Rat,P04 563)、猪(Pig,P01 351)、豚鼠(Guinea pig,P06 885)、兔(Rabbit,G1TS39)、马(Horse,P55 885)、狗(Dog,P01 353)、猫(Cat,P01 354)、骆驼(Camel,S9XCX3)、鸡(Chicken,Q9PU41)、鱼(Fish,A0A0M4JAV4)等14种动物比对情况。从比对结果可知,除了鸡和鱼,其他动物GAS-34的C-端7个氨基酸完全相同;绵羊、山羊和牛GAS-34氨基酸序列完全相同;鸡和鱼GAS仅C-端4个氨基酸序列同其它动物。图1
注:蓝色背景氨基酸表示与绵羊GAS氨基酸序列比对不同的氨基酸
Note: The amino acids with blue background show differences compared to sheep gastrin
图1 不同动物GAS氨基酸序列比较
Fig.1 Comparison of gastrin amino acid sequences in different animals
在UniProt中用BLAST比较可知,绵羊的GAS氨基酸全长序列同山羊比较完全相同,相似性为100%;其次为牛,相似性为95.2%;同人、大鼠和小鼠相似性分别为69.7%、67.7%和67%。未在BLAST所列的250个氨基酸序列数据库中找到鸡和鱼的氨基酸比对数据。
用Megalign构建进化树分析GAS全氨基酸序列表明,羊与牛,狗与猫,兔与骆驼,大鼠与小鼠,鱼与鸡分别在同一个分支上,草食动物相对较近,而非草食动物相对草食动物远;鱼和鸡与其他哺乳动物相距最远。图2
图2 不同动物GAS全氨基酸序列进化树
Fig. 2 Evolution tree of whole gastrin amino acid sequence in different animals
研究表明,绵羊(Sheep,W5NZD6)CCK-33氨基酸序列同牛(Bovine,P41 520)、猫(Cat,M3W5D6)、小鼠(Mouse,P09 240)、猪(Pig,P01 356)、兔(Rabbit,G1T9Y3)、狗(Dog,Q9TS44)、人(Human,P06 307)、大鼠(Rat,P01 355)、马(Horse,F7BAG1)、骆驼(Camel,S9WZ08)、鸵鸟(Ostrich,Q9PU29)、鸡(Chicken,Q9PU41)、金鱼(Goldfish,O93 464)、豚鼠(Guinea pig,H0VR95)等14种动物比对情况。所有比对的15种动物CCK-4(C-端4个氨基酸)完全相同;绵羊、牛和猫CCK-33序列完全相同;除了豚鼠外,所有比对动物CCK-8(C-端8个氨基酸,为具有生物活性的最小CCK)完全相同;鸵鸟、鸡、金鱼和豚鼠CCK-33氨基端与绵羊等比较差异较大。
用Megalign构建进化树分析CCK氨基酸全序列表明,绵羊与牛,猪与猫,大鼠与小鼠,人与兔,鸵鸟与鸡分别在同一个分支上;鱼类和禽类与其他哺乳动物相距较远。在UniProt中用BLAST比较可知,绵羊同牛CCK氨基酸序列全长的相似性最高,达95.7%;其次为狗,达91.4%;同人、大鼠和小鼠相似性分别为80%、76.8%和74.8%;与鸵鸟的相似性最低,仅为49.2%。未在BLAST所列的250个氨基酸序列中检索到与豚鼠的相似性数据。
注:蓝色背景氨基酸表示与绵羊CCK氨基酸序列比对不同的氨基酸
Note: The amino acids with blue background show differences compared to sheep CCK
图3 不同动物CCK氨基酸序列比较
Fig. 3 Comparison of CCK amino acid sequence in different animals
图4 不同动物CCK全氨基酸序列进化树
Fig. 4 Evolution tree of whole CCK amino acid sequence in different animals
研究表明,CCK-A氨基酸序列进化树包括羊(Sheep,W5PET0)、牛(Bovine,A6QLH2)、人(Human,P32 238)、大鼠(Rat,P30 551)、小鼠(Mouse,O08 786)、猪(Pig,I3LFK5)、豚鼠(Guinea pig,Q63 931)、兔(Rabbit,O97772)、马(Horse,F7AHW8)、狗(Dog,Q5D0K2)、猫(Cat,M3W880)、鸡(Chicken,E5RVJ7)和鱼(Fish,H2LRS6)。在进化树中,大鼠与小鼠、狗与猫、羊与牛分别在同一个分支上,鱼类和禽类同其他哺乳动物相距较远。BLAST分析显示相对于绵羊CCK-A的氨基酸序列,与之相似性最高的是牛,为92.2%;其次为人、猫、猪,分别为87.6%、87.4%、87.2%;鱼与绵羊CCK-A相似性最低,仅为59.4%。图5
研究表明,CCK-B氨基酸序列进化树,包括羊(Sheep,W5QBM9)、牛(Bovine,P79266)、人(Human,P32239)、大鼠(Rat,P30553)、小鼠(Mouse,P56481)、猪(Pig,A0A287A2K5)、豚鼠(Guinea pig,H0VZC5)、兔(Rabbit,P46627)、马(Horse,F6S229)、狗(Dog,P30552)、猫(Cat,M3WFK8),鸡(Chicken,A0A1D5P3F3)和金鱼(Goldish,A0A0D5CPE1)。在进化树中,羊与牛、狗与猫、兔与人、豚鼠、大鼠与小鼠分别在同一个分支上,鱼类和禽类与其他哺乳动物相距较远。BLAST分析显示,对于绵羊CCK-B的氨基酸序列,相似性最高的为牛,达98.7%,其次为猪,达94.7% ,与鸡相似性最低,仅为57%。图6
图5 不同动物CCK-A全氨基酸序列进化树
Fig. 5 Evolution tree of whole CCK-A amino acid sequences in different animals
图6 不同动物CCK-B全氨基酸序列进化树
Fig. 6 Evolution tree of whole CCK-B amino acid sequences in different animals
从UniProt数据库检索发现绵羊CCK-A(W5PET0)和CCK-B(W5QBM9)氨基酸序列长度分别为452个和454个,位点相同氨基酸有216个,相似性为45.094%,但两个受体氨基酸序列均为“Unreviewed”。两个受体氨基酸序列比较可知,CCK-A和CCK-B的N-端胞外域分别为1~59和1~57位,C-端胞浆域分别为397~452和400~454位;两种受体七个疏水的跨膜片段氨基酸位置比较相近,但序列有所差异。图7
注:蓝色背景部分氨基酸为7次跨膜区域
Note:Amino acid with blue background means the 7-TM region
图7 绵羊CCK-A和CCK-B氨基酸序列比较
Fig.7 Amino acid sequences of the sheep CCK-A and CCK-B
对不同动物GAS和CCK及其受体氨基酸序列进行了比较,该比较结果可为不同动物这两种多肽及其受体蛋白抗原设计和活性多肽筛选提供参考。无论GAS还是CCK其生物学活性部位均在C-端[10],序列比对结果显示不同动物之间C-端氨基酸序列相对于N-端序列具有高度的保守性。尽管在生理功能方面GAS被认为主要是促进胃液的分泌,而CCK主要是促进胆囊收缩,但在生理功能方面两者具有一定交叉性,例如刺激胆汁和ghrelin分泌等功能[11-13]。因此,在用ELISA、蛋白印迹和放射免疫等方法检测和定位组织中GAS或CCK多肽的时候,要注意使用的抗体是否存在与CCK或GAS的交叉反应问题,如果存在交叉反应,多肽含量检测结果将偏高,而其组织定位可能出现假阳性。
从受体亲和力看,CCK-A仅同C-端第7位酪氨酸硫酸化的CCK(即CCK-II)结合力强,也就是说,如果要激活CCK-A受体,除了需要C-端保守的氨基酸序列外,第7位酪氨酸硫酸化也是必须的[14]。相反,无论GAS和CCK是否酪氨酸硫酸化,CCK-B均可与其结合[15]。目前,市面上出售的GAS或CCK产品,主要是根据人或鼠类氨基酸序列制备,因而在选购用于其他动物的GAS或CCK产品时,要关注购买多肽C-端序列是否和目的动物的相似,相似性越高,则在目的动物使用与其内源性受体亲和力越高,受体激活后表现出的生物学效应也越强。Zhao等[16]研究表明,一次性静脉注射牛GAS-17和GAS-34(无论是否第6位酪氨酸硫酸化)均可促进犊牛血液生长激素水平升高,而注射同样摩尔剂量CCK-4或者GAS-9均未影响犊牛生长激素水平,可见虽然后两种多肽与前两种多肽C-端部分氨基酸相同,但是却无该促进生长激素分泌的生物学效应。
CCK-A和CCK-B两种受体亚型均属于G蛋白偶联7-TM受体家族,包括N-端胞外域(含糖基化位点)、跨膜域(含三个细胞外环,三个细胞质环和七个疏水的跨膜片段)和C-端胞浆域(含蛋白激酶硫酸化位点)[17-18]。研究显示,羊CCK-A和CCK-B两种受体相似性仅为45.094%,这可能是它们同内源性配体(GAS和CCK)亲和力不同的原因之一[19]。在用多肽片段为抗原制备膜受体特异性抗体的时候,最好选择靶动物N-端胞外域或跨膜域的三个细胞外环氨基酸序列,这样利于将来获得的抗体在不破坏细胞的情况下与靶动物受体膜外区域结合。同样,在选择商品化受体抗体的时候,也要关注其使用的抗原氨基酸序列是否在靶动物受体序列存在或相似度高,以此初步判定是否可使用该商品化受体抗体。
哺乳动物血液循环中具有生物活性最小的GAS是GAS-17[20-21];研究显示,鸡和鱼GAS的C-端仅有5个氨基酸与哺乳动物相同,因而在禽类和鱼类是否存在具有生物活性的GAS值得探讨。哺乳动物血液循环中具有生物活性最小的CCK是CCK-8,而鸡和鱼CCK的C-端有10个氨基酸与哺乳动物相同,因而从氨基酸序列比对结果可以推测在禽类和鱼类应具有生物活性的CCK。
除了鸡和鱼,其他动物GAS-34的C-端7个氨基酸完全相同;绵羊、山羊和牛GAS-34氨基酸序列相似性为100%;鸡和鱼GAS仅C-端4个氨基酸序列同其它动物。所有比对的15种动物CCK-4(C-端4个氨基酸)完全相同;绵羊、牛和猫CCK-33序列相似性为100%;除了豚鼠外,所有比对动物CCK-8(C-端8个氨基酸,为具有生物活性的最小CCK)完全相同。
绵羊的GAS氨基酸全长序列同山羊比较完全相同,相似性为100%;其次为牛,相似性为95.2%;绵羊同牛CCK氨基酸序列全长的相似性最高,达95.7%;其次为狗,达91.4%。从GAS和CCK及受体全氨基酸序列(包括信号肽和原肽)来看,禽类和鱼类序列同哺乳动物差距均较大;绵羊CCK-A与CCK-B氨基酸序列相似性仅为45.094%。
GAS和CCK的C-端氨基酸序列在不同动物之间均具有高度的保守性,而N-端为变化区域。该信息分析学结果为不同动物这两种多肽及其受体蛋白抗原设计和活性多肽筛选等研究提供参考。