周贤敏,区灿盛,邓森荣,杨赛亚,张学武,曾巧辉*
(1.佛山科学技术学院食品科学与工程学院,广东佛山 528225)(2.华南理工大学食品科学与工程学院,广东广州 510640)
新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19),简称为“新冠肺炎”[1],是人类和动物感染新型冠状病毒(2019-nCoV)而引起严重的呼吸道感染疾病[2],2019 年12 月在中国武汉发现[3],2020年1 月世界卫生组织紧急委员会宣布中国爆发疫情,被认为是国际关注的突发公共卫生事件[4],快速传播的特征导致其在全球广泛流行,并成为全球关注的问题[3]。查看霍普金斯大学研发的在线网站[5],截止2021年3 月28 日,新冠病毒已夺走2778682 人的生命,涉及192 个国家/地区。目前,虽然已经开发出新型冠状病毒灭活疫苗和减毒疫苗,但是仍然没有治疗新冠肺炎的特效药,也缺乏关于新冠肺炎治疗的调查[4]。据Michael 等[6]的调查,发现至少有50%的新冠感染来自接触无症状感染者。新冠肺炎的广泛传播主要是由于没有或轻微症状的人推动,但他们没有被认为是新冠肺炎患者,结束新冠肺炎全球大流行的关键在于无症状或轻微症状的传播[7]。Mpro是冠状病毒的主要蛋白酶,抑制该酶的活性可以阻止病毒复制和转录,是SARS-CoV-2 最具特征的有效药物靶标[8-9]。研究人员开始利用分子对接分析来研究一些常见的植物蛋白质抑制SARS-CoV-2 Mpro的潜力[10]。
优质蛋白质是COVID-19 潜在感染者和患者的重要营养补充剂。蛋白质是构成人体组织细胞的主要成分,对于维持机体的正常免疫功能、防御病毒感染有至关重要的作用。花生(Arachis hypogaea)含有丰富的蛋白质[11],广泛种植于亚洲、非洲、美洲等地区[12],我国花生种植资源丰富,产量稳居世界第一[13]。花生蛋白质中含有八种人体所必需的氨基酸,其中天门冬氨酸、谷氨酸含量高于其他粮油作物,具有较高的营养价值[14],且有效利用率高[15]。
新的药品研发需要大量的时间[16],疫苗生产到全球接种也需要漫长的时间,在这种情况下,补充优质蛋白以增强新冠病毒潜在感染者的体质是关键,同时药物治疗辅以营养补充剂的方式可能会帮助患者更好地恢复健康[2]。花生产量多且蛋白质含量高,人们以其多肽研制抑制剂和营养补充剂已有先例[17]。花生蛋白的组成及分类的研究众说纷纭,根据不同的原理会有不同的分类方法。本文首先对花生蛋白的分类进行简要综述,筛选出花生中所含的代表性蛋白,通过计算机模拟胃肠道对花生蛋白进行水解,得到的低聚肽(2≤肽段长度≤5)与SARS-CoV-2 Mpro结合。通过对接分数来预测花生作为营养补充剂同时增强潜在感染者体质的潜力。
目前国内外以花生蛋白的组成及分类为研究的报道众多,但结果并不一致,没有明确的分类界线,根据不同的原理会有不同的分类方法。
最常见的分类是按照溶于的物质不同进行分类,分为水溶蛋白和盐溶蛋白。水溶蛋白也称清蛋白,占总蛋白的10%左右,主要由两个分子量为15 ku、19 ku的蛋白组成,他们的胱氨酸二硫键主要存在于肽链中[18]。盐溶蛋白是世界研究的热点,它亦称球蛋白,主要由储藏性蛋白组成,占全蛋白的87%~90%,分为花生球蛋白(arachin)和伴花生球蛋白(conarachin)。花生球蛋白,分子量为600 ku,占总蛋白的23.8%[18],国内外对花生球蛋白组成的研究报道众多,大多数在花生球蛋白主要由花生球蛋白I 和花生球蛋白II 组成这一观点达到一致,但还存在一些争论,主要讨论点在于含有的亚基数量是6 个还是12 个甚至更多;不同种花生品种的花生还会得到不同的亚基数目,国内外一些实验总结其有4 种花生球蛋白不同亚基模式[19-20]。Bland 等[21]研究发现花生球蛋白I 是由两个相同分子量为180 ku 的亚基组成的二聚体。Mouecoucou等[22]对花生球蛋白进行实验,β-巯基乙醇、聚丙烯酰胺凝胶电泳(SDS-PAGE)处理,结果展示其分子质量为350 ku,并得到分子量分别为72.4 ku、60.3 ku、39.8 ku、33.1 ku、29.0 ku、21 ku 的6 个亚基蛋白。杨晓泉等[23]把花生球蛋白用SDS-PAGE 处理后发现其由三个分子量为(40.5 ku、37.5 ku 及19.5 ku);用双向聚丙烯酰胺凝胶电泳(2D-PAGE)处理后发现其由2 个酸性亚基(40.5 ku、pI5.5,37.5 ku、pI 5.0)和3个碱性亚基(19.5 ku,pI 6.3、7.0、8.2)组成。Yamada等[24]的研究研究结果与杨晓泉等[23]基本相同,他们证实了花生球蛋白由6 个亚基组成,其中3 个亚基是酸性的且分子量较大,剩下的3 个分子量较小的亚基是碱性的。伴花生球蛋白也分为I 和II 两种,伴花生球蛋白I 占总蛋白的30%,主要由分子量分别为12.5、13、14、15.5、16.5 和17 ku 的6 个亚基组成;伴花生球蛋白 II 由 6~8 个亚基组成,占总蛋白的15%~25%[23]。盐溶蛋白还有一种分类,分为酸溶性蛋白和碱溶性蛋白,前者由三个分子量为97 ku、77 ku、20 ku 的蛋白组成,蛋白链之间的胱氨酸含量最少;后者也是由三个蛋白组成,分子量分别为97 ku、30 ku、17 ku,蛋白链之间存在最多的二硫键[25-26]。
花生蛋白中的可溶性蛋白还可以根据其沉降系数分为2 s、5 s、9 s、14 s、19 s。2 s 蛋白由六个分子量分别为12.5、13、14、15.5、16.5 和17 ku 的亚基组成;2 s 和5 s 蛋白里含有许多种蛋白,但都不含花生球蛋白I 和伴花生球蛋白II;9 s 蛋白大部分由伴花生球蛋白II 组成;14 s 大部分由花生球蛋白组成;19 s 一般由可溶性的花生球蛋白的聚合物组成[27]。
根据世界卫生组织和国际免疫学会联合会过敏原命名小组委员会批准的系统过敏原命名法,花生蛋白还可分为Ara h1-17,后来发现Ara h3 和Ara h4 是相同的过敏原,因此都被称为Ara h3。其中Ara h1、Ara h2、Ara h3 和Ara h6,这四种过敏原蛋白是花生中含量最丰富的蛋白质,它们都是种子贮藏蛋白[28]。
通过查阅文献对花生蛋白的组成进行简单综述,了解到系统过敏原命名法中Ara h1、Ara h2、Ara h3和Ara h6 是花生中含量最丰富的种子贮藏蛋白质,伴花生球蛋白含量占花生总蛋白的45%~55%,因此选用Ara h1、Ara h2、Ara h3、Ara h6、伴花生球蛋白A(序列号:AEL30377.1)、伴花生球蛋白B(序列号:AAU21493.1 )(数据来源于NCBI数据库https://www.ncbi.nlm.nih.gov/)进行模拟对接[29-30]。
图1 花生蛋白的组成和分类Fig.1 Composition and classification of Arachis hypogaeaproteins
使用BIOPEP-UWM 数据库的三种胃肠道蛋白酶(胰凝乳蛋白酶、胃蛋白酶和胰蛋白酶)对上述的6种花生蛋白进行水解[29-30],理论水解度(TDH)的计算公式如下:
D——氢的数目;
D——蛋白质中肽键总数。
用HPEPDOCK(http://huanglab.phys.hust.edu.cn /hpepdock/)将6 种花生蛋白质用胃肠道蛋白酶水解后释放的含有少数氨基酸的寡肽连接到SARS-CoV-2 Mpro(PDB 代码6LU7)上[32],结合评分低于-110 的寡肽被认为是高亲和力寡肽。通过蛋白所含高亲和寡肽的频率(F)来评估花生蛋白作为营养补充剂的能力:
F——出现频率;
N——蛋白链内高亲和寡肽的数量;
L——蛋白链的长度。
用 PyMol[33](https://www.lfd.uci.edu/~gohlke/ pythonlibs/#pymol)处理受体和配体、LigPlot+[34](版本号:V.2.2)来检测高亲和力寡肽与SARS-CoV-2 Mpro对接结果的氢键以及残基。
表1 花生中高亲和力寡肽与SARS-CoV-2 Mpro结合的序列和频率Table 1 Sequences and frequencies of high affinity oligopeptides binding to SARS-CoV-2Mpro from Arachis hypogaea
三种胃肠酶(胃蛋白酶、胰蛋白酶和胰凝乳蛋白酶)对花生中6 种蛋白质进行水解(图2)。结果表明,TDH 均在34.97%~38.11%,水解产物主要为寡肽(2≤肽段长度≤5),少数为多肽(肽段长度>5)。其中,水解程度较高的是:伴花生球蛋白A(38.11%)、Arah1(36.97%)、Arah3(36.88%)和伴花生球蛋白B(36.22%)。上述TDH与Luo 等[2]研究模拟植物蛋白水解的理论水解度相似。同时,Arah1 产生的寡肽(126)最多,其次是伴花生球蛋白B(122)、Arah3(99)。
图2 花生蛋白质的计算机模拟水解Fig.2 Computer simulation of hydrolysis of Arachis hypogaea protein
寡肽可以在蛋白水解或发酵过程中释放,并通过影响消化、内分泌等系统在人类健康发挥重要作用,对身体功能或状况产生影响[35]。二肽和三肽的寡聚体转运是耗能、饱和载体的运输过程,二肽的摄入是由水离子携带,肽的消化吸收作用也可通过简易扩散来进行,使高浓度肽在体外运转产生重要作用[36]。人们普遍认为,二肽和三肽在肠道中通过PepT1 或PepT2特定的肽转运系统就很容易被吸收[37],而四肽和五肽也可以通过细胞旁紧密连接途径转运[38]。因此对接SARS-CoV-2 Mpro的寡肽,选用被胃肠蛋白酶酶解后肽链长度为2~5 的短肽。
用HPEPDOCK 将上述寡肽与SARS-CoV-2Mpro(PDB 代码6LU7)对接。结合分数≤-110 被认为是高亲和力肽,这里参考Luo 等[2]在植物蛋白作为新冠肺炎患者营养补充剂的潜力中的研究,他们把结合分数≤-100 认为具有高亲和力。用F 值(公式2)来评价花生蛋白抑制SARS-CoV-2Mpro的能力。结果显示,Arah2的F 值最大(6.67%),其次是Arah6(4.73%)、伴花生球蛋白A(4.00%)、Arah3(3.58%)、Arah1(3.35%),伴花生球蛋白B(2.87%)。其中伴花生球蛋白B 的F值最小(2.87%)。
表2 显示对接分数≤-140 的寡肽,他们被认为是超高亲和力寡肽。总计有4 个寡肽达到此分数,一个(PCAQR)来自Arah1,一个(IQQGR)来自Arah3,CQSQL、PCEQH 都来自Arah2 和Arah6。结合分数最高的寡肽是PCEQH(-153.98)来自Arah2 和Arah6,其次是IQQGR(-151.44),来自Arah3。
表2 花生蛋白与SARS-CoV-2 Mpro结合的超高亲和力寡肽Table 2 Ultra-highaffinity oligopeptides binding to the SARS-CoV-2-Mpro from Arachis hypogaeaprotein
根据以上的结果显示,对SARS-CoV-2 Mpro具有超高亲和力的肽一共有四个(PCAQR、CQSQL、PCEQH、IQQGR)。SARS-CoV-2 Mpro的对接图显示(2D 结构图由LigPlot+软件制作,版本号:V.2.2)。
由图3a 知,SARS-CoV-2 Mpro与PCAQR 形成了五对氢键。其中,在酶的一边形成氢键的氨基酸分别是Asp153(两对)、Thr111、Gln110、Lys102。除此之外,还有8 个游离的残基涉及到疏水接触。他们分别是Asp295、Pro293、Ile249、Phe294、Ser158、Val104、Asn151、Thr292。类似的图3b 可得,SARS-CoV-2 Mpro与CQSQL 形成了三对氢键,形成的氨基酸都是Thr111。13 个残基涉及到疏水接触,分别是Asn151、Cys156、Asp153、Lys102、Phe294、Ile249、Pro252、Pro293(两个)、Thr292、Gln110、Leu253、Val297。图3c 显示,SARS-CoV-2 Mpro与PCEQH 形成了4 对氢键。和肽形成氢键的氨基酸分别是Gln110、Thr292、Thr111、Asn151,具有疏水接触的残基分别是Asp295、Phe294、Pro293、Ile249、Ile152、Ser158、Asp153,一共有7 个。图3d 显示SARS-CoV-2 Mpro与IQQGR形成了两个氢键,分别是Thr111 和His246,有12 个疏水残基,分别是Glu240、Pro108、Gly109、Gln110、Pro293、Asn203、Val202、Ile200、Thr292、Asn151、Phe294、Ile249。
图3 低聚肽与SARS-CoV-2 MPRO结合的三维图像和相互作用残基Fig.3 The binding 3D image and interacting residues of oligopeptides with SARS-CoV-2-Mpro
分子模拟对接越来越多地被研究人员接受和使用,尤其是在药物开发方面[39]。SARS-CoV-2 Mpro在介导病毒复制和转录方面起关键作用,使之成为SARS-CoV-2 药物设计和筛选的重要药物靶点。吴灿荣等[16],对SARS-CoV-2 基因编码的所有蛋白进行了系统分析,预测并构建可以通过同源模建的结构,基于靶点的虚拟配体筛选,建立常用抗病毒药物的数据库。Siti[40]等通过分子对接研究,评估在药用植物中发现的生物活性化合物作为潜在的SARS-CoV-2 Mpro抑制剂。Luo 等[2]采用电子计算机方法模拟胃肠道酶对蛋白质的水解并产生大量活性多肽,然后评价产生的多肽与SARS-CoV-2 刺激性蛋白受体结合域(RBD)的结合能力。Cristina 等[41]、Avinash 等[42]、Liu 等[43]通过不同的实验表明较高的模拟对接分数与体外实验结果具有良好的相关性,因此,理论上较高的对接分数可能会具有较强的生物活性。本研究发现,针对SARS-CoV-2 Mpro有PCEQH、IQQGR 两种肽的抑制效果很好(得分分别为-153.98、-151.44),理论上食用花生将会给新冠病毒潜在感染者和患者提供营养补充,并改善新型冠状病毒引起的肺炎症状。
花生是目前理想的高蛋白食物来源,其蛋白质具有较高的营养价值,且有效利用率高。本文对花生蛋白的分类进行简要综述,并通过计算机模拟胃肠道蛋白酶对6 种花生中所含的代表性蛋白(Ara h1、Ara h2、Ara h3、Ara h6、伴花生球蛋白A 和伴花生球蛋白B)进行水解,得到了大量的活性肽,然后,将活性肽与SARS-CoV-2 Mpro进行对接,从而评估上述6 种花生蛋白与SARS-CoV-2 Mpro的结合能力。结果表明,花生蛋白Arah2 的F 值较高(0.0667),可以作为优质食物来源为新冠病毒潜在感染者和患者提供营养和能量。筛选的多肽(PCAQR、CQSQL、PCEQH、IQQGR等)与SARS-CoV-2 Mpro晶体结构的活性位点的结合效果较好,显示了花生蛋白对新冠病毒主蛋白酶具有一定的抑制效果,可提取、提纯后作为喷雾冲洗鼻咽喉腔,减少上呼吸道病载量,有望对医护人员提供一定的保护。整篇文章的结果都是基于计算机虚拟筛选,筛选出的多肽是否真的对SARS-CoV-2 Mpro有效,还需要进一步验证。