郭向阳 李 嘉 梁 帅 李炘正
(山西省肿瘤医院乳腺外科二病区 山西太原 030013)
由于早期不易被发现、高危因素较复杂、病因尚不明确等原因,乳腺癌一直是女性中最常见的恶性肿瘤类型[1]。在全球范围内,乳腺癌每年的新增病例可达130 万人,占恶性肿瘤总发病率的23%以上,且至今仍位居女性癌症死亡率之首[2]。为应对如此严峻的乳腺癌现况,研究人员尝试了多种治疗方法,其中最为引人注目的当属近年来新兴的针对细胞周期调控的细胞周期蛋白依赖性激酶4/6(CDK4/6)抑制剂的应用[3]。
细胞分裂行为的失控是癌症的主要特征性表现,因此对细胞周期的干预为癌症的治疗提供了新的思路。1996年,Cervantes M 等[4]最先提出了CDK4/6 在乳腺癌细胞周期出现改变时发挥的作用。CDK 即细胞周期蛋白依赖性激酶,该蛋白家族目前已发现多种亚型,它们可分别与一种细胞周期蛋白(cyclin)结合,对下游信号蛋白进行磷酸化,使其分泌信号分子,进而调节整个细胞周期,控制细胞分裂行为。其中,CDK4/6 均可与cyclin D 结合,介导下游视网膜母细胞瘤蛋白(Rb)的磷酸化,释放与Rb 结合的转录因子E2F,最终使细胞完成从G1 期向S 期的过渡[5]。因此,研发针对CDK4/6的抑制剂将有效抑制肿瘤细胞的增殖与发展。截至2019年,已有3 种CDK4/6抑制剂药物获得美国食品药品监督管理局(FDA)的审批:palbociclib(PD0332991)、ribociclib(LEE011)和abemaciclib(LY2835219)[6],均作为雌激素受体阳性(HR+)且人类表皮生长因子受体2 阴性(HER2-)的乳腺癌晚期患者的特效药在美国上市[7-8]。临床研究表明,在使用以上3 种药物进行治疗后,患者的无进展生存期(PFS)均得到了显著延长。然而,随着这3 种药物投入市场并改善了众多乳腺癌患者的健康状况,它们所带来的问题,即耐药性问题也日益被人们关注。越来越多的证据表明,乳腺癌细胞已经对CDK4/6抑制剂产生了各种途径的耐药性变异,例如通过影响FGFR-1 受体及TGF-β 通路使CDK4/6抑制剂失效等[9-10],这些问题也逐渐限制了当前已有的CDK4/6抑制剂的使用。因此,如何改进现有的CDK4/6抑制剂,在解决耐药性问题的同时探索更为多元化的癌细胞抑制方案,已成为当前乳腺癌治疗领域的一大难题。
本文将针对CDK4/6抑制剂的改进问题,利用多种生物信息学工具对该类药物的设计策略作出预测分析,通过研究CDK4/6 的蛋白质结构、翻译后修饰位点、参与的生物学过程及通路等问题,以期为新型CDK4/6抑制剂的研发铺垫理论基础,为探索多元化癌细胞抑制方案提供新的思路和角度。
1.1 材料 CDK4(https://www.ncbi.nlm.nih.gov/protein/CAG47043.1)及CDK6(https://www.ncbi.nlm.nih.gov/protein/NP_001250.1)的蛋白序列均在美国国立生物技术信息中心(NCBI)的蛋白库中获得。1.2 方法 通过三维建模软件SWISS-MODEL(https://swissmodel.expasy.org/)对CDK4/6 蛋白进行三维结构建模分析,掌握CDK4/6 最为可能的三维构象。
通过以下3 种软件分别对CDK4/6 的蛋白磷酸化位点进行预测:DISPHOS 1.3(http://www.dabi.temple.edu/disphos/),SCANSITE 4.0(http://scansite3.mit.edu/),NetPhos 3.1(http://www.cbs.dtu.dk/services/NetPhos/);综合3 种软件的预测结果,得到可信度较高的蛋白磷酸化位点。通过NetNGlyc 1.0 Server(http://www.cbs.dtu.dk/services/NetNGlyc/)对2 种蛋白的N-糖基化位点进行预测。通过NetOGlyc4.0 Server(http://cbs.dtu.dk/services/Net-OGlyc/)及YinOYang 1.2 Server(http://www.cbs.dtu.dk/services/YinOYang/)对2 种蛋白的O-糖基化位点进行预测。如无特殊说明,各预测软件均采用默认参数进行预测,且物种均选择为人类。
通过STRING(https://string-db.org/)软件分别构建2 种蛋白的蛋白相互作用网络,并对其进行GO 及KEGG 分析,得到2 种蛋白在人体各种分子活动及生物过程中参与情况的分析。
部分蛋白质相关信息由NCBI(https://www.ncbi.nlm.nih.gov/)数据库及Uniprot(http://www.uniprot.org/)数据库得到。
2.1 CDK4/6 三级结构的预测结果 SWISSMODEL 分别对CDK4 及CDK6 进行了三级结构的预测分析。其中,该软件对CDK4 的氨基酸序列通过50 个模板构建出了2 个三维模型,相比而言,图1 所示的模型更有可能是CDK4 的真实三维模型。该模型的序列识别率达到了100%,且模型覆盖全部序列,其GMQE 值为0.96,QMEAN 值为-3.86,表现良好。由此可知,该模型的可信度较高,可为针对该蛋白研发抑制剂提供空间构象的参考。此外,笔者观察到该模型所显示的CDK4 的三级结构可能是由一段β-折叠连接的2 个球状结构域组成,这段β-折叠位于该蛋白氨基酸序列的第85 至第96 位,长度为12 个氨基酸残基,且其中有一半的氨基酸为中性非极性疏水氨基酸,而酸性及碱性氨基酸均为2 个,因此这一链状结构应为中性,且亲水性较差。在该模型碳端的球状结构域中,有4 段α-螺旋(氨基酸序列第114 位至第134 位、第193位至第206 位、第266 位至第276 位、第286 位至第291 位)形成了特殊的平行结构,称为四螺旋束(four-helix bundle)结构或“捆状”结构。
图1 CDK4 的三级结构
SWISS-MODEL 在预测CDK6 的三级结构时,同样以50 个模板进行建模,得出2 个可能的CDK6 三维模型。其中,拟合度最佳的结构如图2所示。该模型的序列识别率为100%,模型覆盖全部序列,GMQE 值为0.97,QMEAN 值为-1.48,表现良好。因此有理由认为该模型可作为CDK6 三级结构的参考模型。在该模型中,从CDK6 氨基酸序列第13 位至第99 位形成了由5 个反向平行的β-折叠片及1 个α-螺旋形成的带有一定旋转角度的折叠片结构,该结构位于CDK6 的氮端。此外,该模型显示,CDK6 序列的第119 位至第139 位、第199位至第214 位、第270 位至第281 位、第291 位至第301 位形成了由4 个α-螺旋组成的特殊结构域,该结构域的4 条α-螺旋互相平行,结构紧凑,也是一个较为典型的四螺旋束结构。
图2 CDK6 的三级结构
2.2 蛋白修饰位点的预测结果
2.2.1 CDK4 的预测结果 3 种蛋白磷酸化位点预测软件的预测结果如表1 所示,同时被2 种软件命中的位点有4 个,分别为Y-17、T-172、S-243 和S-285。此外,只被1 种软件命中,但得分较高的位点有T-53、S-81 和T-116。
表1 CDK4 的磷酸化位点预测结果
NetNGlyc 1.0 Server 的预测结果显示,CDK4可能不存在N-糖基化位点。
NetOGlyc 4.0 Server 的预测结果显示,CDK4可能的O-糖基化位点为S-243(得分0.625289)和S-259(得分0.782832)。YinOYang 1.2 Server 的预测结果显示,CDK4 可能的O-糖基化位点为S-28(得分 0.5693)和 S -243( 得分 0.5964)。虽然YinOYang 1.2 Server 也预测到了S-259 可能成为潜在的O-糖基化位点,但其得分仅为0.4447,没有超过该位点的糖基化阈值,因此不能入选。由于S-243 同时被2 种软件命中,所以成为O-糖基化位点的可能性较大。
2.2.2 CDK6 的预测结果 3 种蛋白磷酸化位点预测软件的预测结果显示(表2),同时被3 种软件命中的位点分别为Y-24 和S-290,同时被2 种软件命中的位点分别为S-138、T-177 和S-178。只被1 种软件命中但得分较高的位点为S-223。
表2 CDK6 的磷酸化位点预测结果
NetNGlyc 1.0 Server 的预测结果显示,CDK6可能不存在N-糖基化位点。
NetOGlyc 4.0 Server 共预测到5 个可能的O-糖基化位点,分别为:S-256(得分0.726857)、S-258(得分0.761364)、S-293(得分0.527362)、S-312(得分0.725641)和S-317(得分0.872224)。YinOYang 1.2 Server 的预测结果表明CDK6 可能的O-糖基化位点分别为:T-154(得分0.5230)、T-177( 得分0.5753)、S-317( 得分0.4940)和T-320(得分0.4782)。综合2 种软件,S-317 更有可能成为CDK6 的O-糖基化位点。
2.3 蛋白相互作用的预测结果 在线软件STRING 分别对CDK4 及CDK6 的蛋白相互作用网络做出了预测分析,包括理化作用及生物学作用。在网页中设置置信度为最高(0.900),产生互作的蛋白个数为10 个进行分析,结果显示(图3、图4),与CDK4 产生相互作用的蛋白质有:RB1、CCND1、CCND2、CCND3、CCNA2、CCNE1、CDKN2A、CDKN1B、CDKN1A 和CDKN2C;与CDK6 产生相互作用的蛋白质有:CDKN2D、CCND2、CCND3、CCNA2、CCNE1、CDKN2A、CDKN1B、CDKN1A 和CDKN2C。也就是说,除了RB1 及CDKN2D 外,与CDK4/6 产生相互作用的蛋白均相同,且都为CCN蛋白家族与CDK 蛋白家族的成员,与CDK4/6 的互作关系也十分密切。
图3 CDK4 的蛋白相互作用网络
图4 CDK6 的蛋白相互作用网络
KEGG 通路分析结果显示(表3),与CDK4/6形成蛋白网络的蛋白涉及多条信号通路,其中CDK4/6 共同参与的信号通路有2 条,分别为p53信号通路及PI3K-Akt 信号通路。
表3 CDK4/6 蛋白互作网络涉及到的信号通路
GO 生物过程分析显示,CDK4/6 主要参与了细胞周期调节、细胞生长及分化、有丝分裂、蛋白磷酸化、细胞及组织发育等多种与细胞分裂及分化相关的生物学过程。此外,还观察到,CDK4/6还参与细胞对外界生物及非生物刺激的反应、细胞对外部压力的反应等生物学过程。值得注意的是,CDK4 还参与了细胞对许多类型化合物的反应,例如对有机环状化合物的反应、对氧气水平的反应、对有机含氮化合物的反应、对药物的反应、对无机物质的反应、对酮的反应、对酸性化学物质的反应等,因此可判断CDK4 应为一种在细胞中较为敏感的功能性蛋白。
本研究通过多种生物信息学手段对CDK4/6的蛋白结构、翻译后修饰位点、蛋白相互作用关系等信息作出了预测,为CDK4/6 的多种生物学信息作出了系统且详实的归纳与分析,对这2 种蛋白的认识更加全面且深入。以研究中得出的CDK4/6 相关信息为基础,提出了以下几点关于CDK4/6抑制剂的设计策略:
1)对蛋白质结构的掌握,有利于在设计蛋白质的抑制剂时兼顾蛋白质与其抑制剂的生物学作用效果及空间嵌合效果,为抑制剂有能力与目标蛋白发生可控反应提供了条件和基础。通过了解不同蛋白质的特殊空间构象,更易设计出针对某类蛋白的特效抑制剂,提高药物的靶向能力,以最优的解决方案降低副作用的发生风险。本研究观察到CDK4/6 均存在一些特殊的空间结构。CDK4拥有一个中性且亲水性较差的链状结构域,该结构域为一个两端连有2 个不同大小球状结构的β-折叠链。从三维模型可看出,该结构域较为暴露,因此可利用其中性及疏水的特性,设计出可结合在该结构域上的“卡子”状化合物破坏其空间构象或将其水解,从而达到抑制效果。CDK6 氮端的折叠结构主要由5 个反向平行的β-折叠片构成,这类结构的特点是疏水残基位于折叠片的一侧,亲水残基位于另一侧,因此在这一区域内将出现电荷分布的极化,形成一端亲电一端亲核的极性结构,有利于设计出易与该位点结合的药物分子。此外,CDK4/6均拥有一个四螺旋束结构,如果对这2 个四螺旋束进行进一步的结构分析,探索螺旋束内部的极性或官能团暴露情况,可能会为CDK4/6抑制剂的设计提供更可观的方案。
2)细胞内经转录、翻译形成的蛋白质前体往往不具有生物学活性,需要经过翻译后的位点修饰才能拥有具体的特殊功能。本研究通过多种翻译后修饰位点预测软件对CDK4/6 的蛋白磷酸化位点、N-糖基化位点、O-糖基化位点作出了系统性预测。为使预测结果的可信度更高,综合考虑了多种软件对同一位点的预测评估,得到了最有潜力的翻译后修饰位点。从分析结果可看出,CDK4/6均具有2~4 个可信度较高的蛋白磷酸化位点,均具有1 个可信度较高的O-糖基化位点,且都不存在N-糖基化位点。以这些修饰位点为基础,综合考虑这些位点在蛋白三级结构中所处的位置,设计针对这些位点的抑制剂,对CDK4/6 进行再修饰,在确保不对正常通路造成破坏的前提下使其失去自身的生物学活性,或在CDK4/6 进行正常的蛋白修饰前占据其修饰位点,从源头上抑制CDK4/6 的生成。这些思路均有望成为行之有效的CDK4/6抑制剂设计方案。
3)为应对乳腺癌细胞对CDK4/6抑制剂产生的耐药性问题,采用多元化的抑制手段或可奏效。蛋白互作分析结果显示,CDK4/6 共同参与了p53信号通路及PI3K-Akt 信号通路。其中,p53 是CDKs 的抑制剂,可通过刺激p21(WAF1/CIP1)的表达抑制细胞周期的进程[11]。丝氨酸/苏氨酸激酶(Akt)在细胞增殖、分化、代谢等生物学过程中起到非常重要的作用,是一种原癌基因的产物[12]。因此,可跳出单纯针对CDK4/6抑制剂进行设计的思路,转而从其共同参与的信号通路着手,一方面促进p53 的表达,另一方面抑制PI3K-Akt 信号通路的生物学过程,同样可实现对CDK4/6 的抑制效果。同时注意到,与CDK4/6 产生相互作用的蛋白中,除了CDK 蛋白家族的相关成员外,大部分是CCN 蛋白家族的成员。CCN 蛋白是一类基质细胞蛋白,研究表明,CCN 蛋白可影响肿瘤发展和肿瘤微环境中的多个病理生理过程,包括细胞增殖、侵袭和转移等[13-14]。因此,进一步研究CCN蛋白与CDK4/6 的作用形式,从信号通路、理化作用、生物作用等方面揭示CCN 蛋白与CDK4/6 的关系,尤其是加强二者之间的基础研究,将对肿瘤的抑制和治疗产生深远的影响。此外,由于CDK4还参与细胞对多种化学物质的反应,设计出带有多碳环、含氮官能团、羰基、羧基等基团的药物,将可能对CDK4 产生较为敏感的抑制作用。综合考虑CDK4/6 参与细胞对外界刺激及压力的反应,在乳腺癌的治疗中加入合适的物理刺激,将为多元化的治疗提供更为新颖的思路。
综上所述,CDK4/6抑制剂的改进空间还很广阔,未来将有望从空间特异性结合、修饰位点抢占及变构、多通路多形式共同抑制等方面对CDK4/6抑制剂进行设计和改造。尽管本研究是通过生物信息学方法对CDK4/6抑制剂的设计提出理论上的策略,但多种工具的联合使用确保了所得出结论的可靠性,因此所作的策略分析将为进一步的实验论证提供多方面的理论基础、思路和角度。相信随着基础医学的不断发展,人们在CDK 蛋白家族的抑制剂设计领域还将大有可为。