陈柯羽,杜 清,张 华,詹启敏
(1中国医学科学院北京协和医学院,北京100730;2青海民族大学药学院,青海省青藏高原植物资源化学研究重点实验室,青海西宁810007;3北京大学医学部,北京100191)
2011年,美国科学院、美国工程院、美国国立卫生研究院(NIH)及美国科学委员会共同发出“迈向精准医学”的倡议,著名基因组学家Maynard V.Olson博士参与起草的美国国家智库报告《走向精准医学》正式发表[1]。中国早在21世纪初就开始关注精准医学,于2006年首先提出了精准外科的概念。2015年2月,习近平总书记批示科技部和国家卫生计生委组建“中国精准医学战略专家组”。2015年12月11日,“中国个体化用药-精准医学科学产业联盟”在上海正式成立,标志着我国首个精准医疗领域的产学研一体化联盟正式组建。“精准医疗”是一种个体定制的医疗策略,根据患者自身的遗传、生物标志物、表型或心理社会特征,综合应用基因组学、转录组学和蛋白质组学,甚至是泛临床表征来指导医疗决策的医疗手段,包括使用新诊断和治疗,是实现真正个性化医疗的关键步骤,也是未来医疗发展的主要方向。随着基因组学、酶学、药剂学等学科的发展,以及计算机技术和大数据等新技术在医疗产业中的应用,多学科交叉也为药物研发带来新的变革要求,“精准药物”成为药品研发的重要方向。从药物研发的角度来看,精确药物是通过靶向定位提高药物的定位疗效,降低药物不良事件的概率,或者更理想地以优化方式实现这两个目标来改善给定患者群体中药物产品的治疗指数。
现代医学正朝着精准医学的方向发展,其通俗意义上来讲是针对不同个体的生理状态、遗传差异性、疾病发病机制和病理过程的不同进行的“量身订做”的医疗过程。它建议使用特定患者或亚群体的个体特征来定制药物处方,精确命中靶点以提高药物疗效并降低不良反应的风险,很大程度上可通过药物研究中所使用的模型系统和分析的生理表征来验证,由此逐步规范应用至临床研究和患者的疾病治疗。当前药物开发面临的挑战是药物有效性的个体差异、药物作用靶点的复杂性、患者与健康人临床结果对比的情况,即药物在机体内发生作用的分子细节、个体机体的病理状态和发病过程的个体差异性。
药物研发的最终目的是治疗疾病,研发过程中利用基因组学对疾病过程中的具体机制进行深入研究,清晰基因表达过程的规律,整合疾病发展、药物代谢的数据差异和基因组数据差异是进行精准医疗下药品研发的重要工具。另外,精准药物的研发区别于传统药物的研发理念,构建新型的药物测试和效能衡量模型,利用新技术进行新型载药体系和递送系统的改良,是药物在精准医疗背景下创新研发中的重要内容。
2017年2月 21日,麻省理工科技评论(MIT Technology Review)中国地区独家合作伙伴深科技(Deep Tech)公布了“《麻省理工科技评论》2017年全球十大突破性技术”榜单,基因疗法名列其中[1]。自从人类基因组计划开始,人们就对基因组学如何改变药物研发有着特别的热情。随着基因组技术的迅速发展,我们正在进入基因组学的一个新阶段,基因组学现在可以全面地表征患者和健康个体的基因组。重要的是,测序技术已经与整合基因组数据和电子病历的使用相结合,最终会促进用于识别基因组变异与临床之间关系数据共享的推广。精准医疗的核心在于直接准确地依据致病机理和原因进行治疗,这就使在精准医疗下的“精准药物”的研发与以往的各个阶段都不同。药物作用的靶向性、作用机制的精确性是药物研发的重要方向。下一代测序(next generation sequencing,NGS)即组学技术的应用,增加了计算能力和大数据,将有助于精准医学中“精准药物”的发展。其快速的增长为具有高度复杂和异质性的基因组成的疾病带来了希望[2]。
1.1 免疫药物研发和使用当William Coley使用活菌作为治疗癌症的免疫激动剂时,免疫药物控制肿瘤生长的历史可以追溯到1893年,但是由于基因组学研究不透彻,具体免疫机制药物深度不够,免疫治疗进展并不显著。免疫系统在人体的健康维持中具有重要作用,例如在癌症的发病机制中可以抑制或促进癌症生长的双重作用。即癌症免疫编辑,其包括三个阶段:消除、平衡和逃逸。目前针对癌症的免疫治疗策略有癌症疫苗、溶瘤病毒、体外激活T和自然杀伤细胞的过继转移,以及给予共刺激细胞或阻断所谓的免疫检查点途径的抗体或重组蛋白[3]。
免疫疗法是基因组学发展过程中开辟药物研发的重要途径。传统药物在治疗疾病过程中主要作用于发生病变的组织或者细胞,采用损伤患病细胞的方式达到治疗疾病的目的。免疫疗法的不同点在于通过多种创新的方法,包括刺激免疫细胞来激发和增强癌症细胞免疫循环的内在能力(BOXFI2),通过肿瘤疫苗和继发性T细胞治疗增强宿主反应,对抗免疫抑制,即激发肿瘤细胞的免疫反应达到抑制或毁伤肿瘤细胞的作用[4]。目前在肿瘤治疗中应用的免疫疫苗是整个肿瘤发生过程中积累的突变产物,可以用来改善免疫系统区分自身与非自身的能力,从而促进一种有效的抗癌免疫应答的诱导,同时保留正常的、健康的细胞[5]。目前正在进行各种临床试验,以评估用于治疗癌症的个性化疫苗,包括黑色素瘤、胰腺癌和胶质母细胞瘤(NCT01970358、NCT03122106和NCT02510950)。另外,基因组学在遗传疾病的药物研发和癫痫病等神经性疾病的治疗上也有重要的作用[6]。
目前精准医学的实验将特定药物与特定基因联系起来,可归纳为“单药/单基因诊断”。然而,大多数癌症在遗传上是复杂的,并且信号传导失调,突变不确定,使得单基因/单药物模型不可持续。利用基因组学对患有难治性晚期/转移性肝细胞癌患者的肿瘤样品进行靶向 NGS分析,检测到导致 PI3K/AKT/mTOR途径的推定活化的分子畸变,利用基因组学分析结果对患者进行了包括mTOR抑制剂在内的治疗,表现出了良好的治疗效果[7]。利用基因组学进行分析和深入挖掘,有利于发现测量药物反应的新型生物标志物,通过全基因组体细胞新表位分析和HLA分型,可以为每位患者鉴定候选肿瘤新抗原,新抗原检测对于预测免疫疗法的反应非常重要[8-9]。最近可见免疫治疗方式对患者进行成功治疗的报道,如单克隆抗体阻断细胞毒性T淋巴细胞相关蛋白(cytotoxic lymphocyte antigen, CTLA-4)和程序化细胞死亡蛋白1(programmed cell death protein 1, PD-1)信号通路探明,促进了免疫治疗方式的发展。
1.2 小分子药物的研发小分子药物主要来源于新药研发中基因编辑技术和药物代谢途径中的蛋白质、多肽,甚至是单克隆抗体或经修饰的蛋白质。
基因组学研究的深入明显促进了小分子药物的研发,这是基于精准治疗的前提。2015~2017年,美国食品药品管理局(FDA)批准101个新型小分子实体为 NME(new molecule entities)类别(小分子、生物制剂、治疗组合和诊断)。同时利用Drug Bank数据库(该数据库汇编了已批准药物的信息),依据其目标和作用机制(mechanisms of action,MOA),将小分子细分为单靶标和多靶标药物,其中生物技术药物(蛋白质、多肽和单克隆抗体)的研发量占新型NME的31%,几乎接近单一目标药物的数量(34%)。这清楚地反映了最近制药公司对小分子药物的研究明显增强。
激酶抑制剂的研发和应用具有一定的代表性,使抗肿瘤药物的耐药性得到了一定程度的解决[10]。伊马替尼(诺华;Glevec)是第一个上市的靶向治疗慢性粒细胞白血病的药物。靶向其他致癌激酶的药物包括受体酪氨酸蛋白激酶 EbBFI2(human epidermalgrowth factor receptor 2, HER2)、BRAF 或表皮生长因子受体(epidermal growth factor receptor, EGFR),在特定的患者群中也表现出临床反应[10]。目前精准医疗应用中的药品研发还包括聚合酶抑制剂的使用,在卵巢癌的治疗由BRCA1或BRCA2中的LASSFIFF功能突变引起的同源重组修复(homologous recombination,HR)的缺陷肿瘤细胞,使肿瘤细胞对PARP抑制敏感,最终导致肿瘤细胞死亡[11]。PARP抑制剂用于治疗其他包含HRR突变的肿瘤类型的临床试验正在进行中(NCT01682272和 NCT01585805),并且PARP抑制剂奥拉帕利已被FDA批准用于转移性去势耐药前列腺癌(metastatic castration-resistant prostate cancer)的突破性治疗[11-12]。
1.3 生物纳米材料的研发在结构设计、表面功能化、基因/药物存储和递送、细胞靶向和医学成像方面的新问题给药用材料领域带来了许多挑战。用纳米材料构建的非病毒载体成为生物医学应用中最有前途和最受欢迎的递送系统。目前基因或药物传递中的关键问题涉及简便易行、可扩展的合成、无效的RNA有效载荷、基因/药物传递的生物学障碍、低细胞摄取、溶酶体逃逸和全身毒性。各种纳米载体已被设计和开发,如阳离子脂质、聚合物胶束、聚阳离子聚合物为载体和无机纳米粒子,具有特定大小、形状、结构和表面功能。考虑将RNA进行包裹,然后通过纳米体系送入病态细胞中,直接对患病细胞进行杀伤[13],根据非编码 RNAs的颗粒特性,研制安全、稳定、高效的精密药物输送系统已成为纳米材料研究的主要任务之一[14]。
药品研发的方向是一种药物多靶标组合且各个靶标均具有高度靶向性,未来的药品研发方向应该是单药多靶标药物。所谓单药多靶标,指的是一种药物制剂中具有作用于多个靶标的成分或药物分子基团,每个靶向药物具有高度的靶向性,每个成分或分子基团仅针对疾病过程中的个别酶、个别基因或者个别结合位点,精准到细胞生命过程中的最基本的环节或者动作,这样为将来大数据时代下个性化治疗方案的匹配,即精准医疗,实现多靶点、多种药物的配合治疗奠定基础[15]。药品靶向性的关键在于靶标的明确,在于疾病生物标志物的检测,在实验室研发药品的过程中应当尤其注意生物信息学的结合和应用,在生物标志物的检测中加大研究力度,为临床试验的开展建立基本的检测指标[16]。根据它们的实用性,生物标志物可分为预测生物标志物、预后生物标志物、药效学(PD)生物标志物和替代生物标记物,为避免增加药品开发的复杂性,应该合理利用生物标志物进行阶段性、分层性的药品开发活动[17]。
随着基因组学中分子亚型的研究取得的进步,疾病发生环节进一步清晰,药物作用靶标明确性提高,使治疗策略和靶抑制的药物组合由一个基因、一种药物途径转变为多基因、多药模型[18]。Midostaurin是泛激酶抑制剂staurosporine的半合成衍生物,是一种著名的多激酶抑制剂,于2017年4月批准用于治疗那些具有FLT3特异性变异的新诊断的急性髓性白血病成年患者基因,临床使用中发现其可以抑制蛋白激酶Cα(PKCα)、VEGFR2、KIT、PDGFR、WT 和/或突变FLT3酪氨酸激酶的活性[19]。另外,多靶点药物也被应用到治疗精神分裂症和抑郁症。用于治疗精神分裂症的主要策略是利用多巴胺拮抗d2、血清素5-HT 2A和α1肾上腺素受体[20-21]。细胞周期蛋白依赖性激酶(CDK)4和6的双重抑制剂以吡啶并[2,3-d]嘧啶-7-酮支架作为模板,通过化学筛选和优化结合成为广泛的横截面激酶,包括由于相关毒性而中断的泛CDKs抑制剂,发现C2位的修饰为CDK提供了精确的选择性抑制剂。其中,palbociclib、abemaciclib和ribociclib在此时间框架内被FDA批准为乳腺癌治疗药物[22]。
尽管目前单药多靶标的研究工作已经逐步展开,但是药物开发工作仍然面临许多困境。第一个问题是多靶点药物和治疗组合中疾病的靶标的正确组合,需要明确的目标-疾病关联,同时需要兼顾代谢途径-目标-药物-疾病关系和不良事件分析[23]。此外,选择应基于调整所选目标是否会导致加性或协同效应[24]。当靶标属于相同途径时可以获得累加效应,而只有当所选靶标位于功能互补的途径上时才能实现协同作用,这意味着在两种情况下都可以在较低剂量下获得效果,影响药物的安全性。第二个问题,天然产物中药效物质多为偶然发现的,多靶标化合物现在通过合理设计,通常由不同的框架结合成一个单一的化学实体。因此,多靶标化合物通常来自选择性分子的药效团的整合,来源于已知的药物或候选药物,具有相似支架(通常是环系统)的药效团可以根据起始框架之间的重叠程度融合或合并,或者药效团存在与每个靶相互作用所需的不同结构元件,它们可以与可切割或不可切割的接头整合[25]。在所有情况下,多靶化合物的产生通常由靶的性质、起始框架的可用性和化学易处理性驱动。除此之外,多靶标化合物的基本要求是每个框架保留与其特定靶标相互作用的能力。控制起始分子与其特定靶标相互作用的结构-活性关系,并且当这些靶标仅略微相关或不相关时(即当它们属于不同的蛋白质类型时)使得多靶标药物的研发变得最具挑战性。
药物研究中使用的模型系统和检测方法是否具有生理上的代表性,是否可以准确表达出在人体生理环境中的效能问题直接决定了药物研发的临床有效性和安全性。目前兴起的主要技术包括无标记细胞分析技术,其主要来源于患者的病理和生理细胞构建模型系统,特异性调节基因启动子作为特定生理过程的生物标志物,利用荧光和发光蛋白作为标志指标,从而制定某一样本下的精准治疗方案[26],同时对治疗方案中的模型体系构建和基本数据进行大数据积累,从而形成精准医疗下的药品研发数据库,以促进药品研发。
在新型药物研发过程中一旦找到潜在药物的生物学靶标,并鉴定出先导化合物,就必须对化合物的药代动力学(药物如何处理)和药效学(药物对身体功能的作用)进行分析。在这个阶段,大部分测试是在二维细胞培养和动物模型中完成的,这两种方法都没有充分模拟人体生理反应。人体组织本质上是3D的,并且由于存在多种细胞类型和细胞-细胞相互作用,这种结构和异质环境不能在96(或更高)孔板中复制[27]。在药物研究的初级阶段可以采用组织芯片法进行研究,所谓组织芯片法是指通过人为设计用于将细胞定位在模拟身体器官功能的三维结构中的装置,并且以生理反应方式暴露于药物、激素、细胞信号分子和生物力学、压力源的环境。人为设计不同种平台,或者使细胞自组织成类器官型结构,或者为细胞提供支架,以结构定义的方式增殖和生长。一些具有高度规范性的设计,其中将特定细胞类型置于明确定义的位置或区室中(例如肾近端小管或肝窦)以重现器官的功能单元。在3D模型中,人类多能神经祖细胞、内皮细胞、间充质干细胞和小胶质细胞前体在水凝胶上培养,并允许在三周内自组装成“神经球”,其显示具有功能性神经胶质整合的血管网络,然后将构建体暴露于70种已知毒性的化合物,并通过RNASeq读数测量全局基因表达模式变化。生成的大量数据集与机器学习算法一起用于构建神经毒性的预测模型,该模型正确预测了10种不同化合物中的9种可能的毒性(其余化合物后来被鉴定为假阳性),这种机器学习和中等吞吐量平台的组合使用可能对药物筛选方法产生变革性影响[28]。
增材制造(additive manufacturing,AM,也称为3D打印),定义为由3D计算机辅助设计(computer aided design,CAD)文件中的数字信息引导的部件的逐层制造,提供了同步快速原型制作(rapid prototyping,RP)的优势、生物功能化以及高分辨率的细胞、生物材料的精确放置。目前在生物组织和生物器官的打印,例如脑、肺等器官的生物骨架,骨血管等生物组织的构建中已经取得了相当大的进展,这对于体外3D药物筛选模型的构建具有重要的推动作用[29],在肿瘤微环境构建对于抗肿瘤药物的研发起到了重要作用[30]。
虽然目前药品研发中的各环节技术得到了进步,但是精准的个性化药品研发进展仍然是缓慢的。在药品研发的过程中,各个环节的数据收集和处理关乎药品改进方法和作用机制的探明,同时关乎药品从实验室走向临床。因此,药品研发中药品从有效天然产物的发现、结构修饰或者合成药物的设计、药理实验等方面数据的积累和应用具有重要意义,尤其针对临床遗传学数据的深化处理将极大地促进精准医疗的发展。
药物研发过程主要分为天然活性产物的发现/药物分子设计、药物活性筛选、药理活性机制探明、药物临床试验、药物上市等几个主要步骤。
4.1 药品研发和活性筛选大数据和基因组技术的联合应用不仅包括目前已经比较成熟的化合物库和药理模型库的应用,而且在新药的发现、设计、生物活性的筛选和药物靶标的确定等功能上也有了长足的发展和进步。药物分子研发传统上,化合物选择和/或设计是药物化学家的主要研究方向。定向多样性合成提供了一种用于以受控的方式与不同的官能团、立体化学和框架生成的小分子的集合的途径[31]。遵循这一概念,Maurya等[32]报道了碳水化合物衍生的结构单元对大环化合物的多样化。基于大数据Eli Lilly公司的研究,已经建立了这样一个完全自动化的机器人的合成实验室,可以进行遥控,用以完成化合物的自动设计[33-34]。利用大数据和基因组技术部分取代低效的传统筛选方法,例如组合QSAR和混合QSAR 方法,使用 Random forest(RF)和 Decision trees(DT)首次模拟药物-毒性关系。他们的数据包括227 093名潜在候选药物志愿者和39种潜在候选药物,结果模型预测了特定载体对药物的毒性缓解[35]。在小分子药物的筛选过程中,大数据和基因组技术的集合提高药物筛选的效率极为明显。AbbVie的研究人员开发了一个用于小型自动平行合成的集成机器人平台。他们的系统能够进行液体处理和蒸发,用以进行在线分析、纯化和活性测试,24~36 h内可以得出实验报告,这使得项目团队可以在一两天内获得假设检验的结果[36]。未来基于深度学习的背景下可以利用人工智能将模型-预测药物-靶标相互作用关系进行模拟,目前已经有了药物设计和临床效果间的预测方法。 Segler等[37]介绍了使用RNN(recurrent neural network)设计新型聚焦图书馆的生成模型,实现了满意的性能,完成了整个药物设计周期。
4.2 药理数据处理和药物设计优化了解疾病的时间、空间异质性以及这些因素在确定试验和个体治疗成功和失败方面非常重要,其中科学家、临床医生、社会和行为调查员、患者合作产生大量数据,并使用数据网来访问、聚集、整合和分析庞大患者群体、健康人群和实验生物的信息,以确定正常和疾病过程的机制[38],为药物研发的靶点发现,现有药物的改良和配合药物制剂的发现产生了巨大的促进作用。特别是对于罕见病的药物研发、大数据的积累更加重要[39]。基于药物和基因组开发的drug CIPHER就是一个预测药物靶点的计算工具,利用该模型在全基因组范围内构建了726种药物的生物指纹图谱,其中,在501例中发现新的药物互作关系。通过多组学分析发现的与嗜铬细胞瘤和副神经节瘤的发生发展密切相关的13个位点可作为药物研发的靶点[40]。在风湿性关节炎的治疗过程中,通过对10 000例患者的数据整理和深入探讨发现了101个疾病治疗相关靶点,为市场中批准的27种药物中的18种确定了药物治疗靶点。在LDL胆固醇水平类疾病的作用过程的发现和药品发展中,遗传和临床大数据的应用都起到了至关重要的作用[41]。
采用无偏测序技术对亚群体进行疾病控制测序[42],加强实验室数据、药物遗传学数据和临床表征的交叉对比,打破空间限制,加强科研机构与临床机构的联合,建立大数据对比库。加强机器学习,通过化学结构相似性检索、数据挖掘、生物活性谱等算法模拟药物设计过程,寻找潜在的药物靶点。例如改进对已定义问题的病例状态的识别(例如检测烟草暴露),糖尿病足检查的提取元素,或IDE,或改进通用工具,如自然语言处理算法,并通过广谱测算的方法进行药物筛选和副作用预测[43]。随着医疗实践的发展和治疗匹配成为常规,每名患者的结果可以有助于扩大临床数据、药品作用和基因组信息的数据池,患者从中可以导出治疗方法,药品研发也将获得更加结合临床和疾病的珍贵数据。在临床实用过程中通过药物遗传学进一步优化原创设计药物,提高药物质量。药物遗传学的重点是发现改变药物应答的基因变体,通过改变药物的吸收、分布、代谢或排泄产生有效差异,如早期的药物基因组学发现为TPMT基因型和活性的表现[44]。结合基因组学的研究数据发现新生活环境下的个体或个别疾病的发生、发展和变异规律,探究发病深层机制发现新型药物作用靶点,优化现有药物的作用方式,改进现有治疗手段疗效,尤其对于精准医学中“精准药物”的发现和改进作用巨大。
精准医疗下的精准药物的研发是将来药物发展的主要方向,药品研发是一个复杂的体系工程,其中涉及众多环节,然而精准的作用靶点是精准药物使用的基础。精准药物的发现基础在于发病机制的探明,发病位点和生理病理过程的清晰可见,这一切都建立在药理研究和生物信息学的基础上。只有清晰地把握具体生理病理机制,掌握具体的生理病理的关键节点,才可以实现药物的精准作用。就目前的研究现状来看,精准医疗背景下药品研发需要加强的工作是进一步探明药物具体生物学机制,深入研究分子层次的具体作用机理,加强实验机构和临床机构的联合,进行多学科交叉研究,进一步探明药物多作用位点、多靶向药物的研发。同时加强来源生物学机制的研究,探明有效作用分子或化合物的来源机制,进一步加强机体基因通路的影响,小分子药物的研发。对目前已知药物的协作作用成分进行研究,加强疾病微环境的机制探明,横向比较药用成分,发现多成分同靶点、多成分多靶点综合体药物的机制研究,以发现更多的药物。加强计算机模拟技术和体外人工3D模型的构建,加强人工智能在药品研发工作中的使用,相信随着基因组学的进步和大数据、人工智能技术的结合,纳米靶向投送机制的进一步发展,精准医疗下的精准药物会给人民带来巨大福祉。另外,随着上市创新药物的成熟,应当注意成熟药物的再利用问题,争取药物服务人民的可用性最大化。