杨玻琍 曹云 丁岩冰 赵玉明
专业研发外包服务机构(Contract Research Organization,简称CRO)始于欧美,指大型制药企业将部分研发环节外包以提高效率,同时能节省30%~50%的成本。由于药物研发是高度复杂的过程,期间会产生海量数据,而目前对这些数据的存取、搜索和整合工具十分有限,因此建立研发一体化服务平台刻不容缓。尚华医药研发服务集团IT部在上海市科技委员会的支持和赞助下建设起CRO药物研发一体化信息平台,对业内具有一定的借鉴作用。
药物研发一体化已成为专业研发外包服务机构(CRO)服务内容中的重要组成部分。面对研发过程中产生的海量数据,尚华医药研发服务集团IT部研究并建立起以数据整合、挖掘、文献查询以及文档共享为核心功能的综合信息平台,消除了部门间的数据孤岛,从而更好地服务于药物研发过程。
医药CRO发展现状
近十年来,全球各大制药公司面临研发成本不断提高,同时市场上的专利药品逐渐超过专利保护期的不利局面。面对挑战,各制药公司大多采取提高生产效率、加快新药开发的策略保持自身竞争力。以往,将研发项目外包给CRO被制药公司视为一种降低成本或提供额外服务的短期策略,而现在则成为提高制药公司核心研发竞争力,甚至提高其整体研发性能的最佳途径。
近年来,在亚太地区特别是中国和印度,CRO处于高速成长阶段。一方面是由于新兴市场近十年的经济发展速度高于全球平均水平,跨国制药公司逐渐将其作为产品销售的重要增长点,投入了大量资金和资源开展业务。另一方面,新兴市场的人力资源成本远低于欧美地区,吸引了各大制药公司和生物医药公司纷纷将部分研发项目外包到中国和印度。这些变化促使中国和印度的CRO企业高速发展。伴随着CRO企业的发展壮大,CRO提供的服务也从单纯的药化研究,逐步扩展到生物活性检测、肿瘤学研究、代谢病研究、大分子/抗体药物研发、高级中间体合成,以及临床测试的各期研究之中,CRO企业也随之形成了各个领域的技术及服务团队。
当下,越来越多的客户提出研发一体化服务需求,即客户提供一个研发靶点给CRO公司,CRO公司提供从化学、生物、药代药动、毒理,以至工艺开发和生产等不同专业领域和研发阶段的一条龙服务。根据波士顿咨询公司的预测,未来5年,顺应客户需求,中国CRO必将逐步转变为具备研发一体化服务的企业。
由于药物研发高度复杂,会产生大量数据,因此研发一体化服务对CRO企业的IT部门而言是一个巨大挑战。且目前能对这些数据进行存取、搜索和整合工具有限。在国内发展比较成熟的医药CRO中,尚华医药研发服务集团(以下简称“尚华公司”)是领头企业之一。目前尚华公司为全球制药及生物公司提供的服务包括化学、生物及临床前研究、药物开发和生物制药,并从2007年就开始致力为客户提供完整研发一体化服务(见图1)。
图1 尚华医药研发一体化服务平台
从图1可以看出,研发一体化服务与某个项目相关的数据来源于化学、生物、临床前研究等不同领域和研发阶段。通过对研发部门的走访,IT人员了解到在项目中普遍存在的问题是同一个化合物的化学特性数据或生物ADME和TOX数据分布在不同部门,以不同格式保存在不同的系统平台中,存在着信息孤岛。因此信息不能在部门或研究人员之间快速传递,给研发带来极大不便,对进行数据处理也有很大影响。并且在研发的各个阶段,还存在研发人员耗费大量时间做文献查询、缺乏与客户交流的安全平台等问题。
解决方案
为配合尚华公司研发一体化服务,IT部从2010年开始筹划建立数据整合、数据挖掘、信息查询和信息共享综合平台(以下简称“平台”)以支持研发一体化服务项目。平台的建立通过四个步骤完成。
建立数据仓库。从2010年开始,IT部门对尚华公司化学、生物和其他部门所使用的专业软件和数据现状进行调查,得出各部门研发产生的数据类型(见表1)。
这些数据的采集和储存分布在不同专业软件系统和数据库中。因为系统之一的CambridgeSoft系统已保存了部分重要的化合物信息,并且其应用系统和数据库具有开发扩展性强的特点,IT人员决定逐步将化学、生物研发数据均加载到CambridgeSoft系统中,以其为基础扩展建立数据仓库,同时建立数据整合系统,进行数据挖掘。原有CambridgeSoft系统仅保存化合物的结构、纯度等化学特性,IT技术人员将生物Assay、DMPK、ADME和In vivo TOX等信息也载入其中。为实现这个过程,IT部根据尚华公司业务特点对CambridgeSoft系统进行了部分二次开发,如在系统里增加了各部门均能识别的字段,加快数据查询速度,实现整合。至此,研发人员不仅能在CambridgeSoft系统下看到化合物的化学特性,也能看到相关生物检测和活性数据。
计算化学工具开发及数据挖掘。在实现了数据整合的基础上,IT技术人员考虑如何更有效地利用数据。尚华公司计算化学部门由资深计算化学专家组成,具有最新软件如Schrdinger和Seurat系统。Schrdinger以及Seurat产品可以在不改变当前基础架构的情况下,从不同类型数据库获取不同格式的数据进行分析。解决方案的第二个步骤就是把计算化学对数据特性的预测功能与CambridgeSoft系统结合起来。IT技术人员在CambridgeSoft系统开发了一个系统接口,凭借这个接口调用Schrdinger系统Qikprop模块来预测化合物的ADME参数,使预测结果在CambridgeSoft系统中展示。通过以上过程,计算化学人员可直接从CambridgeSoft系统获取数据,而研发人员可在系统里查看到经过计算化学预测功能处理后的计算结果,为计算化学人员和研发人员提供了有效帮助。
经过以上两个步骤,CambridgeSoft系统获取保存了化合物的化学和生物数据,为对这些数据进行化合物结构活性分析提供了数据挖掘的基础。而且化学研发人员可通过Seurat调用Schrdinger的Core Hopping应用程序替换已知小分子母核骨架,设计出具有独立知识产权的新分子结构。
信息查询及文献检索功能。信息查询及文献检索用于研发的各个阶段,研发人员为摸索方法、提高效率,通过查询大量文献和市场资料来获取知识和灵感。IT人员全盘排摸市场上制药领域的付费文献查询网站,发现付费文献价格约在每篇10至40美元之间。同一篇文献可能在不同时间被不同研发人员重复查询,造成资金浪费和外网带宽资源浪费。同时,为查找一篇文献,研发人员可能需要到多个不同专业网站上进行搜索,费时费力。因而如何为研发人员提供更便捷全面的文献检索方法成为综合平台建设重要的组成部分。
尚华公司现建成的文献资料库已收录大量相关领域的重要文献,并与外网资源整合为一体。研发人员可先通过内网查询文献,如未能搜索到满意的结果,再通过外网查询。这样即可加快使用者的查询速度,也可节省网络资源和经费。同时,利用微软SharePoint FAST Server能够用专业语言进行搜索,使公司内部文献库检索速率提高了约三倍。
文档交流平台建立。研发项目的每一步进展都需要与客户及时交流,因此综合平台应具有协同工作的功能。经过测试不同工具,IT技术人员了解到微软SharePoint文档管理功能可以实现对文档的管理,包括上传、修改、版本控制、审批、用户权限管理和登陆记录、流转、协作等。其建立基于独立数据库站点,数据传输经过SSL通道加密,保证了安全性。通过为不同客户申请域名、设置不同账户和权限等方法,也能很好控制对文档的访问和审计。文档交流平台的建立使CRO项目管理更加简单透明。
经过近两年的调研和开发,IT部门初步完成了结合Cambridgesoft、Schrdinger、Seurat、SharePoint文档管理以及FAST检索功能集一体的综合平台(见图2)。
平台的主要流程包括登录CambridgeSoft系统注册化合物,取得结构式和其他化学特性,导入生物检测活性信息;化合物信息自动上传到Schrdinger系统,系统自动调用计算软件Schrdinger的Qikprop模块预测化合物类药性质参数;得到的预测结果自动传回CambridgeSoft系统,并从中导出化合物数据信息到Seurat系统做结构活性分析;在Seurat界面用图表形式直观再现分子母核上已有的取代基因,预测其药物构效关系趋势,指导药物化学机理研究。并且,从Seurat可直接打开Schrdinger软件的Maestro界面,调用其中Core Hopping应用程序可为需要替换已知小分子母核骨架的用户提供不可或缺的工具。而将CambridgeSoft里的化合物信息导入文档交流平台,可与平台里的项目信息进行整合。整个研发过程中的文献检索和信息查询则依托FAST工具加以运作。
案例分析
酶选择性抑制剂项目。酶选择性抑制剂项目是一体化药物研发项目,集合了化学、生物、药代药动、毒理、工艺开发和生产等过程。客户只提供研发靶点,即选择性的抑制组蛋白乙酰化酶来达到治疗癌症的效果。目前,本项目的先导化合物已经进入临床二期研究。在综合信息平台上,能快速并准确找到合成的500个左右化合物,包括化合物的结构、纯度、存储量以及生物的Assay、DMPK、ADME和In vivo TOX。化学部可以在尚华公司的文献资料库中快速查找文献,如果未能搜索到,还可通过FAST检索及时从公司外部文献库查询到所需文献。通过将数据导入Seurat系统做结构活性分析,化学研发人员独立发现新的选择性构效关系特点,从而设计并找到第二个先导化合物。目前项目已顺利结束临床前阶段研究,通过综合信息平台中的文档交流平台,数据已安全传输给了客户,整体沟通有效快捷。
离子通道受体治疗实验性变态反应性脑脊髓炎项目。离子通道受体治疗实验性变态反应性脑脊髓炎项目在临床神经免疫学的研究中具有重要意义。此前项目通过应用Excel数据表进行分析与共享,十分繁琐。化学研发人员利用综合信息平台后,通过对不同数据整合,能快速与客户共享数据。且CambridgeSoft系统里保存了大量化合物信息,只需登入,就能方便地了解到化合物的化学结构、特性数据以及生物活性数据,极大提高了效率,得到了客户的认可。
经过两年的努力,尚华医药研发服务集团IT部门现已完成药物研发一体化信息综合平台的初步建设,这一平台为尚华公司研发一体化项目服务产生了积极的效果。平台未来的扩展计划包括计算化学工具软件的延伸、文献查询工具功能扩展等,未来还将与其他研发业务平台整合,从而提高信息平台的整体利用率。