合成生物研究重大科技基础设施概述

2022-03-16 03:24张亭冷梦甜金帆袁海
合成生物学 2022年1期
关键词:生物学设施生物

张亭,冷梦甜,金帆,袁海,2

(1 中国科学院深圳先进技术研究院,深圳合成生物学创新研究院,广东 深圳 518055; 2 中国科学院广州先进技术研究所,广东 广州 511400)

当今世界,人类面对日渐严峻的疾病、环境、能源等挑战,合成生物学被认为是能应对挑战的新兴技术领域之一,亦成为各国争抢的科技高地。合成生物学采用工程化设计理念,利用人工设计的生物学通路与人工合成的生命体来研究基础生物学问题,即实现“造物致知”,进一步实现“造物致用”,服务于化工、食品、农业、医药、能源、环保等领域[1-2]。然而在对生物体进行设计、改造乃至从头合成的过程中,需要对大量基因元件、线路、系统进行合成与调试,通过对细胞进行“重编程”实现特定功能。由于生命体自身的高度复杂性及目前对合成生命体仍缺乏理性设计的能力,需要进行长期、反复的人工实验试错,才能逐渐靠近预定目标,然而海量的工程化试错实验将远远超出传统的劳动密集型研究范式的能力范畴。为了加速合成生物学的研究,需要在试错过程中引入标准化实验手段,从而高通量、低成本、多循环地完成“设计-构建-测试”的工程化闭环研发,因此建立一个可以实现生命体工程化、大批量合成的合成生物学专业平台已迫在眉睫[3-4]。

国家重大科学基础设施和大型科研仪器是探索未知世界、发现自然规律、实现技术变革的复杂科学研究系统,是突破科学前沿、解决经济社会发展和国家安全重大科技问题的技术基础和重要手段[5]。大科学装置或国家重大科学基础设施在区域科技和经济一体化发展中扮演着日益重要的角色[6-7]。合成生物“造物致知”和“造物致用”的高度复杂性决定了其需要海量工程化试错性实验,大科学基础设施则具有系统性、放大性等功能,如何有效结合二者以期利用大科学基础设施推动合成生物学的快速发展,成为当今生物学科中一个全新的研究方向[8-9]。

基于此背景,在相关部门的大力支持下,合成生物研究重大科技基础设施(以下简称“合成生物大设施”)应运而生,合成生物大设施即以合成生物学基础研究为理论基础,把自动化工业的智能制造理念引入到合成生物学研究中,基于智能化、自动化及高通量设备,结合设计软件与机器学习,快速、低成本、多循环地完成“设计-构建-测试-学习”的闭环,服务于合成生物学科学研究与产业应用的大规模、高通量、智能化软硬件平台。本文将从国内外合成生物设施现状、合成生物大设施建设过程、内容、目标和特色等方面进行介绍。

1 国内外设施建设现状

有计划地设计与合成可预测的生命体,已成为合成生物学领域的核心科学问题,也是工、农、医等各大领域应用的科研利器,合成生物学与自动化的结合, 有望开启生物技术(biotechnology,BT) 与信 息技 术(information technology,IT)融合的颠覆性领域,该领域已成为各国科技竞争的焦点,为此各国陆续投放大量科研资金,以期得到突破性进展。迄今为止,美英两国已分别支持建设多个大型合成生物学研究中心;德国、荷兰、日本、新加坡、澳大利亚等国也启动合成生物学研究的布局[10]。其中美国在自动化合成生物研究方面具有先发优势,伊利诺伊大学香槟分校累计获得美国国防部、能源部、NIH 和NSF 超过2 亿美元投资,建成全球首个自动合成生物功能岛。截至2020年9 月,美国Ginkgo Bioworks 公司、Zymergen公司等企业累计获得超过15 亿美元风险投资,进行自动化合成生物研发。目前合成生物自动化设备、机器人集成等核心技术由Thermo、Beckman、HiRes 等国外公司掌控。

近年来,随着自动化工业在各行各业的普及,全球范围内已建成或在建的多个大型合成生物学研究基础设施拟将自动化技术应用在合成生物学“设计-构建-测试-学习”的各个环节。但该项工作目前主要处在概念验证阶段,即基于少数孤立功能岛,实现部分流程的半自动化运行,存在一定程度的局限性,如底盘细胞单一、大片段DNA 制造成本高、复杂线路尚未实现有效设计、高通量测试手段少、自动化程度不高等。在此基础上,合成生命体系若想取得颠覆性突破,需要通过顶层设计与系统工程,突破集成规模和自动化程度的技术瓶颈,建设全面自动化、智能化、信息化且高度集成的工程化研究平台[11-14]。我国在争抢合成生物学科技高地的同时,总结国际各大合成生物研究机构的优劣势,在结合我国国情的基础上,重点部署了由中国科学院深圳先进技术研究院牵头建设的“合成生物研究重大科技基础设施”及由中国科学院天津工业生物技术研究所牵头建设的国家合成生物技术创新中心。国家合成生物技术创新中心以二氧化碳生物转化为目标,主要建设合成生物自动化工作站,以轨道机器人等为核心,整合各种生物相关仪器设备,形成集成化自动化装置系统,高通量、自动化地完成样品处理、DNA 合成组装、基因组编辑等标准化工作任务,以期通过自动化物流机器人实现高通量的样品“流”管理与统筹、通过机器人与人力的“双轨制”实现人工智能与人类智能的协同工作,具有较强的国际先进性、超前的战略眼光及强大的顶层设计理念[1]。

相较于国家合成生物技术创新中心,合成生物大设施以国产化和自主可控为方针,以全流程自动化为特色,建成后将成为规模最大、自动化水平最高、应用范围最齐全的全球首个合成生物科技基础设施,对我国引领合成生物学前沿探索,推动生物技术产业集群实现跨越式发展具有重大意义。

2019年5 月,中国科学院深圳先进技术研究院和天津大学作为我国两家发起单位,与来自全球8个国家共计16个隶属于公共研究机构的设施成立了“全球合成生物设施联盟”(Global Biofoundry Alliance,GBA),旨在共同应对自动化合成生物研究的技术难题,将智能制造、智能工厂的理念引入合成生物学,根据GBA 官网显示,截至2021年11月,GBA成员已达30个(表1)。

表1 GBA现任成员(按字母顺序排列)Tab.1 Current members of GBA

未来,合成生物大设施将助力合成生物技术成为改变人类社会的颠覆性技术,合成生物技术和产品亦将深刻影响全球经济及人们的生活方式。

2 设施概况

2.1 建设投资与进度

合成生物大设施由深圳市人民政府作为主管部门,中国科学院深圳先进技术研究院作为牵头单位,深圳市第二人民医院、深圳华大生命科学研究院作为共建单位共同建设,项目建设期共5年。

合成生物大设施于2017 年2 月启动项目咨询,随后开展项目建议书和土建方案论证,于2019 年11 月通过可行性研究报告,2020 年8 月通过初步设计和投资概算,正式启动建设。其中位于光明科学城启动区的基建项目概算26.64 亿元(含合成生物大设施、脑解析与脑模拟重大科技基础设施),其中,设施总概算为7.222 亿元,当前已进入全面实施建设阶段。设施基建主体建筑已于2020 年底封顶,整体预计于2022 年开展试运营、2023年开展验收工作。

同时,深圳市于2018 年投入经费7599 万元启动合成生物大设施建设前期预研项目。预研研究立足于从0到1的自主创新,践行“红蓝军路线”,利用粤港澳湾区的生产制造优势及IT产业优势,与国内设备厂商或研发机构合作,全面推动自动化设备、集成系统、应用软件的国产化进程。目前已实现纳升移液仪、挑克隆仪等“卡脖子”类仪器的核心技术突破,自动化集成系统软件和硬件的国产改造替代,以及配套试剂耗材国产化渠道的开拓;在自主开发的底层软件设计和架构方面,目前已掌握包括移动机器人、光反应器等创新装置的从头开发和集成能力,逐步实现我国相关仪器设备、集成系统和设计软件的自主可控,整体技术水平完成了从“跟跑”到“并跑”的转变,部分领域已通过原始创新,奠定了实现“领跑”的基础。

2.2 建设内容

合成生物大设施主要围绕自动化合成生物技术,以合成生物学基础研究为理论基础,把自动化工业发展过程中的智能制造、智能工厂理念引入合成生物学研究中,实现生命体工程化大批量合成,从平台和研发两个方面加强对合成生物学的支持,以研发推动平台建设,以平台建设支撑研发项目的开展。通过建立基于信息管理系统的智能生产单元,快速、低成本、多循环地完成“设计-构建-测试-学习”的闭环,实现理性可预测的设计合成,达成合成生命体的远程定制、异地设计和规模经济生产等目标。合成生物大设施基于智能化、自动化及高通量设备,搭建用于生物元器件、复杂网络、人工细胞等多维度合成生物的合成、组装、植入、激活与测试的生产线,结合设计软件与机器学习的深度研发,建立合成生物理性设计与工程化试错相结合的核心平台。

如图1所示,合成生物大设施共分两期工程建设。一期工程建设主要由三大平台构成,分别是构成数字世界的偏重软件层面的“设计学习”平台、组成物理世界的“合成测试”平台以及提供个性化检测的“用户检测”平台,拟二期建设具体应用层面的医学合成生物学平台。

图1 合成生物研究重大科技基础设施主要建设内容Fig.1 Roadmap for Shenzhen Synthetic Biology Infrastructure

“设计学习”平台主要建设合成生物设计和云端实验室两个主要系统。其中,云端实验室从构建合成生物大设施的运营场景开始,结合工业互联网技术,搭建以基础平台层作为基础设施,实现经营决策层、核心应用层、边缘计算层与物理建设单位无缝互联的四层结构云实验室平台;合成生物设计部分则利用生物信息、数理模型及人工智能等手段,针对特定科学需求,基于生物合成大数据,设计新反应、新酶、新途径、新菌株,建立一站式的设计技术体系、软件工具及生物信息数据库。“设计学习”平台利用生物信息、数理模型及人工智能等手段,针对特定科学需求,提供实验方案,并生成“合成测试”平台的可执行指令,其建设内容如图2所示。

图2 “设计学习”平台的建设内容框架Fig.2 Development of the Design-Learning Platform

“设计学习”平台包含了生物大分子设计、合成基因回路设计和生物信息数据库等7大模块,其中生物信息数据库模块将在已开发的数据库系统的基础上,针对重要生物合成过程的关键模块进行数据收集、挖掘、分类,嵌入目标分子、关键分子片段、反应相似性等生物合成要素的搜索技术,整合生物转化反应的原子-原子映射、反应中心获取、生物合成转化模式自动化挖掘和标准化分类的软件,建立生物合成的生物转化反应和转化模式数据库,同时建立功能全面化、性能标准化的合成生物学元件库。

“合成测试”平台主要由大片段DNA、噬菌体、细菌、酵母4 个自动化合成系统组成。每套自动化合成测试系统由多个核心功能模块及辅助模块构成。通过将科学研究梳理成各种工艺路线和通量需求,设计不同模块的仪器组合和具体工艺流程,并进行通量的仿真模拟来复核方案的实现能力,形成设计逻辑闭环。结合流程自动化、离散自动化的理念和实践,逐步实现由模块到子系统乃至整个“合成测试”平台的完全自主可控。“合成测试”平台将通过搭建局部自动化模块,作为灵活的“功能岛”执行特定功能,并根据需求组合成各类生产线设备系统。多种功能岛模块可以综合各种设备的特点,发挥系统集成的优势,其建设内容如图3所示。

图3 “合成测试”平台的建设内容框架Fig.3 Development of the Synthesis Platform

在建设设计学习和合成测试两大核心平台的同时,合成生物大设施还将着力打造“用户检测”平台。“用户检测”平台主要建设蛋白质和代谢产物分析系统、高级光学检测系统、底盘细胞放大培养系统。该平台将具备分子、蛋白质及单细胞的检测分析、高通量高分辨三维成像、厌氧发酵和小/中试发酵等能力。在初设阶段将针对上述能力的实现进行优化设计,调整优化部分工艺路线,更好地完成各项科学目标和工程指标。“用户检测”平台具备一定的检测能力及转化研究能力,以满足用户的个性化检测及转化应用需求。针对合成生物体系,整合蛋白质与代谢产物分析系统、底盘细胞放大培养系统、高级光学检测系统等,对产物进行多模态跨尺度的全方位测试,其建设内容如图4所示。其中底盘细胞放大培养系统的不同模块(包括设备和控制系统)主要采用购置的方式进行实施。

图4 “用户检测”平台的建设内容框架Fig.4 Development of the Testing Platform

之后在各模块控制系统的基础上,开发中央控制系统以有机整合和协调各模块的联合运行,后期将针对大设施项目运行中的更多特殊需求,对各大模块的协作进一步优化,进一步升级设备性能或自主设计加工更多具有特殊用途的设备。

如图5 所示,三大平台相互支撑,互为依存,形成整体闭环。“合成测试”平台一方面依托“设计学习”平台的云实验室管理系统来集成控制各模块的设备运行,另一方面接收“设计学习”平台对于合成生物设计模块软件的输出作为“合成测试”平台的输入指令,依据相关工艺拆解在“合成测试”平台上完成合成生物学物理上的合成;“合成测试”平台产生的各类生命体的相关生化指标将交由“用户检测”平台进行检测或下游放大,所有测试数据将由“设计学习”平台的实验室信息管理系统进行采集汇总并由相应软件模块进行分析和学习。

图5 合成生物研究重大科技基础设施的构成Fig.5 Schematic diagram for Shenzhen Synthetic Biology Infrastructure

2.3 建设特色

迄今为止,美国政府已支持设立3个大型合成生物学研究中心,英国政府已经资助6个大型合成生物学研究中心。德国、荷兰、日本、新加坡、澳大利亚等国也在紧密跟进。在各大研究中心与学术机构中,一般都建有自动化设施作为核心。它们既用于加速学术研究,也用于推动产业发展。许多企业也搭建了自己的自动化设施平台,如美国Amyris 公司、Ginkgo 公司、Zymergen 公司、Transcriptic 公司等。这些生物铸造厂的规模不一,功能大多是帮助研究人员将特定的基因线路设计自动化装载到活细胞中,并辅以高通量测试。工作流程往往都依照“设计-构建-测试-学习”的循环来组织,以实现工程化的海量试错。

英、美等国现有的自动化设施仍然存在一定的局限性,包括复杂线路设计能力不强、底盘细胞单一、大片段DNA 的制造成本高、高通量测试手段少、与下游应用衔接不紧,等等。许多研发需求仍未能满足,领域的发展仍面临障碍。

为充分发挥大型设施的战略性、整体性、引领性,合成生物大设施在充分借鉴国际、国内经验的基础上,形成自身特色如下:

(1) 创新体制机制

中国科学院深圳先进技术研究院依托合成生物大设施筹建“深圳合成生物学创新研究院”(以下简称“研究院”),统一协调和管理运营,实现建设、管理、生物伦理与安全监管。研究院能够为大设施提供机制保障、人才输出、研发体制创新,更有效地衔接基础研究成果与产业转化,从而实现对合成生物大设施的建设和支撑;同时大设施也能够为研究院的建设和发展提供硬件基础和创新平台。大设施的硬件支撑作用则借由研究院得到最大程度发挥,争取在最短时间内结合自身实际打造资源共享平台与学术交流平台,确立科研制度与服务体系,从而打通由基础研究到产业转化的创新链条,建立从基础研究、关键技术研究、成果转化、项目收益到长期持续运营的良性循环。这种“一体设计、同步推进”的模式,不仅利于理顺国家、地方、部门、依托单位和设施的关系,打破体制机制束缚,有效统筹地方资源支持国家大型设施建设,也将是中国科学院与地方合作共建大型科技基础设施在体制机制方面的有益探索。

表2 全球学术机构的知名合成生物学自动化设施[10]Tab.2 Global synthetic biology automation facilities[10]

合成生物学的快速发展,也给全人类带来了由此引发的安全风险和伦理问题,合成生物大设施在践行防范原则(precautionary principle)监管模式的基础上,于2020 年4 月成立了深圳合成生物学创新研究院生物伦理与安全委员会,主要负责监督保障合成院生物实验符合国家生物伦理的有关规定,并下设生物安全办公室具体落实合成生物大设施及研究院的日常生物安全管理相关工作,坚决筑牢生物安全屏障。

(2) 着重提升生物设计能力

与工业自动化做类比,目前已建成的合成生物学自动化设施因自身的短板,大都处于3.0 时代,即实现了大部分自动化,同时正逐渐朝4.0 时代迈进,即逐渐加强数据化和信息化能力[15]。在“设计-构建-测试-学习”的闭环中,有效的设计将会达到事半功倍的效果。合成生物大设施以全面进入4.0 时代为目标,着重利用生物信息、数理模型及人工智能等手段,系统地大幅提升生物设计能力。

比如,随着CRISPR 等基因编辑技术的普及和设计的规范化,烦琐、耗时且易出错的传统手工基因编辑已不适应合成生物学对于高通量研究的需求。为了帮助科研工作者从繁杂的DNA 双链中解放双手,我们开发了CASdesign--基于CRISPR 基因编辑原理的在线工具。通过计算机辅助设计软件(BioCAD),实现对大肠杆菌、酿酒酵母等模式生物和其他非模式生物的基因进行批量、可视化、实时交互地进行编辑改造工作,并最终输出引物、导向性RNA(guide RNA,gRNA)等结果以指导下游实验。

(3) 自主研发关键技术装备及软件

目前,生物领域的关键设备多为进口,受国际局势等诸多客观因素影响,核心设备仅依靠进口将很容易被“卡脖子”,且设备购置及维护成本高、一次性购买的生产线难以升级改造,成为自动化设施的一大难题。合成生物大设施在建设过程中,对于关键技术设备的研制,采用“红蓝军路线”。红军路线即从0到1,立足于自主创新,与国内的自动机械臂、离心机等设备研发团队合作,研发互相适配的设备开放接口,并建立中央控制系统整合测试,集合而成的国产功能岛如图6所示。

图6 国产设备装备的功能岛Fig.6 Functional units equipped with instruments developed by domestic suppliers

蓝军路线即0.5 到1,立足于吸收国外先进技术,通过对设备的升级改造,尽快完成平台的搭建。红军路线的“1”与蓝军路线的“1”相互竞争、借鉴、融合,实现1 加1 大于2。基于合成生物学科发展及技术需求,统筹规划,协同发展。通过搭建自动化模块及灵活、可拓展且针对性强的“功能岛”执行特定功能,并根据需求组合成DNA、噬菌体、细菌、酵母等各类生产线,可有力应对合成生物学领域的持续技术更新,发挥系统集成的优势,在兼顾自主创新与吸收国外先进技术的同时,推动高端自动化设备的国产化。合成生物大设施建成后,将是我国首个将软件控制、硬件设备、测试反馈和合成生物学应用进行整合的大型规模化智能合成生物制造系统,将实现全流程的高度集成和全自动化生物制造。

(4) 设置医学转化平台

为推进合成生物学与下游应用的衔接,保持其先进性、可持续性,结合深圳市及团队自身优势,合成生物大设施拟于二期时建设医学转化平台,该平台拟包括合成工程系统、细胞功能检测系统等系统,以人工设计的基因线路改造细胞、细菌或病毒载体,干预人体生理病理过程,从而开创突破性生物疗法,提升肿瘤、代谢疾病等的诊断、治疗和预防水平。

(5) 独特的开放共享机制

合成生物大设施将建立民主开放的课题遴选制度,不断开展合成生物大设施开放共享。根据开放共享运营机制,搭建合成生物大设施公共服务平台,包括设备共享管理平台和资源数据共享平台。其次,合成生物大设施将通过设立鹏城访问学者计划与博士后创新人才支持、开放课题基金、国际研讨会项目、横向合作项目、企业孵化项目等多种项目,鼓励全球顶尖人才进行交流访问及短期工作。同时,合成生物大设施注重强化与深圳其他重大科技基础设施的交流合作与资源共享,形成良好的互补性、错位性发展。例如脑解析与脑模拟重大基础设施可提供、共享种类丰富的实验动物模型;多模态跨尺度生物医学成像设施可提供光学之外的成像技术方法,很好地补充合成生物大设施检测系统的局限,满足多模态、跨尺度的研究和检测需求;国家超级计算深圳中心可通过互联网来共享强大的计算能力和数据储存能力,大大缩短“设计学习”平台所需的计算时间,节省资源;国家基因库二期可为合成生物大设施提供很好的生物样本来源与设计信息来源,合成生物大设施同步扩充基因库内涵,并降低成果的单一拷贝丢失的风险,实现“存读写用”。

3 展 望

生物科技(BT)和信息科技(IT)的融合交叉将深刻影响人类未来发展。合成生物学作为“BT+IT”融合交叉的代表性学科,被认为将有望引领第三次生物科技革命。将可能为人类面临的医疗、能源和环境等重大问题提供全新解决方案,从根本上变革人类的生产和生活方式。而合成生物学技术的发展,将有赖于跨学科跨领域的合作。

合成生物大设施建成后,将成为我国首个整合软件控制、硬件设备和合成生物学应用的大型规模化合成生物制造系统。首先,可将传统的合成生物研究模式转变为实验服务模式,帮助科研人员从长时、重复、受人为因素干扰的实验工作中解脱出来,专注于实验设计、规律总结等更具创造性的思维活动。其次有望突破合成生物学基础理论问题,围绕如何实现设计合成可预测的生命体这一关键科学问题,将实验对象、方法、技术等标准化,通过不断的、闭环的高通量的工程化试错,提升理性设计能力,掌握自动化合成元件、模块、底盘和系统的基本原理,揭示合成生物的科学原则。再次,合成生物大设施在核心技术攻关中的应用未来可期,通过进行生物元件功能数字化的技术研发,高通量合成的设备研制和自动化组装的技术和装备集成,数据库和实体库并重,旨在建成一个大容量、自动化、数字化、世界领先的生命科学基础元件中心,实现生命体工程化大批量合成,在根本上提升研究的速度、通量、实验成功率,推动科学探索。最后,将为国产化设备与集成软硬件系统提供一个大规模可验证的真实试验场景,并利用需求牵引促进国产化设备的研发,为推动我国高端生命科学仪器国产化应用助力。总之,合成生物大设施将催动基础和应用研究的原创突破及学科交叉融合,助力生命科学研究实现跨越式发展,推动深圳乃至我国成为新兴产业创新发展策源地。

致谢:感谢深圳市发展和改革委员会对本项目的大力支持和指导、感谢深圳市科技创新委员会对深圳合成生物学创新研究院的大力支持和指导,同时感谢在合成生物大设施可行性研究报告、初设概算等编写工作中付出辛勤劳动的团队成员,以及在本论文撰写过程中提供帮助和建议的老师。

猜你喜欢
生物学设施生物
生物多样性
生物多样性
上上生物
民生设施非“摆设”
太原市61个村要建污水处理设施严禁直排入河
丁酸梭菌的筛选、鉴定及生物学功能分析
谷稗的生物学特性和栽培技术
第12话 完美生物
垂直循环式立体停车设施控制系统的设计与实现
初中生物学纠错本的建立与使用