基于高通量液相色谱质谱技术的菌株筛选与关键分子定量分析研究进展

2023-11-21 03:22吴玉洁刘欣欣刘健慧杨开广随志刚张丽华张玉奎
合成生物学 2023年5期
关键词:高通量质谱菌株

吴玉洁,刘欣欣,刘健慧,杨开广,随志刚,张丽华,张玉奎

(1 中国科学院大连化学物理研究所,中国科学院分离分析化学重点实验室,辽宁 大连 116023; 2 大连理工大学化学学院,辽宁 大连 116024; 3 中国科学院大学,北京 100049)

合成生物学是21世纪新兴的交叉学科,是以工程化的设计理念,对生物体进行设计、改造乃至重新合成的研究领域[1-2],被认为是继“DNA双螺旋结构发现”和“人类基因组计划”后的第三次生物技术革命[3]。微生物细胞工厂(microbial cell factory,MCF)是合成生物学的重要研究内容,被越来越多地应用于生命科学、能源环境、食品农业及先进材料等领域,推动着当前生物技术的发展与进步[4-6]。

近些年来,随着基因编辑技术的进步,MCF的构建策略从最初的随机诱变逐步向全基因组水平定制化改造发展[7],生物学家可以在短时间内获得103~107量级的菌株突变体文库。然而,缺乏灵敏准确的高通量筛选方法限制了MCF的改造进化。合适的信号检测策略是筛选方法建立的核心[8],当前发展的高通量筛选方法多基于产物赋予菌株的颜色、细胞生长状态或与产量相关的荧光信号等,应用于琼脂平板、微孔板及液滴培养等不同培养类型菌株的快速检测[9-10]。但对于那些不具有颜色、荧光信号等表观性状的菌株,开发基于质谱的无标记高通量检测方法就显得尤其重要[11]。

此外,在菌株改造进化及发酵监测过程中,对代谢通路上关键分子(如代谢酶和代谢物)进行精准定量分析的需求日益凸显。而且当待测MCF的样本数量较大时,对检测方法通量也提出了更高要求[12]。当前对代谢通路中关键蛋白质的定量主要采用蛋白质免疫印迹法(Western blot,WB)或导入荧光蛋白标签策略。WB具有特异性强、敏感性高的特点,但通量低且定量准确性较差[13-14];荧光蛋白标签无毒、成像对比度高,然而其可选颜色有限且存在光漂白问题[15-17]。核磁共振技术(nuclear magnetic resonance,NMR)可以通过整合质子信号来识别和量化关键代谢物分子,NMR样品制备快且损失小,不依赖于分离技术,具有高度可重复性。然而,NMR的低灵敏度限制了其在关键分子定量研究中的应用[18]。

液相色谱具有优异的分离能力,可实现目标分子的高效分离,而质谱因其高特异性、高灵敏度的特点,具有强大的检测能力,二者均可以分析小分子及生物大分子。因此,色谱、质谱技术在生命科学领域得到了广泛的应用,尤其在蛋白质和代谢物定性定量分析方面发挥了重要作用[19-21]。近些年来,高通量液相色谱、质谱技术的进步革新,使其成为合成生物学菌株筛选及关键分子定量研究的有力工具。

本文总结分析了近年来高通量液相色谱、质谱技术在菌株筛选及关键分子定量方面的研究进展,从样品制备、色谱分离、质谱采集及数据处理层面展开介绍,并对这一领域未来的前景及挑战进行简要阐述,以期为该领域的研究人员提供参考。

1 基于高通量质谱技术的菌株筛选方法

MCF构建过程中会产生大量菌株突变体文库,需要建立高通量筛选方法。质谱具有灵敏度高且无需特异性标记等特点,可以为无表观性状MCF高通量筛选提供关键技术支撑。目前,菌株高通量筛选依赖的质谱技术包括:解吸电离质谱、电喷雾电离(electron spray ionization,ESI)质谱和原位电离(ambient ionization,AI)质谱。基于质谱的菌株筛选方法主要包括如下步骤:样品制备、色谱分离、质谱信号采集及数据处理和分析。

1.1 菌株高通量筛选中的样品制备方法

样品制备是连接菌株培养与质谱检测的关键环节。菌种培养液中含有无机盐、缓冲液、各种表面活性剂等质谱无法兼容的成分,因此需要对样品进行预处理。对于可分泌到细胞外的待测物,菌株样品制备相对简单,通过萃取或者稀释后即可进行质谱分析。而对于细胞内待测物,则需要菌体破碎、待测物提取等样品预处理过程。而且,针对不同的菌株培养模式,如琼脂平板培养、微孔板培养和液滴培养等,其对应的样品制备流程也有所差异。

用于菌株高通量筛选的解吸电离质谱技术主要包括基质辅助激光解吸电离(matrix-assisted laser desorption ionization,MALDI)质谱、自组装单层解吸电离(self-assembled monolayer desorption ionization,SAMDI)质谱和纳米结构启动质谱(nanostructure initiator mass spectrometry,NIMS)。MALDI电离源具有较高的耐盐性,通常可将菌株分析物直接加在靶板上,待风干后再添加基质以辅助样品离子化。针对不同类型的样本,可选用不同的基质,如α-氰基-4-羟基肉桂酸(α-cyano-4-hydroxycinnamic acid,CHCA)、2,5-二羟基苯甲酸(2,5-dihydroxybenzoic acid,DHB)或芥子酸(sinapinic acid,SA)等。对于微孔板及液滴培养的菌株,借助自动化移液系统和基质喷雾仪等设备可快速实现上述操作。而对于琼脂平板培养的菌株,通常借助膜转移法[22],使菌落转移至放在琼脂平板上的膜上生长,随后将膜上菌落生物质印迹在载玻片上,喷涂基质后进行质谱检测。在MALDI的基础上结合自组装单层技术产生的SAMDI质谱技术,通常使用自动液体处理器将微孔板培养的菌株待测物转移到经功能基团修饰的SAMDI靶板上,通过孵育将反应物富集在靶板上,添加基质后再进行质谱采集[23]。相对于SAMDI,NIMS技术利用含氟聚合物修饰的多孔硅芯片富集分析物,进而采用声学沉积装置辅助加样,且无需添加基质即可进行质谱检测[24-25]。

ESI质谱也是用于菌株筛选的另一主要工具,通常适用于微孔板和液滴培养的菌株。对于微孔板培养的菌株,由于ESI源耐盐性较差,样品通常需要经过萃取或色谱分离[26]后上样。芯片多通道纳喷离子源(triversa nanomate,TVNM)是在ESI电离源基础上,通过整合液体萃取表面分析技术(liquid extraction surface analysis,LESA)发展起来的新一代离子源。该技术通过吸头在样品表面位置进行微萃取,通过自动电喷雾进样将萃取得到的纳升级样品进入质谱分析,因其操作便捷而大大提高了基于ESI质谱技术的筛选通量。值得关注的是,商业化的RapidFire系统和声学辅助系统也是两个有前景的高通量分析平台,已经在抗体、药物筛选方面有所应用[27-31]。RapidFire系统可以在几秒钟内实现上样、固相萃取(solid-phase extraction,SPE)及质谱进样[32];以声雾电离(acoustic mist ionization,AMI)和声学液滴喷射(acoustic droplet ejection,ADE)为主的声学辅助技术,通过无接触方式利用声能从微孔板中喷出样品薄雾或纳升液滴,最快可在0.5 s内完成质谱进样[33-35]。声学辅助技术与RapidFire相比速度有所提升,且无需基质优化及点样,适用于基于微孔板培养的菌株筛选。对于液滴培养的菌株,可将菌株产物稀释后直接进行在线检测[36]。此外,一些在线微萃取研究工作[37-39]也为开发复杂液滴培养条件下的菌株样本制备方法提供了参考。

近些年来,AI质谱技术因其可在敞开环境下操作并实现原位、实时的质谱分析成为研究热点。其中,解吸电喷雾电离(desorption electrospray ionization,DESI)质谱常用于琼脂平板菌株的高通量筛选,采用微孔膜支架(microporous membrane scaffolds,MMS)[40]将待测样本转移至载玻片上进行后续质谱检测。新发展的快速蒸发电离(rapid evaporative ionization,REI)质谱作为一种新型AI质谱技术,可直接采样,无需样品制备,是菌株高通量筛选技术的理想选择之一。

1.2 菌株高通量筛选中的质谱检测方法

虽然液相色谱质谱联用技术具有高分辨率、高灵敏度的优点,但是色谱分离往往需要较长时间,难以实现高通量分析。因此,当前基于质谱的菌株高通量筛选方法通常避免采用色谱分离,而是在样品制备后直接进行质谱检测。

1.2.1 基于解吸电离质谱技术的菌株筛选方法

解吸电离质谱技术的典型代表是MALDI质谱。该技术首先将微生物样品与基质分别点加在钢靶上,晾干后形成共结晶。而后在激光照射下,共结晶中的基质分子吸收激光能量并帮助样品分子电离,进入质量分析器进行检测[41]。MALDI离子源通常与飞行时间质量分析器(time of flight analyzer,TOF)联合使用[42],称为基质辅助激光解吸飞行时间质谱(MALDI-TOF MS)。MALDITOF MS具有检测窗口较大、扫描速率快、耐盐性高和成本相对较低的特点[43-44],非常适用于菌株的高通量筛选。对于琼脂平板菌落的筛选,Zhao等[45]开发了基于MALDI-TOF MS的酰基链磷脂酰胆碱检测方法,将中链脂肪酸(medium-chain fatty acid,MCFA)量化信息转化为m/z730峰和m/z758峰的相对强度,并将其作为检测指标用于高产MCFA的酿酒酵母菌株筛选,实现了每分钟30个样品的分析通量。此外,视觉辅助识别技术的引入也大幅提高了菌落分析的速度。Sweedler等[22]结合机器视觉算法开发了基于MALDI-TOF MS的琼脂平板菌落高通量筛选方法。该方法巧妙地采用膜转移策略将平板上分散的菌落转移至靶板上,利用菌斑自动识别技术对随机分布的大肠杆菌菌落取样分析,以每个样品小于2.5 s的速度进行检测,并在天然产物文库筛选中验证了该方法的实用性。对于微孔板培养的菌株,Sweedler团队[46]开发了将样本位置转换为MALDI检测坐标的算法,在大肠杆菌及荧光假单胞菌文库实现高通量检测(每个样品小于2 s),拓展了MALDI质谱技术在菌株筛选中的应用。此外,选用金纳米颗粒代替DHB作为分析脂肪酸的基质,以增强检测信号强度。为了评估无标记质谱技术在活性酶快速筛选方面的能力,Si等[47]报道了应用于环二肽合酶的定向进化改造的MALDI-TOF MS筛选平台,对重组大肠杆菌突变体文库进行高通量筛选(每个样品5 s)。最近该研究团队将这一技术运用到羊毛硫肽化合物突变体文库筛选[48],且基本实现整个流程的自动化。此外,Cramer等[49]进一步将大气压(atmospheric pressure,AP)与MALDI结合,开发了一种液体大气压基质辅助激光解吸电离(AP-MALDI)装置,可用于肽、抗生素和脂质三类不同物质的高通量大规模样品分析,每秒至少可检测5个样品,优化得到的液体基质可用于分析复杂生物液体,为培养环境复杂的菌株筛选提供选择。对于微滴培养的菌株,也有使用MALDITOF MS直接筛选的报道[50-51]。Dittrich等[51]利用自制装置将液滴转移在平板上的确定位置,进而通过基于平行玻片的液滴分离方法获得细胞上清液样品。该方法结合离线MALDI-TOF MS检测,可在几秒内并行处理数千个液滴,并成功应用于分泌甜蛋白酵母的筛选。由此可见,MALDI质谱是目前适用于不同培养类型菌株高通量筛选的通用平台。

在MALDI基础上发展起来的SAMDI技术,由美国西北大学MiIan Mrksich团队[52]提出并进行了系统研究。SAMDI利用自组装单层技术在靶板上修饰功能基团,可在复杂体系中特异性富集分析物并进行质谱检测[23,53]。Mrksich等[23]利用SAMDI技术将靶板表面修饰马来酰亚胺基团,通过加成反应将未纯化的反应产物固定在自组装单层上,用于筛选大肠杆菌产生的细胞色素P411突变体文库,将5000个变体的筛选时间从24 d(1次重复)缩短为17 h(4次重复)。SAMDI技术还被广泛应用于酶活性筛选[54-57],展现了其在菌株高通量筛选方面的应用潜力。

此外,为了解决常规解吸质谱需要添加基质的问题,斯克利普斯研究院的Gary Siuzdak团队于2007年开发了NIMS技术[58]。该技术首先通过对载体材料进行电化学刻蚀得到纳米结构表面(如多孔硅表面),之后在纳米结构表面捕获氟化物以形成“引发剂”层,并将待测分子吸附在“引发剂”层的表面[59]。当受到离子束或激光击打时,“引发剂”可以释放和离子化待测分子,随后进入质谱进行检测(如图1所示)。尽管利用NIMS分析不同待测物时所选用的氟化物有所差别,但与MALDI相比,减少了基质的干扰。这使得NIMS技术可以更容易分辨出离子峰,提高检测灵敏度,成为菌株高通量筛选的有前景平台[24-25]。Keasling团队[25]提出了一种点击辅助NIMS酶活性测定法(probing enzymes with click-assisted NIMS,PECAN),通过将点击化学与NIMS相结合,对复杂基质中的酶活性进行高通量质谱检测,并利用该方法成功筛选了大肠杆菌细胞色素P450突变体文库。

图1 NIMS原理图Fig. 1 Schematic of NIMS

1.2.2 基于电喷雾电离质谱技术的菌株筛选方法

ESI质谱技术通过施加高电压将液体样品雾化成微小液滴,在辅助气作用下溶剂蒸发,液滴表面电荷密度逐渐增加,最后形成极小的带电离子进入质量分析器进行检测[60]。ESI属于软电离方式,适合于分析极性强、热稳定性差的生物大分子。然而,由于ESI电离源耐盐性较差,菌株样本通常需要经过提取净化或色谱分离后进行质谱采集。Ellis等[26]开发了超快速(84 s)液相色谱质谱联用方法和条形码纳米孔测序相结合的菌株检测方法,解决了色谱分离通常占用大量时间的问题,在24 h内筛选1000个菌落,得到12株三萜桦木酸产量提高的酿酒酵母菌株。融合LESA技术的新一代TVNM离子源是用于菌株高通量筛选的另一良好工具,LESA使用溶剂萃取提取样品,得到的样品直接进入质谱检测,可以最大限度减少基质效应。Sweedler课题组[61]将LESA技术、声学液体工作站及稳定同位素标记方法结合,成功用于酵母菌株衣康酸、三乙酸内酯和棕榈酸的高通量绝对定量筛选,每个样品检测过程大约需要1 min。然而,可能是由于样品提取效率不一致和基质干扰的原因,LESA技术尚未广泛用于工程菌株筛选。除了上述应用于微孔板培养菌株的方法,基于ESI的质谱技术也被用于筛选液滴培养的菌株[36,62]。Dusny等[36]将微流控芯片技术与在线ESI质谱检测结合,将纳升级液滴通过集成发射器直接注入ESI电离源检测,用于筛选不同生长介质中生产赖氨酸的谷氨酸棒杆菌优势菌株,筛选通量为每分钟60个样品。

1.2.3 基于原位电离质谱技术的菌株筛选方法

自2004年美国普渡大学Cooks等[63]首次报道以来,DESI目前已成为AI质谱的代表性技术。该技术通过向样品喷射由ESI 产生的带电雾滴实现样品离子化,经氮气吹扫干燥后,分析物以气相离子形式进入质谱检测(如图2所示)。

图2 DESI源原理图[63]Fig. 2 Schematic of the DESI source[63]

DESI可在大气压条件下工作,通过调节喷雾溶剂种类提高对待测物的选择性检测,且无需复杂的样品预处理,是适用于菌株高通量筛选的有效方法。DESI通常与质谱成像技术(mass spectrometry imaging,MSI)结合,将产物量化信息映射到其空间位置,以区分菌落边界并产生质谱强度信息[64-65]。Barran等[64]利用DESI-MSI技术,对大肠杆菌生物催化剂产物解氨酶及P450单加氧酶进行实时筛选,通量约每分钟60个样品。McLean等[65]同样使用DESI-MSI技术,结合MMS取样方法对工程大肠杆菌中的游离脂肪酸进行快速原位分析,从样本转移到采集质谱数据,每个菌落样本需要8 min。

REI质谱是近些年来新兴的AI质谱技术, 于2009年由帝国理工学院Takáts团队[66]提出。该技术通过电离切割样品释放气溶胶,再通过导管将气溶胶直接吸入到质谱仪进行检测,特别适合原位快速分析。Takáts等[67]将激光与REI技术结合,发展了激光辅助快速蒸发电离(laser-assisted rapid evaporative ionization,LA-REI)质谱技术(图3),激光可实现菌株代谢物即时半定量分析。

图3 LA-REI源原理图[68]Fig. 3 Schematic of the LA-REI source[68]

将该方法用于评估酵母菌株中紫色杆菌素和白桦酸的生产水平,以每分钟6个菌落的通量直接从酵母菌落采样,通过筛选数百个菌落后成功分离出1株高产菌株,其白桦酸产量提高了2.5倍。LA-REI质谱快速、便捷的优势使其在菌株高通量筛选方面具有巨大潜力[68]。

综上所述,不同类型的质谱技术为菌株高通量筛选提供有力工具,筛选速率可以达到秒级,相关内容总结见表1。此外,一些其他质谱技术,如MALDI源与ESI源结合产生的基质辅助激光解吸电喷雾电离(matrix-assisted laser desorption electrospray ionization,MALDESI)质谱,也展现出超快的检测速度[69-70],为菌株高通量筛选方法的开发提供了潜在可能。

表1 基于高通量质谱技术的菌株筛选研究汇总Table 1 Summary of strain screening studies based on high-throughput mass spectrometry

1.3 高通量数据处理和分析

自动化的质谱检测会产生海量数据,需要后续数据平台快速同步分析以满足高通量筛选需求。当前的数据处理分析流程通常基于商业化软件或根据实际工作流程编写相应代码,以实现整个筛选过程的顺利运行。

针对解吸电离质谱技术产生的数据,常用的SpectralAnalysis[71]、Flex Analysis(Bruker)、TOF/TOF Series Explorer(AB Sciex)等软件可满足基本的处理分析需求。此外,有些研究基于Python、MATLAB平台,自行编写代码以匹配实际筛选流程。Sweedler团队[46]基于Python开发了macroMS程序,该程序通过对一定质荷比范围内的离子总数求和对MALDI-TOF MS成像数据的处理,同时创建了数据可视化分析网页,并生成样本数据热图,成功用于产MCFA的酿酒酵母菌株的高通量筛选。Si等[22]开发了用于多元统计分析的算法,结合t分布-随机邻近嵌入(t-SNE)对数据进行降维可视化分析,以快速评估和识别具有所需表型的突变体。对于ESI质谱技术的数据处理分析,可以借助Protein Metrics Intact Mass、MassLynx(Waters)、MultiQuant(AB Sciex)等平台处理。

基于DESI、NIMS的质谱筛选技术通常与成像技术结合,OpenMSI平台[72]是处理上述质谱成像数据的有效工具。为了进一步提高数据处理通量,Bowen等[73]开发了OpenMSI阵列分析工具包(OpenMSI Arrayed Analysis Toolkit,OMAAT)。该软件基于Python编写,并集成了OpenMSI平台,可用于存储、共享和分析MSI数据,解决了大型质谱成像数据集快速处理问题,将基于NIMS技术检测的384个样品成像数据分析时间缩短为原时长的1%。

2 基于高通量液相色谱质谱技术的菌株关键分子定量分析方法

菌株代谢通路中的关键蛋白及小分子代谢物的高通量精准定量分析,不仅是深入认识代谢通路调控机制的重要手段,也有助于加速MCF进化的效率。相比于传统的基于WB的蛋白检测方法和基于NMR的代谢分子检测方法,基于高通量液相色谱质谱的蛋白质组学和代谢组学技术具有定量准确性高、重现性好等特点,在工程菌株关键分子定量环节发挥着重要作用。根据分析检测流程,分为四个关键步骤:样品制备、色谱分离、质谱检测及数据处理。

2.1 高通量样品制备方法

随着液相色谱质谱联用技术的进步,大批量MCF样品中关键分子的定量分析成为可能,同时也对样品制备的通量及重现性提出了挑战。近年来,自动化移液工作站相继问世[74-75],配合微孔板实现批量化样品预处理。仪器代替手工操作不仅大大提升了样品制备通量,而且也显著提高了样品处理的重现性。

传统基于自下而上(bottom-up)的蛋白质组学样品预处理流程包括蛋白质提取、变性、还原、烷基化、除盐和酶解等步骤,通常在自由溶液中离线操作完成,整个流程步骤多、耗时久、损失大。为了提高预处理通量,Petzold等[76]发展了3步模块化样品制备方案,包括菌株裂解、蛋白提取定量及酶解,结合Biomek-NX自动化移液工作站可在1 h内完成96个样品的酶解前流程,并被成功用于革兰氏阴性细菌和真菌样品的预处理。为了加快样品制备流程并减少样品损失,Krijgsveld团队[77-78]发展了单罐固相增强样品制备(singlepot solid-phase-enhanced sample preparation,SP3)方法,利用羧基包覆的顺磁珠与样品之间的亲疏水相互作用,在18 min内完成蛋白质捕获,随后进行原位除盐及酶解处理实现蛋白样品制备。基于SP3方法与96微孔板,Armengaud等[79]开发了一个高通量样品制备平台,省略了还原及烷基化过程,将酶解时间缩短为15 min,实现了细菌蛋白样品的快速制备。Paulo课题组[80]将SP3与串联质量标签(tandem mass tag,TMT)技术结合,使用opentrons OT-2移液工作站开发了半自动SL-SP3-TMT(streamlined-SP3-TMT)样品制备方法(酶解操作需在额外的加热振荡器上进行),可在9 h内实现96个酵母样品的半自动化TMT标记化制备。此外,研究者还报道了针对蛋白质翻译后修饰的高通量样品制备方法。Lipton等[81]发展了一种自动化系统,利用大容量固定化金属离子亲和色谱(immobilized metal affinity chromatography,IMAC)柱增加肽负载量同时减少洗涤时间,实现细菌样品中磷酸肽的高效富集。Leutert等[82]将SP3方法和基于Fe-IMAC磁珠的磷酸化富集技术进行整合,发展了一种高通量的磷酸化蛋白质组学分析流程(rapid-robotic phosphoproteomics,R2-P2),结合King Fisher Flex自动化移液工作站可在5 h内实现酿酒酵母磷酸化蛋白质组预处理。

对于代谢物而言,样本制备流程通常包括采样、猝灭、细胞内/外代谢物提取[18]。细胞外代谢物存在于培养基中,仅需要将培养基与微生物菌株分离,进行下游检测即可。而细胞内代谢物所处的环境复杂,代谢物之间可以迅速转化,因此处理流程更为复杂。尤其在进行大量菌株的代谢物样本制备时,需要尽可能对每一步操作进行优化。为了提高采样速度及猝灭效率,人们开发了自动化采样猝灭装置[83-85]。最近,Blank等[86]开发了一种基于不可逆电穿孔的采样装置,通过脉冲电场调节微流控芯片的流量,可在数秒内实现细胞内代谢物的采样、猝灭及提取处理,适用于细胞壁和细胞膜特性不同的多种细胞类型。此外,提取也是代谢物样品制备的重要环节,包括细胞破碎以及随后的代谢物提取和样品浓缩等步骤。当前常用的细胞破碎方法可分为基于超声、微波及研磨等过程的物理破碎方法,基于热乙醇、乙腈等有机试剂的化学破碎方法,以及基于溶菌酶等破壁酶的酶解法。代谢物提取方法主要有蛋白质沉淀法(protein precipitation,PPT)、液液萃取法(liquid-liquid extraction,LLE)及SPE技术等[87]。其中,SPE技术由于回收率更高,可将分析物与干扰组分有效分离,是当前代谢物提取的主要方法。其利用在短管里填充固体吸附剂,选择性地吸附样品溶液中的目标物质,随后选用适当强度的溶剂冲洗杂质,最后洗脱获得目标物质。为了满足高通量分析的需求,目前自动化固相萃取技术也已问世。Six等[88]发展了一种基于SPE的无标记质谱检测方法(简称:BacPK),结合RapidFire系统,在2 h内完成细菌裂解、提取及固相萃取等操作,用于检测大肠杆菌细胞内化合物的总积累量。在SPE基础上发展起来的固相微萃取技术(solid-phase microextraction,SPME)集萃取、浓缩及进样于一体[89],也被用于菌株中微量代谢物的快速样品制备[90-92]。SPME具有样品用量少、选择性高及使用便捷的优点,易于实现自动化。Pawliszyn等[90]开发并应用不同的SPME涂层,发展了同时提取大肠杆菌中疏水性和亲水性代谢物方法,并与96孔板结合,可在4 h左右完成肠杆菌中代谢物提取、洗涤及解吸过程,随后又将该方法应用于肉桂醛对大肠杆菌的杀菌机制研究[93]。

高通量样品制备方法的革新,将样品预处理时间从原来的数天缩短至几小时,使大规模菌株样本快速处理成为可能。但是,由于样品制备流程步骤多,且步骤之间多需要进行转移,还未实现全流程完全自动化。借助新兴的智能自动化平台,实现样品制备全流程集成化、自动化已成为未来的发展趋势。

2.2 高通量色谱分离方法

目前,液相色谱质谱联用技术在针对大量菌株样本的关键分子定性定量分析中占据主导地位,可用于细胞工厂代谢通路路径识别和优化[94],指导MCF的理性设计,并为基因组尺度代谢网络模型(genome-scale metabolic model,GEM)构建提供支撑。色谱分离可实现复杂样品的高效分离,大幅提高后续质谱检测的准确度和灵敏度,是液相色谱质谱联用技术的关键环节。

传统液相色谱质谱联用技术基于纳升流速,灵敏度虽高,但较长的分离时间严重限制了分析通量。近些年来,以毛细管流速(capillary-flow)液相色谱、微升流速(micro-flow)液相色谱及分析流速(analytical-flow)液相色谱为代表的高通量色谱技术应运而生[95],结合不同的分离模式,为解决大队列样本不同类型关键分子的快速检测提供技术支撑。Petzold等[96]采用C18色谱柱(50 mm×2.1 mm),流速400 μL/min,梯度25 min,联合Agilent 6460三重四极杆质谱仪,对大肠杆菌中的600多条肽(367个蛋白)进行了定量。Ralser等[97]基于HSS T3色谱柱(150 mm×300 μm),在5 μL/min及19 min有效分离梯度条件下与TripleTOF 6600联用,定量来自796个酵母菌株的1576个蛋白质,实现了非整倍体的系统分析,揭示了其在蛋白质组水平上的剂量补偿。以上色谱分离主要采用经典的反相液相色谱(reverse phase liquid chromatography,RPLC)模式。它采用非极性介质作为固定相,极性溶液为流动相,根据溶质极性差别对复杂样品进行分离。对于MCF中的糖类、磷酸化合物等强极性分子,常用的检测模式为亲水相互作用色谱(hydrophilic interaction chromatography,HILIC)。HILIC采用了亲水固定相和疏水流动相,在分离过程中,亲水固定相表面首先形成一个水层,亲水的极性分子集中在固定相周围的水层,而低极性的分子溶解在有机相中。Paglia等[98]报道了用于小分子极性代谢物的常规高通量检测方法,基于HILIC分离和四极杆飞行时间质谱检测模式,在10 min分离梯度及400 μL/min流速下全面分析糖、磷酸化合物、嘌呤和嘧啶、核苷酸等多种小分子极性代谢物。Brouwers等[99]建立了高通量脂质分子分析流程,使用HILIC分离柱(50 mm×4.6 mm)在1 mL/min流速及4 min梯度内与质谱联用检测223个脂质分子。

此外,丹麦Evosep公司于2018年推出新型Evosep One液相系统,包含了用于样品洗脱及梯度存储的低压泵和同步快速上样及色谱分离的高压泵,创新型的高低压管路设计消除了样品间色谱柱平衡时间[100],可在6 min有效梯度内实现每天200个样品的检测通量[101-102]。Evosep One系统通量高及稳定性好的优势为大规模低样本量的菌株关键分子定量分析提供选择。

多色谱柱系统开辟了提升分离通量的另一路径。双液相色谱平台可以充分利用上样时质谱采集的空闲时间,提高检测通量[103-104]。Mann课题组[104]开发了样品制备与双液相色谱平台平行的高通量工作流程,优化样品采集时间为15min,可在1 d内完成96个较低或中等复杂度样品的分析检测。值得关注的是,商业化Transcend TLX系统,结合在线SPE技术及多通道液相色谱分离,有效提高质谱检测利用率,已在病毒蛋白鉴定中有所应用,可以达到每天超过500个样本的分析通量[105],是高通量色谱分离方面很有前景的平台。

2.3 高通量质谱检测方法

质谱拥有卓越的检测能力,可在一次运行中对成百上千个关键分子进行分析。为满足不同检测规模和监测目标的需求,人们可以采用非靶向型技术和靶向型技术对蛋白质或代谢物分子进行质谱分析,例如数据依赖型采集(data-dependent acquisition, DDA)是典型的非靶向采集技术,选择反应监测(selected reaction monitoring,SRM)是靶向采集技术的代表。

2.3.1 关键分子非靶向定量分析

非靶向分析是一种无偏向性检测技术,侧重对微生物体内某一类物质(如蛋白质、代谢物)进行系统性检测,全面深入分析微生物表达特征并发现影响菌株产量的关键差异分子。关键分子非靶向定量分析通常使用无标记定量(label free quantitation,LFQ)策略,通过比较同一离子在多个样品中的质谱信号差异,可以对不同样本中同一分子的含量进行相对定量分析[106]。此外,稳定同位素标记定量是另一种常用的非靶向定量分析策略。该方法通过代谢标记或体外标记,在蛋白或肽段上引入13C、15N等稳定同位素[107]。使不同样品中同一肽段具有不同的质量标签。在对混合样品进行质谱分析时,不同来源的同一肽段产生不同的信号离子,根据它们的峰强度进行定量分析[108-109]。无标记定量方法具有更宽的动态范围和更深的覆盖度,而稳定同位素标记方法的定量精度和准确性更高[110]。DDA是经典的非靶向质谱采集模式,即首先进行一级质谱全扫描,随后对一级谱图中选中的强度较高的母离子进行二级扫描[111]。由于这种方式获得的谱图质量较高,因此在分子定性定量检测中应用广泛。然而,传统DDA模式随机性大,导致数据重现性较差,易产生大量缺失值。近年来发展起来的数据非依赖型采集模式(data-independent acquisition,DIA),即不依赖一级谱中的离子强度信息,对每个窗口区域所有母离子进行连续碎裂检测。该方法可以获得所有碎片离子信息(见图4),提高了数据利用度,具有重现性好、定量准确性高及通量高等优点[113-114],逐渐成为关键分子高通量定量分析的有力工具。Mann等[115]建立一种快速DIA分析方法,与RPLC联用,在2.2 d内定量检测了100个酵母蛋白质组样品。Ralser课题组[116]发展了Scaning SWATH模式,结合800 μL/min分析流速,可在5 min内对来自酵母的1900种蛋白进行相对定量。值得注意的是,DIA采集模式也有其不足,即在获得更多信息的同时增加了谱图分析难度。此外,离子淌度(ion mobility,IM)技术[117]可以根据离子大小和形状差异引起的漂移时间差来实现第四维度的分离,有效降低谱图复杂程度及数据匹配的假阳性,可以进一步提高鉴定准确度。Burgess等[118]采用两性离子亲水相互作用色谱(ZICHILIC)与漂移管离子淌度-四极杆飞行时间(DTIM-QTOF)质谱模式,开发了一种高覆盖度的非靶向代谢组学快速工作流程,在800 μL/min流速及3.5 min梯度条件下检测到细菌细胞内2139个代谢物分子特征。

图4 非靶向采集模式原理图[112]Fig. 4 Schematic diagram of the untargeted acquisition mode [112]

2.3.2 关键分子靶向定量分析

靶向分析侧重于已知关键分子的定量检测,通过针对性地检测代谢通路中的关键蛋白及代谢物,克服了非靶向采集过程中大量离子干扰及低丰度离子不易检测的问题。靶向分析通常用于关键分子的绝对定量,使用待测组分标准品或在样品中加入内标物质,通过比较标准品或内标物质与待测样品质谱信号峰面积进行定量。对于代谢物分子的绝对定量,通常由不同浓度的标准品得到标准曲线,使用内标物质消除系统误差,在标准品浓度与峰面积、目标物质峰面积已知的情况下,计算出样品中目标物质的含量[119]。对于蛋白质的绝对定量,已经发展了绝对定量分析(absolute quantification,AQUA)[120]、基于定量肽段聚合物(concatemer of quantification peptides,QconCAT)[121]、蛋白标准品绝对定量(protein standard absolute quantification,PASQ)[122]等多种方法,通过合成标准肽段或构建重组蛋白,经过质谱分析,达到对目标肽段准确定量的目的。以上绝对定量方法的本质是通过已知标准物质的量化信息来间接得到目标蛋白质或代谢物的绝对量。SRM[123]是最经典的靶向采集技术,该技术基于三重四极杆质谱对目标物进行分析,通过第一重四极杆选择目标分子的母离子,随后在第二重四极杆中发生碎裂,再由第三重四极杆进行目标碎片离子检测。目标分子母离子的碰撞碎裂效率与离子传输和离子聚焦相关,增加多极杆数目可提升传输效率却影响离子聚焦,为了平衡二者以获得更好效果,常选用六极杆碰撞池对母离子进行碎裂,但是在表述上依然采用三重四极杆的说法。在SRM基础上发展起来的多反应监测(multiple reaction monitoring,MRM)技术,可实现多个碎片离子同时监测,由于二者根本原理一致,可不做明显区分。SRM/MRM技术特异性强、灵敏度高且重现性好,在微生物关键分子定量分析研究中应用广泛[94]。Petzold等[124]开发了基于高流速RPLC和SRM检测技术的高通量靶向蛋白质组学方法,在5.5 min有效梯度内实现了大肠杆菌21条主要代谢途径的400多种蛋白质的绝对定量分析,为大肠杆菌关键代谢通路蛋白质的快速精准定量分析提供了可靠的工具。Gao等[125]利用微流RPLC结合SRM采集模式,在32 min内实现了恶臭假单胞菌(P. putidaKT2440)中132种蛋白质的定量分析,揭示了恶臭假单胞菌KT2440在不同碳源及培养基中这些酶的表达水平的变化。Herrgård课题组[126]开发了一种用于高通量定量代谢组学的快速反相离子配对液相色谱三重四极杆质谱(rapid reverse phase ion-pairing liquid chromatography triple quadrupole mass spectrometry,RapidRIP)方法,结合MRM采集模式,该方法能够在不到5 min的时间内定量分析氨基酸、核苷酸和辅因子等102种工程大肠杆菌的代谢物。高通量关键分子SRM/MRM分析方法的进步为深入认识并指导MCF代谢通路改造提供帮助。

此外,针对混合型高分辨质谱系统(如四极杆离子阱质谱、四极杆飞行时间质谱),人们发展了平行反应监测(parallel reaction monitoring,PRM)技术,可以对母离子产生的所有碎片离子进行检测(如图5所示)。

相比于SRM/MRM,PRM选择性及灵敏度更高,且由于避免了母子离子对的选择与优化,更便于方法开发,已在菌株关键分子定量方面有所报道[127-130],在大规模样本定量分析方面展现出了应用潜力。

随着高通量液相色谱和质谱技术的发展与进步,人们已经可以在数分钟内实现MCF中的大量蛋白及代谢物的规模化定量分析,为大批量样本快速检测提供技术支撑,相关总结内容见表2。

表2 基于液相色谱质谱技术的菌株关键分子定量研究汇总Table 2 Summary of quantitative studies of key molecules of strains based on liquid chromatography mass spectrometry

2.4 菌株关键分子定量分析中的高通量数据处理和生物信息学工具

高通量液相色谱质谱联用检测产生大量的数据信息,亟需发展高通量的数据处理平台与之匹配。质谱采集产生的原始数据通常需要进行特征提取、噪声过滤及峰提取和对齐等前处理操作,随后进行多元统计分析和生物信息学分析[131]。这一过程可以借助软件及商业化平台进行,如MaxQuant、Spectronaut、MZmine、XCMS等。此外,已经报道了多项面向大型数据集处理及分析的研究工作。

2.4.1 数据处理

质谱采集的信号中含有大量背景噪声信号。当样品复杂程度高且目标信号峰强较低时,难以选定基线将目标信号与噪声信号有效区分,处理不当会引入假阳性结果。因此准确区分样本信号与噪声信号对于后续定量分析十分重要。此外,高通量分析过程中产生大规模的数据集,为了提高数据处理通量,亟需发展高通量自动化的数据处理平台。为了解决上述瓶颈问题,Aoshima等[132]开发了一种基于一级质谱数据的无标记峰检测和定量算法(AB3D),该方法的主要特点为可以结合局部最小值及加权平均值算法进行峰值提取、降序处理所有排列候选峰。AB3D采用2D降序峰检测、较少的模型拟合方法及简便的操作步骤有助于快速处理大规模数据。使用革兰氏阴性菌株Bartonella quintana测试了AB3D算法的定量能力及运行时间,发现其比四种现有软件工具(MZmine2,MSight,SuperHirn和OpenMS)分析速度快大约1.2~15倍,但定量能力相当。相比于AB3D算法,MZmine2、OpenMS使用多种不同类型模型拟合峰以及嵌入可视化工具,灵活性强,但操作较为复杂[133-134];MSight从原始数据文件生成图像以用于基于图像的峰检测,提供更为直观的数据信息,但计算相对昂贵[135];SuperHirn使用多重比对策略结合聚类分析进行数据处理,但处理文件格式有限[136]。同位素标记提供了更准确、更可靠的关键分子定量信息,但产生数据集更加复杂,数据分析的难度和用时都大幅增加。Kiefer等[137]开发了基于Python平台的DynaMet扩展包,用于从质谱原始数据中自动提取同位素标记特征,可在10 min内提取386个动态标记特征,并在芽孢杆菌及大肠杆菌动态标记实验中测试了该方法的普适性。此外,基于人工智能和机器学习的大数据发展平台也在合成生物学及代谢工程领域崭露头角,大大提升了分析效率[138-139]。Ralser课题组[140]开发了用于处理高度复杂DIA数据的软件(DIA-NN),利用深度神经网络分析(deep neural networks,DNNs)分辨真实信号与噪声,发展新的量化和信号校正策略提高定性定量准确度,可在3 h内高通量完成364个酵母样本的数据处理。

此外,研究者还开发了一系列针对靶向采集模式的数据处理工具[141-143]。针对当前靶向检测数据处理通量较低的问题,Aebersold等[141]开发了识别置信度转移(transfer of identification confidence,Tric)算法填补了大规模靶向蛋白质组学数据集自动化分析的空白。该软件利用碎片离子数据进行交叉比对、统一峰提取和定量策略,可将大规模靶向蛋白质组数据集分析误差率降低为原来的1/3。Zhu等[142]开发了一种面向大规模靶向代谢组学数据处理的R包MRMAnalyzer,用于自动化处理基于MRM模式的代谢组学数据,可在20 min内处理包含8000个母子离子对的大肠杆菌代谢组学数据集。

2.4.2 数据分析

高通量检测技术造就的“大数据”时代已经到来,对数据分析与挖掘提出了挑战。为了更好地阐明预处理后的数据,需要对其进行深入的统计分析与生物信息学分析。Kang等[144]报道了代谢工程目标选择和最佳菌株识别工具(metabolic engineering target selection and best strain identification tool,MESSI),用于预测与酵母生物生产相适配的高效底盘和调节组件。MESSI可以分析已有的高通量代谢组学数据,并将其转换为相关代谢途径,以获得可实现目标化合物高产的最有效的酿酒酵母菌株。Karp等[145]开发了一款生物信息学工具(pathway tools,PTools),可以为单细胞生物、多细胞生物以及泛基因组和生物群落(如大肠杆菌)自动生成完整的代谢网络图,并可以进一步搜索和分析这些网络。PTools也可用于可视化基因组规模代谢网络,分析高通量代谢数据集,帮助研究人员更好地理解生物体内代谢网络。对代谢通路关键分子数据处理及分析工具总结见表3。

表3 关键分子定量分析中数据处理软件及生物信息学工具汇总Table 3 Summary of data processing software and bioinformatics tools in the quantitative analysis of key molecules

3 总结与展望

近年来,高通量液相色谱、质谱技术的发展为菌株筛选与关键分子定量分析提供有力支撑。在MCF高通量筛选方面,自动化设备的出现加速了样品制备速度。基于解吸电离、ESI和AI等不同类型的质谱技术为菌株高通量筛选提供多种选择,可以兼容琼脂平板培养、微孔板培养和液滴培养等不同模式下的菌株样品。对于质谱筛选产生的大型数据集可结合商业化软件平台进行处理,或根据需求自行编写程序以提高数据分析可靠性。在MCF代谢通路关键分子定量方面,自动化移液工作站的应用在提高分析通量的同时减少了人为误差,其与自由溶液酶解或磁性富集材料表面酶解相结合实现了菌株蛋白质的快速样品预处理,与SPE或SPME相结合实现了菌株代谢物快速样品预处理。在色谱分离方面,以毛细管流速、微升流速及分析流速色谱为代表的高通量色谱技术缩短了分离时间;不同类型的分离模式,如RPLC及HILIC,为检测不同类型关键分子提供多种选择。在质谱检测方面,以DIA为主的非靶向质谱采集模式弥补了DDA随机性大的缺陷,成为高通量关键分子鉴定的有效选择;SRM/MRM靶向采集模式为已知关键分子定量提供有力工具。此外,DIA-NN、Tric等用于处理大型组学数据集的软件及生物信息学工具也已相继报道。

目前,基于质谱技术的菌株高通量筛选方法仍处于起步阶段,所采用的质谱技术以解吸电离、ESI及AI为主。值得关注的是,AI质谱通常耐盐性较高,但对于某些MCF复杂的培养环境,如何对细胞外产物进行快速样品制备仍是需要解决的问题;而在分析细胞内产物时,针对菌株裂解、提取等环节,开发出高通量、高重现性且自动化的样品制备方法对于基于质谱的菌株高通量筛选显得尤为重要。近年来,多个非色谱依赖的高通量质谱筛选方法显示出令人惊讶的潜力,但这些方法牺牲色谱分离以提高分析通量,可能导致离子抑制及低覆盖率等问题。此外,当菌株筛选通量足够高时,需要进一步提高定量覆盖度与准确度。另一个挑战是处理高通量筛选所产生大型数据集的通用分析平台发展缓慢,研究工作多聚焦于开发定制的数据分析程序或支持商业平台的自制脚本,公开通用或商业可用的数据分析工具研究较少。在MCF代谢通路关键分子定量分析方面,样品制备流程步骤繁多,不易实现全流程自动化。例如目前自动化蛋白质样品制备流程通常不包含菌株裂解过程,而适用于细胞内代谢物提取的通用方法也较少。发展具备集成化、自动化和在线化特点的样品制备方法可以进一步提升分析通量,或将成为未来一个研究热点。与纳流液相色谱相比,高流速液相色谱在提升分析通量的同时也损失了灵敏度,如何保证快速分离过程中的检测灵敏度与定量准确度也是面临的另一挑战。此外,如何加快高通量组学分析平台的数据处理速度,如何生成标准化的分析报告及大数据整合,便于公开访问以更好阐释内在机制将是值得关注的问题。

菌株高通量筛选是加速MCF进化的关键环节,代谢通路关键分子定量分析有助于细胞工厂的改造及生产监测。随着液相色谱和质谱技术的不断进步,及其与自动化装置、数据处理平台的深度融合,它们在合成生物学菌株高通量筛选及关键分子定量分析方面的优势会愈发凸显,必将推动基于合成生物学的生物智造领域的快速发展。

猜你喜欢
高通量质谱菌株
灰树花工厂化瓶栽菌株筛选试验
高通量卫星网络及网络漫游关键技术
植物根际促生菌Bacillus mycoides Gnyt1菌株生物学特性比较研究
菌株出马让畜禽污染物变废为宝
气相色谱质谱联用仪在农残检测中的应用及维护
高通量血液透析临床研究进展
Ka频段高通量卫星在铁路通信中的应用探讨
中国通信卫星开启高通量时代
吹扫捕集-气相色谱质谱联用测定水中18种挥发性有机物
枣霜化学成分的色谱质谱分析