张慧 徐楚帆 江来
上海交通大学医学院附属新华医院麻醉与重症医学科(上海200092)
细胞是构成生物体的基本组成单位,即便来源于相同个体同一细胞系,具体细胞在基因组、转录组、表观遗传组都可能呈现不同的特点[1]。以往基因组研究得到的结果往往是一群细胞基因表达的平均值,因而难以明确在生命发育及疾病发生过程起关键作用的具体细胞类型[2]。随着分子生物学技术的飞速发展,通过对单个细胞进行全基因组或转录组的扩增后进行下一代测序(next generation sequencing,NGS)技术测序,单细胞测序技术(single cell sequencing,SCS)实现了单细胞的全基因组测序,从而揭示细胞群体差异和细胞进化关系[3]。目前,SCS技术已经应用于生命科学的各个方面,并逐渐在临床疾病的诊断治疗发挥重要作用,因此本文将对SCS技术进行总结概述,并对其最新应用进行介绍。
单细胞分离是进行单个细胞研究的第一步,现有的单细胞分离方法包括荧光激活细胞分选、激光捕获显微切割和微流控技术等。荧光激活细胞分选是目前应用最多的单细胞分离方法,荧光标记是其实现单细胞筛选的基础。荧光激活细胞分选需要悬浮大量细胞而实现分选,具有自动化高通量的优势,但不利于分离数量较少的细胞种群。此外,筛选过程产生的高流速可能对细胞活力造成损伤[4]。激光捕获显微切割通过显微直视操作,利用激光束熔化覆盖于组织切片上的热塑聚合物薄膜,冷却后将目的细胞固定于膜上从而实现细胞分离。激光捕获显微切割技术(LCM)是一种非接触技术,在显微解剖后不会破坏邻近组织[4],但人为操控细胞的选取和分离严重限制了通量[5]。微流控技术是一项新近发展起来、具有极好应用前景的单细胞分离技术。微流控技术在微尺水平上分选目的细胞,芯片精密的几何学技术有效减少移液误差,间接降低了微流控装置所需底物含量[6]。此外,利用微流控技术可以实现在微流控芯片上对细胞进行操控,例如通过特定因子溶解上游细胞为下游细胞测序腾出空间[7]。
基因测序技术是基因组学研究的关键,自Sanger测序法为代表的第一代测序技术发明以来,基因测序技术不断发展,下一代测序方法实现了全基因组的高通量、低成本和快速化检测,现已成为单细胞测序的首选方法。
2.1 单细胞基因组测序 单个二倍体细胞仅含6pg DNA,为获取足够多的DNA进行测序需要在测序前对DNA进行扩增,主要技术为全基因组扩增(WGA)。目前,WGA可细分为简并寡核苷酸引物聚合酶链反应(DOP-PCR),多重置换扩增法(MDA)以及多重退火环状循环扩增法(MALBAC)。DOP-PCR使用Taq DNA聚合酶,可以准确保留拷贝数水平,但因覆盖度低使其难以检测碱基水平的突变而应用受限。MDA通过使用Phi29或Bst DNA聚合酶使单细胞基因组或外显子组达到高于90%的高覆盖度,但存在覆盖度不均而使阅读深度失真,从而降低DNA拷贝数的测定[8]。MALBAC技术使用Bst DNA聚合酶形成环状DNA片段后再进行线性PCR扩增,可同时获取拷贝数变异(CNVs)和单核苷酸多态性(SNPs)[9]。为克服MALBAC所存在的假阳性率高的缺点,采用高保真DNA聚合酶代替Bst DNA聚合酶,可以减少扩增误差从而优化MALBAC[10]。通过扩增结束的产物来构建DNA文库,再通过Illumina平台或其他平台进行下一步的测序工作。
2.2 单细胞转录组测序 单细胞转录组测序需先将mRNA逆转录成cDNA,再对cDNA进行扩增。近年来涌现出多种单细胞cDNA扩增法,如末端加尾法、Smart-seq、Cell-seq和独特分子识别标识的全转录组扩增方法。末端加尾法是在第一链cDNA的3′末端加上一连串脱氧核苷酸A或G,然后利用其互补核苷酸T或C形成多聚引物,从而合成第二链cDNA。Smart-seq利用反转录酶的末端转移酶和模板转换活性在单细胞水平上生成并扩增全长cDNA,有效增加全长转录数量,但其扩增灵敏度较低。Cell-seq利用体外转录反应进行扩增,其线性扩增的方式可以减少扩增偏倚,但因其不能扩增全长cDNA,会引起部分转录组信息的丢失[11]。为了改善上述方法的局限,采用独特分子识别标识(unique molecular identifiers,UMIs)的全转录组扩增方法应运而生。寡聚脱氧胸腺嘧啶序列是该方法扩增识别的引物,其模板通过携带独特分子标识而识别转换寡核苷酸,有效降低定量偏差和技术噪声[12]。
2.3 单细胞表观基因组测序 表观基因组学是在基因组水平上对表观遗传学改变的研究。Hi-C法是最先被提出的单细胞表观基因组测序方法,可在百万碱基分辨率的基础上识别单细胞水平的染色体相互作用[13],随后,科学家利用单细胞亚硫酸盐测序法(scRRBS)对小鼠个体胚胎干细胞1500万个CpG位点的胞嘧啶甲基化修饰进行测量,使得单细胞和单碱基水平上的DNA甲基化分析成为可能[14],新的改进方法通过结合NGS可以进行全基因组亚硫酸盐测序,实现在全基因组水平上评估DNA甲基化[15]。ATAC-seq则是表观基因组测序的又一大进步,是一项使用高通量测序对易接近转座酶核染色质区域进行分析的一种创新表观遗传学研究技术[16],通过单细胞ATAC-seq技术,研究者从254个个体的GM12878类淋巴母细胞中描绘出可及性DNA图谱,提出了对细胞间变异的深度见解[17]。
3.1 神经生物学 神经细胞是最具形态多样化的细胞之一,以往通常根据神经元形态或化学特性区分不同神经元,单细胞测序克服了传统分类方法在精准性上的缺陷。USOSKIN等[18]证实了一些已知的主要神经元的分型,还为新的神经元亚型分类提供了生物标志物:TAC1和FAM19A1分子识别PEP神经元,以富含大量Piezo2和特异性Slc17a8分子标记TH神经元,用溶血磷脂酸受体标识NP1神经元等。此外,一些研究对小鼠的多巴胺能神经元、背根神经节以及大脑皮质神经元进行了以单细胞转录组学为基础的分类,揭示不同神经元在分子水平的生物学特性,描述了不同神经元之间的连接,并为神经退行性疾病以及神经精神疾病的研究提供了新的思路[19]。
3.2 微生物 目前,由于微生物的DNA和RNA含量少、扩增难度大,地球上超过99%的微生物不能在实验室进行培养和繁殖[20],对其遗传信息的了解较少。而单细胞测序则为探索微生物基因组,揭示微生物种类的多样性提供了可能。研究者利用单细胞基因组学对9个不同来源、属于29个主要生命树未知分支(即所谓“微生物暗物质”)的201个古细菌和细菌细胞进行了靶向测序,通过获得的基因组信息阐明繁复的门内及门间关系,有利于在微生物水平上对生态系统进行解释。SCS极大地扩充了有关生命树的基因组信息,使生物进化得到更加系统化的认识[3]。
3.3 胚胎发育 早期胚胎发育伴随广泛的转录调控和表观遗传再编码,由于可获取的细胞数量少,传统的测序方法难以反映此过程的基因组信息。单细胞测序克服这一缺点,成功揭示胚胎发育过程中细胞分化的多样性和基因组信息调节的复杂性。用单细胞RNA测序分析人类和小鼠胚胎从卵子到桑椹胚发育过程,得出胚胎发育过程中细胞周期、基因调控、翻译和代谢的转录改变的相继次序。有研究使用单细胞亚硫酸盐测序的方法检测小鼠胚胎干细胞中DNA胞嘧啶的修饰,发现其表观遗传的改变表现为全面的脱甲基现象[14]。因此,利用单细胞测序方法可以反映早期胚胎发育过程中转录调节和表观遗传再编程的复杂性。
3.4 器官发生 绝大多数组织中的细胞类型分类都局限于已知的部分细胞标志物,针对同一器官不同分化时期进行单细胞测序可以重建分化过程中的细胞谱系。肺祖细胞的发育追溯到它们形成肺泡气囊时,用单细胞转录组学的方法研究肺上皮的发育,确定了数百种新的标记物以区分四种主要的细胞类型并利用其重建肺泡囊分化过程中的细胞谱系[21]。单细胞基因表达谱表明肾脏在发育过程中存在多谱系启动,肾祖细胞表现出与多种潜在分化谱系相关的基因的随机表达[22]。这些初步研究表明使用无偏倚RNA测序方法可以对细胞进行细化分类并识别器官发育过程中细胞谱系的新标志物。
3.5 免疫 免疫系统的多样性使得宿主免受多种病原的侵害,使用传统的方法研究得到的是参与免疫反应总细胞的平均值,而单细胞技术使得研究在宿主应答中起到关键作用但数量极少的细胞的成为可能[23]。通过单细胞转录组学,分析在体外不同条件下被刺激的小鼠骨髓来源的树突细胞,发现单个细胞显示出不同的反应且这种反应通过干扰素旁分泌信号进行调节[24]。此外,通过单细胞RNA测序描绘出LPS引起抗原激活后的小鼠脾脏的4 000个单细胞图谱,揭示了7种免疫细胞类型并识别出抗原激活后1 575个可变基因反应位点[25]。因此,单细胞测序用于研究抗原激活后免疫细胞的遗传异质性反应具有良好的前景。
3.6 单细胞测序在临床上的应用
3.6.1 肿瘤诊断与治疗 恶性肿瘤细胞往往通过基因突变产生新的致病性表型从而适应宿主体内复杂的肿瘤微环境,目前有研究报道肿瘤组织可以单个细胞为单位产生独特的突变表型,即瘤内异质性[26],SCS技术的运用可以有效识别单个肿瘤细胞产生的独特突变表型,提高恶性肿瘤的精准治疗[27]。首先,SCS技术可以用于肿瘤标志物的检测,例如结肠癌伴KRAS基因突变,非小细胞肺癌伴EGFR基因突变等[28]。同时,SCS参与部分肿瘤的治疗,如用下一代测序技术检测肺腺癌患者在铂类化疗期间的血浆样本,通过ctDNA(circulating tumor DNA)的动态变化,可以对肿瘤治疗方案进行调整[29]。此外,SCS技术对肿瘤治疗的评估作用也日益受到重视,如WANG等[30]发现在肿瘤进化过程中三阴乳腺癌患者的肿瘤细胞突变率明显高于雌激素受体阳性患者的肿瘤细胞,部分解释了临床上雌激素受体阳性乳腺癌患者的治疗效果好于三阴乳腺癌患者的现象;又如通过对治疗过程中多个时间段的外周血循环肿瘤细胞(circulation tumor cells,CTCs)进行单细胞水平的测序,可以实时监测肿瘤的发展及癌细胞异质性的动态变化[31]。
3.6.2 辅助生殖 SCS技术作为胚胎植入前遗传学诊断(PGD)和胚胎植入前遗传学筛查(PGS)的新手段,可以对试管婴儿植入前的胚胎进行遗传学分析,有利于全面了解胚胎植入前的遗传学信息以选择整倍体胚胎进入子宫,同时诊断单基因遗传病和染色体病,降低反复植入失败及流产的发生,从而提高筛选后再植入的成功率[32]。此外,通过单细胞测序检测女性卵细胞极体细胞或胚胎细胞,选择健康的胚胎移植,可以降低新生儿先天性遗传疾病的发生率,有助于预防遗传疾病[33]。
4.1 单细胞测序的优势 SCS技术提供了一个前所未有的单细胞水平的研究方法,解决了细胞异质性难题。有别于传统的基因组研究,SCS技术可以对胚胎干细胞、CTCs等数量较少的细胞进行扩增测序从而允许对复杂多样化的生物学现象进行高特异性的探索。此外,SCS技术为临床疾病,尤其是肿瘤的个性化治疗开拓新思路,促进了精准医学的发展。
4.2 单细胞测序的不足 尽管基因组研究的成本日渐降低,SCS技术成本目前仍居高不下,影响其广泛运用。此外,单细胞水平测序对目标细胞提取的要求高,扩增过程常出现扩增失败和等位基因脱扣,技术误差、技术噪音仍不可避免。同时,测序技术仍面临着用于分析数据的计算方法严重缺乏的问题,需要进一步的优化。
SCS技术在过去几年迅速发展,已成为生物学研究的一项新手段,并改变了我们对很多疾病的认知。SCS在微生物、免疫和肿瘤等诸多领域发挥重要作用,已知的技术缺陷正在不断改进,通过低量级泊松过程降低转录组测序的技术噪音;使用靶向正交验证区分测序过程中的技术误差和生物异质性等。随着不断创新,尤其是NGS的进步,高通量低成本的SCS技术将会给整个生命科学界带来重大变革。