邱晓芬,陈洁晶,薛 雯,林 华,杨 明△,汤冬娥,戴 勇,▲
(1.广西师范大学生命科学学院,广西桂林 541006;2.中国人民解放军联勤保障部队第九二四医院 中心实验室/广西代谢性疾病研究重点实验室,广西桂林,541002;3.暨南大学第二临床医学院/深圳市人民医院临床医学研究中心,广东深圳 518020)
由于基因组和表观基因组的重编程及细胞分裂和分化过程中的DNA复制错误,单个细胞水平会呈现不同的基因组、转录组和表观基因组[1]。传统转录组测序方法是对群体水平细胞簇的转录组进行测序,是对组织平均表达水平的剖析,难以揭示其中单个细胞的基因表达情况,如肿瘤细胞的异质性、循环肿瘤细胞(CTC)、最早的胚胎干细胞和肿瘤干细胞[2],如法医鉴定中痕量生物样本,这些细胞的转录组难以通过常规测序技术进行分析。单细胞转录组测序(sc RNA-seq)技术的发展和改进用于细胞异质性发现,也可用于微量样品的转录组分析,可更全面地理解真核生物转录组基因复杂性,单细胞测序技术可以确定单核苷酸多态性(SNP)、拷贝数变异、单细胞基因组的基因组结构变异、基因表达水平、基因融合、可变剪接及单细胞表观基因组中的DNA甲基化状态[3],有助于充分了解疾病与生命活动进程,进而找到治疗疾病的方法。
sc RNA-seq技术首先要从微生物群落或细胞团中分离出单个细胞。目前已开发出多种适合不同情况的单细胞分离技术,主要包括连续稀释法、显微操作法、激光捕获显微切割技术(LCM)、荧光激活细胞分选技术(FACS)、微流体控技术、拉曼镊子技术(ROT)[4]。单个细胞易受外界环境的影响,应注意避免机械力与化学作用对单个细胞的破坏。连续稀释法是将细胞置于特定的细胞悬液中梯度稀释,最终获得单个细胞的方法,该方法对设备依赖小,只需手工操作就能实现单细胞分离,成本低廉、操作简单,缺点是不能特异性筛选靶细胞,在操作过程中容易发生分离错误,甚至丢失细胞,因此,更适合分离均一性好的样本。显微操作法是低通量方法[3],在高倍显微镜下用显微操作镊子分离单个细胞,基于细胞形态和着色特征的视觉辨别中在显微镜下观察和拍摄每个独立的单细胞,实现无偏差分离,但耗费人力,因此,常用于从人工培养的细胞系或早期胚胎中分离单个细胞。LCM是在显微镜下观察组织细胞,直接从固定组织的切片中切割和分离单个细胞的方法,可特异性获得目的细胞,同时可以将不需要的细胞切除而获得单个细胞[5]。LCM的缺点是分离的单个细胞的完整性可能会被破坏,并且激光能量进行微切割也可能对DNA造成直接损害而导致遗传物质损失,且通量低、成本高。FACS是流式细胞仪基于荧光标记物的细胞特异性特征,如不同的光散射信号实现自动化高通量方式分离单个细胞的技术[3],FACS需要大量悬浮细胞作为起始材料,因此,不适合从数量低的细胞群中分离出单个细胞。ROT是光学镊子和拉曼光谱相组合的技术[6],前者通过轮廓区分细胞而无需染色,后者利用激光捕获细胞,具有同时操作和表征单个细胞而无标签或物理接触的优点,在肿瘤和微生物细胞的异质性研究中起重要作用。微流体控技术广泛应用于DNA测序、药物筛选、化学合成等领域,具有代表性的有两种:液滴式微控和芯片式微流控,这两种方法都是将细胞分离至纳升级的微容器中,提高单细胞制备效率,其中芯片式微流控技术可利用不同特性材料的芯片作为反应容器,将传统生化分析实验室操作集成于微小芯片上,集采样、反应与分离一体,几乎囊括全部化验室功能。可利用少量样品和化学试剂实现单个细胞的识别和分离技术,具有灵敏度高,精确度好,少污染,灵活组合,精确操控、高效筛选目的细胞的优势[7]。微流体控技术是一种较新的单细胞分离技术,被认为是一种较合适的方法,在分离单细胞的应用中具有广阔的前景。
RNA-seq是以单个细胞为研究对象进行转录组水平测序,并对所得数据进行生物信息学统计分析的技术。单个哺乳动物细胞总RNA水平仅约为10 pg,通常mRNA最多只有0.5 pg[8]。但一般高通量测序建文库至少需要几十纳克DNA,细胞内核酸扩增需十万倍以上构建cDNA文库达到测序水平,首要解决的问题是用微量RNA准确建库,避免扩增偏倚,提高灵敏度和可重复性,并获得细胞追溯来源。cDNA文库构建的核心技术是全面捕获目标样本内的总RNA,其中关键步骤是全转录组扩增,将RNA反转录成cDNA,然后再进行cDNA扩增,必须将RNA完全反转录成cDNA进行线性扩增才能表征单个细胞的转录组特征。目前主要的方法可分为同聚物加尾唐氏法、模板转换法Smart-seq/Smart-seq2、STRT-seq[9]、体外转录扩增CEL-Seq、Quartz-seq[3,10-11]等,以下简要介绍其中几种。
2.1同聚物加尾唐氏法 TANG等[12]首次使用Tang′s RNA-seq在单个小鼠卵母细胞和卵裂球进行转录组分析,是利用同聚物加尾扩增的一种方法。分离单个细胞并通过转移到裂解物缓冲液中并直接在全细胞裂解物上进行反转录。通过核酸外切酶除去游离引物,用末端脱氧核苷酸转移酶将poly(A)尾添加到第一链cDNA的3′末端,PCR循环扩增单细胞cDNA,得到100~200 ng扩增的cDNA用于构建测序文库,文库用于SOLiD系统进行深度测序。
2.2体外转录扩增CEL-Seq CEL-Seq是体外线性(IVT)扩增单细胞转录组的方法。利用含有oligo-dT序列、独特条形码、Illumina测序接头和T7启动子的引物将单细胞RNA反转录成一链cDNA。在合成第2条链后,合并几个样品的cDNA用于IVT。然后将T7转录的RNA片段化并与Illumina衔接子连接,反转录为cDNA,从而可以选择含有Illumina衔接头与条形码的30个最大片段。由于IVT是线性扩增方法,与其他基于PCR的扩增方法比较,可减少扩增偏倚,同时与基于PCR的扩增方法比较,CEL-Seq具有更高的可重复性和灵敏度。HASHIMSHONY等[10]通过研究早期秀丽隐杆线虫胚胎发育表明,早在胚胎时期两细胞之间已存在转录产物的差异,CEL-Seq转录组定量方法可用于含有不同细胞类型群体的复杂组织的转录组学分析。
2.3模板转换法Smart-seq/Smart-seq2 DANIEL等[2]通过Smart-seq捕获来自黑素瘤的潜在循环肿瘤细胞,筛选黑素瘤循环肿瘤细胞的生物标志物,Smart-seq明显增加长度超过1 kb的所有转录本的全长覆盖率。测定前列腺(PC3和LNCaP)和膀胱(T24)癌细胞系细胞的12个单个细胞的基因表达情况,在这3个细胞系中鉴定数百个差异表达的基因,对数十个起始细胞总量少的RNA检测灵敏度较高。PICELLI等[13]在开发的Smart-seq2在Smart-seq的基础上进一步完善反转录,模板转换和预扩增等流程已获得高产量cDNA。Smart-seq2可以增加单细胞的cDNA文库产量和平均长度,并且可以实现更高的灵敏度,降低扩增偏倚,可同时分析数百个细胞,可回收全长cDNA,可分析每个转录物的所有外显子并检测不同的剪接变体,可实现全面的SNP和突变分析,应用领域宽广[14]。
sc RNA-seq其主要应用是分析稀有细胞类型及揭示细胞间异质性[15],在免疫系统[16]、神经细胞[17-18]、胚胎干细胞[19-20]、细胞图谱构建[21]、肿瘤及微环境[22]等领域应用。
3.1揭示细胞新亚型 JAITIN等[23]对来自超过4 000个小鼠脾单细胞的RNA进行测序,筛选1 575个差异基因,鉴定出细胞类型特异性应答基因组,如巨噬细胞中的Tnf和Marco,自然杀伤细胞(NK细胞)中的Xcl1和Gzmb,以及大量Ⅰ型干扰素应答基因(Irf7、Stat2、Ifit1、Cxcl10)。
POWELL等[24]第一次直接测量了单个CTC中的高维基因表达,与正常细胞系比较,转移NPTN、S100A4、S100A9和上皮间充质转变相关的基因升高,VIM、TGFβ1、ZEB2、FOXC1,CXCR4的转录水平较高。CTC转录分析受白细胞污染的限制,克服这个问题的方法是单细胞分析。晚期癌症患者的药物选择,血液含有具有这些不同表型的CTC的患者可以在优化的多种药物治疗方案中得到更好的治疗。FREDRIK等[25]在单细胞转录组水平上分析了从一只成年大鼠海马体CA1亚区捕获的单细胞,表达谱分析揭示,CA1中至少有两种不同的神经元细胞类型。DOMINIC等[26]随机选择小鼠肠类器官的数百个细胞进行sc RNA-seq,并开发RaceID算法与之结合,将Reg4鉴定为肠内分泌细胞的新标记物,肠内分泌细胞是一种罕见的激素产生的肠细胞群,揭示了罕见肠细胞类型的存在。
3.2肿瘤微环境研究 有研究表明,基因突变是肿瘤发生的根本原因,肿瘤微环境研究有助于揭示肿瘤发生的具体机制,CTC是在实体瘤患者的血液中发现的罕见瘤细胞,实体瘤和CTC明显是不同克隆起源[27],可能在癌症传播中起关键作用,揭示CTC表型为治疗提供了可能的途径,对于推测分析来自不同肿瘤区域的细胞能阐明肿瘤的进展。TIROSH等[28]从19例患者分离的445个单细胞进行单细胞测序,分析肿瘤微环境中恶性肿瘤细胞、免疫细胞、基质细胞等在细胞个体、空间、功能和转录组的异质性,结果揭示,黑素瘤细胞系可能存在潜在的耐药群体。
3.3免疫系统 MONIKA等[29]已经通过PCR技术在多发性肌炎患者的肌肉和血液中鉴定了CD8 T细胞的克隆扩增,包括T细胞受体(TCR)互补决定区(CDR)3长度分析(分型)。将CDR3光谱分型、激光显微切割和单细胞PCR结合来检测这些克隆扩增的T细胞可能的致病作用,接触、侵入和破坏骨骼肌纤维的单个细胞毒性T细胞,通过CDR3光谱类型筛选鉴定的寡克隆峰与形态学表征的显微切割的T细胞相关联。1例患者中部分显微切割的T细胞携带共同的TCR-BV氨基酸CDR3基序和CDR3区域中的保守核苷酸交换,结果表明,CDR3谱型和单细胞分析可以结合起来识别、跟踪血液和靶组织中的自身攻击性T细胞克隆起源。这种方法适合其他炎症和自身免疫性疾病。
3.4细胞图谱构建 AIZARANI等[30]用sc RNA-seq技术对来自9例人类供体正常肝脏组织约10 000个细胞进行测序分析,创建了所有重要肝脏细胞类型的人类肝脏细胞图谱,其中包含肝细胞、肝脏主要代谢细胞、血管内皮细胞、肝脏巨噬细胞等,鉴定一个胆管细胞亚群之前未知的特性,很可能是肝前体细胞或祖细胞。AIZARANI等[30]解释这类祖细胞在肝脏再生中起重要作用,并且可能参与肝脏疾病或肿瘤产生。VENTO-TORMO等[31]对妊娠早期(6~14周)胎盘约7万个细胞进行单细胞转录组测序并绘制胎盘细胞图谱,鉴定出蜕膜dNK细胞的3个主要亚群。初次妊娠者dNK1细胞亚群细胞与特定的胎盘细胞之间相互作用可能使dNK1细胞能够更加有效地应答再次妊娠时的胎盘植入,这一新发现对理解早期妊娠有指导意义,给诊治妊娠相关疾病提供了新思路。
自然界99%的微生物还不能人工培养[32],只有少数CTC可以从癌症患者的外周血中分离,这些还难以研究的目标都可以通过单细胞测序技术来解决。利用单细胞水平上的高通量RNA测序已经在生命研究中有大量新发现,从新细胞类型的鉴定到随机基因表达全局模式的研究,还可以同时应用多组学来共同揭示生物生长发展机制。目前,scRNA-seq除了要克服检测技术上的通量、效率、灵敏度、成本等问题外,还要克服具体计算策略和分析的挑战。尽管用于分析来自大量细胞群体的RNA-seq数据的一些工具可以容易地应用于scRNA-seq数据,但是相信随着生物信息学的发展,许多新的计算策略可以充分利用起来解读数据[33],并且能够在基因表达的基础上进行全面详细的分析。