李 璐,刘金晶,郑文洁
作者单位:100730 北京,中国医学科学院 北京协和医学院 北京协和医院风湿免疫科风湿免疫病学教育部重点实验室
转录组测序(RNA sequencing,RNA-seq) 分析逐渐成为一种常用的实验手段,但过去对于转录组的分析仅局限在群体细胞水平,由于常规转录组测序分析方法是对大量细胞测序分析得出的平均结果,或者反映的是数量占优势的细胞数据,罕见细胞亚群的转录组特征则在平均化过程中被掩盖,忽略了细胞之间或细胞亚型之间的异质性。近年兴起的单细胞转录组测序(single-cell RNA-sequencing,scRNA-seq) 是从单个细胞水平获得全转录组的表达谱,其原理是将分离的单个细胞的微量全转录组RNA 扩增后进行高通量测序,利用该技术能够揭示单个细胞内整体水平的基因表达状态和基因结构信息,准确反映细胞间的异质性。2009年Tang等[1]首次报道了基于高通量测序的scRNA-seq 技术,发现了芯片未检测到5 200 多个基因和1 800个可变剪切点。随着单细胞测序技术迅速发展,该技术已经被应用在多个领域,如干细胞发育和分化[2-5]、胚胎细胞[6]、肿瘤[7-8]、神经[9-11]以及微生物[12]研究等各个方面。下文将主要对scRNA-seq技术的核心步骤和在自身免疫病研究中的应用以及潜在应用价值进行介绍。
单细胞转录组测序主要包括以下4 个步骤:单细胞分离,单细胞全转录组扩增,转录组测序和数据分析(图1)。其中单细胞分离、单细胞全转录组扩增和转录组测序是scRNA-seq 的核心技术。
图1 scRNA-seq 技术路线Fig 1 scRNA-seq technical route
常用的单细胞分离方法主要有梯度稀释法、显微操作法、荧光激活细胞分选法、激光捕获显微切割法以及微流控平台。梯度稀释法虽然操作简单,但不能有效分选所需要的细胞亚群且容易发生错误而导致细胞丢失。显微操作法选择精度高,但分离效率低,且容易对细胞造成机械损伤,不适于规模化应用。荧光激活细胞分选法是目前常用的分离单细胞的方法,该方法通过细胞的物理特性(如细胞大小、荧光散射度) 和特异性的分子标记对靶细胞进行识别和分离,具有高灵敏度、高准确度、高通量的特点,但需要大量的起始细胞数,对于小样本并不适用。激光捕获显微切割法可以快速、准确地分离细胞且重复性好,但对组织切片的质量要求较高。微流控平台具有需要的样本量较少,试剂损耗低,细胞污染率低,高通量的特点,可以广泛推广和应用。每种方法各有利弊,需根据实际需求合理选择。
与群体细胞提取核酸不同,单个细胞的核酸在皮克级别,要想达到核酸测序所需的核酸里量,需要高效的cDNA 扩增方法。根据合成第二条cDNA链时使用的酶,可将单细胞转录组测序的cDNA 扩增方法分为PCR 法 (如mRNA-Seq、Smart-Seq、Smart-Seq2、STRT-Seq 和SMA)、体外转录法(如CEL-Seq) 和Phi29 聚合酶法(如PMA)。
在某一特定阶段,由细胞转录出来的全部RNA 称之为转录组,包括信使RNA 和非编码RNA。单细胞转录组测序就是在单个细胞水平上对转录组进行扩增与测序的一项技术,通常狭义上仅以mRNA 作为研究对象。单细胞全转录组测序将获得的转录本与参考基因组相比较,可以得到基因表达差异、可变剪接、融合基因等遗传调控信息,发现亚细胞成分的基因表达谱,有助于全面理解细胞基因表达和调控网络的作用,连续追踪基因表达的动力学变化,从而监测疾病的进展。
常规转录组测序方法是对所有细胞的混合样本进行测序分析,其结果是所有细胞测序结果的平均值,或反映的是数量占优势细胞的数据,少数细胞的异质性在平均化过程中被掩盖,对于揭示单个细胞间的异质性存在明显的缺陷。而scRNA-seq 技术的最大优势是可以对组织中单个细胞分别进行研究,明确单个细胞间基因表达异质性,获得更多样本信息,对揭示细胞来源、功能起着关键作用。除此之外,对于早期胚胎细胞、干细胞和循环肿瘤细胞等低样本获取量细胞,常规转录组测序因细胞数量的限制已不再适用。但scRNA-seq 技术可以很好地解决样本低获取量的问题,数百至数千个细胞即可满足测序需求,样本获取量灵活。
scRNA-seq 技术最初被用于哺乳动物早期胚胎发育阶段[3]的转录组分析,随着技术的不断成熟,应用范围扩大到干细胞发育和分化[4]、组织器官发育[13]、微生物[14]、肿瘤[15]、神经系统疾病[16]和自身免疫系统疾病[17]等多个领域(表1)。自身免疫性疾病病种多样,且发病机制复杂,各种免疫细胞在疾病发生、发展过程中发挥重要作用。scRNA-seq 技术可以在单细胞水平上发现新的免疫细胞亚群,确定基因表达异质性并发现免疫细胞分化、发育规律,为自身免疫性疾病发病机制、治疗的研究提供新方法。
表1 scRNA-seq 技术在各领域的应用Table 1 Application of scRNA-seq technique in various fields
2.1.1 树突细胞:根据细胞表型和功能差别,外周血中树突细胞(dendritic cells,DCs) 分为2 个亚群,髓样树突细胞(myeloid DCs,mDCs) 和浆细胞样树突细胞(plasmacytoid DC,pDCs)。mDCs特征性表达CD11C、CD13、CD33、CD11b,主要发挥抗原提呈功能,促进Th1 细胞极化和细胞免疫应答的发生;pDCs 特征性表达CD123、CD303 和CD304,可产生大量Ⅰ型干扰素[18]。Villani 等[19]应用scRNA-seq,发现了“AS DCs”,即AXL+SIGLEC6+DCs,此类DC 细胞亚群具有和pDC 相近的功能,但却可以更有效的激活T 细胞。除此之外,还对 CD1C+DCs 进一步分群。其中 CD32B+、CD1C+、CD11C+为CD1C-A 细胞,高表达MHC-Ⅱ类基因,如HLA-DQA1、HLA-DPB1 等;CD32B-、CD1C+、CD11C+、CD163+、CD36+为CD1C-B 细胞,高表达与急、慢性炎症相关的基因,如CD14、S100A9、S100A8 等,这两种DC 细胞均可以有效诱导原始T 细胞增殖。
2.1.2 外周T 辅助细胞及成纤维细胞:CyTOF 质谱流式细胞仪是已公认的确定细胞亚群的方法之一,2017年,Rao 等[20]通过这一技术在类风湿关节炎(rheumatoid arthritis,RA) 滑膜组织鉴定出了高表达MAF、CXCL13 和PDCD1 的新型“外周T 辅助细胞(peripheral T helper cell,TPH) ” 群,该细胞群具有促进B 细胞活化,产生抗体的特点。近期,应用scRNA-seq 技术亦鉴定出此类高表达MAF、CXCL13 和PDCD1 且促进B 细胞分化的细胞亚群[17],由此可见scRNA-seq 技术具有和CyTOF 质谱流式细胞技术一样的可以对复杂细胞群体进行精细分群的强大优势。
在此基础上,该研究还通过scRNA-seq 技术在RA 患者滑膜组织中鉴定出两种新型成纤维细胞,分别表达CD55 和CD90,其中CD55+成纤维细胞与内皮细胞增值,调节ROS 有关;CD90+成纤维细胞与金属肽酶活性及胞外基质产生有关。
2.1.3 软骨细胞:骨关节炎osteoarthritis,OA)是一种以关节软骨稳态破坏为特点的疾病[21],软骨细胞表达和分泌大量的细胞外基质维持软骨正常功能。已知的软骨细胞分型中,增殖软骨细胞主要存在于软骨生长部位的可再生区域,肥大前软骨细胞可调节软骨肥大分化,肥大软骨细胞能诱导基质矿化,衰老细胞表现为细胞周期循环阻遏和与衰老相关的分泌表型[22],而软骨祖细胞具有维持OA软骨修复和自身稳态的作用[23]。Ji 等[24]对OA 患者不同疾病部位分离的软骨细胞进行scRNA-seq 分析后,根据其各自的功能特点定义了7 种软骨细胞,包括新发现的3 种新型细胞亚型:效应软骨细胞、调节软骨细胞、自稳软骨细胞。效应软骨细胞与细胞代谢相关,表现为高水平摄取与三羧酸循环和氨基酸代谢相关的营养物质。调节软骨细胞高表达与抗原加工、提呈相关的基因,并检测到此类细胞有MHC 分子相关基因的表达,提示调节软骨细胞在OA 软骨中可能发挥免疫细胞的作用。同时,在OA 软骨退化中,生物节律系统在维持细胞代谢中起重要作用[25]。其中自稳软骨细胞高表达与生物节律系统相关的基因,例如PER1 和SIRT1 等,所以此类细胞可能参与调节软骨变性、退化过程,为软骨再生研究提供方向。
2.1.4 肠固有层间充质细胞:肠固有层间充质细胞是非造血、非上皮细胞类型的异质群体,在先天免疫、免疫调节和上皮屏障维持中起着重要作用[26]。在发生炎症性肠病(IBD) 时,它们通过介导炎症性环境,促进肠狭窄和炎症相关癌症发生。对健康人和初治的IBD 患者结肠组织的16 500个间充质细胞进行scRNA-seq 分析后,确定了四种类型的间充质细胞亚群[27]:S1 ~S4。S1 富含非纤维胶原蛋白 (COL14A1,COL15A) 和弹性纤维(FBLN1,FBLN2,FBLN5,EFEMP1,FN1);S2特异性表达SOX6 和片状胶原蛋白 (COL4A5,COL4A6),而片状胶原蛋白是上皮基底膜的主要成分,提示S2 细胞在维持上皮屏障中发挥作用;S3 与超分子纤维组织相关;S4 类细胞具有促炎作用,与调节T 细胞活化,正向调节白细胞迁移相关。在IBD 中,SOX6+S2 类细胞明显减少,片状胶原产生减少,进而可导致上皮屏障功能紊乱;S4 类细胞明显增多,发挥促炎作用参与IBD 进展。
综上,scRNA-seq 技术可以高效、迅速发现与疾病相关的新的细胞亚群,通过后续相关实验验证,从而证明相应细胞亚群在疾病中发挥的作用,进而揭示特殊细胞群体在疾病发生发展的作用,提供更广阔的科研思路。
根据细胞表面分子表达差异,NKT 细胞分为NKT1、NKT2、NKT17 及NKT0 四群,其中NKT0是其他三群的前体细胞。scRNA-seq 基因异质性分析发现[28],NKT1 中Ccl5,NKT2 中Irf4,NKT17中Ccr2 存在差异性表达,为NKT 细胞功能差异性研究提供方向。
Th17 细胞高表达IL-17,促进炎性细胞因子和趋化因子的表达,招募DCs、T 细胞、中性粒细胞到炎症部位,引起炎症反应,介导组织损伤,参与多种自身免疫性疾病发病。scRNA-seq 对实验性自身免疫性脑髓炎(experimental autoimmune encephalomyelitis,EAE) 小鼠的研究确定了驱动Th17 细胞致病的四个关键基因:Gpr65、Plzp、Toso 和Cd5l,并在相应基因敲出小鼠中得到了验证,可为多发性硬化的治疗提供潜在的靶点[29]。其中GPR65 基因除与EAE 相关外,还与强直性脊柱炎[30],IBD[31-32]等具有密切关系,并且Toso 基因表达在疾病发展中扮演促炎作用。
对RA 患者滑膜组织成纤维细胞进行scRNAseq 后发现[33],和OA 患者相比,在滑膜组织深层,RA 患者CD34-THy1+的成纤维细胞在毛细血管周围明显富集,并且成纤维细胞Thy1 基因表达明显升高[34],而THy1 基因的表达可以使成纤维细胞具有分化成脂肪细胞的倾向[35],并且该基因同时参与神经元发育和肿瘤发生。
而在OA 中,确定了软骨祖细胞的标志性基因[24]:BIRC5、CENPU、UNE2C、DHFR 和STMN1,这些基因与软骨祖细胞细胞循环、染色体重建、DNA 复制等功能密切相关。
与健康人皮肤角化细胞相比,scRNA-seq 分析检测到狼疮肾炎患者来源的角化细胞其IFN 诱导基因IFI27、STAT1、IFI6、IFITM1 明显高表达,进一步支持IFN 反应通路参与SLE 发病[36]。
故通过scRNA-seq 方法可迅速、高效的确定靶向基因,明确锁定工作目标,在寻找标志性致病基因,确定细胞异质性中具有指导性意义。
scRNA-seq 还可以用于检测细胞动态过程,包括细胞分化、成熟[37-39],对刺激后的反应和活化[40]、以及循环过程:包括新陈代谢规律和细胞循环[41]。对细胞的动态演变过程进行建模分析其基因表达调节网络,并分析在疾病过程中可能出现的调节紊乱。免疫细胞发育成熟过程发生紊乱可以导致一些疾病的发生,例如X 连锁无丙种球蛋白血症,即是由于Btk 基因缺陷导致酪氨酸激酶合成障碍,使B 细胞发育停滞在前B 细胞状态,导致成熟B 细胞数目减少,甚至缺失。所以通过动态分析可以确定调节特定阶段的调节因素,并确定这些因素对于调节下一阶段的基因表达的必要程度。
在单细胞水平研究免疫细胞发育、成熟轨迹,可以确定细胞发育过程中发生紊乱的关键点,并判断这种紊乱是如何影响下游信号通路的。Shalek 等[40]对脂多糖诱导的DC 应答反应的系列研究发现了细胞应答的旁分泌机制:DC 中的小部分细胞即早熟DC 在病原体刺激早期出现抗病毒基因的转录激活并分泌干扰素,早熟DC通过干扰素介导的旁分泌信号激活抗病毒基因在其余DC 中的表达。在单细胞水平上揭示了免疫细胞在接受刺激后作出反应的级联调节机制。另外,小鼠感染模型中进行CD4+T 细胞的离体scRNA-seq 证实了Th2 细胞的三种状态,即活化状态,中间活化状态以及产生细胞因子状态。对该过程的理解可以用于T 细胞免疫疗法,成为免疫调节的新靶标,为自身免疫性疾病治疗提供思路[42]。Ji 等[24]将OA 患者软骨细胞进行scRNAseq 拟时间轨迹分析后,确定了在病情发展过程中增殖软骨细胞、肥大前软骨细胞、肥大软骨细胞的线性转化过程,及在各个阶段相关标志性基因表达的差异,为骨关节炎的分期、治疗提供有力依据。
目前scRNA-seq 技术仍在迅速发展,并在免疫学研究中得以广泛应用,为自身免疫机制及自身免疫病发病过程中参与的相关细胞的异质性的探索提供高效检测方法,可用于确定疾病中特定细胞的分子易感性并为干预治疗提供候选靶标分子,实现在转录水平上确定相关细胞转化方式。scRNA-seq 与生物信息学技术的紧密结合,为揭示细胞发育和分化过程中的基因调控网络提供了强有力的检测方法。随着技术的不断进步,scRNA-seq 终将造福于自身免疫病发病机制及免疫治疗的研究。