陈 刚, 郑泽宇
(1.福建省立医院内分泌科,福建 福州 350001;2.福建医科大学省立临床医学院,福建 福州 350100)
自从40多年前科学家发现了RNA印迹法(northern blotting),单细胞表型研究就成为了生物学家的梦想。以往研究中需要百万计的细胞才能获取足量的RNA来检测单个基因mRNA水平,而现在通过单细胞RNA测序(single-cell RNA sequencing,scRNA-seq),可以轻松确定单个细胞中各基因的表达水平。如今,scRNA-seq也为胰岛细胞生物学研究提供了极大便利。过去3年间已有一系列关于小鼠和人类胰岛scRNA-seq分析的文献资料相继发表。scRNA-seq分析能够帮助人们了解已知细胞特征,并发现已知不同内分泌细胞(如产生胰高血糖素的α细胞和产生胰岛素的β细胞)之间的异质性,从而使细胞亚型分类更科学。
新一代测序技术的发展和应用给生物学研究带来了极大的便利和突破,而传统的批量测序(Bulk RNA-seq)作为其中的突出代表,在科学研究中发挥着极大的作用。尽管从一群细胞中获得全基因组范围的RNA表达量在生物学机制研究中十分有利,但是这种方法只能获得所有细胞基因表达的平均水平,无法体现细胞的异质性。单细胞测序是在单个细胞水平对细胞转录组进行高通量测序的一项新技术,其原理是将分离的单个细胞中微量mRNA通过高效扩增后再进行高通量测序。单细胞转录组测序能够有效解决组织样本细胞异质性以及常规RNA-seq被掩盖的细胞群内的转录组异质性难题,有助于发现新的稀有细胞类型,并深入了解细胞生长过程中的表达调控机制。
随着技术的发展,如今科学家们可以用多种方法进行单细胞测序。从通量方面,可将现有的单细胞测序技术分为三类:①一次检测单个细胞,如RNA转录5’末端转换机制2(switching mechanism at 5’end of RNA template 2,SMART-seq2);②一次检测100个左右的细胞,如Fludigm C1;③一次检测上万个细胞,如基于分割池连接的转录组测序(split pool ligation-based tranome sequencing,SPLiTseq)、10×Genomics等。在选择使用哪种测序技术用于特定研究之前,需要重点考虑的是该研究的实验规模、每种方法的成本和灵敏度以及要回答的生物学问题。基于液滴的微流控体系可以在一次实验中对数千个细胞进行常规分析[1-2]。该方法非常适用于发现稀有细胞类型或筛选具有高度异质性的细胞群体。然而,这些技术降低了每个细胞的灵敏度,可能无法识别细胞之间微妙的转录差异。基于微流控芯片的测序方法如Fluidigm C1,可对单个细胞进行深度剖析,但实验成本会大幅增加[3],更适用于研究单细胞之间的随机变异性,或发现“同质”细胞群中微妙的转录差异。基于10×Genomics最新Chromium系统利用油包水的微反应体系,通过序列标签(cell barcode)区别群体中不同细胞和转录本,能够获得单细胞水平的基因表达谱,实现数千甚至上万个单细胞群体的分析,10×Genomics的Chromium系统利用8通道的微流体“双十字”交叉系统,将含有标签的凝胶珠、细胞和酶的混合物、油三者混合,形成油包水的微反应体系(gel bead in emulsion,GEM)。GEM形成后,细胞裂解,凝胶珠自动溶解释放出大量的标签序列,随后mRNA逆转录产生带有10×barcode的互补DNA(complementary DNA,cDNA),构建出精准的测序文库。通过上述方法,可解决常规RNA-seq方法在通量、扩展性、准确性、效率性方面存在的不足。
细胞异质性是生物组织的普遍特征,常规的转录组测序技术需要上万个细胞,所测的结果为细胞基因表达的平均值,较难鉴别细胞之间的异质性。scRNA-seq技术的分辨率能够精确至单个细胞,为辨别异质性群体中各类型的转录组提供有力的证据。β细胞是胰岛中最丰富的内分泌细胞[4]。Li等[5]通过荧光激活细胞分选仪 (fluorescence activated cell sorter,FACS)分离并通过SMART-seq2处理了64种人胰腺细胞,并采用高通量测序技术鉴定出12个β细胞亚型。以上64种人胰腺细胞在DLK1(delta drosophila homolog-like 1)基因转录组中存在异质性。Wang等[6]应用流式细胞术测量胰岛β细胞中主要的胰岛激素、增殖标志物,并在单细胞分辨率下计数参与增殖的信号通路数量,借此对β细胞分类,结果发现个体内有3个主要的β细胞簇,而增殖的β细胞仅属于其中2个簇。
当研究者在设计和进行单细胞转录组实验时,往往会在被检查的细胞数量、每个细胞的测序深度和实验成本之间权衡。需要大量细胞和深入的测序来充分识别并准确描述罕见的β细胞亚群。Li等[5]首次在人类胰岛上进行scRNA-seg研究。研究只筛选了70个细胞,验证了之前在单细胞水平上所描述的标记基因,并确定了在所有类型胰岛细胞中特异表达的转录因子。虽然本次研究发现为转录异质性提供了早期证据,但由于所捕获的细胞数量太少,无法透彻描述不同细胞类型中的亚群差异。之后越来越多的研究团队发表了关于2型糖尿病胰岛细胞的单细胞转录数据结果。Xin等[7]确定了约250个在2型糖尿病中具有差异表达的基因,其中92%的基因与胰岛细胞功能或生长无关。Muraro等[8]报道,决定β细胞异质性的主要基因是硫氧还蛋白(sulfiredoxin,SRXN1)、泛素结合蛋白核自噬受体(sequestosome 1,SQSTM1)和3个铁蛋白亚基铁蛋白重链1铁蛋白重链 (ferritin heavy chain 1,FTH1)假基因3(ferritin heavy chain 1 pseudogene 3,FTH1P3)、FTH1和 铁 蛋 白 轻 链 (ferritin light chain,FTL)都与内质网(endoplasmic reticulum,ER)和氧化应激有关[9]。Baron等[10]和Segerstolpe等[11]发现,某些基因的表达变化与β细胞功能[如尿皮质素3(urocortin 3,UCN3)]和ER应激同型半胱氨酸诱导ER应激诱导的泛素样结构域1蛋白(homocysteine inducible ER protein with ubiquitin like domain 1,HERPUD1)、热休克蛋白A5(heat shock protein A5,HSPA5)和DNA损伤诱导转录因子(DNA damage-inducible transcript 3,DDIT3)相关。有趣的是,由于机体对胰岛素分泌的高需求,从而加强了β细胞ER应激,最终使得人和鼠的β细胞更有增殖的可能[12-13]。研究进一步发现了人类导管细胞群体中的亚结构;已知导管细胞有2种形态,一种形成末端导管,另一种与腺泡(中心腺泡细胞)相连。通过免疫染色,证明了与转录组分析相对应的细胞类型之间的空间分离关系。
本团队进行了20月龄与3周龄C57BL/6小鼠胰岛β细胞的单细胞测序,同样发现了β细胞的异质性。在20月龄的老年小鼠与3周龄的年轻小鼠胰岛β细胞中发现具有较低胰岛素表达量的β样细胞。并且发现老年鼠β细胞具有较强的线粒体活性,且脂质代谢功能减退,推测随着年龄增长,活性氧(reactive oxygen species,ROS)的产生增多,自身抗氧化机制的失衡和脂质的堆积将导致β细胞受氧化应激、脂毒性和ER应激的影响[14]。
内源性再生疗法的目的是刺激有潜力的细胞亚群分化,从而起到补偿丧失功能的β细胞群的作用。其中去分化的β细胞能够在疾病状态下存活很长时间,引起了研究人员的关注。据报道,在1型糖尿病患者中,少量有功能的β细胞可以保留多年并逃脱免疫攻击[13]。同样,在2型糖尿病患者中,并不是所有β细胞均死亡。其中小部分β细胞倒退到更不成熟的状态,形成1个前体细胞池,具有重新分化的潜力[15]。此外,在疾病早期,仍有功能正常的β细胞可通过诱导使其增殖,导致细胞存活、死亡或增殖的分子机制差异仍然难以琢磨。因此,为了直接针对特定的β细胞亚群并触发其增殖和(或)功能成熟,破译β细胞的异质性并确定其潜在的分子机制至关重要。
胰岛具有能够迅速适应环境变化的功能灵活性,可通过β细胞的大量扩增和胰岛素分泌的增强而迅速适应环境的变化。因此可以利用自然增殖来增加疾病状态下的β细胞数量。β细胞增殖高峰在出生后早期,在此期间β细胞质量被确定。Wang等[6]和Qiu等[16]的研究结果显示,根据细胞周期相关基因的表达,小鼠出生后第3天有25%的β细胞处于增殖状态。然而,从第9天开始,增殖迅速下降,成年后β细胞更新率很小且稳定(在小鼠中低于1%)。了解促使出生后早期β细胞增殖的分子机制,促进成熟后β细胞的增殖并诱导其细胞周期停滞,可能是糖尿病治疗的新方向。最近的2项scRNA-seq研究旨在重建胰腺β细胞的发育轨迹,以深入了解出生后β细胞增殖和成熟的分子调节机制。Zeng等[17]利用mIns1-H2B-mCherry鼠系分离β细胞,而Qiu等[16]利用Ins1-RFP、GCG-Cre和Rosa-RFP鼠系分离β细胞和α细胞。在这2项研究中,对从出生后多个时间点分离的β细胞排序,根据转录相似性重建β细胞成熟轨迹。Qiu等[16]的研究成果分别报道了664个基因和448个基因在β细胞和α细胞成熟过程中受到动态调控。研究结果表明,β细胞的成熟主要通过基因上调来实现。相反,α细胞似乎通过基因下调来使α细胞成熟。此外,通过拟时序分析揭示了未成熟、增殖β细胞的特征,以及调控氨基酸摄取和代谢、线粒体呼吸和ROS产生的基因在出生后β细胞发育过程中的相关表达变化。Zeng等[17]的研究结果表明,由于氨基酸转运蛋白基因下调而导致的氨基酸剥夺,以及β细胞成熟过程中ROS水平的降低和血清应答因子(serum response factor,SRF)及其靶基因的下调,可能导致出生后β细胞增殖能力下降。因此靶向ROS/SRF/促分裂原活化的蛋白激酶(mitogen activated protein kinase,MAPK)/血小板衍生生长因子(platelet derived growth factor,PDGF)通路和氨基酸的激活可能会重新刺激成人β细胞增殖。在妊娠或肥胖等高代谢需求下观察到β细胞增殖的促进,出生后早期β细胞增殖调控有关的通路在这些条件下是否被重新激活将有待进一步研究。
有效恢复代谢动态平衡的前提是实现新生成β细胞全部功能的成熟。在β细胞自然的细胞周期中,β细胞在成年期预计会经历类似于不同分化状态的一系列变化[18]。成熟的β细胞表型通常与高水平的胰岛素和β细胞特异性葡糖转运蛋白2(glucose transporter 2,GLUT2)以及转录因子肌腱膜纤维肉瘤癌基因同系物(v-maf musculoaponeurotic fibrosarcoma oncogene homologue A,MafA)和Nkx6.1的表达有关。相反,在小鼠未成熟β细胞中,早期β细胞发育所需的基因MafB、配对盒基因(paired box gene 4,Pax4)、Pax6和UCN3表达升高和胰岛素分泌减少,即在未成熟β细胞中失去了β细胞功能正常所需的关键成熟因子[19]。在人和小鼠成年胰岛中仍存在未成熟的β细胞。Szabat等[20]检测到2个稳定的胰十二指肠同源框(pancreatic and duodenal homeobox 1,PDX1)阳性β细胞亚群,但其胰岛素水平不同。人和小鼠β细胞中有25%是PDX1阳性,但是胰岛素水平较低并且表达谱不成熟,这群细胞随着复制速率的增加,胰岛素分泌会随之减少。此外,在培养过程中,这些细胞中部分会转变为更成熟的状态。有研究进一步证实了未成熟或前β细胞的存在,并将活跃的Wnt/平面细胞极性(planar cell polarity,PCP)信号与β细胞成熟联系起来[21]。该团队发现Wnt/PCP途径的下游效应因子flattop(Fltp)在小鼠胰腺内分泌细胞中特异性表达,并将β细胞细分为Fltp阴性的增殖细胞(20%)和Fltp阳性的代谢活性细胞(80%)[21]。Wnt和MAPK信号在未成熟的出生后β细胞和FVR阴性的内分泌细胞中都高度表达。Arda等[22]证明SIX2和SIX3转录因子能增加幼年未成熟β细胞的胰岛素含量和胰岛素分泌,提示SIX2和SIX3在β细胞成熟过程中起关键作用。因此,虽然转录水平上的差异很小,但翻译后的Wnt/PCP信号对于触发成熟的β细胞表型至关重要。同样,许多单细胞研究报告了胰岛素调节和β细胞发育相关基因表达的异质性。Segerstolpe等[11]检测到2组血清视黄醇结合蛋白4(retinol binding protein 4,RBP4)和G蛋白耦联受体120(Gprotein coupled receptor 120,GPR120)[也称为游离脂肪酸受体4(free fatty acid receptor 4,FFAR4)]水平较高。综上,单细胞分析确定了成熟β细胞新的潜在标志物。为了从分子上剖析β细胞的异质性,更好地理解和推动β细胞成熟的机制研究,尚需更多关于转录因子和信号分子等调控元件的信息,这些调控元件的表达量很低,但可能对细胞的周期和状态有很大的影响。
α细胞分泌胰高血糖素,诱导糖原分解以提高血糖水平。重要的是,α细胞比β细胞更能抵抗代谢应激,1型糖尿病和2型糖尿病患者中数量无明显变化[6,11,23-25]。Collombat等[26]通过异位过表达Pax4单基因操作足以诱导α细胞转化为β细胞。有研究发现UCN3阴性胰岛素阳性的β细胞(占所有β细胞的1%~2%)在转录上[如葡萄糖-6-磷酸酶催化亚基-2(glucose-6-phosphatase catalytic subunit,G6PC2)、Eroib和GLUT2表达确实]和功能上(无法感知葡萄糖)不成熟,表明自然发生的α细胞到β细胞转分化是维持自体胰岛稳态的一部分[27]。谱系追踪研究表明,这些细胞既代表了α细胞向成熟的β细胞转分化的中间阶段,也代表了从β细胞向有功能α细胞的反向转变。其他研究也报道了在人类胰岛中同时表达α和β细胞标志的中间状态细胞,并且在胰岛α细胞和δ细胞能向β细胞发生转换[28]。α细胞可以相对容易地转分化为β细胞,从表观遗传学上解释其可塑性。α细胞在发育基因上有数百个存在激活性和抑制性的二价组蛋白标记,与人类胚胎干细胞的组蛋白修饰图极为相似,表明α细胞存在未分化的多能表观基因组状态[29]。此外,与β细胞相比,α细胞有更多开放的染色质区域,其中许多与β细胞标记基因有关。同时失活α细胞调节因子Arx和DNA甲基转移酶1(DNA methyltransferase 1,DNMT1)足以促进α细胞快速转化为能够产生和分泌胰岛素的β细胞。这证实除了细胞类型特异性调控因子的调节外,转换过程还涉及表观遗传的变化。scRNA-seq和功能评估显示,转化β细胞和天然β细胞间的差别非常小,但未被覆盖的细胞保留了α细胞的特征,这表明并不是所有α细胞都同样易被重新编辑[30]。通过相当简单的遗传和表观遗传操作或药物治疗可以诱导α细胞转分化,并且α细胞具有较高的增殖率,具有发育基因位点的二价组蛋白修饰和与β细胞相似的基因中开放的染色质区,这使得α细胞可能成为未来1型糖尿病和2型糖尿病临床治疗的新方向,并表明α细胞除了能分泌胰高血糖素外,还可能具有其他重要的功能。
单细胞转录组分析在临床上可以连续且动态追踪疾病基因表达、病程变化,并能预测疾病预后。但scRNA-seq仍然存在一些问题,如覆盖率低、特异性差;另一方面即使是在非糖尿病情况下,胰岛细胞组成也是高度可变,β细胞百分比变动于25%~80%,而α和β细胞分别占比2%~67%和5%~25%[31]。因此,β细胞(或其他胰腺内分泌细胞)中发生的小范围变化则会被相关细胞类型对总胰岛RNA贡献的mRNA变化所掩盖。
表面标记方法可用于研究α和β细胞基因特征及与其表观基因组标记的相关性,但该方法也存在一些弊端,如分选方案不允许富集稀有内分泌细胞类型如D细胞和胰多肽细胞。通过大量RNA分析只能提供细胞系中每个基因的平均表达值,而scRNA-seq可在所分析的细胞中捕获更丰富的基因表达参数集。因此,scRNA-seq除了发现和描述假定的特定生物状态如β细胞或细胞亚型外,还可以确定由代谢疾病驱动的基因表达变异性的变化。在scRNA-seq研究中,每个细胞中只有小部分转录本被测序。这会导致对低表达或中度表达的基因进行不可靠的量化,从而阻碍下游分析。因此许多科学家为了提高scRNA-seq的准确性,开发了许多新的统计及检测方法,如准确而稳定地估算出scRNA-seq数据中丢失的sclmpute统计法[32]、一种基于独特分子标记的scRNA-seq数据的表达恢复方法SAVER[33]。
ScRNA-seq新技术大大提高了检测的分辨率,从而提高了转录组分析的能力,该技术可捕获单一基因发生的活性变化。虽然这些变化可能只存在于小部分细胞中,但这对于理解疾病进展可能更为重要。随着mRNA捕获和cDNA合成技术进一步发展,研究的样本量将会进一步扩大,再加上计算分析方法的进步,scRNA-seq和相关的研究方法将大大提高我们对理解胰岛细胞在1型糖尿病和2型糖尿病发病机制中的作用,从而探索出新的治疗模式。