杨帅 王新恒 吴佳乐 付子彤 魏博 杨灵冰 综述 许守平 审校
作者单位:哈尔滨医科大学附属肿瘤医院乳腺外科一病区(哈尔滨 150081)
乳腺癌是女性中最常见的恶性肿瘤,2020年大约有230万新发病例,超过68.5万人死于乳腺癌[1]。乳腺癌是一种起源于乳腺导管上皮细胞高度异质性的疾病,由于这些异质性的存在,乳腺癌治疗面临很大的困难。单细胞测序技术是一种在单细胞水平上揭示细胞的基因组、转录组或表观遗传变化的技术,从不同角度揭示细胞的功能和特征。通过构建数据库,可以一次检测庞大的每个单元信息。人类对单细胞的研究主要是基于测序技术。第一代测序技术是1997年开发的Sanger测序方法,主要测序标记的单个核酸分子的碱基,科学家使用该技术在2003年绘制了人类基因的初步序列,为生命的解码奠定了基础。2005年,Roche公司开发了第二代测序(高通量平行测序),进一步解码单细胞转录组、基因组、表观遗传学和结合多组学单细胞测序技术的细胞和分子变化,为医学研究进展提供了良好的平台。传统高通量测序技术获得的测序数据只是对大量组织样本中混合细胞的平均基因测定。与传统的测序技术相比,单细胞测序技术不仅能够准确测量基因表达水平和检测非编码RNA的表达,还可以充分利用测序特殊样本的优势,弥补特殊样本样本量小、不易获得的缺点[2-4]。
近年来不断发展的单细胞测序技术已经能够分离单细胞,在单细胞水平上建库测序,捕获单个细胞的基因表达信息。2009年,Tang等[5]首次报道了单细胞转录组测序技术。最初的单细胞测序只能对10~100个细胞进行研究,随着技术的不断完善,现阶段人们已经能够在单个项目中对成千上万个单细胞进行测序[6-8]。运用单细胞测序技术,不仅能够区分肿瘤细胞间的异质性,也能识别不同细胞类型。本文综述了单细胞测序技术应用于乳腺癌图谱、乳腺癌微环境、乳腺癌转移与耐药以及乳腺癌异质性与克隆演化方面的文献,为乳腺癌的研究提供参考。
乳房由复杂的上皮导管和小叶网络组成,这些上皮导管和小叶网络嵌在结缔组织和脂肪组织中[9-11]。目前大多数的研究都集中在乳腺上皮细胞类型上,而对非上皮细胞类型的研究相对较少[12-14]。Kumar等[15]构建了具有单细胞和空间分辨率的综合人类乳腺细胞图谱。科研人员通过单细胞转录组测序研究分析了146例女性的714 331个细胞和117 346个细胞核,得到了包括内皮细胞、免疫细胞、基底肌上皮细胞、间充质细胞和肥大细胞在内的12种不同的细胞类型图谱。这些正常乳腺细胞类型图谱揭示了乳腺组织丰富的血管周围样细胞(Perivascular like, PVL)、内皮细胞和免疫细胞群,以及高度多样化的管腔上皮细胞群。同时这些数据为研究乳腺癌和乳腺生物学等疾病提供了正常乳腺组织的参考信息。
乳腺癌的异质性可能源于其不同的细胞来源,体现在不同的亚型与独特的治疗不敏感性[16]。然而科研人员对早期肿瘤形成和进展的研究常常受到不发达、偶尔相互矛盾的乳腺谱系注释的限制。现有的注释通常由少量标记定义,不能充分代表乳腺谱系内异质性。乳房是一个动态器官,其对生理和病理生理条件的反应会改变其疾病易感性,但这些临床变量对细胞状态的具体影响仍不清楚。Gray等[17]通过整合单细胞RNA测序(single-cell RNA sequencing,scRNA-seq)、质量流式细胞术和循环免疫荧光,呈现一个统一的高分辨率乳腺癌图谱。他们定义了肺泡、激素感应和基底上皮谱系中的细胞亚型,描述了不同亚型与癌症风险因素的关联,包括年龄、胎次和BRCA2种系突变。被称为基底腔细胞的肺泡细胞子集,带有与基底样乳腺癌相关的基因特征。有趣的是肺泡细胞子集表现出较差的转录谱系保真度,并且随着年龄的增长而积累。这些数据更全面地高分辨率定义乳腺癌细胞类型。
乳腺癌是复杂的细胞生态系统,其中异型细胞相互作用在疾病进展和对治疗的反应中发挥核心作用。然而,目前的研究对其细胞组成和组织的了解是有限的。Wu等[18]提出了人类乳腺癌的单细胞和空间转录组学分析,并开发了一种内在亚型分类的单细胞方法来揭示复发性肿瘤细胞的异质性。通过scRNA-seq使用转录组和表位的细胞索引进行免疫表型分析可提供高分辨率的免疫图谱,包括与临床结果相关的细胞程序性死亡-配体1阳性或者细胞程序性死亡-配体2阳性的巨噬细胞群。他们发现间充质细胞通过在内皮细胞、癌症相关成纤维细胞(Cancer-associated fibroblast, CAF)和PVL三个主要谱系内分化显示出不同的功能和细胞表面蛋白表达的差异。该研究提供了乳腺癌细胞结构的全面转录图谱。
肿瘤微环境是由肿瘤细胞、免疫细胞、成纤维细胞和血管细胞组成的复杂微环境。肿瘤内的细胞组成决定了肿瘤微环境的高度异质和动态特性[19]。乳腺癌的微环境包括肿瘤浸润淋巴细胞、肿瘤相关骨髓细胞[20-21]、脂质相关巨噬细胞[22]、癌症相关成纤维细胞(Cancer-associated fibroblast,CAF)和其他促进肿瘤细胞生长和迁移的因子。微环境中的细胞成分被证明参与乳腺癌的发生、生长和转移。目前,乳腺癌微环境细胞的模式研究相对较少,没有很好的评估这些微环境细胞在发病机制中的具体作用 。单细胞多组学生物技术,尤其是单细胞RNA测序技术以更高的分辨率揭示单细胞表达水平,精细剖析肿瘤微环境的分子特征[23]。
CAF大量存在于几乎所有肿瘤微环境中,并影响肿瘤进展。虽然人们逐渐地了解到它们的功能和异质性,但对CAF的起源知之甚少。Houthuijzen等[24]通过对小鼠进行的各种移植研究,发现浸润性小叶乳腺癌和三阴性乳腺癌中的CAF均源自乳腺组织常驻的正常成纤维细胞(Normal fibroblasts,NF)。单细胞转录组学、体内和体外研究揭示了CD26+和CD26-NF细胞群分别转变为炎性CAF和肌成纤维细胞CAF。功能性共培养实验表明,CD26+NF转变为促肿瘤炎性CAF,后者以趋化因子12依赖性方式募集骨髓细胞,并通过基质金属蛋白酶活性增强肿瘤细胞侵袭。他们的结果表明CD26+和CD26-NF在乳腺癌小鼠模型中转化为不同的CAF亚群。Bartoschek等[25]利用遗传工程改造的乳腺癌小鼠模型的768例间充质细胞转录组的单细胞RNA测序,定义了三个不同的CAF亚群。并且在转录和蛋白水平上揭示了不同来源的CAF亚类的空间分布,包括PVL、乳腺脂肪垫和转化的上皮细胞。每种CAF亚型的基因谱与其独特的功能程序相关,CAF三种亚群的分辨率可作为生物标志物为CAF精确靶向药物的开发提供了可能性。
作为临床预后的指标,乳腺癌的淋巴结转移引起了人们的广泛关注。许多报道揭示了转移性乳腺癌细胞的特征,但仍然需要更多乳腺癌相关淋巴结微环境成分和空间转录组图谱的研究。Xu等[26]他们的研究中,通过整合scRNA-seq和空间转录组学,研究了6例手术切除淋巴结样本的转录谱和1例阳性淋巴结的组织。结果发现高表达CD68和CD163的破骨细胞样巨细胞。CD68和CD163是肿瘤相关巨噬细胞的生物标志物。通过空间转录组学方法,他们发现破骨细胞样巨细胞分散在转移性乳腺癌细胞中。在乳腺癌细胞浸润的淋巴结微环境中,肿瘤相关巨噬细胞富含包括NF-κB信号通路和NOD样受体信号通路在内的前肿瘤通路。进一步的子聚类展示了巨噬细胞从活跃的趋化因子产生状态发展为活跃的淋巴细胞激活状态的潜在分化轨迹。该研究首次将scRNA-seq和空间转录组学整合到腋窝淋巴结肿瘤微环境中,为深入研究乳腺癌淋巴结转移提供了系统方法。
尽管转移仍然是大多数癌症相关死亡的原因,但对远端组织转移播种的机制知之甚少。Davis等[27]建立了一种可靠的方法,使用单细胞RNA测序和患者衍生的乳腺癌异种移植模型,用于在过程中识别罕见转移细胞的整体转录组变化。他们发现原发性肿瘤和微转移都显示出转录异质性,但微转移具有独特的转录组程序,该转录组程序在患者衍生的异种移植模型中保守,可以高度预测患者的不良生存率。通路分析显示线粒体氧化磷酸化是微转移中上调的主要通路,而原发性肿瘤细胞中糖酵解酶水平较高,并且通过流式细胞术和代谢组学分析证实了这一点。通过抑制氧化磷酸化可以显著减弱肺部的转移播种,证明了氧化磷酸化在转移中的重要性,并突出了其作为预防乳腺癌患者转移扩散的治疗靶点的潜力。
耐药性是乳腺癌治疗的主要障碍。为了解决这个问题,Prieto-Vila等[28]对腔面型乳腺癌细胞系MCF7及其耐药细胞进行了广泛的单细胞基因表达谱分析。在耐药细胞中观察到上皮-间质转化和干性相关基因的上调和细胞周期相关基因的下调。这些基因主要受淋巴样增强因子1调节。亲代细胞中的少数细胞表现出与耐药细胞相似的基因表达谱,表明未经处理的亲代细胞已经含有耐药的细胞亚群。
雌激素受体阳性乳腺癌的主要治疗方法是内分泌治疗,临床上大约90%的转移性乳腺癌患者最终对内分泌治疗产生耐药,至少33%的早期乳腺癌患者将产生内分泌耐药[29-31]。细胞周期蛋白依赖性激酶(Cyclin-dependent kinase,CDK)抑制剂联合内分泌治疗能够改善晚期转移性雌激素受体阳性乳腺癌患者的预后,但其在早期患者中的价值尚不清楚。Griffiths等[32]运用scRNA-seq对单独使用内分泌治疗或者联用CDK抑制剂的内分泌治疗活体组织进行测序。研究者发现单独用药和联合用药均出现了共同的耐药表型。联合用药治疗的耐药肿瘤显示出雌激素信号的加速丧失,同时通过生长因子受体对JNK信号进行集中上调。相比之下,在单一或联合治疗期间维持雌激素信号传导的癌细胞通过ERBB4信号传导,显示CDK4/6激活和ERK上调的增强。这些结果表明,早期ER阳性乳腺癌的联合治疗通过从雌激素转变为替代生长信号介导的增殖而导致耐药性的出现。
人表皮生长因子受体2(Human epidermal growth factor receptor2,HER2)阳性乳腺癌患者受益于HER2靶向治疗,其中最常用的是曲妥珠单抗。然而,获得性耐药通常在接受靶向治疗的一年内发生,这种耐药机制尚不清楚。Guoyu等[33]在两种HER2阳性乳腺癌细胞系SKBR-3和BT474中通过耐药筛选,构建了曲妥珠单抗耐药细胞。通过外显子组测序技术,检测抗性诱导过程中不同时间点的细胞,用来研究基因组随时间的变化。其中单细胞靶向测序被用于识别与耐药性相关的基因突变。结果发现了拷贝数变异区域的快速增加,以及单核苷酸变异的逐渐积累。单细胞靶向测序发现在SKBR-3和BT474细胞中多个基因位点的突变导致肿瘤细胞对曲妥珠单抗敏感性降低。
乳腺癌的异质性使得不同患者之间(肿瘤间异质性)、甚至在每个个体肿瘤内(肿瘤内异质性)差异很大。肿瘤异质性发生在形态学、基因组、转录组和蛋白质组水平,给诊断和治疗带来挑战[34]。
近年来,scRNA-seq在探索肿瘤细胞群体的异质性以及肿瘤发生和转移相关的稀有细胞类型方面,比传统测序方法具有更大的优势[35]。scRNA-seq技术将具有不同分子亚型的乳腺癌细胞群体聚集在一起,来鉴定可能与不良预后和耐药性相关的不同群体。scRNA-seq技术还用于鉴定潜在免疫治疗靶点的不同免疫细胞亚群。此外,除了探索异质性,scRNA-seq在乳腺癌研究中还具有多种应用,包括分析细胞间信号通路、调节单细胞状态和免疫细胞分布等。由于scRNA-seq能够定义具有潜在治疗靶点细胞亚群的能力,因此有助于乳腺癌的个体化治疗。
异质性和复杂的细胞结构对乳腺癌的进展以及对治疗的反应具有重要的影响。然而,破译肿瘤亚型及其空间组织仍然具有挑战性。Liu等[36]将scRNA-seq与基于微阵列的空间转录组学相结合,来识别细胞群及其在乳腺癌组织中的空间分布。肿瘤细胞聚集成不同的亚群,这些细胞簇具有不同的起源、特征和功能。他们发现这些亚群分布在不同的组织区域,观察到基质细胞类型的差异富集,并且通过对大型乳腺癌RNA-seq队列的去卷积推断了这些肿瘤亚群的丰度,揭示了与患者生存和治疗反应的差异关联。这项研究为乳腺癌的细胞结构和潜在的治疗策略提供了新的见解。
确定肿瘤异质性及其对药物反应的影响能更好地对患者进行分层,帮助制定患者个性化治疗方案。为了评估肿瘤细胞异质性对药物反应的影响,Gambardella等[37]对来自32例乳腺癌细胞系的35 276个单个细胞进行转录分析,得到32个单细胞图谱。研究者设计了一种单细胞转录谱映射到乳腺癌图谱的算法,通过这种算法可以从肿瘤活检的基因表达谱中确定细胞系组成,对患者来源的细胞系进行分层,从而预测药物反应。最后,他们将细胞系体外药物筛选的结果与单细胞数据联系起来进行比对,进而预测单细胞谱与药物敏感性的关系。结果发现非遗传的转录异质性使具有不同药物敏感性的细胞在相同的细胞系中也能共存。这对确定细胞系组成和药物反应方面的肿瘤异质性提供了一个框架。
在克隆演化方面,拷贝数改变(Copy number alterations,CNA)在塑造乳腺癌基因组中发挥重要作用,并证明在临床上可用于治疗和预后。Balsan等[38]使用单细胞测序技术,全面绘制出乳腺癌肿瘤队列中拷贝数改变异质性的特点。分析揭示:肿瘤块内非肿瘤细胞(即基质)的遗传异质性;拷贝数异质性对乳腺癌基因组的影响程度以及亚克隆事件的基因组位置和剂量的重要性;染色体扩增的遗传异质性普遍存在;以及拷贝数异质性与临床和生物学参数(如多倍体和雌激素受体阴性状态)的关联。他们的数据突出了单细胞基因组学在剖析多种形式的CNA肿瘤内遗传异质性方面的特点,CNA异质性对乳腺癌基因组的影响程度,以及CNA异质性对肿瘤耐药和复发的影响。
Kacavas等[6]对来自六个原发性三阴性乳腺癌患者超过1 500个细胞进行了scRNA-seq。结果发现每个肿瘤内基因表达程序的细胞间异质性是可变的,并且在很大程度上与推断的基因组拷贝数变化的克隆性相关。基因表达谱的聚类确定了多个肿瘤共有的不同恶性细胞亚群,包括与治疗抗性和转移的多个特征相关的单个亚群,其功能特征是激活鞘糖脂代谢和相关的先天免疫途径。定义该亚群的新特征预测了大型队列中三阴性乳腺癌患者的长期结果。这项分析揭示了三阴性乳腺癌的功能异质性及其与基因组进化的关联,并揭示了导致这种疾病预后不良的未预料到的生物学原理。
近年来,对单个细胞水平的分析正在改变人们对疾病的认识,肿瘤研究者开始逐渐认识到肿瘤组织和细胞群体的复杂性和异质性,传统的混合组织测序分析不能很好地表征生物学的复杂性。然而,在单细胞研究广泛开展的大背景下,单细胞测序技术应用于肿瘤研究也存在一些局限性。首先,单细胞测序技术的成本很高,需要一定的科研经费支持;另外单细胞分析的常规方法还不完善,技术方面受限于单细胞的分离和捕获、细胞膜的完整性及活性,从而使下游分析中的细胞失去了其在机体内环境下的真实状态;其次,单细胞测序基因组学在单个实验中测量成千上万单细胞基因组信息,所产生的庞大数据的分析处理及对生物学信息的解析是一个巨大的挑战。因此,与生物信息学和计算机生物学的跨学科合作将极大提高单细胞测序实验领域的进展,对肿瘤学的研究具有重要的意义。