董媛媛, 孙桂江, 李遇伯, 李晓萌 △
天津医科大学第二医院 1腔镜检查科, 2肾脏病血液净化治疗科 (天津 300211); 3天津中医药大学中药学院(天津 301600)
细胞是生物的基本结构和功能单位,多个功能相同或不同的细胞结合形成不同的细胞群,从而进行生命活动的传递。如果这些细胞发生功能紊乱将会导致疾病的发生,从微观角度可以体现在基因的转录和表达,蛋白质合成代谢,细胞分泌以及细胞或细胞群之间的物质代谢,信号传导等的功能紊乱。相比于许多疾病的个体或组织的分析介绍,单细胞分析技术从单个细胞层面对细胞的结构和功能进行分析从而得到更加全面的信息[1],这有效地弥补由细胞异质性导致个体或组织平均数值引起的误差[2-3],为更加充分地了解疾病发生、发展的机制以及个体差异化的研究提供了补充。了解单细胞层面的研究方法有很多,如质谱、单细胞测序、微流控芯片、流式细胞术等技术[4]。利用这些技术从“组学”角度探讨单个细胞内基因、蛋白等分子的分布、动态变化并揭示其中的关联以发现未知基因或新的细胞类型等信息[5]。依据遗传中心发展的过程中包含的基因、转录、蛋白质以及代谢物等物质,在单细胞组学中这些物质相对应的的组学研究依次为单细胞基因组学、单细胞转录组学、单细胞蛋白质组学以及单细胞代谢组学[6]。然而对这些方向的单一研究无法对疾病发生、发展过程中的变化进行全面解释,于是对基因、蛋白质等分子提出整合分析,进而从多组学角度对细胞结构、功能等方面的改变进行分析研究以阐明机体在疾病发展或药物治疗的过程中的转变,为在人类发病机制的探索道路上提供新的指向。该综述将从单细胞基因组学、单细胞转录组学、单细胞蛋白质组学、单细胞代谢组学等方面对近年来的单细胞组学的研究进行简略的介绍。
基因组学是对基因组核酸碱基序列等分子的结构和功能进行分析研究的学科[7-8]。通过基因组学的研究可寻找疾病相关的基因、疾病发生发展或药物作用于机体后基因表达变化,为疾病的确诊、干预以及预后保养等方面的研究提供理论依据[8-10]。
单细胞基因组学不仅可以详细准确地描述细胞类型和状态,还可以寻找到未知的基因[11]。其基本的步骤如下:(1)样品前处理;(2)分离细胞;(3)提取脱氧核糖核酸(DNA);(4)基因组扩增;(5)构建文库;(6)基因组测序;(7)数据分析[12-13]。
许多研究采用单细胞基因组学的技术为研究提供可靠的数据支持,如Velmeshev等[14]对自闭症谱系障碍和正常患者的上层皮层投射神经元和小胶质细胞进行基因组学分析,发现特定基因集与自闭症谱系障碍的患病程度之间存在关联,对寻找治疗疾病的有效靶点具有深远的意义。 Ludwig等[15]通过对线粒体突变进行克隆追踪,测定线粒体中不同水平的DNA突变,提高推断克隆谱系的准确性。提示通过单细胞基因组学研究不仅能了解基因状况,还可对疾病治疗有重要意义。
转录组学是指通过对基因转录产物以及调控规律的研究以获得细胞表型和功能信息的一门学科[16-17]。通过对一个细胞转录的核糖核酸(RNA)分析获取细胞内基因表达的具体情况,在基因表达水平上分析疾病发生、发展、药物干预疾病的关键基因以及为进一步的治疗或机制研究提供依据[18-21]。
单细胞转录组学可对单个细胞中数千种基因的信使RNA浓度进行同时测量。单细胞RNA测序技术是单细胞转录组学研究的重要手段之一,该技术不仅避免因样本量过大忽略单个样品的不足,还可扩大识别的转录本范围[22-23]。利用单细胞测序技术进行单细胞转录组学分析的基本操作如下:(1)样品前处理;(2)分离和捕获单细胞;(3)对细胞裂解或其他处理;(4)提取核糖核酸;(5)制备互补脱氧核糖核酸(cDNA);(6)聚合酶链式反应(polymerase chain reaction, PCR)扩增;(7)测序;(8)数据处理[23-26]。
单细胞测序与其他技术结合可突破传统测序高噪音、可靠性低、数据丢失等的局限,进而获得更加全面的基因表达谱[24,27-29]。例如,Hanchate 等[25]采用逆行病毒追踪和单细胞转录组学结合的方法探讨上游神经元的分子特性以及调节特定神经肽的调控因子。Aynaud等[30]采用单细胞RNA测序技术将独立成分分析与EWSR1-FLI1基因结合位点和开放染色质区域的时间分辨映射结合,以阐明Ewing肉瘤内部异质性的来源。由此可见,单细胞测序与其他技术的结合分析可以为细胞或疾病的研究提供新的视角。
蛋白质组学是指对在不同条件下的细胞、组织或生物体的蛋白质组的表达、加工以及相互作用等过程研究的学科[31-33]。有文献介绍称世界上大部分疾病与蛋白质关联的生物学过程密切相关,与基因序列有关的疾病仅有约2%[34]。这是因为相比于基因组和转录组几乎恒定的数据的情况,蛋白质组因基因转录表达后的修饰等过程变得更加复杂化[35-36]。从蛋白质组出发更加详细地了解疾病发生、发展的机制、临床确诊依据以及药物作用位置等信息[37-39]。
单细胞蛋白组学旨在分析研究单个细胞内蛋白分子的变化情况。其基本程序如下:(1)样品分离;(2)去除干扰;(3)提取蛋白质;(4)处理消化;(5)质谱分析;(6)数据处理等[40-41]。
近年来已有质谱、流式细胞术、微流控芯片等单细胞蛋白质组学分析技术[42-43]。如 Fuchs等[44]采用流式细胞术的高维单细胞蛋白质组学方法对正常和溃疡性结肠炎患者的外周血自然杀伤细胞进行研究,通过比较自然杀伤细胞、卵子频率以及部分蛋白质表达等变化,揭示疾病相对应免疫细胞亚群的变化。Palii 等[45]介绍一种使用单细胞质谱仪、细胞进行条形码、流式细胞术飞行时间、靶向质谱法[稳定同位素稀释(SID)-选择性反应监测(SRM)]相结合的可随时间变化来量化蛋白质的绝对浓度的单细胞蛋白质组学方法,探究LS-TFs蛋白水平丰度在红细胞系分化过程中的变化、双潜能祖细胞中单细胞水平上是否存在共同表达,得到该蛋白丰度的改变是逐渐发生且其在细胞命运中具有积极促进作用的结论。然而流式细胞术具有因标记蛋白的影响以及质谱局限性的缺点,据此,班琳[42]采用具有能够精确操控优势的微流控芯片技术,利用探针、芯片电泳以及实时成像平台相结合的方法,探索单细胞蛋白质表达以及蛋白质通量状况。通过利用不同技术对单细胞进行蛋白质组学分析研究,得到体内蛋白质的表达情况。
代谢组学是对代谢产物进行研究的一门学科。通过代谢组学研究不仅可以获得机体代谢物及其产物变化情况,还可以获取其涉及到的代谢通路相关的生物学信息,为进一步探究疾病发生、发展的原因以及临床确诊、药物干预、新材料的应用等方面提供有力的理论依据[46-48]。
单细胞代谢组学是对生物体内相对分子质量<1 000且与细胞表型相关的小分子即包括中间产物在内的某些代谢物变化情况的研究[2]。相比于多细胞或组织由于细胞异质性引起的误差,单细胞代谢组学分析不仅有效地避免这一缺陷并且可映射单一细胞功能以及揭示细胞异质性与代谢间的关系[49]。其处理过程基本包括以下几个步骤:(1)细胞分离;(2)样本处理;(3)单细胞质谱等技术的耦合分析;(4)数据筛选,如消除背景噪音、标准化处、峰对照等;(5)使用代谢分析工具进行统计学分析如主成分分析;(6)代谢组数据根据m/z值初步鉴定代谢物;(7)根据丰度高的离子信号进行MS/MS分析或与数据库配对,获得细胞内的细胞物种或得到差异代谢物或主要代谢途[49-53]。单细胞代谢组分析的步骤并不是完全一样的,可根据自身的实验设计进行适当的修改,以便满足自身条件要求。
目前基于质谱的单细胞代谢分析已广泛应用,例如具有较高特异性及重现性、敏感度好等优势的基质辅助激光解吸电离、激光烧蚀电喷雾电离、激光捕获显微切割-液体涡流捕获质谱法等[2,54-56]。但单细胞质谱分析也面临检测量低、内容物易缺失、基质干扰、鉴定代谢分子困难、活细胞内代谢物变化快等巨大挑战[57]。与其他技术相结合可以解决这些问题,如Zhu等[52]采用重新设计的T探针与串联质谱相结合技术,可对悬浮液中活结肠癌细胞进行实时在线的细胞内容物分子结构鉴定,从而获得细胞的代谢变化,这可解决单细胞质谱法在制备和取样过程中内容物丢失以及不能检测悬浮细胞的障碍。Zhang等[58]应用毛细管微取样电喷雾离子质谱结合离子迁移率分离方法,对单贴壁哺乳动物的黏附细胞分析以及离子的数据库配对分析,得到不同等压离子的串联质谱图从而鉴定单细胞产生的离子,避免了基质对于离子信号的干扰。Wei等[59]介绍一种基于脉冲直流电喷雾电离源方法的Pico-ESI策略,不仅能从单细胞等极小型样品中获得大量与代谢物相关的数据,还可通过降低样品流速避免数据的大量丢失。此外,也能减少基质干扰。这些技术的结合对单细胞代谢组学研究发展具有里程碑的意义。
近年来,已有许多在单个细胞的代谢物上的研究。通过单细胞代谢组的研究,可以更好地了解细胞内分子生物化学过程改变以及细胞表型异常等相关的生物信息,从而能有效地进行生物学评价,临床诊断等。但单细胞代谢组学依然存在许多挑战[49,60],如许多分析工具不能覆盖更多的代谢物;代谢物及其产物鉴定的困难;如何拥有较高的敏感度将单细胞内的代谢物进行定量分析;如何对活的单细胞内代谢物随时间变化的速率进行量化等问题,虽然已有相关研究,但存在巨大困难亟需解决。
由于单水平的单细胞组学研究只能给出该层面的具体信息而不能详细介绍关于该细胞的全面信息,对单细胞多组学数据的整合分析研究应运而生[61]。已有许多单细胞水平的多组学研究,如Xhangolli等[62]从单细胞转录组学和蛋白质组学层面上对抗原刺激下嵌合抗原受体T(CAR-T)细胞进行分析,从而探究单个嵌合抗原受体T细胞与天然T细胞间的差异控制以及具有抗肿瘤毒性的CAR-T细胞、细胞因子状态和细胞分化表型间的关联性,为药物治疗前后的变化评估以及质量保证提供新的思路。而Ooi 等[63]介绍一种微流控的工作流程可对具有96个靶点的蛋白质和RNA进行定量分析,从而将RNA与蛋白质表达联系起来呈现出更加全面的动态生物学过程。Maurer-Alcalá等[64]通过探讨美洲大睑球菌、几种双合细菌、大型截形囊和贪婪的捕食性纤毛虫鼻二式体在单细胞基因和转录进化模式的复杂性,为研究不同微生物的生物学特征提供数据。多组学研究不仅可以获取遗传中心法则中相关物质的关联性以及全面的动态生物学信息,还能得到微生物相关的生物谱信息。当然多组学的大规模数据对实验平台的要求较高,需要进一步研发[6]。
综上所述,单细胞的组学研究不仅消除细胞异质性引起的数据损失,还可对从基因结构到转录过程再到功能执行的整个过程进行系统地介绍。这为发现疾病以及诊断、治疗和预后等提供有力的依据。目前,单细胞组学相关的研究虽然已有进展,但挑战依然存在,如多组学整合分析对相关组学数据并不能全面地分析、检测小样本量时所需高敏感度的缺少、样本处理时的损失、其他物质干扰等问题需要进一步的研究解决。而在未来,单细胞水平的整合组学研究会逐渐剖开生命奥义,推动医药领域的进展。
利益相关声明:所有作者共同认可本文无相关利益冲突。
作者贡献说明:综述撰写为董媛媛, 综述设计为李晓萌,综述指导为孙桂江,综述修改为李遇伯。