基于单细胞测序数据系统分析SARS-CoV-2受体ACE2在胰腺中的表达

2022-05-11 05:36张立俊于帆陈科谚汤希国世星袁新华何海洪
海南医学 2022年8期
关键词:单细胞阳性细胞胰腺

张立俊,于帆,陈科谚,汤希,国世星,袁新华,何海洪

南方医科大学深圳医院检验科,广东 深圳 518110

2019 年12 月,武汉出现不明原因的肺炎患者,我国科学家通过对肺炎患者的样本进行测序发现一种新型冠状病毒。2020 年2 月11 日,世界卫生组织(WHO)将该病毒命名为严重急性呼吸系统综合征冠状病毒2(SARS-CoV-2),并将此类病毒统称为2019冠状病毒(COVID-19)[1]。目前的疾病传播学表明,该病毒的临床症状或许不如SARS-CoV 以及MERS-CoV表现得严重,但其在病例数量上升速度以及传播方式则更为严峻。例如,因家庭性聚集而导致的日益增加感染病例就表明了该病毒相比SARS-CoV 以及MERS-CoV更具有感染性与传播性[2-3]。

尽管SARS-CoV-2 的病原体机制尚未查明,人们目前主要认为,与SARS 的致病原理相似,ACE2 可作为刺突糖蛋白[spike(s) glycoprotein]的受体从而允许病毒与细胞薄膜相结合[4-5]。因此,人体中表达ACE2蛋白质的细胞则更有容易被感染上SARS-CoV-2。多位学者所开展的研究表明,对于SARS患者而言,血糖水平与糖尿病分别是发病率与死亡率的预测因素[6]。根据初步报告,在感染SARS-CoV-2 的41 例患者中,有8 例患者患有糖尿病,占感染人数的20%。而钟南山医学小组所得的数据则表明,在173 例重症患者之中,28 例患有糖尿病,占总人数的16.2%[7-8]。以上研究都表明,糖尿病患者更容易感染SARS-CoV-2。而在那些COVID-19 的死亡病例中,糖尿病为其第三大常见病症[9]。

现有研究表明,ACE2 在胰腺内分泌腺体内表达较少,而其在胰腺外分泌腺体内则表达较多。此外,强阳性细胞也相对集中[10]。人们目前也需要对特定细胞进行更深一步的了解。而单细胞RNA 测序(scRNA-Seq)技术的快速发展则为人们揭示人体单独组织中的每一细胞类型的ACE2 表达水平提供了可能,并提供了有关单细胞分辨的大量信息。目前,人们尚未针对胰腺外分泌腺细胞中的ACE2表达开展系统性的研究。

为此,本研究首先对成年人胰腺中的单细胞分辨层面的ACE2的RNA表达信息进行了研究。此外,其还利用了基因组富集分析(GESA)方法对与表达ACE2 的阳性细胞中病毒转录相关的基因组表达进行了分析,并对ACE2 阳性标记基因进行了基因概念网络分析。

1 材料与方法

1.1 伦理 本研究的数据主要来源于公开数据库,故予以豁免患者知情同意。

1.2 基因数据库 该研究使用了单细胞表达信息数据库(https://www.ebi.ac.uk/gxa/sc/home)中的人体胰腺组织的单细胞测序数据来开展表达ACE2的阳性细胞的聚类分析[11]。根据初步筛选结果,对GEO数据库中的人体胰腺导管细胞的scRNA-seq数据组进行了系统性分析,且其基因库序列号为GSE131886。

1.3 Scanpy 软件分析 使用Scanpy 软件(版本1.4.6)分析整个scRNA-seq 的下游数据,其中Filter-Cells 和FilterGene 函数用于读取过滤和作图,而Kallisto 函数用于基因/转录本定量。采用t-分布随机邻居嵌入(t-SNE)算法降低归一化后的标准化数据的维数,进行小区聚类,将“困惑度”值设置为20,Kinds(k)=7。细胞中的基因表达水平以每百万计(CPM)的形式所表示,并利用CellMarker (http://biocc.hrbmu.edu.cn/CellMarker)数据库中的数据进行了比较,以识别出胰腺聚类细胞。

1.4 CellRanger 软件分析 使用CellRanger(1.1.0版)将从每个样本生成的原始基因表达矩阵导入R(4.0.0 版),并使用Seurat R 软件包(3.1.5 版)进行进一步的数据分析。在数据集中测量的基因少于200个的细胞、少于3 个细胞的基因和线粒体基因表达率大于5%的细胞被过滤。FindVariableFeatures 函数可识别在细胞之间具有高度可变表达水平的基因。主成分分析(PCA)使用Seurat RunPCA 功能进行。统一流形逼近和投影(Uniform manifold approximation and projection)非线性降维技术用于可视化和探索细胞聚类。然后,使用FindMarker函数识别用于细胞聚类的标记基因,并基于这些标记基因使用Panglao DB数据库(https://panglaodb.se/)进行细胞注释。

1.5 群集细胞进行基因本体(GO)功能分析 Org.Hs.eg.db(3.11.4 版)程序包和topGO(2.40.0 版)程序包(3.11.4 版)用于对群集细胞进行基因本体(GO)功能分析。分子特征数据库(MSigDB)上的基因集富集分析(GSEA)通过presto 软件包(版本1.0.0)和fgsea 软件包(版本1.14.0)执行了GO 功能富集的C5 GO 基因集(版本7.0)。

1.6 基因概念网络可视化 基于ACE2阳性细胞标记基因与疾病和基因注释数据库(DGA)数据资源相结合,对基因与疾病之间的基因概念网络进行了可视化。用来进行可视化的R 软件安装包包括:Pathview软件包(1.28.0版本),Enrichplot软件包(1.8.1版本)以及DOSE软件包(3.14.0版本)。

2 结果

2.1 ACE2 在胰腺细胞中的表达 为了阐明ACE2 在胰腺细胞中的表达,本次实验分析了来自单细胞表达图谱数据库的数据。细胞聚集后,胰腺细胞主要聚集成7种类型的细胞(图1A)。进一步的数据分析表明,ACE2 阳性细胞主要集中在簇2 细胞中(图1B)。通过注释簇2细胞的细胞亚型,发现它们主要由胰腺腺泡细胞和胰腺导管细胞组成(图1C)。比较腺泡细胞和导管细胞中ACE2阳性表达的CPM值,发现胰腺导管细胞的CPM 值高于腺泡细胞的CPM 值,差异具有统计学意义(P=0.006 1),见图1D。

图1 胰腺与聚类2细胞中的ACE2阳性表达的单细胞测序细胞聚类分析

2.2 ACE2阳性细胞在腺泡细胞和导管内皮细胞中富集 采用UMAP方法对570个细胞进行细胞聚类分析。散点图显示总共形成了8 个簇(图2A)。小提琴图的结果表明,表达ACE2 的阳性细胞主要富集在簇2和簇6中(图2B)。群集2包含100个单元(图2C),群集6包含36个单元(图2D)。ACE2阳性细胞约占聚类2 细胞的1%,约占聚类6 细胞的2.8%(图2E)。对每个细胞簇的标记基因进行计数以注释簇(图2F),最后将簇2 确定为腺泡细胞,而簇6 确定为内皮细胞(图2G、2H)。

图2 胰腺细胞的单细胞测序分析

2.3 ACE2阳性细胞的功能富集分析 对腺泡细胞和内皮细胞标记基因进行功能富集分析的结果表明,两种类型细胞中最富集的前5 个GO 项为SRP 依赖的共翻译蛋白,靶向膜易位,核转录mRNA 分解代谢过程无义介导的衰变、翻译起始、病毒转录和细胞质翻译。

2.4 基因集富集分析(GSEA) 基于功能富集分析的结果,继续分析腺泡细胞和内皮细胞在病毒转录中的潜在功能,并应用GSEA分析ACE2阳性细胞富集的途径。结果表明,ACE2 阳性腺泡细胞中最丰富的4个基因组是靶向膜的共翻译蛋白、胞浆核糖体、内质网蛋白质定位的建立和核糖体的结构成分(图3A)。在对表达ACE2的阳性细胞进行GSEA分析后,前4个基因组中的3个与腺泡细胞相同,第四个基因组是内质网的蛋白质定位,内质网不是核糖体的结构成分(图3B)。

图3 使用了GSEA方法对ACE2阳性细胞的基因组进行了可视化处理

2.5 标记基因与疾病的基因概念网络分析 通过分析表达ACE2 的阳性细胞的标记基因,研究人员发现,这些基因与多种胰腺炎有关。这其中,包括慢性胰腺炎、胰腺炎、急性胰腺炎和其他疾病(图4A)。而Circos图显示了不同类型胰腺炎与基因之间的基因概念网络关系(图4B)。这其中,BNIP3、PNLIP、PRSS2、PRSS3、CLU、MUC1、ALB 与多种胰腺炎病发的联系最为密切。对ACE2阳性内皮细胞标记基因的分析表明,这些基因与胆管癌、癌前病变、胰腺腺癌等肿瘤疾病密切相关(图4C)。Circos图显示了基因与疾病之间的基因概念网络关系(图4D)。其中,AGR2、ISG20、HMGA1、CIB1、MMP1、S1OOP 与肿瘤的发生关系最为密切。

图4 ACE2阳性细胞的基因-概念网络分析

3 讨论

随着疫情的进一步蔓延,世界卫生组织也在2020年3 月11 日对COVID-19 进行了断定,预测其为一种流行病[12]。自2020年5月以来,美国、欧洲国家、韩国、伊朗、日本和其他国家的COVID-19 患者人数急剧上升,这表明该病毒具有潜在的风险,可能会影响周围人群的健康和生活。目前,COVID-19 的致病机制尚不清楚。有限的研究表明,它具有与SARS 相同的受体ACE2,而ACE2确实是SARS-CoV-2感染细胞所必需的分子[13]。

动物模型表明,ACE2mRNA 在患有糖尿病的实验鼠的胰腺上高度表达,并证实了ACE2 参与糖代谢的调节[14-15]。胰腺分为两部分,即外分泌腺与内分泌腺。其中,外分泌腺主要是由腺泡与腺管组成的,而内分泌腺则主要是由胰岛组成。而胰岛则主要是由4种细胞组成:A细胞、B细胞、D细胞以及PP细胞[16]。目前胰腺组织细胞的异质性相对具有典型性,而ACE2在人类不同胰腺细胞中的表达在相关研究中鲜有报道[17]。对2 209 个胰腺细胞的单细胞测序数据进行了分析。经tSNE 聚类分析,主要分为7 个细胞簇,其中ACE2则主要分布于簇2 中,而簇2 中的细胞主要由胰腺外分泌腺的腺泡细胞和导管细胞组成。2003 年爆发严重呼吸综合征(SARS)时,病理解剖显示SARS 冠状病毒存在于患者尸体的胰腺腺泡细胞中[18]。此外,其还在动物实验中发现,ACE2 在胰腺外分泌腺中高度表达[19-20]。进一步研究胰腺导管细胞的scRNA-seq 数据表明,ACE2 再次在胰腺腺泡细胞和内皮细胞中阳性表达,其阳性表达率分别为1%和2.8%。这些数据结果增加了人类胰腺外分泌腺也是SARS-CoV-2感染的潜在途径的可能性。

GO分析基于胰腺腺泡细胞和导管内皮细胞的标记基因,主要富集SRP 依赖性共翻译蛋白,靶向膜易位、核转录mRNA分解代谢过程、无义介导的衰变、翻译起始、病毒转录、细胞质翻译。通过分析ACE2在病毒转录过程中在胰腺导管细胞中的表达模式,与ACE2阴性细胞相比,ACE2阳性腺泡细胞和导管内皮细胞的基因组主要富集于靶向于膜的共翻译蛋白、胞浆核糖体和内质网蛋白质定位的建立。这些结果表明胰腺外分泌腺易受SARS-CoV-2 感染,感染细胞在病毒转录中起重要作用。

通过基因-概念网络分析,对标记基因与疾病病发率之间的相关性进行了预测,并发现BNIP3、PNLIP、PRSS2、PRSS3、CLU、MUC1、ALB基因与多种胰腺炎的病发率密切相关。而AGR2、ISG20、HMGA1、CIB1、MMP1、S1OOP基因则与肿瘤发生息息相关。这些数据表明,感染SARS-CoV-2 的胰腺外分泌腺细胞可能导致各种类型胰腺炎的发生和进展,并且可能存在肿瘤的长期潜在风险。

由多位学者所开展的研究表明,在感染SARS 冠状病毒的患者中,ACE2 在胰腺外分泌腺和胰岛细胞中均有表达[21]。因此,猜测其原因可能是不同的组织和细胞来源可能导致结果的差异或ACE2 表达的变化[22-23]。根据最新文献,在缺氧的条件下,胰岛细胞中ACE2 的表达将上调[24-26]。而COVID-19 所引起的呼吸衰竭也很有可能会导致缺氧,这意味着健康人中ACE2阴性表达的胰岛细胞可能在SARS-CoV感染后引起胰岛细胞中ACE2 阳性表达,但尚需进一步研究来验证这一推测。

总之,本研究通过对单细胞测序数据的数据分析提供了生物信息学证据,证明胰腺外分泌腺可能易受SARS-CoV-2 感染。该研究表明,那些感染COVID-2019的患者应跟踪并评估其胰腺外分泌腺功能,患者应定期监测康复后肿瘤发展的风险。

4 利益冲突

本文作者承诺本文不涉及任何利益冲突。

本研究所涉及的所有数据均可从EMBL-EBI(https://www.ebi.ac.uk/gxa/sc/home)及高通量基因表达数据库处获取(序列号:GSE131886)。

猜你喜欢
单细胞阳性细胞胰腺
依达拉奉右莰醇对大鼠液压冲击脑损伤模型的神经保护作用
大鼠永久性脑缺血后脑内Nestin 的表达变化
单细胞转录组测序技术在骨关节炎发病机制中的研究进展
《中华胰腺病杂志》稿约
CT,MRI诊断急性胰腺炎胰腺内外病变价值比较
核心素养背景下生物重要概念课例
胰腺超声检查
Ghrelin阳性细胞在食蟹猴消化系统中的分布定位
FOXO4和nNOS在星型胶质细胞瘤中的表达及意义
一种快速分离苹果果肉单细胞的方法