心房颤动患者人成纤维细胞的单细胞RNA序列的生物信息学分析

2023-05-26 19:25周科向杰张长江张莉
中国现代医生 2023年9期
关键词:生物信息学分析心房颤动

周科 向杰 张长江 张莉

[摘要] 目的 筛选心房颤动(atrial fibrillation,AF)促纤维化的关键基因及信号通路,探讨AF诱导的人心房成纤维细胞的促纤维化重塑的分子机制。方法 从公共基因数据库(gene expression omnibus,GEO)下载单细胞RNA序列表达谱GSE148506,通过主成分分析和T分布式随机邻接嵌入得到差异基因,利用SingleR软件包进行细胞类型注释和轨迹分析,使用clusterprofiler软件包,对成纤维细胞的差异基因进行基因本体(gene ontology,GO)功能富集分析和京都基因与基因组百科全书(kyoto encyclopedia of genes and genome,KEGG)信号通路分析。利用在线STRING数据库和Cytoscape软件进行蛋白质相互作用网络和模块分析。利用插件cytoHubba筛选出关键基因。结果 共得到6个细胞类型注释群,包括成纤维细胞、脂肪细胞、内皮细胞、单核细胞、成纤维细胞、骨骼肌细胞。共鉴定出367个成纤维细胞差异基因,包括37个下调基因和330个上调基因。GO功能富集分析结果显示,成纤维细胞的差异基因生物过程主要富集于细胞外基质组织等;细胞组成主要富集于含胶原细胞外基质等;分子功能主要富集于细胞外基质结构成分等。KEGG信号通路分析表明,差异基因主要富集于黏着斑、细胞外基质-受体相互作用等。STRING分析从蛋白质网络互作图中鉴定出6个成纤维细胞关键基因,即FN1、TIMP1、LAMB1、FBN1、C3、VCAN。结论 利用生物信息学分析,鉴定出FN1、TIMP1、LAMB1、FBN1、C3、VCAN在内的基因及黏着斑、细胞外基质-受體相互作用、磷脂酰肌醇3激酶-蛋白酶信号通路和转化生长因子-β信号通路可能是AF诱导的人心房成纤维细胞促纤维化重塑的重要分子机制。

[关键词] 心房颤动;单细胞RNA序列;人心房成纤维细胞;生物信息学分析

[中图分类号] R541.7      [文献标识码] A      [DOI] 10.3969/j.issn.1673-9701.2023.09.001

Bioinformatics analysis of single-cell RNA-seq of atrial human fibroblasts with atrial fibrillation

ZHOU Ke, XIANG Jie, ZHANG Changjiang, ZHANG Li

Cardiology Department, Affiliated Minda Hospital of Hubei Minzu University, Enshi 445000, Hubei, China

[Abstract] Objective To screen key genes and signaling pathways for pro-fibrosis in atrial fibrillation (AF) and explore the molecular mechanisms of AF-induced pro-fibrotic remodeling in human atrial fibroblasts. Methods Single-cell RNA-seq (scRNA-seq) expression profile GSE148506 (AF and SR fibroblasts), was downloaded from the gene expression omnibus (GEO) database. The marker genes were obtained by quality control and data filtering, principal component analysis and t-distributed stochastic neighbor embedding. SingleR package was utilized for cell type annotation and trajectory analysis. By using the clusterprofiler package, the marker genes of fibroblasts were performed through gene ontology (GO) and Kyoto encyclopedia of genes and genomes (KEGG) pathway analysis. Protein-protein interaction network analysis and module analysis was performed using the STRING database and Cytoscape software. The hub genes were screened out by utilizing the plug-in cytoHubba. Results 6 clusters of cell type annotations were obtained, included fibroblasts, adipocytes, endothelialcells, monocytes, fibroblasts, skeletal muscle. A total of 367 fibroblasts marker genes were identified, included 37 down-regulated and 330 up-regulated genes. GO functional enrichment analysis results showed that the marker genes for fibroblasts were predominantly enriched for extracellular matrix organization for biological process; collagen-containing extracellular matrix for cellular component; and extracellular matrix structural constituent for molecular function. KEGG pathway analyses indicated that the marker genes were meaningfully enriched in Focal adhesion, extracellular matrix (ECM)-receptor interaction, and so on. Top 6 hub genes of fibroblasts included FN1, TIMP1, LAMB1, FBN1, C3, VCAN. Conclusion Using bioinformatics analysis, we identified genes including FN1, TIMP1, LAMB1, FBN1, C3 and VCAN and Focal adhesion, ECM-receptor interactions, PI3K-AKT signaling pathway and transforming growth factor-β signaling pathway as possible important molecular mechanisms of pro-fibrotic remodeling in human atrial fibroblasts in AF.

[Key words] Atrial fibrillation; Single-cell RNA-seq; Atrial human fibroblasts; Bioinformatics analysis

心房颤动(atrial fibrillation,AF)是临床上常见的心律失常类型之一,其发病率的增加与许多因素有关,如高血压、糖尿病、肥胖、吸烟等,导致心房结构和组织病理学的改变,从而增加对AF的易感性[1]。目前观点认为,心房纤维化会刺激心房结构的重塑,从而导致AF的发生和维持[2]。研究表明,AF患者纤维组织的含量和分布与AF发生的机制、并发症和治疗失败的风险有关[3]。成纤维细胞被认为是心肌中丰富的非肌细胞群,它控制着细胞外基质的组成和结构[4]。成纤维细胞占心脏细胞数量的75%,但仅占其质量的10%~15%[5]。因此,通过成纤维细胞可更好地了解AF发生、发展的分子机制并发现抗心律失常干预的新靶点。单细胞RNA测序(single-cell RNA-seq,scRNA-seq)可在细胞分子水平上全面分析AF的发生机制,AF的遗传学非常复杂,罕见和常见的突变均会增加对AF的易感性[6]。尽管许多研究已通过微阵列分析获得与AF相关的潜在基因和通路,但目前对AF患者成纤维细胞scRNA-seq的研究较少。本研究通过成纤维细胞的scRNA-seq数据分析,利用AF和窦性心律(sinus rhythm,SR)样本的成纤维细胞以评估AF中的差异基因和潜在信号通路,现报道如下。

1  材料與方法

1.1  scRNA-seq数据

筛选公共基因数据库(gene expression omnibus,geo)(http://www.ncbi.nlm.nih.gov/geo/)中所有AF成纤维细胞的scRNA-seq表达数据集后,选择GSE148506进行分析,它来自GPL18573平台Illumina NextSeq 500(Homo sapiens),包括4个AF和4个SR的384个样本的表达谱。

1.2  PCA和T-SNE分析

主成分分析(principal component analysis,PCA)和T分布式随机邻接嵌入(t-distributed stochastic neighbor embedding,T-SNE)被用于数据的降维处理。由于原理和机制不同,T-SNE保留的属性信息更具代表性,反映样本间差异,但T-SNE速度较慢,PCA速度相对较快。

1.3  差异基因

经T-SNE分析后得到不同聚类,将|log (fold change)|>2和P<0.05作为筛选标准寻找每个聚类的差异基因。

1.4  细胞类型注释和轨迹分析

SingleR是一种计算方法,将单细胞转录组与参考转录组数据集相关联,并迭代改进其推断,可用于改进scRNA-seq中的细胞类型注释。Monocle工具被用于分析细胞分化轨迹,以转录数据为基础,使用模型预测细胞进化/分化过程。

1.5  GO和KEGG通路富集分析

使用R软件包Clusterprofler比较基因簇之间的生物学特性,利用其进行基因本体(gene ontology, GO)分析探讨差异基因的生物学功能,并进行京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路分析以确定差异基因富集的信号通路。

1.6  蛋白互作网络分析

使用在线STRING数据库(https://string-db.org/)预测差异基因的蛋白互作网络信息,相互作用论证的最高置信度设定>0.7。利用Cytoscape(3.7.1版)软件对蛋白互作网络进行可视化分析。通过使用cytoHubba插件最大克里尔中心度和度识别关键基因,包括利用Cytoscape软件的分子复合体检测(molecular complex detection,MCODE)插件寻找整个网络的模块,参数设置:度值=2,节点得分值=0.2,k-core=2,最大深度=100。

2  结果

2.1  PCA和T-SNE分析

经PCA分析得到一系列主成分(principal component,PC),见图1。实际PC关键基因与理论基因的差异显示见图2。选择前20个PC进行T-SNE分析,得到6个聚类。不同细胞群中基因的表达情况见图3。各聚类中6个关键基因表达水平的小提琴图见图4A;T-SNE中6个关键基因表达水平的散点图见图4B;各聚类中6个关键基因表达水平的气泡图见图4C。关键基因的表达主要集中在聚类0和4,选择聚类0和4(成纤维细胞群)的差异基因进行分析。

2.2  细胞类型注释和轨迹分析

共得到6个聚类的细胞类型。聚类0,成纤维细胞;聚类1,脂肪细胞;聚类2,内皮细胞;聚类3,单核细胞;聚类4,成纤维细胞;聚类5,骨骼肌细胞。6个聚类细胞类型的轨迹分析见图5。

2.3  差异基因

聚类0中共鉴定出242个标记基因,包括205个上调的差异基因和37个下调的差异基因;聚类4中共鉴定出125个上调的差异基因,聚类4中未筛选出下调的差异基因。

2.4  GO和KEGG通路富集分析

GO功能富集分析结果显示,成纤维细胞的差异基因生物过程主要富集于细胞外基质组织、细胞外结构组织、结缔组织;细胞组成主要富集于含胶原细胞外基质、基底膜、内质网腔;分子功能主要富集于细胞外基质结构成分、糖胺聚糖结合、肝素结合。GO富集度前5位的基因及其相关基因见图6A、6B。KEGG信号通路分析表明,差异基因主要富集于黏着斑、细胞外基质-受体相互作用、血管平滑肌收缩、磷脂酰肌醇3激酶(phosphatidylinositide 3-kinases,PI3K)-蛋白激酶B(protein kinase B,AKT)信号通路(PI3K-AKT)、蛋白质消化吸收等,前5个KEGG信号通路及其相关基因见图6C、6D。

2.5  蛋白互作网络、关键基因和模块分析

使用STRING数据库,创建一个蛋白互作网络探讨这些差异基因的生物学特性,包含343个节点和786条边。使用Cytoscape-cytoHubba插件,通过最大克里尔中心度和度值的方法筛选出6个关键基因,即FN1、TIMP1、LAMB1、FBN1、C3和VCAN。

3  讨论

AF是一种日趋严重的临床疾病,遗传学特征复杂,罕见和常见的基因突变均可极大地增加AF的易感性。近年来生物信息学取得较大进步,随着基因芯片技术的快速发展,基因芯片技术在心血管临床和研究中得到广泛应用。因此,应用生物信息学方法进一步探讨AF的发病机制非常重要,有助于在遗传水平上发现预防和治疗AF的新靶点。本研究中,被鉴定出的关键基因和信号通路在AF的研究中已有少量报道,表明综合生物信息学分析的结果具有重要作用。

结构重塑、电重塑和收缩性重塑在AF的发展和维持中起着关键作用。结构重塑取决于两个部分:一是细胞结构变化,二是细胞外基质分布不平衡[7-8]。大量研究表明,AF的存在与细胞外基质沉积和降解平衡关系的破坏与心房重塑之间存在着极大的相关性[8]。本研究发现,这些差异基因主要富集在与细胞外基质有关的生物过程中。心肌成纤维细胞主要参与心肌重塑,单核细胞在心肌梗死诱发的炎症期间的心脏重塑中也发挥重要作用[9]。此外,在炎症和伤口愈合期间,诱发的心脏纤维化与单核细胞亚群有关,这些证据表明,单核细胞与AF密切相关[10]。根据细胞轨迹分析结果显示,单核细胞和成纤维细胞相互毗邻。金属蛋白酶组织抑制剂1(tissue inhibitor of metalloproteinases-1,TIMP-1)基因通过控制基质金属蛋白酶(matrix metalloproteinases,MMPs)的活性在细胞外基质重塑中发挥重要作用。研究表明,血浆和组织中TIMP-1水平的升高与心肌纤维化和舒张功能障碍有着密切的联系[11]。同时,TIMP-1对AF的病理生理学有重大影响,而这种影响是由MMPs和TIMPs间的不平衡所致[12]。Nakano等[13]发现MMP-9在AF患者的心房组织中高度表达,可能导致AF期间心房结构重塑和心房扩张,因此,本研究结果进一步表明,TIMP-1/MMPs信号通路是治疗AF心房重塑和纤维化的潜在目标。

纤连蛋白1(fibronectin 1,FN1)属于细胞外基质的糖蛋白家族,广泛存在于各种类型的细胞中,与细胞的黏附和迁移过程密切相关,通过整合素跨膜受体参与病理生理过程变化[14-15]。Dong等[16]发现在心肌纤维化重塑和衰竭过程中,成纤维细胞的FN1表达显著增加。本研究发现,FN1主要富集在黏着斑、细胞外基质-受体相互作用和PI3K-AKT信号通路上,FN1通过影响PI3K/AKT信号传导调节细胞的生物学特性,通过阻断PI3K-AKT的激活抑制FN1基因的表達,抑制细胞增殖,促进细胞衰老和凋亡,并减少细胞迁移和侵袭[17]。

通过KEGG信号通路分析,发现肌原纤维蛋白-1(fibrillin-1,FBN-1)明显富集于转化生长因子-β(transforming growth factor-β,TGF-β)信号通路中。TGF-β被认为是心房纤维化的一个主要介质,而TGF-β过度表达模型在体外或体内研究心房纤维化和AF的发病机制已被广泛认可[18-19]。

总之,利用AF和SR患者成纤维细胞的scRNA-seq数据,确定与AF相关的差异表达基因,从而在基因水平上探讨AF发生的机制。FN1、TIMP1、LAMB1、FBN1、C3和VCAN在内的基因及黏着斑、细胞外基质-受体相互作用、PI3K-AKT信号通路和TGF-β信号通路有可能成为AF的新生标志物,并可能成为AF的潜在治疗目标。

[参考文献][1] STAERK L, SHERER J A, KO D, et al. Atrial fibrillation: Epidemiology, pathophysiology, and clinical outcomes[J]. Circulation Research, 2017, 120(9): 1501.

[3] ZAHID S, COCHET H, BOYLE P M, et al. Patient- derived models link re-entrant driver localization in atrial fibrillation to fibrosis spatial pattern[J]. Cardiovascular Research, 2016, 110: 443–454.

猜你喜欢
生物信息学分析心房颤动
斑节对虾金属硫蛋白全基因DNA克隆及生物学信息分析
雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析
11例非瓣膜性心房颤动患者行左心耳封堵术后的护理
高龄非瓣膜病性房颤应用华法林抗凝治疗的疗效及安全性研究
ACS合并心房颤动患者的抗栓治疗研究进展
经食道超声对射频消融术前房颤患者左房及左心耳血栓的诊断价值
杂交手术治疗心房颤动的研究进展
西瓜食酸菌CusB蛋白的生物信息学分析
羊种布氏杆菌3型Omp25基因序列及其表达蛋白生物信息学分析
西藏牦牛NGB基因克隆及生物信息学分析