基于GEO数据库筛选稳定性心绞痛患者外周血关键差异基因及诊断模型构建

2022-12-07 02:08侯芳霞马美娟刘富强唐治国
现代检验医学杂志 2022年6期
关键词:差异基因外周血冠脉

侯芳霞,刘 琳,张 维,方 凤,齐 婷,马美娟,刘富强,唐治国

(陕西省人民医院心血管内一科,西安 710068)

冠心病是严重危害人类健康的疾病,据《中国心血管健康与疾病报告2019》报道[1],我国估计现有冠心病患者1 139万,给社会和家庭带来了沉重的负担。慢性稳定性心绞痛是冠状动脉固定性严重狭窄基础上,由于心肌负荷的增加引起的心肌急剧、短暂的缺血缺氧临床综合征,即慢性冠脉综合征,是冠心病最常见的类型[2]。然而由于慢性心绞痛与急性冠脉综合征相比,症状较轻、心肌酶等心肌特异性损伤标记生化指标不高,很容易被患者和医生忽视,失去早期治疗的机会,进而导致病情恶化形成急性心肌梗死。因此早期识别稳定性心绞痛对冠心病的预后有着重要的意义。经典诊断稳定性心绞痛主要依赖于有关冠状动脉造影术及冠状动脉CT,这些检查因有创、费用高等不易被患者接收,基于外周血细胞能对稳定性冠心病进行早期诊断有着广阔的前景。本研究拟基于基因表达综合(Gene Expression Omnibus,GEO)数据库采用生物信息学方法对稳定性心绞痛患者外周血基因表达谱芯片进行分析,获取稳定性心绞痛外周血表达谱特征,筛选关键差异表达基因作为潜在的分子标记物,并以关键基因为变量构建Nomogram诊断预测模型,为稳定性心绞痛的早期诊断提供新思路。

1 材料与方法

1.1 资料来源 从美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)的GEO数据库中(https://www.ncbi.nlm.nih.gov/geo/)下载GSE98583数据集。该数据集包括12例稳定性心绞痛患者(排除糖尿病)和6例正常受试者外周全血表达谱数据,所有患者均行冠脉造影证实冠脉情况。所采用表达谱芯片为Affymetrix Human Genome U133A 2.0 Array,平台为GPL571。所有数据均可在网上免费获得。本项目是对在线数据库再分析,不涉及伦理问题。

1.2 方法

1.2.1 分析差异表达基因:采用R studio4.1.0软件对下载的基因表达谱数据进行标准化,再采用limma 包分析差异基因 (differential expression genes,DEGs)进行筛选[3],筛选标准为同时满足:①P<0.05;②组间差异表达倍数(fold change)≥ 2.0。使用ggplot2和pheatmap包对差异基因进行火山图和热图展示。

1.2.2 差异基因功能富集分析:使用R studio4.1.0软件clusterProfiler包对获取的差异基因进行基因本体(Gene ontology, GO)富集分析和KEGG 通路分析,基于Benjamini-Hochberg理论对P值进行排序和多重校正,以FDR(false discovery rate, 伪发现率)<0.05为显著性的阈值[4]。选择GO注释条目下的生物学过程(biological process,BP)细胞成分(cellular component,CC)以及分子功能(molecular function,MF)对DEGs进行注释。

1.2.3 关键基因筛选:利用STRING v10在线分析平台(https://string-db.org/)构建蛋白-蛋白交互作用(PPI)网络关系,导出PPI网络关系tsv数据[5]。通过Cytoscape 3.8.0软件实现蛋白网络的可视化,同时使用其cytoHubba插件,计算PPI网络的拓扑特征,用于计算每个蛋白节点的程度,根据中心性分值的高低,前10位基因认为是中心基因[6]。

1.3 统计学分析 差异表达基因分析采用非配对Wilcox检验,差异表达基因分析及富集分析中的P值经过BH(Benjamin and Hochberg)法校正得到FDR值。根据确定核心基因,通过R软件中的RMS包进行Logistic回归,并建立冠心病稳定型心绞痛的Nomogram模型。所有统计分析均在R软件(https://www.r-project.org/)中实现,除差异表达分析及富集分析外,双侧P<0.05为差异有统计学意义。

2 结果

2.1 稳定性心绞痛外周血差异表达基因筛选 火山图(图1A)所示,与正常受试者外周血基因表达相比,稳定性心绞痛患者有303个差异表达基因,其中上调基因160条,下调基因43条,使用前40条差异基因热图(图1B)显示,差异基因可明显将稳定性心绞痛患者和正常受试者区分开,说明稳定性心绞痛患者和正常受试者外周血表达谱存在明显差异。

图1 稳定性心绞痛患者与正常受试者差异基因的火山图(A)和热图(B)

2.2 差异基因富集分析 见图2。将303条差异基因使用R软件clusterProfiler包进行GO富集分析发现,在生物学过程中神经递质转运、突触传递、神经肽类信号通路等明显富集(图2A);在细胞成分中,差异基因集中在质膜、细胞外基质、突触膜等位置(图2B);在分子功能方面,主要富集在细胞外配体门控离子通道活性、突触后神经递质受体活性、神经递质结合等方面(图2C)。KEGG通路分析显示差异表达基因主要参与神经递质配体受体相互作用、脂肪吸收消化、钙调节信号通路、PI3K-Akt 通路、NF-kappa B通路及氧化磷酸化等通路(如图2D)。

图2 差异基因的富集分析

2.3 关键基因筛选 见图3。我们对差异基因进行了蛋白互作PPI网络构建,该网络包含152个点,258条边,我们采用Cytohubba插件的NCC算法进一步分析,筛选出10个关键基因BDNF,GFAP,SYN1,NES,PLG,HPGDS,KCNC1,APOA4,AMBP和TJP1。颜色由红至黄逐渐改变,表示得分逐渐降低。

图3 差异基因蛋白

2.4 基因Nomogram预测诊断模型的建立 见图4。我们使用10个关键基因BDNF,GFAP,SYN1,NES,PLG,HPGDS,KCNC1,APOA4,AMBP和TJP1变量构建Nomogram模型,根据某患者每个变量实际情况找到其对应的刻度,向上投射到顶部的标尺(Points)即可得出每个变量的分值,分值相加即为总分值(total points),根据总得分值向下投射即可得到该患者诊断概率。从图4我们可以看出在10个关键基因中,BDNF,HPGDS表达水平在模型中的权重明显较其他基因高。

图4 Nomogram预测冠心病诊断模型

3 讨论

近年来随着基因芯片技术的成熟以及生物信息学的迅猛发展,对复杂疾病样本进行高通量分析,己成为当前揭示疾病发病机制及发现新的分子标记物常用的手段。GEO数据库隶属于美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI),免费提供微阵列及其他形式的高通量数据,还提供可以完全注释原始数据和经处理数据的基本信息,支持对原始数据、处理后的数据和原数据的存档,是目前全球最大、最全面的公共基因表达资源[3]。数据共享平台能提供给研究人员详实、可信度高的第一手资料,我们可以通过科学的算法和严谨的统计学分析,借助合理的生物信息学分析,进而帮助我们从大样本数据中筛选出关键基因,从而揭示基因在疾病发生和发展过程中的重要作用,并鉴定生物标志物来精确地预测早期诊断、预后判断并为疾病提供潜在的治疗靶点[4-5]。本研究基于GEO数据库分析比较稳定性心绞痛患者和正常受试者外周血基因表达谱,发现两组外周血表达谱存在明显差异,筛选出303个明显差异表达基因,并筛选出10个关键基因,这为无创外周血生物标记物早期识别稳定型心绞痛提供思路。

脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)是1982年BARDE等首先在猪脑中发现的一种具有神经营养作用的蛋白质。BDNF由小分子二聚体蛋白质构成,通过与原肌球蛋白激酶受体B以及p75神经生长素受体结合后维持神经元分化和存活,促进轴突生长,并参与调节突触可塑性。越来越多研究显示,BDNF也存在于心脏、肺、脾脏、骨骼肌等器官,同时巨噬细胞、淋巴细胞、内皮细胞和平滑肌细胞中也有表达,且BDNF通路对心血管系统的发育及诱导其对缺血损伤的反应至关重要。ZIEROLD等[6]研究显示巨噬细胞、平滑肌细胞和成纤维细胞是粥样硬化斑块中BDNF 的主要来源,BDNF 可能通过激活冠脉 NADPH 酶系来诱导氧化应激导致斑块不稳定。人群研究发现血浆BDNF 浓度与三酰甘油、低密度脂蛋白-胆固醇和纤维蛋白原水平、糖尿病状态、年龄呈负相关,与心绞痛患者血浆高密度脂蛋白-胆固醇水平和血小板计数呈正相关[7]。与此同时,JIN等[8]研究发现循环中BDNF水平对稳定性心绞痛识别有重要的诊断价值,ESMAEILI等[9]报道BDNF水平与冠脉病变严重程度呈正相关。同时BDNF 与微血管性心绞痛和冠脉钙化也有着密切关系[10-11],更有人群队列研究发现BDBF水平可作为冠心病发生和全因死亡率的四年独立预测因子,低血浆 BDNF水平可能与未来的冠状动脉事件和这些患者的死亡有关[12]。与既往研究结果一致,本研究也显示稳定性心绞痛外周血BDNF表达与正常受试者存在明显差异,有望成为稳定性心绞痛潜在的诊断分子标记物。

造血前列腺素 D 合成酶(hematopoietic prostaglandin D synthase,HPGDS)是一种 sigma 类谷胱甘肽-S-转移酶家族成员,该酶催化前列腺素H2(prostaglandin H2,PGH2)向前列腺素 D2 (prostaglandin D2,PGD2)的转化,并在免疫系统和肥大细胞的前列腺素的生产中起作用。PGD2是一种来源于花生四烯酸代谢的关键脂质介质,通过其受体促进炎症的消退和调节T细胞功能,进而参与了心血管疾病包括动脉粥样硬化、高血压、肺部高压腹主动脉瘤以及其他代谢性疾病等的形成[13-14]。最近有学者发现PGD2可以通过其受体DP1/DP2促进血管平滑肌细胞表型转化进而导致动脉粥样硬化的形成[15]。作为PGD2的调解酶HPGDS在心血管疾病中的角色尚未被报道,本研究通过生物信息学方法发现HPGDS在稳定性心绞痛患者中高表达,同时在构建的Nomogram预测诊断模型中权重较高,提示其在稳定性心绞痛诊断过程中可能有潜在的诊断价值。

总之,本研究基于GEO数据库进行生物信息学分析,发现稳定性心绞痛患者和正常受试者外周血基因表达谱存在明显差异,同时发现BDNF和HPGDS为代表的关键基因可能成为稳定性心绞痛的潜在的诊断分子标记物。但由于样本人群少且为非亚裔人群,有待于今后进一步扩张人群样本进行验证。

猜你喜欢
差异基因外周血冠脉
外周血B细胞耗竭治疗在狼疮性肾炎中的应用进展
心肌缺血预适应在紫杉醇释放冠脉球囊导管扩张术中的应用
冠脉CTA在肥胖患者中的应用:APSCM与100kVp管电压的比较
256排螺旋CT冠脉成像对冠心病诊断的应用价值
冠脉CT和冠脉造影 该怎样选
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
白血病外周血体外诊断技术及产品
结肠炎小鼠外周血和结肠上皮组织中Gal-9的表达
慢性荨麻疹患者外周血IL-17和IL-23的表达及临床意义