新型冠状病毒感染致造血损伤及潜在治疗药物的生物信息学分析

2020-10-14 06:50张钧栋杨波陈浩然王紫宁陈熙勐智鹏张皓旻迟小华郭斌王毅兴卢学春
解放军医学杂志 2020年9期
关键词:差异基因细胞系骨髓

张钧栋,杨波,陈浩然,王紫宁,陈熙勐,智鹏,张皓旻,迟小华,郭斌,王毅兴,卢学春*

1解放军医学院,北京 100853;2解放军总医院第二医学中心血液病科/国家老年疾病临床医学研究中心,北京 100853;3火箭军特色医学中心药剂科,北京 100088;4山西省心血管病医院人事科,太原 030024;5同济大学附属东方医院中医科,上海 200120

2019年12月,新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)开始暴发流行。截至2020年4月9日,WHO报道全球累计确诊病例1 356 780例,死亡79 385例[1]。COVID-19由新型冠状病毒(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)感染引起,发病初期表现为发热、干咳、腹泻等症状,随着病情进展,除肺炎外,重症及危重症患者还会合并心、肝、肾、造血系统(骨髓、脾、淋巴结)等多器官损害[2-5]。火神山医院收治的COVID-19患者的骨髓涂片显示,胸骨骨髓涂片中出现大量空泡,可能是由病毒直接破坏所致。此外临床研究发现,COVID-19患者出现血小板减少、淋巴细胞减少及D-二聚体升高,与病情加重及病死率高有关[6-8]。前期已经报道了大量关于COVID-19患者临床特征的资料,但针对COVID-19患者转录组及各系统/器官损伤机制的研究较少。本研究采用生物信息学方法分析预测SARS-CoV-2感染所致造血损伤及具有潜在治疗作用的药物,以期为临床救治SARS-CoV-2感染所致造血损伤提供理论依据。

1 资料与方法

1.1数据来源 检索基因表达数据库(g e n e expression omnibus,GEO),检索时间为建库至2020年4月8日,检索词为“SARS-CoV-2”,查看所有“series”,筛选至少包括3个生物学重复的人或小鼠细胞系的转录组数据,要求数据来源的实验设计思路清晰、数据质量好。详细查看所有数据的注释文件,确定数据样本类型和数量后进行后续分析。

1.2实验设计 本研究采用的数据集均为转录组表达谱矩阵。根据数据来源、实验描述以及样本类型,将数据类型设定为人肺腺癌肺泡基底上皮细胞系(A549)和正常人支气管上皮细胞系(NHBE)。在区分不同SARS-CoV-2感染细胞系的基础上,对SARS-CoV-2感染和未感染细胞系的转录组数据进行差异分析并开展后续研究。

1.3数据处理及差异表达基因分析 生物信息分析R语言程序包下载自Bioconductor(http://www.bioconductor.org)网站[9]。应用Bionconductor中的Impute程序包对表达谱进行归一化处理,使各个样本的数据归一化[10],同时应用Bionconductor中的注释包对数据进行注释,将探针比对到基因上,获得用于后续分析的表达谱。

应用Bionconductor中的Limma软件包筛选表达谱中不同细胞系的差异基因。首先以P<0.05进行初步筛选,然后应用Bonferroni算法校正假发现率(FDR)的原始P值并计算倍数变化(FC)[11]。差异基因的筛选标准为FDR<0.05,|log2FC|>1。差异结果保存用于后续分析。

1.4富集分析及关键基因的筛选 应用R语言中的ClusterProfiler软件进行基因本体论(Gene Ontology,G O)和京都基因与基因组百科全书(the Kyoto Encyclopedia of Genes and Genomes,KEGG;https://www.kegg.jp/kegg/pathway.html)富集分析[12-14]。 首先对筛选的差异基因进行聚类分析,聚类结果以P<0.05为阈值进行初步筛选,然后查阅文献筛选造血损伤相关信号通路,并提取富集在这些信号通路中的差异基因作为关键基因以进一步分析,最后应用R语言程序对结果进行可视化展示[15]。

1.5构建关键基因蛋白互作(protein-protein interaction,PPI)网络 应用STRING v9.1(http://www.stringdb.org/)开源数据库构建PPI网络[16]。为进一步研究重要基因的相互作用,使用STRING数据库预测上述关键基因编码蛋白的PPI网络,可靠性阈值>0.4。使用Cytoscape软件(http://cytoscape.org/)构建PPI网络[17]。在PPI网络中,每个节点代表基因、蛋白质或其他分子,节点之间的连线代表生物分子之间的相互作用。核心节点,即具有重要生物功能的蛋白质,通过计算蛋白质之间的连线数以及每个节点与特定节点有无直接连接来确定,并给出排名。应用Cytoscape软件提供的Cytohubba插件筛选前10名核心基因[18]。

1.6潜在治疗药物的筛选 利用基于“系统生物学”和“比较功能基因组学”理论设计的表观精准治疗预测平台(EpiMed)对上述关键基因进行多组学关联分析[19-20]。在已知化合物、临床常用药物中寻找能够有效调节SARS-CoV-2感染相关造血损伤的药物或化合物。选取负相关结果作为具有潜在治疗作用的药物,并以关联系数>0.1,P<0.05为阈值作为筛选条件。

2 结 果

2.1数据处理及差异基因表达分析 选用编号为GSE147507的A549细胞系和NHBE细胞系感染与未感染SARS-CoV-2的转录组数据。共筛选出差异基因222个,其中A549细胞系68个(上调58个、下调10个),NHBE细胞系154个(上调114个,下调40个,图1)。

图1 SARS-CoV-2感染的不同细胞系中差异基因表达分析Fig.1 Differential genes expression analysis of different cell lines infected by SARS-CoV-2

2.2GO、KEGG富集分析及关键基因的筛选 GO富集分析结果显示,差异基因主要富集于生物学进程、细胞成分、分子功能等3种类型。其中,在生物学进程方面,差异基因与Ⅰ型干扰素反应、细胞周期调节、炎性细胞迁移及先天免疫反应有关;在细胞成分方面,与血液微粒和囊泡分泌有关;在分子功能方面,大多与细胞因子的生成、趋化因子及其受体和生长因子有关(图2)。KEGG富集分析结果显示,差异基因显著富集于病毒感染、心肌损伤、补体及凝血级联、细胞趋化、血小板活化、急性炎症、免疫反应、细胞信号转导等相关信号通路 (图3)。

依据P<0.05对富集分析结果初步筛选得到176个GO富集结果及KEGG通路,随后查阅文献筛选出造血损伤相关信号通路28条,从中提取关键基因117个。聚类分析结果显示,SARS-CoV-2感染后,可以调节炎性因子迁移、补体及凝血级联反应、血小板活化以及造血谱系等相关基因的表达,从而引起造血系统相关信号通路的改变(图4-6)。

2.3构建关键基因PPI网络 应用STRING在线数据库对28条造血损伤相关信号通路中的117个关键基因进行PPI网络构建,如图7所示,其中109个关键基因编码的蛋白出现在PPI网络中,排名前10名的核心基因为STAT1、IL-6、IRF7、TNF、MX1、ISG15、IFIH1、IRF9、DDX58和GBP1。

2.4潜在治疗药物的筛选 应用EpiMed平台进行疾病-药物关联分析,结果显示,SARS-CoV-2感染相关疾病除传染性疾病与严重急性呼吸综合征(severe acute respiratory syndrome,SARS)外,还包括与造血系统相关的疾病,如骨髓纤维化、骨髓异常增生综合征、急性早幼粒细胞白血病和贫血等(表1)。药物分析共获得66个中药结果,42个西药化合物结果,依据|关联系数|>0.1、P<0.05对负相关药物进行筛选,关联系数前10名药物如表2 所示。

3 讨 论

图2 SARS-CoV-2感染相关的全基因组GO富集分析结果Fig.2 Results of GO enrichment analysis

图3 SARS-CoV-2感染相关的全基因组KEGG富集分析结果Fig.3 Results of KEGG enrichment analysis

图4 SARS-CoV-2感染所致造血损伤补体及凝血级联信号通路Fig.4 Complement and coagulation cascade signal pathway

图5 SARS-CoV-2感染所致造血损伤血小板活化信号通路Fig.5 Platelet activation signal pathway

图6 SARS-CoV-2感染所致造血损伤造血谱系相关信号通路Fig.6 Hematopoietic cell lineage signal pathway

图7 SARS-CoV-2感染所致造血损伤关键基因蛋白相互作用网络(A)及排名前10名的核心基因(B)Fig.7 Key gene protein interaction network and top 10 core genes

S A R S-CoV-2 是一种正链R N A 病毒,其与SARS-CoV的体内结合蛋白均为血管紧张素转换酶2(angiotensin-converting enzyme 2,ACE2)[21]。虽然二者感染后引起的临床症状不完全相同,但均会引起白细胞、血小板、淋巴细胞减少,以及D-二聚体升高,而且这些表现通常与感染患者病死率高关系密切[22-23]。因此,通过对SARS-CoV-2感染所致造血损伤和治疗药物的生物信息学分析及预测,可为治疗COVID-19患者贫血、血小板减少、淋巴细胞减少和D-二聚体升高提供指导和借鉴。本研究分析SARS-CoV-2感染细胞系的全基因组表达谱发现,SARS-CoV-2感染后,大量凝血级联反应、急性炎症相关信号通路被高度激活,趋化因子、IL-1β、IL-6、TNF等炎症关键基因高度表达,与自身免疫调控相关的基因如METTL7A和造血干细胞分化相关的基因如MIR221、POU2AF1等则降低表达。

表1 EpiMed平台疾病相关联分析结果Tab.1 Analysis of disease association on EpiMed platform

表2 EpiMed平台疾病-药物相关联分析药物筛选结果Tab.2 Analysis of disease-drug association on EpiMed platform and drug screening results

研究发现,COVID-19重症患者血浆炎性因子水平显著高于轻症患者,且淋巴细胞减少较轻症患者更加显著,差异有统计学意义[22]。本研究KEGG富集分析发现,差异基因显著富集于大量炎症信号通路如TNF、NF-κB、JAK-STAT等。提示SARSCoV-2感染人体后可能导致机体免疫失衡,产生“炎性因子风暴”,进而出现各种临床症状和造血系统受损表现。早在20世纪90年代已有研究指出,病毒可以直接感染并破坏人体骨髓导致造血异常[24-25]。 SARS感染的死亡患者的病理检查发现,除弥漫性肺泡损伤外,淋巴结和脾脏均出现出血性坏死和淋巴细胞减少[26]。Yang等[27]研究发现,SARS-CoV可通过CD13或CD66a直接感染造血细胞和骨髓基质细胞,导致造血异常和血小板减少。使用EpiMed平台进行疾病相关联分析发现,除传染性疾病和SARS外,与SARS-CoV-2感染相关的造血系统疾病中关联度最高的为骨髓纤维化,这可能是由于SARS-CoV-2感染后JAK-STAT信号通路异常激活造成的,同时提示SARS-CoV-2对骨髓的直接损伤作用。临床研究发现,D-二聚体升高是COVID-19患者死亡的独立危险因素[28],本研究也发现补体及凝血级联反应相关通路的高度活化,提示高凝状态下血小板的过度消耗可能是导致血小板减少的原因。作为成熟巨核细胞释放血小板的部位,SARS-CoV-2感染肺部后造成的急性肺损伤不仅会抑制血小板的释放,还会通过炎性因子大量破坏血小板[29]。此外,SARS-CoV-2可能诱导自身抗体和免疫复合物对血小板造成免疫损伤。由此可见,SARS-CoV-2感染后不仅可以直接破坏造血细胞和骨髓基质细胞,且可通过诱导免疫反应对造血系统造成损伤。因此,治疗SARS-CoV-2感染所致造血损伤不仅要清除病毒在体内的复制,同时应修复COVID-19患者异常基因的表达,为恢复患者的造血功能提供正常的免疫微环境。研究表明,结合系统生物学方法如表观基因组、转录组和蛋白质组数据,可提供一种数据集成方法,以识别宿主在感染病毒后发挥关键作用的调控基因组簇和区域[30]。本研究团队在基于系统生物学和临床生物信息学的基础上,率先提出“整合多组学分析”的方法并建立了EpiMed表观精准治疗平台,基于该平台优化了6种血液病治疗方案[19,31]。本研究通过EpiMed平台对疾病相关联分析发现,骨髓纤维化、骨髓异常增生综合征、急性早幼粒细胞白血病和贫血都与SARS-CoV-2感染具有相关性。虽然这种相关性可能是由于SARS-CoV-2感染后相关信号通路发生改变造成的,但表明了SARS-CoV-2感染确实会造成造血系统损伤。

本研究药物相关联分析发现,大部分药物均为免疫调节类药物,如冬凌草、西罗莫司、糖皮质激素、鱼腥草、何首乌、赤芍、维甲酸、甘草、环孢素A、氟伐他汀等,可通过恢复患者正常的免疫微环境从而达到治疗SARS-CoV-2感染所致血液系统损伤的作用。糖皮质激素作为一种被广泛用于治疗多种炎症性疾病的药物,不仅可以降低机体炎性因子水平,减轻免疫损伤,且可诱导造血干细胞归巢,加速造血功能恢复[32]。Xu等[4]结合COVID-19患者的尸检结果,建议对重症患者早期行糖皮质激素介入治疗。研究发现,作为临床治疗高脂血症的常用药物,氟伐他汀在影响流感病毒RNA及蛋白质复制的同时可抑制TNF-α、IL-6及γ干扰素的产生, 从而保护宿主细胞免受病毒诱导产生的炎性因子损害[33]。西罗莫司和环孢素A作为免疫调节剂广泛应用于免疫性血小板减少症患者且效果显著[34-35]。冬凌草为唇形科香茶属植物碎米桠的干燥地上部分,具有清热解毒、活血止痛等作用[36]。研究发现,冬凌草除用于治疗髓系白血病外,还具有抑制炎症、调节Th1/Th2分化,以及改善机体免疫微环境的作用[37-39]。覃小兰等[40]发现,丹参、赤芍可显著改善登革热病毒感染患者的血小板减少。甘草兼具抗肿瘤与提高免疫力的作用,可明显改善肿瘤患者血小板和淋巴细胞减少[41]。

总之,从2003年的SARS-CoV到目前的SARSCoV-2,尚未发现针对冠状病毒的特效药物。目前针对病毒造成的机体多器官或多系统损伤,临床多采取对症治疗。本研究通过分析SARS-CoV-2感染后机体全基因组表达谱的变化,为更加深入和全面地认识SARS-CoV-2感染相关造血系统损伤提供了新的视角,同时基于感染后造血系统基因表达谱的特征,预测出潜在治疗药物。虽然以上预测药物尚未经体外实验验证,但均为已在临床广泛使用的经典药物,在安全性得以保障的前提下可直接开展小规模临床试验进行验证。截至目前,本研究为国内首次针对SARS-CoV-2宿主转录组数据开展的研究,从全基因组角度研究冠状病毒感染,探索冠状病毒感染后机体微环境的变化,为防治新生病毒引发的疾病提供了一种新的研究方法。当疫情在短时间内突然暴发时,通过宿主转录组学研究,可在短期内获得有价值的数据,对新生病毒的致病机制研究和早期控制具有指导意义。

猜你喜欢
差异基因细胞系骨髓
骨髓18F-FDG摄取模式在初诊弥漫大B细胞淋巴瘤诊断骨髓浸润的价值
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
骨髓中缺氧诱导因子1α和血小板衍生生长因子B在骨髓增生异常综合征的表达
赞美骨髓
紫檀芪处理对酿酒酵母基因组表达变化的影响
JAK2V617F基因突变在骨髓增殖性肿瘤诊断中的应用
GCF低表达宫颈癌HeLa细胞系的构建及辐射对其调控IER5基因表达的初步探究
E3泛素连接酶对卵巢癌细胞系SKOV3/DDP顺铂耐药性的影响
SSH技术在丝状真菌功能基因筛选中的应用
七叶皂苷钠与化疗药联合对HT-29 结肠癌细胞系的作用