戴永刚,程世亮,王珏,钱景荣,王洪亚
山东省立第三医院检验科,济南 250031
葡萄膜炎又称色素膜炎,是虹膜、睫状体及脉络膜组织炎症的总称,可引起严重的并发症和后遗症,是主要的致盲原因之一[1]。按发病部位可分为前葡萄膜炎、中间葡萄膜炎、后葡萄膜炎,按临床表现可分为浆液性葡萄膜炎、纤维素性葡萄膜炎、化脓性葡萄膜炎及肉芽肿性葡萄膜炎。葡萄膜炎的病因复杂,一般分为外因和内因两个方面。其中,外因包括外伤、理化损伤或邻近组织疾病蔓延引起;内因归结于两大类,一类是各种病原体感染,主要是细菌或真菌感染,另一类是自身免疫性疾病,并与HLA-B27阳性以及中枢骨关节病如强直性脊柱炎有关[2]。外周血白细胞在细胞免疫中具有重要作用,并与自身免疫性葡萄膜炎(AU)的发生密切相关[3]。因此,本研究选择HLA-B27 阳性的AU 患者作为研究对象。转录组学是从RNA 水平上研究基因的表达,其利用高通量测序技术对组织或细胞中全部mRNA反转录后的cDNA 分子进行测序,从而全面快速获得某一特定样本特定时间内几乎所有的mRNA 序列信息。该技术可解决转录图谱的绘制、基因差异表达模式、可变剪切调控、代谢途径、基因家族鉴定及进化分析等方面的问题。随着大规模基因测序、人工智能、各种云平台分析的应用,转录组学可研究疾病在mRNA 水平上的分子机制,而转录组又是连接基因组与蛋白组的纽带[4-6]。本研究分析了HLA-B27 阳性AU 患者外周血转录组差异表达基因。现报告如下。
1.1 临床资料 选择2022 年6 月—2023 年5 月山东省立第三医院收治的初诊AU 患者4 例,男2 例、女2 例,年龄35~65 岁,体质量51~85 kg。患者均有不同程度眼红、眼痛、畏光、流泪、视物模糊等临床表现,裂隙灯下可见不同程度瞳孔缩小或后黏连、前房闪辉、角膜后见呈尘状或羊脂状沉着物、睫状体充血、晶状体表面色素沉着。本研究经山东省立第三医院伦理委员会审核通过(伦理编号:KYLL-20211112),患者均知情同意并签署书面知情同意书。
1.2 标本总RNA 提取与质量鉴定 采集外周静脉血4 mL,取全血200 µL,加入TRIzol 1 mL,反复吹打混匀,室温静置20 min。4 ℃下加入氯仿200~300 µL,振荡混匀,室温静置5 min。4 ℃下15 000 × g 离心10~15 min。取上清液600~700 µL,加入1 倍体积-20 ℃异丙醇,混匀后置于-20 ℃冰箱过夜。4 ℃下15 000 × g 离心30 min,去上清,加入-20 ℃ 75%乙醇的DEPC 水1 mL 洗涤沉淀,4 ℃下15 000 × g 离心5 min,去上清。RNA 沉淀经适当干燥,加入DEPC水溶解,经紫外可见分光光度计鉴定,OD260/OD280为1.8~2.0,浓度为200~500 ng/µL。
1.3 文库构建与测序 使用带有Oligo的磁珠富集真核生物mRNA。随后加入fragmentation buffer 将mRNA 随机切断。用六碱基随机引物并以mRNA 为模板合成cDNA 第一链,之后加入缓冲液、dNTPs 和DNA polymeraseⅠ合成cDNA第二链,然后用AMPure XP beads纯化双链cDNA。纯化后的双链cDNA 经末端修复、加A 尾并连接测序接头,随后用AMPure XP beads 选择片段大小,最后经PCR 富集得到最终的cDNA 文库。文库构建完成后,检测文库的有效浓度和插入片段的长度,以确保文库质量[7]。不同文库按照目标测序数据进行pooling,上机测序。
1.4 转录组差异表达基因分析流程
1.4.1 原始测序数据 经高通量测序得到的原始图像数据文件经CASAVA 碱基识别分析转化为原始测序序列,最终结果以FASTQ 格式文件存储,包括测序序列(reads)信息和相对应的测序质量信息。
1.4.2 原始数据组成 原始测序序列包含低质量的reads 和带接头的reads,为了确保后续分析质量,应去除接头序列,同时过滤掉低质量(碱基平均质量值小于20)的reads和N(无法确定的碱基)数量大于5的reads,得到可用于后续分析的clean reads。
1.4.3 基因水平计算 基因水平的直接展现是其转录本的丰度信息,转录本丰度越高,其基因水平越高。使用featureCounts 软件得到各基因在每个样本中的表达量(FPKM)。
1.4.4 差异表达基因筛选 差异表达基因分析所用的数据为基因表达水平分析中获得的read count。无生物学重复样本,采用edgeR 软件分析;有生物学重复样本,采用DESeq2软件分析。在RNA-seq中的差异表达基因解析是对大量基因进行独立的统计假设测试,致使造成总体假阳性偏高的情况,在差异分析过程中,应对原本假设实验得到的P-value 进行更正。即将padj≤0.05、|log2(Fold Change)|≥1 作为筛选差异表达基因的标准。
1.4.5 差异表达基因的GO功能富集与KEGG通路富集分析 差异表达基因的功能富集分析是根据GO 功能的注释结果将全部差异表达基因与参考物种的基因组进行比对,经过Fisher 精确检验,获得双方显著性的差异,进而得到全部差异表达基因富集的功能类别(P-value<0.05)。KEGG 通路富集分析方法是以KEGG 通路为单位,以参考基因组为基础,经过Fisher 精确检验,用P-value 排列通路富集水平的显著性,取值为0~1,越接近于零,表示富集越显著,最终确定受显著影响的代谢和信号转导途径。
1.4.6 差异表达基因的蛋白-蛋白互作网络(PPI)分析 采用STRING 蛋白质互作数据库中的相互作用关系,针对数据库中包括的物种,在数据库中提取出目标基因集(如差异表达基因list)的互作联系构建网络;如数据库中不包括的物种,应首先将目标基因集序列用blastx(阈值:E-value<1e-10)比对到STRING 数据库中包括的参考物种蛋白质序列上,同时利用参考物种的蛋白质互作关系构建互作网络。
1.5 统计学方法 从Illumina或BGI平台上生成的数据用于生物信息学分析。由上海中科新生命生物科技有限公司完成统计分析。
2.1 原始数据组成 样本有效浓度均达标,Q20、Q30 符合测序质量要求,GC 含量无明显偏倚,表明测序结果有效。各样本数据质量见表1。
表1 各样本数据质量一览表
2.2 基因水平计算结果 不同FPKM 水平下基因的数量见表2。
表2 不同FPKM 水平下基因的数量(个)
2.3 差异表达基因分析结果
2.3.1 筛选的差异表达基因结果 将基因水平分析中得到的read count 作为输入数据。结果显示,在32 778个基因中共筛选出差异表达基因2 638个,其中表达上调基因1 876 个(前10 位依次为CXCL8、FFAR2、HBB、HBA2、JUN、KCNJ15、ADGRG3、SLC25A37、CXCR2、CXCR1)、表达下调基因762 个(前10 位依次为SLC4A10、CD27、PAQR8、TRBV28、TRDC、TRAC、GZMK、LDLRAP1、IL-32、GSTM1)。
2.3.2 差异表达基因的聚类分析结果 依据样本中基因表达情况的相似程度,对差异表达基因进行聚类分析,结果显示组内样本差异表达基因的高低表达分布集中,组间样本则距离较远,提示差异表达基因的聚类性较好。
2.3.3 差异表达基因的GO 富集分析结果 以校正后P<0.05 为标准,筛选出显著上调的GO。挑选具有显著性差异的GO 富集分析中排序前30 位的BP、CC 和MF 条目,包括免疫应答、白细胞激活、细胞活化、刺激反应、细胞通信、髓系白细胞活化、信号转导和细胞过程调节、细胞外周环境、细胞膜、三级颗粒、T 细胞受体复合物和分泌颗粒。具有显著性差异的GO富集分析主要与免疫应答过程有关。
2.3.4 差异表达基因的KEGG 通路富集分析结果 差异表达基因的KEGG 通路富集分析主要集中于破骨细胞分化信号通路、NF-κB信号通路、趋化因子信号通路、卡波西肉瘤相关的疱疹病毒感染、细胞因子与细胞因子受体的相互作用、弓形虫病、坏死性凋亡信号通路、脂质和动脉粥样硬化、美洲锥虫病、TNF 信号通路、利什曼病、结核、疟疾、MAPK 信号通路、幽门螺杆菌感染中的上皮细胞信号通路、IL-17信号通路、PD-L1 在癌症中的表达和PD-1 检查点通路、神经营养因子信号通路和癌症途径。
2.3.5 差异表达基因的PPI 分析结果 利用STRING 数据库对30 个差异表达基因构建PPI,以E-value<1e-10为阈值。PPI分析发现,POLR2A、RBPJ、SUPT5H、ATP6VOD1、JUND、FOS、JUN、PCNA 和CAD 等基因处于PPI 的核心位置,对AU 的发生、发展可能具有重要的调控作用。
本研究通过转录组学GO 富集分析,筛选出具有显著性差异的生物学过程,包括子网络与免疫系统反应、免疫响应、白细胞激活、细胞活化、刺激反应、细胞通信、髓系白细胞活化、信号转导和细胞过程调节等。这些生物学过程几乎都与免疫系统有关,为下一步AU的研究提供了方向。
本研究通过转录组学KEGG 通路富集分析发现,差异表达基因的KEGG 通路富集主要集中于破骨细胞分化信号通路、NF-κB信号通路、趋化因子信号通路、细胞因子与细胞因子受体的相互作用、坏死性凋亡信号通路、脂质和动脉粥样硬化、TNF信号通路、MAPK 信号通路、IL-17 信号通路、PD-L1 在癌症中的表达和PD-1检查点通路等。
NF-κB 是一种蛋白质复合物,NF-κB 的不当调节与癌症、炎症和自身免疫性疾病、感染性休克、病毒感染等有关。NF-κB还可介导正常的免疫应答过程。机体受到感染引起炎症反应时,需要开启NF-κB 信号通路,转录部分细胞因子来介导免疫应答,从而清除入侵的病原菌[8-9]。
TNF 家族、IL-17、IFN 家族以及血管内皮生长因子等炎症细胞因子是引起AU 进而导致黄斑水肿的重要原因。TNF 作为关键的促炎症因子,可诱导炎症细胞活化,上调趋化因子及血管黏附因子表达,促进白细胞迁移与细胞凋亡、淋巴细胞浸润,阻断视网膜血管内皮细胞之间的紧密连接,增加血管通透性,从而导致血-房水屏障及血-视网膜屏障被破坏,继而形成黄斑水肿。这可能是AU 的发病机制之一[10-12]。
根据筛选出的差异表达基因发现,表达上调前10 位的基因有趋化因子家族及其受体CXCL8、CXCR2、CXCR1 以及与趋化因子有重要关联的G 蛋白偶联受体(ADGRG3),提示AU同趋化因子家族的关系密切;而表达下调前10 位的基因多集中在T 淋巴细胞受体(TRBV28、TRDC、TRAC)、溶酶体(SLC4A10、GZMK)、脂代谢相关基因(PAQR8、LDLRAP1、GSTM1),这可能体现了机体对免疫反应的负性调控以及骨质破坏与修复等过程。而促炎症因子IL-32表达下调,则体现了免疫调控的复杂性。
通过转录组KEGG 通路富集分析,筛选出了卡波西肉瘤相关的疱疹病毒感染、弓形虫病、美洲锥虫病、利什曼病、结核、疟疾、幽门螺杆菌感染中的上皮细胞信号通路、神经营养因子信号通路和癌症途径等信号通路。这些信号通路涵盖了细菌、真菌、病毒等微生物,说明感染要素丰富且复杂,需要进一步研究。富集出的这些信号通路不一定是相应病原体的感染途径,而是感染后机体免疫反应的共同途径。因此推测,病原体感染在AU 的发生、发展中具有重要作用,提示在日常的临床诊疗中要重视患者的感染史。
通过PPI 分析筛选出10 个关键节点基因,结果发现细胞凋亡相关基因是重要的PPI 节点基因,包括溶酶体激活(ATP6V0D1)、异常增殖相关基因(RBPJ、PCNA、FOS 家族、POLR2A)。说明在AU 的疾病过程中伴随着细胞凋亡与异常增殖,甚至与血液肿瘤有一定的相关性[13-14]。另外,通过转录组KEGG 通路富集分析筛选出了PD-L1和PD-1检查点通路,这也符合抗PD-L1 和PD-1 单抗能够导致药物源性葡萄膜炎这一临床实践[15-16]。