甲状腺癌差异表达基因的生物信息学分析

2021-06-14 04:13盛福梅韩崇旭1
实用临床医药杂志 2021年10期
关键词:通路模块基因

盛福梅, 连 旭, 韩崇旭1,

(1. 扬州大学医学院, 江苏 扬州, 225001; 2. 扬州大学医学院附属六合医院 检验科, 江苏 南京, 211500;3. 江苏省苏北人民医院/扬州大学临床医学院 医学检验科, 江苏 扬州, 225001)

甲状腺癌(THCA)是内分泌系统常见的恶性肿瘤。近些年, THCA发病率快速上升,根据中国癌症中心网2018年统计[1]显示, THCA居常见恶性肿瘤的第7位以及女性常见恶性肿瘤的第4位。THCA已成为耳鼻咽喉头颈外科学、腺体外科学、内分泌学和肿瘤学共同的研究热点[2]。THCA的发病率以女性居多,学者们揭示了在THCA发生及发展过程中有着重要影响的体细胞基因的改变,但对相关基因表达差异对THCA发病影响的研究较少。本研究运用统计学方法分析江苏省扬州地区THCA患病情况,并用生物信息学分析筛选参与女性THCA癌变和进展的差异表达基因(DEGs), 以揭示女性THCA发生发展的分子机制,寻找具有临床意义的生物标志物,现报告如下。

1 材料与方法

1.1 一般资料

收集江苏省苏北人民医院2020年1—12月诊断为THCA患者的临床资料,共纳入患者1 780例,年龄13~84岁,平均(50.3±11.8)岁。根据性别分为男性组(n=300)和女性组(n=1 480), 其中男性组年龄13~81岁,平均(52.37±12.70)岁; 女性组年龄13~84岁,平均(49.88±11.60)岁。男性患者占总体的16.85%, 女性患者占83.15%。女性THCA发病率高于男性,男女发病的性别比为1∶4.93。

患者均符合美国甲状腺学会修订发布的《成人甲状腺结节与分化型THCA治疗指南(2015)》[3]中THCA的诊断标准。本研究已获伦理委员会批准(伦理批号: 2021ky028)。

1.2 统计学处理

采用统计软件SPSS 25.0分析数据,计数资料以率表示,组间比较采用卡方检验,以P<0.05表示差异有统计学意义。

1.3 数据获取与基因筛选

从GEO数据库(http://www.ncbi.nlm.nih.gov/geo)下载基因表达谱数据GSE329265, 该芯片为Affymetrix人基因组U133 2.0芯片(HGU133_Plus_2, 安捷伦GPL570平台)。GSE29265数据集共包括THCA组织及癌旁正常组织20对。男性组为男性肿瘤(MT)、男性正常(MN),女性组为女性肿瘤(FT)、女性正常(FN)。通过在线工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/), 以P<0.05和|logFC|>2对2组基因表达数据进行分析。利用Venn软件(http://bioinformatics.psb. ugent. be/webtools/Venn/)在线获取各组上调基因、下调基因。logFC>0的DEGs被认为是上调基因, logFC<0的DEGs被认为是下调基因。

1.4 PPI网络与模块分析

利用数据分析软件STRING(https://string-db. org/cgi/input. pl)分别对FT和MT差异基因编码蛋白进行相互作用分析(置信度≥0.4, 互作最大值=0), 并建立PPI网络。通过Cytoscape 3.6.0软件的MCODE 插件从构建的PPI 网络中选取连接最紧密的模块进一步分析(设置参数为degree=2, node score=0.2, k-core=2, max. depth=100), 模块所含基因为关键枢纽基因(Hub基因)。

1.5 基因的功能富集

通过在线DAVID网站(https://david.ncifcrf.gov/)对DEGs进行基因本体(GO)功能注释和京都基因与基因组百科全书(KEGG)通路富集,分析这些基因的生物学过程、细胞组成、分子功能以及主要涉及的肿瘤相关通路。

2 结 果

2.1 不同性别THCA年龄分布比较

60岁以下年龄段,男性和女性THCA患病率随年龄增长均呈增高趋势(男性趋势χ2=191.1,P<0.000 1; 女性趋势χ2=562.2,P<0.000 1), 女性THCA 40~49岁年龄段的分布高于男性, ≥60岁年龄段的分布低于男性,差异有统计学意义(P<0.05 )。见表1。

表1 不同性别THCA年龄分布比较[n(%)]

2.2 THCA及正常组织中差异表达基因

通过在线工具GEO2R和Venn分析,在MT中检测到165个差异倍数达 4 倍以上的显著DEGs, 包括70个上调基因和95个下调基因; 在FT中检测到163个显著DEGs, 包括83个上调基因和80个下调基因,见图1。2组共有55个上调差异基因, 59个下调差异基因,见图2。

A: 男性组; B: 女性组。

A: MT、FT上调差异表达基因; B: MT、FT下调差异表达基因。MT: 男性肿瘤; FT: 女性肿瘤。

2.3 构建PPI网络及筛选鉴定Hub基因

分别将MT、FT中筛选获得的164、190个差异基因输入到STRING网站,构建各自PPI 网络(图3A、图4A), 然后用Cytoscape软件中MCODE 插件提取PPI 网络中连接最为紧密的模块基因。MT中评分最高的模块包含了8个基因,共形成了28种相互作用关系,为MT的Hub基因(图3B)。FT中具有最高连接度的模块包含了10个Hub基因,共形成25种相互作用关系(图4B)。结果显示, Hub基因中有SERPINA1、FN1、CHRDL1和GPC34种基因在2组同时存在,其中SERPINA1、FN1为上调基因,CHRDL1、GPC3为下调基因;APOE、TIMP1、FAM20A和CDH2在MT中独立存在,均为上调基因; 而PROM1、EVA1A、PRSS23、ITGA2、NCAM1和KIT这6个基因在FT中独立存在,其中PROM1、NCAM1与KIT为下调基因,EVA1A、PRSS23和ITGA2为上调基因,提示性别因素对THCA的发病机制存在一定影响。

A: PPI网络; B: 模块分析。图3 男性DEGs构建的PPI网络和模块分析

A: PPI网络; B: 模块分析。图4 女性DEGs构建的PPI网络和模块分析

2.4 THCA女性组Hub基因GO功能注释及KEGG信号通路分析

GO分析表明THCA女性组Hub基因:ITGA2、FN1、NCAM1参与细胞黏附生物学过程;KIT、FN1参与基因表达的正调控等生物学过程。SERPINA1、FN1、GPC3、PROM1、PRSS23与细胞外泌体细胞组分相关;FN1、PROM1与内质网-高尔基体中间区室细胞组分相关。SERPINA1、KIT主要分子功能为蛋白酶结合。KEGG分析显示FT中DEGs主要富集于3条信号通路,富集于蛋白聚糖肿瘤信号通路的基因有ITGA2、GPC3、FN1; 富集于PI3K-Akt信号通路的基因有ITGA2、KIT、FN1; 富集于癌症信号通路的基因为ITGA2、KIT、FN1。

3 讨 论

THCA是最常见的内分泌恶性肿瘤,约占所有内分泌恶性肿瘤的90%。流行病学研究[1]发现,女性THCA患病率显著高于男性,其原因尚不明确。基因突变是THCA发生发展的重要因素之一,并与其疾病诊断、预后评估及分子靶向药物治疗密切相关。

本研究分析扬州地区1 780例THCA患者临床资料,发现女性THCA发病率高于男性,男、女发病的性别比为1∶4.93。60岁以下人群中,男、女THCA患病率随年龄增长均呈增高趋势。女性THCA 40~49岁年龄段的分布高于男性, ≥60岁年龄段的分布却低于男性,差异有统计学意义(P<0.05)。研究[4]显示女性THCA患病率约为男性的3倍,并发现雌激素可能是甲状腺良恶性细胞的一种有效生长因子。RUBIO G A等[5]实验发现,绝经后雌激素受体α表达增加可能与甲状腺乳头状癌的侵袭有关,这与本研究结果一致,女性THCA的发病率随年龄增长逐渐增加,绝经后开始呈下降趋势。本研究筛选女性组和男性组内差异表达基因,建立各自组内的PPI网络,从中将联系最紧密的一个模块基因提取出来作为关键基因研究。筛选2组共同表达的差异基因,并鉴定为非性别差异性基因, 4个为MT特有基因, 6个FT特有基因。6个FT特有基因为:KIT、EVA1A、ITGA2、NCAM1、PROM1和PRSS23, 其表达水平变化可能在女性THCA的发生发展中起关键作用。

KIT基因编码Ⅲ型受体酪氨酸激酶,其在造血、黑色素的生成、精子的生成以及Cajal间质细胞的发育中起多种作用,并已证实其激活突变与多种肿瘤类型相关[6-7]。研究[8]表明,与良性甲状腺组织相比,甲状腺恶性病变中的KIT基因表达降低,这与本研究中女性组KIT基因低表达一致。在正常甲状腺上皮转化为肿瘤细胞的过程中,KIT基因表达低下,提示该基因可能参与甲状腺细胞的分化和肿瘤的进展。EVA1A基因位于染色体2p12, 是一种新型的溶酶体和内质网相关蛋白表达基因,参与自噬和细胞凋亡[9]。研究[10-11]证明,EVA1A基因在肝细胞癌和非小细胞肺癌中低表达,且通过自噬、凋亡抑制肿瘤细胞的生长。在结肠腺癌以及弥漫性大B细胞淋巴瘤中,癌组织中的EVA1A基因表达明显高于在正常组织中的表达。LIN B Y[12]等发现EVA1A是增强THCA侵袭性的有效癌基因。

ITGA2基因编码整合素蛋白α2, 该蛋白与β亚基形成异源二聚体,主要介导细胞内外信号传导,在肿瘤浸润、侵袭和转移中发挥重要作用[13]。研究[14-16]表明ITGA2的表达与癌症的转移及预后相关,许多组学研究已将ITGA2作为胃癌、前列腺癌及乳腺癌早期诊治及预后分析的潜在分子标志物。CHERNAYA G等[17]发现在甲状腺乳头状癌(PTC )组织中,ITGA2基因表达水平高于正常甲状腺组织,并通过实验发现侵袭性PTC中miR-16的下调导致ITGA2基因表达上调,从而促进肿瘤的入侵和迁移。 神经细胞黏附分子(NCAM1)是一种膜蛋白表达基因,主要在神经系统中表达。实验[18-19]发现,NCAM1异常表达与多种癌症的发生发展有关,如急性髓细胞性白血病和小细胞肺癌[19]。NCAM1同样存在于正常甲状腺组织的滤泡上皮细胞中, GOLU I等[20]发现NCAM1的表达可使PTC与非肿瘤性病变的其他甲状腺疾病区分开,具有非常好的敏感性,并认为标志物NCAM1在诊断PTC时,具有评估边界病变的发展潜力。

由PROM1基因编码的CD133是一种戊聚糖跨膜糖蛋白,具有作为泛癌靶标的巨大潜力,其通常与包括THCA在内的多种不同肿瘤类型的癌症干细胞有关[21-22]。研究[23]发现,乙酰胆碱通过激活CD133-Akt途径增高CD133的表达量,从而提高THCA细胞的自我更新和免疫逃逸能力。PRSS23是一种新发现的丝氨酸蛋白酶基因,与多种类型的癌症进展有关,如卵巢癌、胃癌[24-25], 敲低PRSS23基因可抑制EIF2信号传导,进而在体内外抑制胃癌的生长。目前暂未有研究发现PRSS23与THCA的相关性。上述均提示该6个基因与THCA有较为密切的联系本研究进一步运用GO和KEGG富集分析,发现女性组DEGs对细胞黏附、基因表达的正调控等生物学过程有一定影响,并参与PI3K-Akt、蛋白聚糖肿瘤、癌症等信号通路的调控。PI3K-Akt信号传导途径被认为是癌症的主要调控因子[26]。研究[27]表明, Akt 作为PI3K-Akt信号通路的关键分子,可使细胞周期激酶抑制剂失活,从而促进细胞的生长及肿瘤的生成。同时,该通路的异常活化促进肿瘤细胞的增殖、分化及转移。因此,监测该通路可有助于预测女性THCA的进展。

综上所述,本研究分析了扬州地区THCA患者的临床资料,筛选出THCA性别差异基因,有助于阐明女性THCA发生发展的分子机制,并为潜在的生物标志物提供理论依据,但后续还需分子生物学研究来验证结果。

猜你喜欢
通路模块基因
28通道收发处理模块设计
“选修3—3”模块的复习备考
氧化槐定碱体内体外通过AKT/mTOR通路调控自噬抑制HBV诱发肝纤维化
Frog whisperer
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
修改基因吉凶未卜
创新基因让招行赢在未来
基因
SphK/S1P信号通路与肾脏炎症研究进展
通路快建林翰:对重模式应有再认识