李少东,洪 森,李世权,董睿智,梁 斌,康振华
(吉林大学第一医院,吉林 长春130021)
胃癌和结直肠癌是世界上发病率和死亡率较高的恶性消化道肿瘤,严重影响着患者的生存质量,依然是世界各国重点防治的恶性肿瘤之一。消化道肿瘤的发生与基因调控、环境因素、饮食习惯等都有很密切关系。目前国内外认为基因调控仍是发病的主要因素,胃癌和结直肠癌的发生发展分别与很多基因有密切关系,本文通过NCBI-GEO微阵列数据库中筛选到基因表达谱GSE156355和GSE154127,对胃癌和结直肠癌的发生发展中的共同基因做出了初步研究,在结直肠癌基因表达谱GSE156355筛选到特有的差异基因有738个,占比为62.9%,在胃癌基因表达谱GSE156355筛选到特有的差异基因有425个,占比为36.2%,结果显示共检测到11个基因在两个基因表达谱中共同表达,占比仅为0.9%,其中3个基因上调表达(logFC>0),8个基因下调表达(logFC<0)。但这11个基因对患者存活率影响没有明显的差异,只有CST1基因与正常样本相比,在胃癌和结直肠癌样本中均高表达。
NCBI-GEO被视为微阵列/基因图谱,我们获得了基因微阵列基因图谱,我们在NCBI-GEO(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi)搜索获得了在结直肠癌和胃癌中的基因表达谱GSE156355和GSE154127。基因表达谱GSE156355是基于GPL21185测序平台,利用全基因组微阵列技术比较了6例结直肠癌患者癌组织和6例正常结直肠组织的基因表达谱。基因表达谱GSE154127为了了解胃癌干细胞获得5-FU耐药的分子基础,使用微阵列来详细描述胃癌中5-FU耐药和干细胞特性维持的基因表达谱,其中包括了4例正常胃组织,3例胃癌组织,3例5-FU干预治疗胃癌组织。
DEGs的筛选通过GEO2R在线工具识别,FDR(false discovery rate)表示错误发现率,它是通过p value进行校正得到的,是差异基因筛选取的关键指标。在筛选中,选取P value < 0.05且|logFC |>=2作为标准(Fold Change表示差异倍数)筛选出DEGs。原始数据以TXT的格式在Venn软件(在线提供:http://bioinformatics.psb.ugent.be/webtools/Venn/)在线检查结直肠癌和胃癌两个数据集中常见的DEGs,logfc<0的DEGs被认为是下调基因,而logfc>0的DEGs被认为是上调基因。
Kaplan-Meier绘图仪[1]是一个常用的网站工具,基于EGA、TCGA数据库和GEO(仅限Affymetrix微阵列)用于评估大量基因对生存率的影响,并在曲线图上显示出来。为了验证这些DEGs,我们应用GEPIA网站[2]对来自GTEx项目和TCGA的数千个样本的RNA测序表达数据进行了分析。
通过GEO2R在线工具,提取基因表达谱GSE156355和GSE154127中的数据,以P value < 0.05且|logFC |>=2作为标准,用维恩图软件识别出了两个数据集中共有的DEGs,在结直肠癌基因表达谱GSE156355筛选到特有的差异基因有738,占比为62.9%,在胃癌基因表达谱GSE156355筛选到特有的差异基因有425,占比为36.2%,结果显示在共检测到11个基因在两个基因表达谱中共同表达,占比仅为0.9%,其中3个基因上调表达(logFC>0),8个基因下调表达(logFC<0),详见图1和表1。
图1 通过Venn diagrams软件验证两个数据集(GSE156355和GSE154127)中公共的DEGs
表1 11个共有差异表达基因(DEGs)
KaplanMeierplotter(http://kmplot.com/analysis)对11个共有差异表达基因的存活率数据进行统计。结果发现这11个基因对患者存活率没有明显的差异;P值均大于0.05。用GEPIA技术挖掘出11个基因在正常人和癌症病人之间的表达水平,结果表明,结果只有CST1基因与正常样本相比,在结直肠癌和胃癌样本中均高表达(P<0.05),(图2)。
图2 CST1基因在肿瘤组织和正常组织中的表达
为了识别更多差异基因在消化道肿瘤中的表达,本文在NCBI-GEO微阵列数据库中,筛选胃癌和结直肠癌基因谱,共有6例结直肠癌患者癌组织和6例正常结直肠组织,3例正常胃组织,3例胃癌组织,3例5-FU干预治疗胃癌组织。以P value < 0.05且|logFC |>=2作为标准,在结直肠癌基因表达谱GSE156355筛选到特有的差异基因有738,占比为62.9%在胃癌基因表达谱GSE156355筛选到特有的差异基因有425,占比为36.2%,结果显示在共检测到11个基因在两个基因表达谱中共同表达,占比仅为0.9%,其中3个基因上调表达(logFC>0),8个基因下调表达(logFC<0),生存分析发现这11个基因对患者存活率没有明显的差异;但CST1基因与正常样本相比,在结直肠癌和胃癌样本中均高表达。
胃癌[3]和结直肠癌[4]是世界上发病率和死亡率较高的恶性消化道肿瘤,严重影响着患者的生活质量,恶性肿瘤的发生、发展与基因表达异常和突变等有密切关系,目前已明确了肿瘤发生的部分机制。半胱氨酸蛋白酶抑制剂(CST)是对半胱氨酸蛋白酶具有抑制作用的一类蛋白质,广泛分布于人体体液和分泌液中[5]。目前研究表明CST超家族与肿瘤之间具有密切联系,在多种肿瘤中都能检测到CST1基因所表达的产物[6];也有研究表明,CST1基因异常表达与肿瘤发生、发展密切相关,近年来大量研究表明,过度表达的CSTl在恶性肿瘤细胞的增殖、转移及浸润等方面发挥关键作用[7]。胃癌中CST1基因异常高表达,RNA干扰其表达后可降低细胞增殖,RNA干扰CST1基因表达可抑制结直肠癌细胞的增殖和侵袭[8]。CST1在结直肠癌中高表达,且高表达将缩短结直肠癌患者生存期,过表达CST1能够促进结直肠癌细胞增殖、迁移和侵袭能力[9]。
本文研究发现在胃癌和结直肠癌中,CST1基因上调表达,与正常样本相比,在肿瘤组织中均高表达,推测CST1基因与胃癌和结直肠癌的发生密切相关,可以作为检测的重要指标,可以作为消化道肿瘤诊疗中的有效靶点。