姚迪,常红岩,王琳
(郑州大学第一附属医院 信息处,河南 郑州 450052)
医学的进步是医学研究者不懈努力所获得的结果,但是从基础实验到临床应用是一个漫长的过程,期间根据某种现象到提出假说,再通过一系列摸索得出适应人体水平的结果,往往带有极大风险及花费。所以找到一种方法能够简化其中步骤是有必要的。进入新世纪,生物信息学从提出到实践逐渐成熟,它将信息技术与生命科学相结合,成为研究方法的一种热点。利用计算机技术及生物信息技术,对于目前研究发现结果进行分析,进而对实验假想进行探索及验证,是可以利用的方法[1]。食管癌是最常见的癌症之一,在全世界所有癌症中病死率排名第六[2]。食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)为主要组织学类型,在中国非常普遍[3]。由于晚期发病所致和转移倾向,尽管最近在诊断和治疗后ESCC的预后仍不满意,年生存率仅为15% ~25%[4]。白细胞介素-17(interleukinIL-17,IL-17)是一种主要由Th17辅助细胞分泌的炎症细胞因子,并且一些研究显示IL-17在多种肿瘤中发挥了重要作用[5],但关于IL-17在ESCC内对肿瘤作用的研究较少,并且仍有争议[6-7]。目前基因表达综合数据库(Gene Expression Omnibus database,GEO)是当今最大、最全面的公共基因表达数据资源,包含了43个肿瘤项目及68种肿瘤类型,其中含有大量的微阵列芯片和测序数据[8]。本研究基于数据库研究IL-17在食管鳞癌的表达及其相关通路蛋白的表达情况,并基于现实世界中食管鳞癌相关细胞因子的表达情况。
1.1 文献检索策略检索PubMed数据库获取食管癌相关文献,检索起止日期为2000年1月1日至2021年11月21日。检索策略主要是Esophageal squamous cell carcinoma和IL-17,采用Excel 2016软件进行数据录入,统计研究数据,包括发表时间和研究细胞因子,获得目前关于研究情况,获取热点研究因子,为下一步统计分析做指导。
1.2 数据收集和预处理本研究样本选取标准为于2021年1月从GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)中下载食管鳞癌组织样本数据集GSE26886(包含69例食管组织)的芯片原始数据。分析其中相关细胞因子表达情况。在RStudio 4.0中用Affy包读取原始文件,使用RMA算法预处理得到标准化的基因表达谱数据,再对两个数据集进行注释,log2转化,R包SVA校正批次效应并合并。
1.3 食管组织病理学检查
1.3.1 免疫组化检测IL-17表达 将组织玻片依次放入二甲苯,体积分数为100%的乙醇,1×PBS洗3次,每次5 min。提前将抗原修复液在微波炉中煮沸,煮沸后将载玻片放入抗原修复液中,使抗原充分暴露。自然冷却至室温。1×PBS中洗3次,每次5 min。取20 mL体积分数为30%的过氧化氢、180 mL甲醇混匀,将载玻片放入体积分数为3%的过氧化氢-甲醇溶液中,浸泡20 min。1×PBS洗3次,每次5 min。用1×PBS配置体积分数为5%的山羊血清,用免疫组化笔将组织圈起来,将配好的山羊血清直接加到组织上,以刚好在圈内覆盖组织为宜,孵育10~30 min。用1∶50的一抗加到组织芯片上覆盖住组织,孵育过夜。1×PBS中洗3次,每次5 min。按体积比为1∶100的比例用1×PBS配置二抗,将二抗加到组织芯片上覆盖住组织。孵育5 h。向组织芯片上加DAB,进行染色,将组织芯片放入苏木素中染色。将组织芯片放平,在组织上滴加中性树胶,尽可能覆盖组织,盖上盖玻片,注封片。
1.3.2 蛋白质免疫印迹(western blot,WB)检测细胞因子表达 裂解组织,提取蛋白;应用BCA法测定蛋白含量;根据蛋白大小配制浓缩胶和合适浓度的分离胶及浓缩胶,毎孔加30μg已变性的蛋白样品,80 V电泳至分离胶后改为120 V电泳,约50 min终止电泳,按白扳、海绵、滤纸、PVDF膜、PAGE胶片、滤纸、海绵、黑板顺序放置,放置时保证去除气泡使PVDF膜与电泳凝胶充分贴合,蛋白转膜;随后将NC膜放入50 g·L-1脱脂奶粉封闭液中封闭2 h,然后进行一抗及二抗孵育,随后进行ECL显色。
2.1 文献检索结果通过文献检索共获得56篇文献,经反复阅读文献内容,排除重复研究、会议摘要、编者按、勘误、信件等40篇,排除相关文献中不包含缺失研究因子,或者研究通路不明确的文献,最终纳入15篇进行分析。其中2000—2010之间有1篇文献发表,2010—2021年有14篇文献发表。统计其中研究的细胞因子包括白细胞介素-6(interleukin-6,IL-6)、S100钙结合蛋白A8(recombinant S100 calcium binding protein A8,S100A8)、S100钙结合蛋白A9(recombinant S100 calcium binding protein A9,S100A9)、基质金属蛋白酶9(matrix metallopeptidase 9,MMP-9)、基质金属蛋白酶13(matrix metallopeptidase 13,MMP-13)等各细胞因子研究热度,以及各细胞因子在肿瘤组织中相比正常组织中的对比值,并定义其为表达量,结果显示:其中IL-6、S100A9及MMP-9研究热度较高;MMP-9在肿瘤组织中表达量高;而S100A9在肿瘤组织中表达量低。见图1。
图1 各细胞因子研究热度
2.2 从GEO数据库中下载食管鳞癌组织样本数据集GSE26886GSE数据集中包含28例食管标本,其中10例食管鳞癌及18例正常标本基因集,食管鳞癌与正常组织标本非成对标本,仅仅提供肿瘤组织临床数据。其中男女分别为8例及2例;中位年龄为58.2岁;分化程度为中分化5例,高分化5例;其中T1病变为1例,T3病变为9例;出现淋巴结转移为7例,未转移为3例。选取其中鳞癌样本进行分析,结果显示肿瘤组织中IL-17、IL-6、MMP-9、MMP-13的基因表达量均高于正常组织,S100A8在正常与肿瘤组织中表达差异不明显,但是肿瘤组织中S100A9表达量低于正常组织。见图2。
图2 食管鳞癌数据集GSE26886中显示肿瘤组织中IL-17、IL-6、S100A8、S100A9、MMP-9、MMP-13表达情况
2.3 蛋白检测
2.3.1 食管鳞癌组织免疫组化 利用12例T3N0M0食管鳞癌标本行免疫组化检测。其中男6例,女6例;中位年龄为54岁;高分化5例,中分化7例;所有患者肿瘤病变为T3;淋巴结均未转移。结果显示肿瘤组织中IL-17表达量(66.30±17.14)较正常组织(22.53±5.13)表达量增加(P<0.05);在高分化肿瘤中表达量(60.53±3.96)高于正常组织中(23.5±3.28)表达量(P<0.05);中分化肿瘤中表达量(76.17±4.73)高于正常组织中(76.17±4.73)表达量(P<0.05)。
2.3.2 WB 根据发表的相关文献统计的关于IL-17的研究结果,选取研究热度较高的细胞因子进行组织蛋白检测;选取IL-17上游细胞因子IL-6及下游细胞因子MMP-9、S100A9行WB检测,蛋白结果显示MMP-9。IL-6在肿瘤组织标本中表达量高于正常组织,S100A9肿瘤组织中表达量低于正常组织,与基因芯片中获得的数据结果类似。见图3。
图3 组织中各因子WB表达情况
上世纪80年代美国科学家在科学杂志上首次提出检测人类基因组[9],因为数据庞大,为解决这个问题,逐渐兴起了一门新兴的科学即生物信息学,它的出现,不仅使人们对生物体和生物信息的起源有了新的认识,而且也为人类疾病的诊治开辟了全新的途径。所以这门学科能够使信息工作者和临床科技人员紧密联系起来。目前有很多的大型生物学数据库都是公开的,包含了众多的生物学资源,可以使人们更方便地获取想要的资料,例如TCGA、GEO等数据库。一些研究结果显示可以利用相关数据库获得一些结果[10-11]。但是这些结果只是筛选可能有用基因,并未在组织标本中验证。本研究是与临床医生合作,利用计算机技术及生物信息技术验证理论猜想。
河南省林州为食管癌高发区,虽然经过半个世纪的努力,但是目前食管癌患者治疗后的生存情况仍不够理想[4,12]。为了改善患者预后,探索新的治疗模式。而目前IL-17在许多研究中显示其对肿瘤的发生发展起到一定作用[13],遂以此为方向,研究IL-17在食管鳞癌中的作用。首先建立理论依据,根据发表的文献,获得研究方向;查阅大量文献,目前使用最多的就是美国的国家生物技术信息中心包含的PubMed功能,在上面可查询成千上万篇的文献和文摘,并且可以得到近500种期刊发表的文章全文[14]。本研究首先以esophageal squamous cell carcinoma和IL-17为关键词,在PubMed上进行检索,排除不符合标准文献。在对符合标准的文献进行仔细阅读分析后,发现IL-17在食管癌组织中是有可能升高的,而其相关的一些细胞因子在肿瘤组织中表达各有不同。
获得需要研究的相关细胞因子后,在GEO中检索出GSE26886提供的临床资料及基因数据类型符合研究所需。GEO是一个巨大的基因数据库,包含了100多种生物体的超过10亿个单独的基因数据[15]。虽然GEO可以提供简单的数据分析,但是却不能进行复杂的分析。检索的基因数据表达谱采用的是Affy芯片,使用RStudio提取基因数据,获取基因探针,对比正常组织及肿瘤组织中相关细胞因子表达量,获得了与文献类似的结果。一些研究结果显示可以利用GEO获取相关细胞因子[11,16]。
本研究进一步提供证据表明,食管癌患者中IL-17在肿瘤分泌量较正常组织高,而且研究结果显示随着肿瘤发展,IL-17在肿瘤组织中的表达量较正常组织高,这与以前的一篇研究结果[17]类似,可以提示IL-17可能促进肿瘤生长。一些研究表明某些上游细胞因子(IL-6)参与了Th17细胞的分化和发育,进而影响IL-17分泌及相关通路的表达[18-21]。IL-6对IL-17的影响主要体现在其可以调节产生IL-17的Th17细胞,IL-6诱导幼稚T细胞与TGF-β共同刺激Th17细胞的发育[22-23]。本研究中也发现IL-6在肿瘤组织中有所升高,显示其间可能有相关性。S100A8/A9是由S100A8与S100A9蛋白结合形成的异二聚体,通过与不同的金属离子及细胞作用调节炎症状态,抑制细菌增殖,促使细胞骨架重排。基质金属蛋白酶(matrix metalloproteinases,MMPs)是一类广泛存在于血管壁细胞外基质的锌离子依赖性水解酶,与细胞外基质破坏和重建以及动脉粥样硬化、脑梗死、脑出血、肿瘤等疾病密切相关。一些研究显示S100A8、MMP-9及MMP-13在食管癌组织中表达量增高且可能与IL-17相关[24-26],在本研究中获得类似结果。本研究显示肿瘤组织中S100A9的表达量低于正常组织,显示S100A9可能与IL-17的分泌成负相关,与以前的研究结果[27]相似。
综上所述,本研究通过对GEO食管癌芯片数据进行生物信息学分析,显示IL-17在食管癌肿瘤组织中表达量高于正常组织,而与其分泌相关的IL-6在肿瘤组织中表达量高于正常组织,而IL-17影响的MMP-9等因子在肿瘤组织中也高于正常组织,且在组织标本中已经进行相关验证。这显示了生物信息学分析工具在挖掘肿瘤发生机制、疗效评价及预后预测方面的巨大应用价值,相信结合后续分子生物学领域的研究,可以为其他疾病的诊断与治疗提供新的思路。