王玉林,胡祖权,叶远浓,唐福州,王 赟
(贵州医科大学生物与工程学院,贵州 贵阳 550004)
乳腺癌主要是患者乳腺腺上皮组织出现的恶性肿瘤,现阶段,临床上在治疗乳腺癌患者没有显著的效果,在较大程度上提升患者的死亡率[1]。妊娠期乳腺癌主要是患者在妊娠期间出现的原发性乳腺癌症状,该症状发病率比较低下,乳腺癌的预后效果与癌基因之间存在较大的关联性[2]。
此次研究所应用的数据来源于妊娠乳腺癌芯片数据库,在该数据库当中以妊娠,乳腺癌作为检索关键词,得到了相关芯片数据。
(1)处理数据和分析差异基因:主要是按照统计学分析方式对芯片数据进行分析,首先需要将数据上传至专业软件中,通过该软件处理数据,并且使用t检验对两组数据进行分析。按照肿瘤上皮组织和正常上皮组织进行分组,之后对比分析两组样本的数据。过滤数据信息,筛选差异基因。
(2)差异基因的基因本体论通路分析和富集分析:首先就是生物学信息注视数据库,在大规模基因列表当中找寻生物功能注释信息,此次筛选的差异基因上传DAVID在线软件,在其中选择基因功能注释指令,需要全面分析以上基因的细胞组成,生物学过程以及分子功能等[3]。
将此次研究的数据上传到专业软件之后,在PCA图上两组细胞混合为一体,不存在差异性。见图1。在此次期间应用P<0.05方式分离两组样本细胞。在DSE31192筛选后,共筛选出150个差异表达基因,有22个上调表达,126个下调表达。
(1)富集分析结果:乳腺癌在GO分类当中总共占据42个,其中分子功能有12个分类细胞组分,47个生物学过程。对以上GO分类的采用P<0.05进行过滤,其中有22个BP和5分CC被保留,之后通过错误发现率校正P值,FDR保留在5%以下。并且所有分类当中包含基因书多余5的GO类,分别有22个BP和2个CC被保留。以上差异基因在细胞骨架蛋白结合,血管发育,细胞分化以及调节蛋白激酶活性当中有参与。
(2)差异基因的通路分析结果:差异基因所牵扯到7条通路分析,将筛选标准制定为P<0.05,最后只留下6条通路。分别为丝裂原活化蛋白激酶信号通路,调节肌动蛋白细胞骨架通路,黏着斑信号通路,黑色素瘤疾病通路,细胞外基质受体等。
(3)差异表达基因的相互作用网络分析:使用STRING根据分析150个差异基因的蛋白相互作用,结果显示,在网络分析中,KIT、PAK7、JUN、EGR1、TPM2、ACTA2、MYL9蛋白都与其他>5个蛋白之间存在相互作用关系,因此将蛋白作为网络的中心节点。
此次研究主要是利用生物信息学在数据库当中检索妊娠期乳腺癌的相关数据信息,之后使用专业软件深入挖掘芯片数据,共发现150个差异基因。其与细胞完整性,结构以及运动等方面存在较大的关联性。能够在造血干细胞中广泛表达,能够对癌细胞的增殖产生一定的抑制作用,有效作用在肿瘤发生发展期间。
在数据分析软件中,差异基因主要集中表达在妊娠期乳腺癌上调,下调及妊娠期乳腺癌,还在KEGG通路分析和GO功能富集分析上发现以上基因参与血管发育,有丝分裂周期,细胞分化,调节蛋白激酶活性,细胞骨架蛋白结合,细胞磷酸盐代谢过程等。聚合酶Ⅱ启动子转录的症调控以及胞膜囊泡组成等,与丝裂原活化蛋白激酶信号通路,调节肌动蛋白细胞骨架通路,黏着斑信号通路,黑色素瘤疾病通路和细胞外基质受体相互作用,此研究结果与其他学者的研究结果一致。差异基因在乳腺癌中的基因功能,作用机制以及通路分析等都具有较高的一致性,在差异基因生物学通路当中还牵扯到黑色素瘤疾病通路,从该种分析结果可以看出,妊娠期乳腺癌可能会导致患者出现黑色瘤疾病。
在于以上差异基因进行相互作用的网络分析后,结果显示,以KIT、PAK7、JUN、EGR1、TPM2、ACTA2、MYL9蛋白都与其他>5个蛋白之间存在相互作用关系。通过研究其他文献的得知,鲜少有文献分析乳腺癌发病与下调LMOD1之间的关联性。
综上所述,使用生物信息学能够分析妊娠期乳腺癌基因芯片数据,并且全面获取生物内在信息。
[1] 滕牧洲,陈利娜,卢严方,等.妊娠期乳腺癌相关基因的生物信息学分析[J].解剖学报,2016,47(03):348-352.
[2] 王一澎,陈国际.妊娠与乳腺癌的相关研究进展[J].癌症进展,2015,12(05):416-423+433.
[3] 董春龙.30例妊娠期乳腺癌相关受体免疫组化分析[J].深圳中西医结合杂志,2016,26(21):69-70.