烟酒成瘾者基因差异性表达及成瘾机理研究*

2018-10-18 03:10徐绍凯陈洪波范琳刘喻
生物医学工程研究 2018年3期
关键词:成瘾者烟酒饮酒

徐绍凯,陈洪波,范琳,刘喻

(桂林电子科技大学生命与环境科学学院,广西 桂林 541004)

1 引 言

近年来人工智能技术的爆发,大大加快了机器学习、数据挖掘技术在医学领域中的应用[1-2]。主要方法是通过对基因表达谱数据的挖掘以实现特征基因的提取、疾病相关基因的发掘、疾病分类、疾病发现等[3-5]。目前,对烟酒成瘾者的基因研究大多是基因位点分析和基因文献荟萃分析,它们能够得到一些特定的基因或基因位点与烟酒成瘾的关系,却无法从基因间的共同作用和功能上发掘基因与烟酒成瘾的相关性[6-7]。一些常用的差异表达基因提取方法目前也尚未被运用于烟酒成瘾相关基因的提取[8-10]。本研究采用NCBI的GEO数据库所提供的烟酒成瘾者的基因表达微阵列数据,通过基于R语言的方差分析,试图找到与吸烟和饮酒高度相关的基因以及探索吸烟成瘾与饮酒成瘾的内在联系。对于烟酒成瘾的治疗和探寻与烟酒成瘾相关的疾病有着十分重要的意义。

2 材料与方法

2.1 数据来源

本研究数据取自于美国国立生物技术信息中心(national center for biotechnology information,NCBI)的GEO数据库,收录号为GSE20568,为吸烟与饮酒成瘾者的脑组织基因表达微阵列数据[11]。GEO数据库是NCBI基因表达汇编计划所建立的数据库,是目前世界上最大的基因表达数据仓库和在线资源,其所收录的数据拥有统一标准的格式以及关于数据的详尽的介绍,在使用起来十分方便。数据共包括20个样本,分别为吸烟且饮酒组、吸烟不饮酒组、不吸烟不饮酒组以及不吸烟饮酒组四组样本,数据集中包含的基因探针数为8829个。对于每个样本,原实验中均可获得完整的疾病史。所有饮酒者均有慢性过度饮酒的历史,所有吸烟者根据其严重吸烟记录,均被归类为“烟草滥用者”[12]。所有样本均没有任何其他混杂的潜在的精神疾病的报告。数据中的20个样本为原实验中经过筛选后的病例,病例之间在年龄,死亡间隔和PH方面没有任何显著差异。数据在原实验中已进行标准化处理。

2.2 双因素方差分析对差异表达基因的筛选

采用双因素方差分析法对基因表达数据进行分析,筛选对吸烟和饮酒敏感的基因。在建立方差分析模型时,每一个表达数据称为一个观测值,基因的表达量称为观测变量,吸烟与饮酒是两个控制变量,对基因表达微阵列数据中每一行基因进行双因素方差分析。将样本是否吸烟成瘾作为一个控制变量,将样本是否饮酒成瘾作为另一个控制变量,利用方差分析分别求得每一条基因对于是否吸烟成瘾呈差异表达的P值以及对于是否饮酒成瘾呈差异表达的P值。P<0.01被认为存在显著差异。

2.3 使用DAVID软件对差异表达基因做GO功能注释与KEGG信号通路映射

原始数据中每一条基因的信息由EST数据库的genebank收录号给出,使用NCBI自带的BLAST工具将经过方差分析筛选出来的基因批量的与nucleotide数据库中的基因序列进行对应,将所得结果保存为XML文件,通过解析XML文件取得与每条基因相似度最高的nucleotide已知序列,得到该序列的genebank收录号。将所得基因的genebank收录号传入DAVID分析网站中,得到GO功能注释的生物过程(BP)和KEGG信号通路。DAVID分析操作步骤如下:提交基因集,选择基因标识名为“GENEBANK_ACCESSION”,选择基因集类型为“Gene List”;得到注释结果摘要,包括多种注释数据;选择“GOTERM_BP_DIRECT”和“KEGG_PATHWAY”,并得到分析结果。

3 结果

3.1 吸烟(饮酒)成瘾样本的差异表达基因

在方差分析中,共得到197 (77)个与吸烟(饮酒)成瘾相关的基因。使用层级聚类方法对吸烟(饮酒)成瘾相关基因进行聚类分析, 20个样本被聚成两大类,第Ⅰ类样本均为不吸烟(饮酒)的样本,第Ⅱ类样本均为吸烟(饮酒)成瘾的样本,筛选出的基因在两类样本中呈现明显的差异性。197 (77)条基因共被聚成两大类,第Ⅰ类基因在不吸烟(饮酒)样本中普遍呈现高表达,在吸烟(饮酒)样本中普遍呈现低表达,第Ⅱ类基因在吸烟(饮酒)样本中普遍呈现高表达,在不吸烟(饮酒)样本中普遍呈现低表达。

利用DAVID软件对吸烟(饮酒)成瘾相关基因进行分析。吸烟成瘾相关基因GO功能注释的生物过程(BP)见表1(P<0.05)。根据表1可以看出与吸烟相关的功能注释大多与物质转运、细胞迁移、信号传导有关。饮酒成瘾相关基因GO功能注释的生物过程(BP)见表2(P<0.05)。从表2中可以看出饮酒相关的功能注释同样包括信号传导、物质转运。吸烟与饮酒相关的功能注释中均包括细胞外基质的调节功能。

3.2 烟酒成瘾中均呈差异表达的基因

对比吸烟成瘾相关基因与饮酒成瘾相关基因,有七个基因在二者中均有出现,分别为TMEM53、IGFBP7、FN1、HNRNPA2B1、FLJ59422、SYNJ1、TLN2。

将七个基因对于各自的四类样本的表达量变化趋势进行构图,见图1,根据图中每条线段斜率的正负可以得到饮酒与基因表达量之间的定性关系;比较图中虚线段与实线段的相对位置可以得到吸烟与基因表达量之间的定性关系。

表1 吸烟成瘾相关基因的GO功能注释(BP)

从图1中可以看出,TMEM53基因和TLN2基因的表达量对吸烟与饮酒均成明显的负相关趋势, IGFBP7、FN1、HNRNPA2B1、FLJ59422、SYNJ1基因对吸烟与饮酒均成明显的正相关趋势。总体来看,七个基因在吸烟样本中呈现高表达的,其在饮酒样本中也必然呈现高表达,反之亦然。

表2 饮酒成瘾相关基因的GO功能注释(BP)

图1 7条交叉的基因对吸烟、饮酒的健康与成瘾样本表达趋势对比图(NS在0处的点代表非吸烟非饮酒样本,NS在1处的点代表非吸饮酒烟样本,S在0处的点代表吸烟非饮酒样本,S在1处的点代表吸烟饮酒样本)

Fig1Comparisonoftheexpressionof7crossedgenesonsmokinganddrinkingbetweenhealthandaddiction(Thepointattheintersectionof0andNSrepresentsnon-alcohol-non-smokingsamples,thepointattheintersectionof1andNSrepresentsalcohol-non-smokingsamples,thepointattheintersectionof0andSrepresentsnon-alcohol-smokingsamples,thepointattheintersectionof1andSrepresentsalcohol-smokingsamples)

4 讨论

吸烟与饮酒成瘾和基因之间的关系已经越来越明显,但目前尚不能确定与烟酒成瘾相关的基因以及其发病机理。利用生物信息学方法对烟酒成瘾相关基因进行筛选是目前十分有效的方法之一。本研究选用双因素方差分析分别提取对吸烟成瘾和饮酒成瘾呈现差异表达的基因,其中共有的差异表达基因有七条。

TMEM53基因编码跨膜蛋白53(transmembrane protein 53),该基因同其他跨膜蛋白一样在转运物质及信号传导方面具有一定的作用,与该基因有关的表型有增加痘苗病毒(VACV)感染、增加γ-H2AX磷酸化、降低CFP-tsO45G细胞表面转运、增加转铁蛋白(TF)内吞作用、减少IL-8分泌等[13-14]。

TLN2基因位于人类15号染色体,编码与Talin 1相关的蛋白质,是一种细胞骨架蛋白,在肌动蛋白丝的装配和各种细胞类型的迁移中有着重要的作用[15]。IGFBP7基因编码胰岛素样生长因子结合蛋白7(insulin like growth factor binding protein 7),与其相关的信号通路是细胞衰老和自噬,与该基因相关的GO功能注释包括胰岛素样生长因子结合。FN1基因编码纤维连接蛋白1(fibronectin 1)该蛋白参与了基质重塑及细胞黏附和迁移过程[16]。HNRNPA2B1基因编码的蛋白质为不均一型核糖核蛋白A2B1(heterogeneous nuclear ribonucleoprotein A2B1,HNRNPA2B1)。HNRNPA2B1蛋白参与很多重要的生理过程,包括RNA的转录、外显子剪接、PremRNA的成熟降解、细胞分化及细胞凋亡等[17]。已有许多研究表明TLN2、IGFBP7、FN1和HNRNPA2B1基因与多种人类癌症的发病、治疗和预后有很强的关系,包括肝癌、乳腺癌、甲状腺癌、胰腺癌、胃癌、食管鳞癌、口腔癌等恶性肿瘤[18-22]。本研究显示这些基因与烟酒成瘾具有很强的相关性,据此可初步推断吸烟或饮酒会直接或间接影响此类恶性肿瘤的发病和治疗,烟酒成瘾与癌症发病在基因层面上的相关性与发病机理有待进一步验证。

FLJ59422基因编码的蛋白质高度相似于含GRAM结构域的蛋白质3,,其余信息暂无相关研究和文献资料[23]。

SYNJ1编码一种磷酸肌醇磷酸酶蛋白(synaptojanin 1),其在突出小泡的内吞后循环中有重要作用,这种酶的表达可能影响突触传播和膜运输[24]。已知的与SYNJ1基因相关的疾病包括早发性帕金森病和非典型青少年帕金森综合征[25]。本研究显示SYNJ1基因的表达同吸烟与饮酒具有相关性,其在吸烟与饮酒者中的表达量均为明显的高表达。已有研究显示吸烟者患帕金森病的风险比不吸烟者低63%,而既往吸烟者(已戒烟者)比不吸烟者低41%[26]。本研究通过对基因表达谱的分析,再次证实SYNJ1基因表达趋势的变化可能对吸烟与饮酒者患帕金森病的几率产生影响。

本研究发现的烟酒成瘾相关基因均在物质运输、信号传导、细胞外基质和细胞周期中发挥一定的作用,长期吸烟与饮酒会引起这些基因表达量发生显著变化,从而对神经系统与细胞物质运输能力产生一定影响,当短时间戒断时,机体内神经系统与物质运输能力减弱,从而使人产生不适感,这很可能是烟酒成瘾者产生戒断反应的原因之一。在整个脑区域,酒精具有许多潜在的目标,包括膜和几个离子通道,而尼古丁通过特异性受体或结合蛋白起作用,长期使用酒精和尼古丁会使得大脑区域中产生适应性变化,最终导致成瘾[27]。已有大量研究证实多巴胺信号传导和吸烟成瘾有着重要的相关性,与之相关的基因包括DRD2、DAT1、NACHR等[28-29]。

5 总结

研究中使用双因素方差分析对吸烟与饮酒者的基因表达数据进行差异表达基因提取,用层级聚类的方法对筛选出的特征基因绘制热图,观察特征基因在四类样本中的表达趋势变化。取吸烟成瘾者的特征基因与饮酒成瘾者的特征基因的交集后,二者共有的基因包括TMEM53、IGFBP7、FN1、HNRNPA2B1、FLJ59422、SYNJ1、TLN2。根据DAVID分析结果以及对七个交叉基因的分析,认为烟酒成瘾与信号传导与物质运输之间存在重要的相关性,这对于临床治疗烟酒成瘾具有一定的指导意义。通过对七个交叉基因的分析以及结合已有研究成果,查阅国内外数据库资料得知,其中IGFBP7、FN1、HNRNPA2B1基因与癌症的发病与治疗存在密切的联系,SYNJ1基因与帕金森综合征存在密切联系。综合这些基因的生物学功能及已有研究结果,推知吸烟与饮酒极有可能与恶性肿瘤的发病和预后存在直接或间接的相关性,对于疾病的预防和治疗具有重要意义。

猜你喜欢
成瘾者烟酒饮酒
3.主动拒绝烟酒与毒品 第一课时
中秋的月
饮酒,到底是好还是坏呢
美沙酮维持治疗门诊海洛因成瘾者心理及行为调查
《陶渊明 饮酒》
与猫狗共饮酒
大学生网络成瘾者的时间知觉机制研究
短期戒断的海洛因成瘾者大脑白质完整性的DTI研究
中外烟酒茶杂志《问道·中国茶》专刊各地读者俱乐部
《中外烟酒茶》各地读者俱乐部