区锦涛,吴 东,黄 丹,李 文* (.广东医科大学,广东湛江 5403;.广东医科大学附属医院,广东湛江 5400)
吸烟是全世界最主要的公共卫生问题之一。在中国约有3.2亿吸烟者[1]。烟草烟雾中包含了超过7 000种化合物,主动或被动烟雾暴露可导致多种呼吸系统疾病[2-3]。如慢性阻塞性肺疾病(COPD)最常见的环境危险因素是吸烟,与不吸烟者相比,吸烟者更容易出现呼吸系统症状和肺功能异常[4]。金属硫蛋白(MT)是一类低分子量的蛋白家族,以重金属和半胱氨酸含量高为主要特征。MT有重金属解毒的功能,同时还具有抗氧化和抑制炎症反应的作用[5-6]。miRNA是长度约20个核苷酸的单链非编码RNA,其在转录后调节基因表达的作用已引起广泛关注[7]。hsa-miR-4722-5p于2011年 被Persson等[8]测序和鉴定,但目前仍未有其与COPD相关的研究。本文利用公共基因表达综合数据库(GEO),运用大样本量的整合分析和生物信息学方法,探讨吸烟对MT表达的影响及其潜在机制。
在GEO数据库(https://www.ncbi.nlm.nih.gov/geo/) 中获取GSE97010和GSE14383矩阵数据。GSE-97010用于探索急性烟雾暴露对气道基因表达的影响;GSE14383用于研究人支气管上皮细胞长期暴露于低剂量香烟烟雾冷凝物(CSC)的影响。使用R语言GEOquery、Biobase、Bioc Generics和AnnotationDbi包,按以下标准进行探针过滤和基因映射:(1)排除无效和多基因注释探针;(2)如果一个基因有多个探针,则选择表达平均值最大的探针。对MT基因表达值进行log2转换后,使用GraphPad Prism 8软件绘制GSE97010矩阵急性烟雾暴露后MT表达差异、GSE14383矩阵CSC组与对照组MT表达差异。矩阵GSE97010急性烟雾暴露后与自身基础状态的比较进行配对t检验,P<0.05表示差异有统计学意义。
1.2.1 获取和筛选微阵列数据 查询GEO公共功能基因组数据库(www.ncbi.nlm.nih.gov/geo/)进行筛选,关键字为“smoker”或“smoke”,选择物种为“Homo sapiens”。 筛选标准依次为:(1)纳入初始矩阵的独占样本,确保后续矩阵中被重新分析的样本不会被重新纳入;(2)检测样本取自气道;(3)包含吸烟组与不吸烟组;(4)每组受试者人数3人及以上;(5)矩阵的基因表达值不能为零或 “不可用(NA)” 。19个基因矩阵(GSE10006、GSE10135、GSE11784、GSE11906、 GSE14633、 GSE19027、 GSE19722、GSE22047、 GSE3320、 GSE4302、 GSE43079、GSE43939、 GSE4498、 GSE5056、 GSE5057、GSE5059、GSE7895、GSE8545、GSE994)的753个独占样本被选出并用于整合分析。19个矩阵及其753个独占样本见表1。
1.2.2 探针过滤和基因映射 使用R语言GEOquery、Biobase、BiocGenerics和AnnotationDbi包,按以下标准进行探针过滤和基因映射:(1)排除无效和多基因注释探针;(2)如果一个基因有多个探针,则选择表达平均值最大的探针。对MT基因表达值进行log2转换。
1.2.3 组内相关系数(ICC) 选择矩阵GSE22047中7位受试者的大、小气道MT表达值,使用R语言irr包计算双向随机/混合模型、绝对一致性计算类型、单一度量的组内相关系数[ICC(A,1)]作为衡量大、小气道MT表达值一致性和可靠性的指标,并进行F检验。ICC取值在0~1,ICC<0.2说明一致性程度较差,0.2~0.4说明一致性程度一般,0.5~0.6说明一致性程度中等,0.7~0.8说明一致性程度较强,0.9~1.0说明一致性程度很强;P<0.05表示拒绝大、小气道MT表达不一致的虚无假设。
表1 19个矩阵的基本特征
1.2.4 统计分析 使用筛选得到的19个微阵列矩阵、753个独占样本的基因表达值,对各矩阵吸烟与不吸烟组的表达差异进行整合分析,使用R语言meta、metafor包进行异质性检验统计量法的Q检验、I2检验、H检验以评估各矩阵的异质性,计算逆方差(IV)加权的标准化均数差(SMD);根据Cochrane干预措施系统评价手册(version 5.0.1)及组内相关系数分析结果,采用固定效应模型(FEM)进行敏感性分析;采用漏斗图不对称的加权线性回归检验评估发表偏倚。pval.Q<0.05表示矩阵间可能有显著异质性;0% 进一步筛选表1的19个矩阵,设定自变量x为吸烟者的packyear指数(吸烟指数=packyear×20),因变量y为吸烟者气道MT表达值与不吸烟者平均值的log2变化倍数,建立过原点(0,0)的线性回归模型,斜率(即回归系数)为自变量x对因变量y干预效应的大小,斜率非零的P值用于评估干预效应的显著性。建立吸烟者与不吸烟者气道MT基因的表达差异与吸烟指数的线性回归模型,并假设误差服从均值为0的正态分布,自变量x、因变量y的注释如下: 其中ai为不吸烟者的气道MT表达值,bj、dj为吸烟者的气道MT表达值、packyear指数。248个吸烟者、14个MT家族基因共2 473个点,使用GraphPad Prism 8软件将2 473个点绘制散点图,建立线性回归模型,假设0 packyear指数的吸烟者气道MT表达值与不吸烟者相等并强制线性回归方程经过原点(0,0),采用GraphPad Prism 8软件分析线性回归方程结果。 使用miRDB的自定义预测功能预测靶向16个MT的miRNA,CLUSTAL W软件对16个MT的信使RNA进行多序列比对。 基因表达矩阵数据集GSE97010对63名吸烟者在急性吸烟暴露后与自身基础状态的气道MT表达进行比较,发现除MT3外所有MT亚型表达均增高,其中MT1B、MT1H、MT1IP、MT1L、MT1M、MT1X和MT4的mRNA显著上调(P<0.05或0.01)。见图1。 图1 急性烟雾暴露后MT的表达 基因表达矩阵数据集GSE14383显示,CSC能够诱导BEAS-2B细胞MT1和MT2的表达,而MT3和MT4的变化则不显著。见图2。 图2 CSC对MT的影响 矩阵GSE22047的7位受试者大、小气道MTICC(A,1)的中位数为0.8558。F检验P<0.05,拒绝虚无假设,大、小气道MT表达高度一致且可信度高。见表2。 整合分析结果显示:MT1G和MT3可能有显著异质性但其效应较低,只有MT1F可能存在中度异质性或实质性异质性。吸烟组气道MT1、MT2和MT3被显著抑制,而长期烟雾暴露对MT4无显著的干预效应。敏感性分析在每次删除1个矩阵数据后将重新计算的SMD与原SMD比较,没有发现有任何一个矩阵在本次整合分析中起关键作用,发表偏倚不显著。见表3。 由表4可知:样本量>200的MT1、MT2、MT3线性回归方程斜率<0且显著非零,提示吸烟者气道MT1、MT2、MT3的表达与吸烟指数呈显著负相关(P<0.05),吸烟指数对气道MT4表达的干预效应不显著(P>0.05)。 所有MT1、MT2、MT3亚型的miRNA预测结果的交集为hsa-miR-4722-5p,MT1、MT2、MT3亚型的信使RNA序列包含3~5个“CTCCTGC”片段,可与hsa-miR-4722-5p种子区域匹配,MT4的信使RNA序列未发现hsa-miR-4722-5p种子区域结合位点。hsa-miR-4722-5p可能参与MT1、MT2、MT3基因转录后调控。 尽管已有研究证明吸烟者气道MT的表达被抑制,但很少有文献详细报道急、慢性烟雾暴露的气道MT有相反的表达趋势:矩阵GSE97010和GSE 14383分析所示,急性烟雾暴露和低剂量烟雾冷凝物能够上调所有的MT1和MT2。我们根据公开的GEO矩阵数据集,通过对大量样本的吸烟者与不吸烟者气道MT表达谱进行整合分析,更加准确地评估了慢性烟雾暴露对气道MT的抑制效应。 表2 矩阵GSE22047的7名受试者大、小气道MT表达的一致性 表3 MT表达差异的整合分析结果 图3 吸烟者气道MT变化倍数与packyear指数的关系 表4 吸烟者气道MT变化倍数与packyear指数线性回归模型的特征 图4 hsa-miR-4722-5p靶向MT1、MT2、MT3的结合位点 研究发现,与不吸烟者相比,吸烟者血液、肾脏、肝脏组织的MT mRNA和蛋白水平均升高,而上升的肺MT在持续烟雾暴露后又将降至正常[12]。尸体解剖亦发现重度吸烟者的肺MT表达下降,表明慢性烟雾暴露能够特异性降低肺/气道MT的表达,导致气道对氧化应激的敏感性增高,造成活性氧积累,破坏呼吸系统正常的修复和防御机制[13]。本研究首次证明了慢性吸烟者气道MT1、MT2、MT3亚型的表达与吸烟指数显著负相关。亦有研究证实吸烟者被抑制的MT即使在戒烟后仍难以回升,提示MT可能是COPD等吸烟相关肺疾病发生、发展的关键,可作为监测吸烟强度的标志物[14-15]。 本研究使用生物信息学方法探索了慢性烟雾暴露抑制气道MT1、MT2、MT3表达的潜在机制。根据miRDB预测结果和CLUSTAL W多序列比对,MT1、MT2、MT3的信使RNA高度同源,且包含“CTCCTGC”序列可与hsa-miR-4722-5p种子区域相匹配,较好地解释了MT1、MT2、MT3同步下降及MT4无显著变化的原因。但迄今为止,尚未有研究报道MT蛋白家族与hsa-miR-4722-5p的关系。 总之,本研究证实了慢性烟雾暴露能够显著抑制吸烟者气道MT1、MT2、MT3亚型表达,且与吸烟指数呈显著负相关。慢性烟雾暴露可能通过hsamiR-4722-5p抑制气道MT1、MT2、MT3。MT和hsamiR-4722-5p或可为减少吸烟损伤和预防COPD等吸烟相关肺疾病的发展提供新的治疗靶点。1.3 建立线性回归模型
1.4 miRNA预测[10-11]
2 结果
2.1 急性烟雾暴露和CSC对MT的影响
2.2 长期烟雾暴露对气道MT1、 MT2和MT3表达的影响
2.3 吸烟指数对气道MT1、MT2和MT3的影响
2.4 hsa-miR-4722-5p对长期烟雾暴露气道MT1、MT2、MT3的影响
3 讨论