典型水环境介质中整合酶基因分布特征研究

2022-04-06 10:17李紫涵张徐祥任洪强
环境监控与预警 2022年2期
关键词:饮用水介质典型

李紫涵,张徐祥,任洪强

(污染控制与资源化研究国家重点实验室,南京大学环境学院,江苏 南京 210023)

0 前言

整合子是一种携带多种耐药基因并能够使其在不同细菌间进行水平转移的可移动遗传元件[1],主要由整合酶基因(Integrase gene,intI)和可携带耐药基因(Antibiotic resistance genes,ARGs)的基因盒2部分组成[2-3]。据文献报道,目前至少有9类整合酶基因[4],有研究表明Ⅰ、Ⅱ、Ⅲ类整合酶基因和耐药基因的关系最密切[5]。

由于人类生产生活的影响,大量整合子和耐药基因进入水环境[6-7]。医疗废水被认为是污水处理厂和自然环境中人为释放整合子和耐药基因的主要来源,含高浓度抗生素与抑菌剂的水体为耐药细菌、可移动遗传元件和耐药基因提供了选择性环境[8-9]。生活污水则是整合子和耐药基因排放到自然水体中的主要途径,污水处理设施中高密度、多种类的细菌环境成为了整合子及其携带的耐药基因的巨型反应器[10]。由于抗生素在养殖业中的使用,水产养殖废水分离菌株亦被检测出含有整合酶基因[11-12]。饮用水是与人体健康息息相关的极为重要的水体环境,已有报道发现饮用水携带Ⅰ、Ⅱ类整合子[13],而Ⅲ类整合子少有文献报道。

目前对水环境介质中整合酶基因的检测大多集中于用荧光实时定量聚合酶链式反应(PCR)扩增整合酶基因的特定片段[7, 14-16],该方法对样品浓度和整合酶基因丰度有一定要求,引物的选择也会影响整合酶基因的检测结果。宏基因组测序技术可以全面地对不同环境样品进行针对性分析,近年来,宏基因组测序技术也运用到整合酶基因的检测中[7, 17],其主要依赖整合子数据库,如INTEGRALL[18-19]。现选取4种典型水环境介质:饮用水、生活污水、水产养殖废水和医疗废水,通过宏基因组高通量数据与数据库比对的方法对数据库中已有的多种整合酶基因同时进行比对,全面地检测样品中的整合酶基因和ARGs的种类,分析不同种类整合酶基因的多样性及均匀度特征,并采用多元统计分析方法揭示水环境介质中整合酶基因和ARGs丰度的相关性。从而有助于识别水环境中ARGs的水平转移风险,为水环境中ARGs的有效控制提供科学依据。

1 材料与方法

1.1 宏基因组数据收集

选择4种典型水环境介质(饮用水、生活污水、水产养殖废水及医疗废水)作为研究对象。

饮用水样品分别采集自上海、苏州、无锡、南京、芜湖、安庆、九江、武汉、岳阳、荆州、万州、重庆12个城市的自来水管网;生活污水样品采集自中国东部某城市的2个生活污水处理厂的进、出水口及活性污泥工艺段。采集得到的样品使用FastDNA SPIN试剂盒提取样品总DNA并送至生工生物工程(上海)有限公司进行宏基因组测序,测序平台为Hiseq 2500。

水产养殖废水和医疗废水数据下载自美国国家生物技术信息中心(NCBI)的序列读取存档(Sequence Read Archive,SRA)平台,上传时间为2017—2019年。样品宏基因组数据信息见表1。

表1 4种典型水环境样品的宏基因组高通量测序数据的基本信息

1.2 生物信息分析流程

(1)数据格式转化。水产养殖废水、医疗废水数据下载自NCBI的SRA平台,使用sratoolkit工具包中fastq-dump工具将下载的SRA数据转换为fastq文件。

(2)双端测序数据质量控制。为确保数据分析的准确性,采用fastp软件对下载数据和SRA转化数据进行质量控制,得到最终的高质量序列。

1.3 整合酶基因注释

(1)数据库构建。整合酶基因数据库选用INTEGRALL数据库(http://integrall.bio.ua.pt/),包含整合酶基因1 498条及基因盒8 562条。

(2)数据库比对结果筛选。将质控后的fastq文件转化为fasta文件与下载到本地的INTEGRALL数据库进行BLAST比对,比对软件为BLAST 2.2.7,比对条件:E-value≤ 10-5,num_alignments为1。

(3)整合酶基因注释。按相似性≥90%、比对长度≥50%筛选比对结果,将筛选后的BLAST比对结果与INTEGRALL数据库中整合酶基因列表进行再次比对,保留注释结果为整合酶基因的条目。

1.4 ARGs注释

ARGs数据库比对选用耐药基因分析工具ARGs-OAP v2.0[20],该数据库包含24个ARGs类型、1 208个抗性亚型、12 307条ARGs参考序列。比对共有2个步骤:(1)对高通量数据进行比对及过滤,以E-value≤10-7,相似度≥80%为过滤条件输出meta-data文件;(2)使用SARGfam数据库,将ARGs基因进行定性定量分析和types及subtypes分类。

根据公式(1)、(2)计算出整合酶基因及ARGs绝对丰度[21]。

(1)

(2)

式中:CAbundance——基因绝对丰度;n——属于某ARGs类型的映射ARGs参考序列的数量;NARG-like sequence——注释到某特定ARGs参考序列的类ARGs序列的数量;Lreads——该类ARGs reads的长度;LARG reference sequence——对应的特定ARGs参考序列的序列长度;Ncell number——细胞数;N16S sequence——16S rRNA基因序列的数量;L16S sequence——16S rRNA基因的全长;m——根据提取的超可变区域信息,从宏基因组数据检测出的总类群;Mi——CopyRighter数据库中分类单元i的拷贝数;ai——宏基因组数据集中分类单元i的丰度;A——所有m分类群的总丰度。

1.5 数据分析

使用SPSS软件对整合酶基因和ARGs丰度相关性进行Pearson检验,显著性分析则选用双侧检验并标记显著性相关关系,判断不同典型水环境介质中,不同种类整合酶基因和24个类型ARGs相关性关系,当r≥0.6且P<0.05时,认为结果具有统计学意义。为分析不同典型水环境介质中整合酶基因丰度和类型的多样性,使用R语言中vegan包对整合酶基因进行alpha多样性分析,计算其Shannon-wiener多样性指数和Pielou均匀度指数。Vegan包和ggplot2包还被用于分析与绘制Bray-Cutis距离下4种典型水环境介质中整合酶基因相似性,并使用多元方差分析(Adonis)、相似性分析(ANOSIM)和多响应置换过程分析(MRPP)3种统计学方法对其组间与组内差异进行显著性检验。

2 结果与分析

2.1 典型水环境介质中整合酶基因丰度分析

将4种典型水环境高通量数据与整合子数据库INTEGRALL进行比对及结果筛选,各类整合酶基因的检出率见表2。intI1和intI3基因在4种水环境介质中均有检出。除饮用水外,intI2在其他3种水环境介质样品中部分检出,分别为生活污水26.7%(8/30个),水产养殖废水4.8%(1/21个)、医疗废水41.7%(10/24个)。

表2 4种典型水环境介质中各类整合酶基因检出率 %

4种典型水环境介质中整合酶基因总丰度见图1,图中*为P<0.05;**为P<0.01。由图1可见,生活污水、水产养殖废水和医疗废水中整合酶基因相对丰度显著大于饮用水整合酶基因(P<0.05),生活污水相对丰度显著大于水产养殖废水(P<0.05),而其与医疗废水和水产养殖废水的整合酶基因相对丰度无显著性差异(P>0.05)。生活污水的整合酶基因在30个样品中分布最为集中,相对丰度为2.23×10-2~6.31×10-1copy/cell,有研究表明生活污水中整合酶基因丰度变化受时间的影响较小[22]。医疗废水中整合酶基因相对丰度最低为7.43×10-3copy/cell,最高为1.34 copy/cell,显著高于饮用水(P<0.05),但与生活污水和水产养殖废水中整合酶基因相对丰度无显著性差异(P>0.05)。水产养殖废水的整合酶基因相对丰度为1.64×10-3~2.11×10-1copy/cell,介于生活污水和饮用水之间。饮用水中整合酶基因相对丰度虽在4种水环境介质中最低(P<0.05),为2.47×10-4~1.40×10-1copy/cell,但其分布范围广,在采样的12个城市饮用水管网末梢均有检出。

图1 4种典型水环境介质中整合酶相对丰度

4种典型水环境介质中各类整合酶基因相对丰度见图2(a)(b)(c)(d),除文献中已明确报道的intI1—intI9外,将数据库比对结果中未分类的整合酶基因统一归为“others”。

图2 4种典型水环境介质中各类整合酶基因相对丰度

由图2可知,4种典型水环境介质中intI1的检出率和相对丰度均高于其他种类整合酶基因。intI2在生活污水和医疗废水中相对丰度分别为1.74×10-4~4.27×10-3copy/cell和2.80×10-4~1.31×10-1copy/cell,只在一个水产养殖废水样品中检测出intI2基因,饮用水样品中未检测出intI2基因。intI3在生活污水、水产养殖废水和医疗废水中丰度分别为6.48×10-5~6.60×10-2,3.51×10-5~3.59×10-5和5.05×10-5~1.59×10-2copy/cell,仅在1个饮用水样品中检测出intI3基因,其相对丰度为2.13×10-5copy/cell。intI9基因也在生活污水、水产养殖废水和医疗废水中检出。intI6基因仅在1个医疗废水样品中检测出。intI1和intI2基因在医疗废水中平均丰度最高,生活污水次之,而intI3和intI9在生活污水中平均丰度最高,医疗废水次之。

2.2 典型水环境介质中整合酶基因多样性及均匀度分析

4种典型水环境介质中整合酶基因种类多样性及均匀度相关性分析结果见图3(a)(b),图中*为P<0.05;**为P<0.01。Shannon-Wiener指数用于表征整合酶基因组成的丰富程度,指数越大,表明该种水环境介质中整合酶基因的多样性越高[23]。Pielou指数用于表征环境中不同基因分布的均匀程度(Species evenness)[24-25],Pielou指数越高,表明环境中各类整合酶基因丰度越接近,均匀度越大。

图3 4种典型水环境介质中整合酶基因种类多样性及均匀度

由图3(a)可见,4种典型水环境介质两两之间Shannon-Wiener指数均有显著性差异(P<0.05),医疗废水中含intI1、intI2、intI3、intI6和intI9共5种整合酶基因,多样性最高,其次是生活污水,水产养殖废水整合酶基因多样性显著大于饮用水。由图3(b)可见,4种典型水环境介质中,医疗废水均匀度最大,说明医疗废水中各类整合酶基因的分布较为平均,饮用水的Pielou指数最小,生活污水和水产养殖废水均匀度指数无显著性差异。综上所述,4种典型水环境介质中整合酶基因多样性大小为:医疗废水>生活污水>水产养殖废水>饮用水;均匀度大小为:医疗废水>水产养殖废水、生活污水>饮用水。

2.3 典型水环境介质中整合酶基因组成相似性分析

为探讨4种典型水环境介质中整合酶基因组成的相似性,对111个样品进行主坐标分析(PCoA),结果见图4。Bray-Cutis距离是根据均一化丰度表定量度量基因组成差异的距离计算方式。由图4可见,在Bray-Cutis距离下,生活污水整合酶基因丰度和饮用水差异较大,与水产养殖废水的相似性较高,饮用水、水产养殖废水和医疗废水的整合酶基因差异性小,即这3种水环境的整合酶基因丰度及组成结构的相似性较高。通过Adonis、ANOSIM、MRPP 3种统计方法对Bray-Cutis距离下4种水环境整合酶基因组成的组间差异进行显著性检验,结果见表3。Adonis利用距离矩阵对总方差进行分解,常用于分析不同分组因素对样品差异的解释度,r2越大时,分组方案对差异的解释度越高,表3中Adonis的r2=0.261,说明整体上4种典型水环境整合酶基因的组成有显著性差异(P<0.001)。ANOSIM是一种非参数检验,主要用于比较组内和组间差异的大小,r值趋近1时,组间差异大于组内差异,r值趋近-1时,组内差异大于组间差异。MRPP是另一种基于组内和组间差异的置换检验,当Expected δ>Observed δ时,组间差异大于组内差异。表3中,ANOSIM的r=0.305,MRPP的Expected δ=0.686>Observed δ=0.576,说明4种典型水环境介质中整合酶基因的组成有显著性差异,且组间差异大于组内差异(P<0.001)。

图4 4种典型水环境介质中整合酶基因组成基于Bray-Cutis距离的PCoA分析

表3 Bray-Cutis距离下3种统计方法对4种典型水环境介质中整合酶基因组成的显著性检验

2.4 典型水环境介质中整合酶基因与ARGs相关性分析

水环境介质中intI1基因与磺胺类、大环内酯-林肯酰胺-链阳霉素、四环素类、氯霉素和甲氧苄氨嘧啶5类抗生素耐药基因丰度具有强相关性(r≥0.6且P<0.05);intI2基因与磺胺类抗生素耐药基因丰度具有强相关性(r≥0.6且P<0.05);intI3基因与18种抗生素耐药基因丰度均为弱相关或无相关性(r<0.4)。

对4种典型水环境介质中整合酶基因丰度和抗生素耐药基因丰度相关性分别进行分析,结果见图5。由图5可见,饮用水中I类整合酶基因intI1丰度与氨基糖苷类和磺胺类耐药基因丰度呈显著相关。由于磺胺类耐药基因是I类整合子3′保守末端的组成部分,因此氨基糖苷类耐药基因可能是饮用水中I类整合子基因盒中的常见ARGs。Adesoji等[26]研究发现饮用水中分离的假单胞菌intI1基因盒内含有2种抗氨基糖苷类耐药基因(aadA1和aadA2)和一种抗磺胺类耐药基因(sul1),胡亚茹等[27]也发现饮用水水源地中intI1与磺胺类耐药基因sul1、sul2存在正相关关系,认为intI1在磺胺类ARGs的水平转移过程中起到了重要作用,与本研究分析结果一致。

生活污水中intI1基因与磺胺类、氯霉素、β-内酰胺类、氨基糖苷类等15种抗生素耐药基因显著相关,Harnisz等[28]用实时荧光定量(qPCR)方法检测17个污水处理厂的污水样品中ARGs和intI1基因丰度,发现intI1基因与磺胺类sul1、β-内酰胺类blaTEM、氨基糖苷类aac(6′)-lb-cr、大环内酯类ermF和四环素类tet(A)基因具有良好的正相关性(Spearman相关系数r= 0.69~0.83,P<0.05),An等[29]在污水样品I类整合子基因盒克隆文库中检测出氯霉素catB8基因、β-内酰胺类blaOXA-101基因、氨基糖苷类aadA2基因、甲氧苄氨嘧啶drfA14基因等。生活污水中intI2基因与博来霉素、大环内酯-林肯酰胺-链阳霉素和四环素耐药基因显著相关,有文献还发现Ⅱ类整合子可与I类整合子携带相同基因盒,且I类整合子的整合酶基因可能协助Ⅱ类整合子基因盒内ARGs表达[30]。intI3基因与比对出的18种耐药基因均无显著相关性。生活污水中携带耐药基因盒的主要为I类整合子和Ⅱ类整合子。

水产养殖废水中intI1、intI2、intI3基因与18种耐药基因均无显著相关,仅有intI1与喹诺酮(r= 0.462,P<0.05)、利福霉素(r= 0.442,P<0.05)和四环素(r=0.439,P<0.05)呈中等相关。

医疗废水中intI1与磺胺类、氨基糖苷类、β-内酰胺类、甲氧苄氨嘧啶、大环内酯-林肯酰胺-链阳霉素和四环素类6种抗生素耐药基因丰度呈显著相关(r>0.6,P<0.05)。intI2与磺胺类、氨基糖苷类、β-内酰胺类和甲氧苄氨嘧啶4种抗生素耐药基因显著相关(r>0.6,P<0.05),有文献发现Ⅱ类整合子基因盒中携带drfA1、aadA1、blaCARB-4、catB2、ereA、sat2等耐药基因,其中抗甲氧苄氨嘧啶类、氨基糖苷类和链阳霉素(dfrA1-sat2-aadA1)耐药基因盒最为常见[31-32]。intI3与喹诺酮、膦胺霉素、春日霉素和多粘菌素4种耐药基因有显著相关性(r> 0.6,P<0.05)。

近年来,有关Ⅲ类整合子基因盒携带耐药基因的报道较少,Elizabeth、Yamamoto等[33-34]分别在分离菌株发现1株基因盒中携带blaCTX-M的Ⅲ类整合子和1株携带aacA31-fosE-blaIMP-1的Ⅲ类整合子,本研究中氨基糖苷类和β-内酰胺类耐药基因与intI3的相关性系数分别为0.22和0.30(P>0.05),无显著相关关系,可能是由于Ⅲ类整合子基因盒中大多为功能基因,如insB、iroB、glpK等,而耐药基因携带的数量和种类有限,无法从丰度上显示其相关关系。

图5 4种水环境介质中3种整合酶基因与各类ARGs丰度的Pearson相关性

3 结论

(1)在4种典型水环境介质中检测出intI1、intI2、intI3、intI6和intI9共5种已明确分类的整合酶基因,整合酶基因相对丰度为:生活污水>水产养殖废水>饮用水,且医疗废水>饮用水;多样性为:医疗废水>生活污水>水产养殖废水>饮用水;均匀度为:医疗废水>水产养殖废水、生活污水>饮用水,生活污水与水产养殖废水的均匀度无显著性差异。

(2)在Bray-Cutis距离下进行主成分分析,结果表明4种典型水环境介质中整合酶基因的组成有显著性差异(P<0.001),且组间差异大于组内差异(Expected δ = 0.686>Observed δ = 0.576)。生活污水和饮用水中整合酶基因的组成差异性最大,而生活污水和水产养殖废水中整合酶基因组成和丰度的相似性较高,饮用水、水产养殖废水和医疗废水中整合酶基因的相似性较高。

(3)4种典型水环境介质中整合酶基因和ARGs丰度相关性分析结果表明,生活污水整合酶基因丰度最高,其I类整合子的基因盒携带磺胺类、氯霉素、β-内酰胺类、甲氧苄氨嘧啶等15种ARGs的可能性较高,Ⅱ类整合子携带博来霉素、大环内酯-林肯酰胺-链阳霉素和四环素ARGs的可能性高;医疗废水I类整合子的基因盒中磺胺类、氨基糖苷类、β-内酰胺类、甲氧苄氨嘧啶等6种ARGs较为常见,而Ⅱ类整合子基因盒中磺胺类、氨基糖苷类、β-内酰胺类和甲氧苄氨嘧啶4种ARGs较为常见;饮用水中主要存在I类整合子,其基因盒中可能携带氨基糖苷类ARGs;而水产养殖废水中整合子丰度较高,但与ARGs的相关性较弱,无法从数据分析上判断其主要携带的ARGs类型,亟待进一步研究。

猜你喜欢
饮用水介质典型
线切割绝缘介质收纳系统的改进设计
用最典型的事写最有特点的人
重介质旋流器选煤技术在我国的创新发展与应用
信息交流介质的演化与选择偏好
饮用水水质检测方法及存在问题分析
典型胰岛素瘤1例报道
生活饮用水微生物检验质量控制
“减塑”水站
典型催开百花香
典型引路 稳步推进