夏 骏 汪 岷 宫 政 姜 勇 马 玉 汪 俭邵红兵 王多兵 许志梦
(中国海洋大学海洋生命学院病毒实验室 青岛 266003)
海洋环境中的病毒数量极为丰富, 总共有将近4×1030个, 平均丰度约 3×109ind./L (Suttle, 2005)。海洋病毒以微食物环、侵染微生物等形式影响海洋生物群落组成和碳氮循环(Wilhelm et al, 1999), 浮游病毒优先杀死占优势宿主的特性能使海域富营养区的赤潮快速消散(Brussaard et al, 2005, 2008)。渤海的浮游病毒数量相当丰富, 2010年从春季至冬季数量变化范围是(6.40×108—3.59×1010)ind./L, 并且呈现出中部海域丰度高于近岸海域的情况(王健等, 2013)。本文所研究的站位 B47(38.66°N, 118.97°E)处于渤海远离岸边的海域, 受近岸的环境因素影响较小, 2011年12月以流式细胞仪测得的病毒丰度为 8.97×109ind./L, 因此选择这个点的数据来代表渤海浮游病毒群落的大致情况。
宏基因组学(metagenomics)作为研究环境总基因组的有效方法在1998年第一次提出(Handelsman et al,1998), 可以直接对环境样品中未经培养的微生物群落复杂的总基因组进行分析, 通过遗传物质的提取、测序、拼接、注释、统计分析等步骤(Thomas et al,2012), 了解环境微生物群落的物种组成、功能基因结构、进化地位、种间关系以及与环境因子的相关性(Handelsman, 2004)。
近十多年来, 有多个探索海洋病毒宏基因组的研究成果被发表。有针对海水中病毒组的相关研究(Angly et al, 2006; Steward et al, 2011; Williamson et al, 2012; Hurwitz et al, 2013; Winter et al, 2014; Brum et al, 2015), 从病毒物种组成和多样性、各大洋病毒宏基因组之间的关系、病毒种之间的进化关系、病毒群落结构与环境因子之间以及地域、水深、离岸距离的相关性等方面全面阐述了大洋海水中的病毒宏基因组特征; 也有针对海洋沉积物病毒组的相关研究(Breitbart et al, 2004; Yoshida et al, 2013), 对近岸海域以及深海的沉积物病毒组作出具体分析。
目前还没有针对渤海这一海域的病毒宏基因组的相关报道。本文所涉及的综合分析内容可为国内海域真光层病毒群落、微生物、海洋生态系统等各类研究提供相关数据支持。
于2010年9月和2011年12月东方红2号国家自然科学基金开放航次中, 用潜水泵在渤海 B47站(38.66°N, 118.97°E)(图 1)采集表层海水样各 150L。海水润洗塑料桶三次后泵入海水。先使用直径 300mm,孔径 3μm 的混合纤维素膜进行第一次过滤, 再使用直径300mm、孔径0.22μm的混合纤维素膜进行第二次过滤, 去除非病毒生物颗粒。滤过液经中型切相流系统(膜包: Pellicon® 2 Cassette, 材质: 聚醚砜, 孔径:50kDa)浓缩至 0.5L, 再用小型切相流系统(膜包:Pellicon® XL Cassette, 材质: 聚醚砜, 孔径: 50kDa)浓缩至0.01L。将高度浓缩后的样品置入液氮中速冻,船上-20°C储存, 实验室提取DNA前-80°C储存。
图1 渤海病毒宏基因组采样站位图Fig.1 Sites map for sampling viral metagenome in Bohai Sea
样品37°C水浴解冻, 加入聚乙二醇(终浓度10%)和NaCl(终浓度 0.6%), 4°C避光静置24h。在4°C下以13500r/min离心40min, 去除上清液, 让沉淀悬浮于 300μL 钠-镁离子缓冲液。加入 100μL KCl, 冰浴30min。4°C 12000r/min离心10min, 去除沉淀。加入10μL蛋白酶K, 混匀后再加入20μL 10%十二烷基硫酸钠溶液, 56°C金属浴1h(每10min震荡摇匀一次)。连续两次用215μL的平衡酚和215μL的氯仿-异戊醇萃取, 取上清液20°C 12000r/min离心4min, 去除有机相。加入43μL醋酸钠, 860μL无水乙醇, -20°C静置 3h。4°C 12000r/min离心15min, 去除上清液, 加入0.001L 70%乙醇, 使沉淀悬浮, 4°C 12000r/min离心 5min。去除上清液, 加入 0.001L无水乙醇, 吹打悬浮, 4°C 12000r/min离心5min。吹干, 使沉淀溶于30μL Tris-EDTA 溶液, 4°C 静置 30min, -80°C 保存。
利用 Hiseq 2000(Illumina)为样品进行高通量测序, 2×100bp双末端测序, 插入片段长度为170bp, 测序公司为深圳华大基因科技有限公司(BGI)。首先对样品进行检测, 然后根据Illumina标准建库测序流程进行测序: (1) 电泳回收主要的DNA片段; (2) 用T4DNA Polymerase、Klenow DNA Polymerase和 T4多核苷酸激酶将打断形成的黏性末端修复成平末端; (3)通过 3′端加碱基“A”, 使得 DNA 片段能与 3′端带有“T”碱基的特殊接头连接; (4) 用合格的文库进行cluster制备和测序。对得到的所有reads序列进行进一步处理: (1) 去除含N碱基数目总和达到3个或以上的reads; (2) 去除与reads序列有15bp的重叠区的接头序列污染; (3) 去除质量值连续(默认 reads中质量值小于Q20的碱基数目大于36, 设置为84、36); (4)去除重复污染; (5) 对数据进行去宿主污染的分析,一致性大于等于 90%的条件下, 与宿主比对上的被认为是宿主污染reads。最终得到干净数据。用SOAP denovo (1.06版)软件对reads进行拼接, 设置多个K值选择质量最高的结果, 2010年9月样品选择K值为59, 2011年 12月样品选择 K值为 47, 参数设置为“SOAP denovo-63mer all-K*–p8–F–M2–d1–R–u–k–o”。拼接完成后过滤掉长度小于500bp的scaffold。
上传拼接好的scaffold序列, 利用 MetaVir网站平台(http://metavir-meb.univ-bpclermont.fr/)在病毒基因组参考序列蛋白库(Refseq complete viral genomes protein sequences database)中 进 行 Blastp 比 对(e-value<10–3)。用 GAAS(Genome relative Abundance and Average Size)软件进行病毒物种分类统计(Roux et al, 2014)。
使用MetaGeneMark(2.10版)软件预测scaffold中的开放阅读框(ORF)(Zhu et al, 2010), 再用 CD-HIT(4.6版)软件去除冗余的ORF。将非冗余的ORF利用Blastp(e-value<10–3)在 WebMGA 网站上进行 COG 功能基因数据库比对(Wuet al, 2011)。
两个样品中的病毒超过97%属于双链DNA病毒,所以选择以双链 DNA病毒基因的保守结构域(conserved domain)AVS、G20、GP23、MCP、PhoH、Polβ、Polβ2、T7gp17、TerL 作为待建树的标记基因,用 Blastp(e-value<10–3)在 ORF 中查找。其中属于 Polβ和TerL保守结构域中的各一条基因在样品的ORF和GenBank NR 库均有最好的比对结果(e-value<10–10),被挑选出来进行系统进化分析, 分别是 DNA聚合酶Polβ中的CyPHP-SSM4(pfam编号: PF00136)和DNA末端酶大亚基TerL中的Q58LJ7_BPPRS(pfam编号:03237)。在用CLASTALW进行两两比对和多序列比对后, 用MEGA(6.06版)软件建立邻接树(Hall, 2013)。
2010年9月和2011年12月的样品中各拼接得到 19875条、31319条 scaffold, 总长度分别为28.29Mbp、33.46Mbp, 拼接序列其它数据见表1。两个样品预测到非冗余ORF 48227个(2010年9月)、63660个(2011年12月)(表1)。
表1 reads拼接以及开放阅读框预测结果Tab.1 Result of reads assembly and predicted ORF
在NR库(non-redundant protein database, 非冗余蛋白库)中比对上(blastx, e-value<10–3)病毒序列的分别有9716条(48.89%)和13599条(43.42%)。两个样品共比对上1240个病毒种。与太平洋深海沉积物中大多数序列属于单链 DNA病毒不同(Mitsuhiroet al,2013), 在两个样品比对上病毒基因组的序列中, 双链DNA病毒占据主要地位, 2010年9月的样品中占97.65%, 2011年12月的样品中占97.51%。以病毒目来划分, 有尾噬菌体目占据主导地位(81.19%、80.63%)。以病毒科来划分, 除了有尾噬菌体目下的肌尾病毒科(2010年9月为27.26%, 2011年12月为21.08%)、长尾病毒科(27.83%和 25.34%)和短尾病毒科(23.64%和 30.90%)外, 藻类 DNA病毒科(3.04%和3.28%)和米米病毒科(1.38%和 0.83%)也占据一定的比例, 这五个科的病毒序列数量占到总病毒序列数的 83.15%(2010年9月)、81.43%(2011年12月)(图 2)。
两个样品中总序列数排在前十的病毒种(图 3)为Puniceispirillumphage HMO-2011(5.26%和 6.97%)、Pelagibacterphage HTVC008M(3.58%和 2.77%)、Pelagibacterphage HTVC010P(2.33%和 3.01%)、cyanophage KBS-S-2A(1.82%和 1.15%)、Cellulophagaphage phi38:1 (0.54%和 1.97%)、Prochlorococcusphage P-SSM2(1.17%和 1.52%)、Synechococcusphage S-SM2(1.86%和 0.51%)、Pelagibacterphage HTVC011P(0.60%和 1.38%)、Pelagibacterphage HTVC019P(0.70%和 1.17%)、Idiomarinaceaephage 1N2-2(0.98%和0.93%)。这十个种的病毒序列占到总序列数的20.32%。
序列按照主要宿主来划分病毒大类(图 4),Synechococcusphage (共 33 个种, 10.28%)、Pelagibacterphage (共 4 个种, 7.86%)和Puniceispirillumphage (共 1个种, 6.26%)为数量最多的三大类, 以这12类微生物为宿主的病毒序列占到两个样品总序列数的 52.01%。而其中在两个样品中差距最大的为Synechococcusphage, 2010年 9月样品中所占比例为 12.75%, 而2011年 12月的为 8.52%。原绿球藻噬藻体(Prochlorococcusphage)所占比例为3.09%至3.73%。
另外, 对于存在于渤海病毒组中不占优势的病毒大类, 共有27条序列比对上单链DNA病毒的8个种, 5条比对上单链RNA病毒5个种。
物种多样性指数采用 Shannon-Wiener指数H′,以序列的个数作为病毒个体数进行计算, 2010年9月病毒组为5.87nats, 2011年12月的为5.83nats。Pielou’s均匀度J′冬季为0.612, 秋季为0.639。
将所有预测到的 ORF在 COG(Clusters of Orthologous Groups of proteins, 直系同源蛋白簇)数据库中进行比对(blastp, e-value<10–3)。共有20.85%(2010年 9月)和 9.39%(2011年 12月)的 ORF在COG数据库中比对上。在具有特定功能的基因中,以复制、结合和修复蛋白最为丰富, 其次为细胞壁/细胞膜/包膜合成蛋白, 以及转录蛋白等(表 2)。渤海冬季病毒群落复制、结合和修复蛋白所占比例远高于秋季, 在北黄海的 9个病毒组中呈现相同的现象(汪俭, 2015)。
图2 病毒物种科级分类Fig.2 Viral taxonomy in family
图3 序列数量丰富度前十的病毒种Fig.3 The top 10 virus species in sequence abundance
将全部 ORF与各标记基因比对(blastp, e-value<10–3), 有多个 ORF被比对上, 结果见表 3, 其中以DNA末端酶大亚基 TerL最多, 其次为 T7噬菌体尾丝蛋白 gp17和 DNA聚合酶 Polβ。选取比对结果最好的两个标记基因Polβ和TerL建立N-J系统进化树(图5, 6)。结果显示, 渤海病毒组的ORF在已分离的病毒基因中, 亲缘关系与聚球藻噬藻体(Synechococcus phage)、原绿球藻噬藻体(Prochlorococcus phage)、根瘤菌噬菌体(Sinorhizobium phage)、远洋杆菌噬菌体(Pelagibacter phage)较近。
在以Polβ建的系统进化树中, 一支Cluster I与已知的蓝藻噬藻体亲缘关系较远, 与之最近的一个种为Sinorhizobium phage phiM12。以TerL建的系统进化树中, 渤海病毒组的序列较为分散, 其中Cluster II一支的 bootstrap值为 100%, 聚类极为可信, 其进化地位同样在T4-like virus的HTVC008M与phiM12之间, 但不与phiM12在同一分支上。
图4 以主要宿主分类的前12大类病毒Fig.4 The top 12 major viral groups classified in by hosts
表2 COG功能基因注释结果Tab.2 Functional gene annotation by COG
在渤海表层海水2010年9月和2011年12月的两个病毒宏基因组中, 大部分的病毒序列属于双链DNA病毒, 其中肌尾病毒科、长尾病毒科、短尾病毒科、藻DNA病毒科占据主导地位。类似结果也出现在近期的印度洋和太平洋东北部真光层海水病毒组中, 渤海各级分类与太平洋物种分类结果接近一致,原因可能是均没有对样品 DNA进行扩增, 最大程度地还原了病毒群落结构的真实情况(Stewardet al,2011)。而印度洋虽然同样以双链DNA病毒—有尾噬菌体目占绝对主导地位, 但其扩增后的病毒组中肌尾病毒科占据 54.3%与渤海病毒组相差较大(Williamsonet al, 2012)。
噬藻体(cyanophage)能够侵染蓝细菌中聚球藻属和原绿球藻属两个重要的初级生产者, 在自然水体中数量极为丰富(Berghet al, 1989), 其对宿主的致死率在 1%至 8%(Garzaet al, 1998), 是微食物环(microbial loop)中的重要成员。噬藻体序列在病毒组序列中占有相当大的比例, 通过系统进化分析指明,渤海噬藻体中存在未知的物种分支 Cluster I(图 5)和Cluster II(图 6), 且很有可能属于肌尾噬菌体—T4-like病毒。对未知物种分支的探索, 可为将来的病毒分离提供指导, 并完善病毒宏基因组中的“Unknown”物种部分。
表3 保守结构域在样品开放阅读框中比对的匹配结果Tab.3 The alignment between conserved domains and ORFs of samples
图5 渤海病毒与已知病毒Polβ(DNA聚合酶β)保守结构域基因的N-J系统进化树Fig.5 Neighbor-joining tree based on conserved domain Polβ (DNA polymerase β) from known virus以Vibrio phage、Enterobacter phage、Proteus phage和Edwardsiella phage为外类群
图6 渤海病毒与已知病毒TerL(DNA末端酶大亚基)保守结构域基因的N-J系统进化树Fig.6 Neighbor-joining tree based on conserved domain TerL (DNA terminase large subunit) from known virus以Rhizobium phage、Vibrio phage、Enterobacter phage、Erwinia phage、Aeromonas phage和Salmonella phage为外类群
聚球藻(Synechococcus)对于海洋初级生产力的贡献为25%(Li, 1994; Smith et al, 2001), 是海洋中重要的微生物类群。在黄海海域, 由于水温降低, 聚球藻冬季的数量小于秋季数量(Zhao et al, 2011)。聚球藻噬藻体呈现出与宿主相同的变化趋势, 2011年 12月所占比例小于2010年9月。另一个重要的大类, 原绿球藻噬藻体(Prochlorococcus phage)所占比例为3.09%至3.73%。但相关研究指出, 原绿球藻仅分布于夏季水温较高的亚热带和热带海域(焦念志, 2006),对中国海域原绿球藻生长的实验研究也表明, 其最适生长水温范围在25—30°C(冯宪栋等, 2007)。渤海B47站 2011年夏季表层海水水温为 18.0°C, 且本实验室并没有以流式细胞仪测出原绿球藻的存在。可能的原因是原绿球藻噬藻体宿主范围较广, 能够侵染其他属蓝细菌, 或是对马暖流分支将部分聚球藻从亚热带海域携带至渤海。
在冬季和秋季渤海病毒组中, 4个病毒种Puniceispirillum phage HMO-2011、Pelagibacter phage HTVC010P、Pelagibacter phage HTVC008M 和Synechococcus phage S-SM2占据优势地位。海洋真光层细菌其中一个主要分支为 SAR116(Candidatus Puniceispirillums类群), 它对于甲基营养和光合异养代谢有着潜在影响(Grote et al, 2011; Giovannoni et al,2012)。Puniceispirillum phage HMO-2011序列在印度洋的3个病毒组以及太平洋的4个病毒组中占到病毒序列总数的 10.3%—25.3%, 为丰富度第一或第二的病毒种(Kang et al, 2013), 与之前报道的太平洋病毒组(POV)中开阔海域和近岸的 SAR11噬菌体Pelagibacter phage HTVC010P总数结合来看(Zhao et al, 2013), 大洋真光层水体中最占优势的病毒种为HMO-2011和HTVC010P。其次为Pelagibacter phage HTVC008M和 Synechococcus phage S-SM2(Kang et al, 2014)。因此处于太平洋西岸的渤海, 样品中这四种已分离纯化病毒的基因序列比例占据相当大的优势应为正常现象。但渤海病毒组与其它海域不同的是,cyanophage KBS-S-2A(1.43%)、Cellulophaga phage phi38:1(1.38%)和Idiomarinaceae phage 1N2-2(0.95%)为序列数排在前十位的优势种。
仅有极少数的单链DNA病毒存在于渤海病毒组中, 这与MetaVir病毒宏基因组数据库中大部分海域的病毒组相似, 但也与部分海域差异很大, 如 2005年马尾藻海的 ssDNA序列占到了总病毒序列的22.43%。27条单链DNA序列中最丰富的病毒科为丝杆噬菌体(Inoviridae)。有研究表明, 海洋中存在大量单链DNA病毒(Labonté et al, 2013), 但由于其高突变率难以被分离纯化, 数据库中仅有少数病毒种的全基因组序列。在病毒组研究中, 将以发掘海水中未知单链DNA病毒种为未来的一个方向。
在冬季病毒种数(1093)高于秋季(1010)、病毒序列数(13599)也高于秋季(9716)的情况下, 冬季病毒物种多样性低于秋季, 原因是冬季优势种的优势度更大。从 Pielou’s 均匀度 J′(冬季为 0.612, 秋季为 0.639)可以看出, 秋季各物种序列数更为平均。冬季功能基因中的复制、结合和修复基因所占比例却是秋季的两倍多, 说明渤海病毒群落(特别是劣势种)在冬季水温较低的情况下代谢活性减弱, 但以能够适应低温条件的微生物为宿主的病毒则更具优势。例如Puniceispirillum phage和Pelagibacter phage两个主要的大类, 在冬季的比例明显高于秋季。聚球藻噬藻体在冬季数量降低, 是由于宿主聚球藻的数量与水温呈显著相关, 在中国海域数量有冬季<秋季的规律(赵苑, 2010)。
进化关系中, 与 Cluster I最近的一个种为Sinorhizobium phage phiM12, 宿主 Sinorhizobium meliloti 1021能在土壤中与根系共生, 达到固氮的作用(Stroupe ME et al, 2014), 属于有尾噬菌体目-肌尾噬菌体科-T4-like病毒属。T4-like噬菌体有着可收缩尾部因而宿主范围广, 从肠杆菌至蓝细菌噬藻体, 广泛分布于海水和淡水中(Mann et al, 2005; Sullivan et al, 2005; Weigele et al, 2007; Dreher et al, 2011)。Cluster I可能代表海洋真光层中新的一类病毒, 从Polβ进化地位在同属于 T4-like 病毒的 Pelagibacter phage HTVC008M与Sinorhizobium phage phiM12之间可以推断, Cluster I所代表的一类病毒很可能属于T4-like 病毒。Cluster II极为可信, 进化地位在HTVC008M与phiM12之间, 可能属于Cluster I以外的另一支T4-like病毒类群。
在将来的海洋病毒宏基因组研究中, 采样和实验方法需要联系最新的研究进展不断改善, 如最近的Fe离子沉降病毒法(John et al, 2011)可使病毒宏基因组采样步骤简化。数据分析方面, 除了对群落的基础分析, 更应在结合环境因子和宿主序列, 拓宽研究病毒大类领域, 明确病毒群落的海洋生态学地位方面有所突破。
综上所述, 渤海 B47站的表层海水病毒宏基因组中双链 DNA病毒占据主要地位, 前五位的病毒科依次为肌尾病毒科、长尾病毒科、短尾病毒科、藻类DNA病毒科、米米病毒科, 病毒种类与太平洋、大西洋、印度洋等远洋相比, 有一定的独特性。渤海秋季病毒物种多样性和均匀性都比冬季更高, 且功能基因分析结果表明秋季病毒代谢活性更强。原绿球藻一般情况下只存在于水温较高的亚热带海域, 但在秋季和冬季水温较低的渤海海域, 病毒组中却存在原绿球藻噬藻体, 值得进一步研究探讨原因。在系统进化分析结果中发现噬藻体中可能属于未知 T4-like噬菌体的病毒分支, 可为噬菌体分离提供指导。
王 健, 汪 岷, 刘 哲等, 2013. 渤海浮游病毒的时空分布.海洋与湖沼, 44(6): 1597—1603
冯宪栋, 蒋霞敏, 符方尧, 2007. 理化因子对原绿球藻生长及其色素含量的影响. 水产科学, 26(12): 643—647
汪 俭, 2015. 北黄海浮游病毒群落的宏基因组学研究. 青岛:中国海洋大学硕士学位论文, 36—37
赵 苑, 2010. 黄海和东海微微型浮游生物分布研究. 青岛:中国海洋大学博士学位论文, 101—102
焦念志, 2006. 海洋微型生物生态学. 北京: 科学出版社,77—78
Angly F E, Felts B, Breitbart M et al, 2006. The marine viromes of four oceanic regions. PLoS Biology, 4(11): e368
Bergh Ø, Børsheim K Y, Bratbak G et al, 1989. High abundance of viruses found in aquatic environments. Nature, 340(6233):467—468
Breitbart M, Felts B, Kelley S et al, 2004. Diversity and population structure of a near-shore marine—sediment viral community. Proceedings of the Royal Society B: Biological Sciences, 271(1539): 565—574
Brum J R, Ignacio-Espinoza J C, Roux S et al, 2015. Patterns and ecological drivers of ocean viral communities. Science,348(6237): 1261498
Brussaard C P D, Kuipers B, Veldhuis M J W, 2005. A mesocosm study of Phaeocystis globosa population dynamics: I.Regulatory role of viruses in bloom control. Harmful Algae,4(5): 859—874
Brussaard C P D, Martínez J M, 2008. Algal Bloom Viruses.Plant Viruses, 2(1): 1—13
Dreher T W, Brown N, Bozarth C S et al, 2011. A freshwater cyanophage whose genome indicates close relationships to photosynthetic marine cyanomyophages. Environmental Microbiology, 13(7): 1858—1874
Garza D R, Suttle C A, 1998. The Effect of cyanophages on the mortality of Synechococcus spp. and selection for UV resistant viral communities. Microbial Ecology, 36(3—4):281—292
Giovannoni S J, Vergin K L, 2012. Seasonality in ocean microbial communities. Science, 335(6069): 671—676
Grote J, Bayindirli C, Bergauer K et al, 2011. Draft genome sequence of strain HIMB100, a cultured representative of the SAR116 clade of marine Alphaproteobacteria. Standards in Genomic Sciences, 5(3): 269—278
Hall B G, 2013. Building phylogenetic trees from molecular data with MEGA. Molecular Biology and Evolution, 30(5):1229—1235
Handelsman J, 2004. Metagenomics: application of genomics to uncultured microorganisms. Microbiology and Molecular Biology Reviews, 68(4): 669—685
Handelsman J, Rondon M R, Brady S F et al, 1998. Molecular biological access to the chemistry of unknown soil microbes:a new frontier for natural products. Chemistry & Biology,5(10): R245—R249
Hurwitz B L, Sullivan M B, 2013. The Pacific Ocean Virome(POV): a marine viral metagenomic dataset and associated protein clusters for quantitative viral ecology. PLoS One,8(2): e57355
John S G, Mendez C B, Deng L et al, 2011. A simple and efficient method for concentration of ocean viruses by chemical flocculation. Environmental Microbiology Reports, 3(2):195—202
Kang I, Cho J C, 2014. Depth-specific distribution of the SAR116 phages revealed by virome binning. Journal of Microbiology and Biotechnology, 24(5): 592—596
Kang I, Oh H M, Kang D et al, 2013. Genome of a SAR116 bacteriophage shows the prevalence of this phage type in the oceans. Proceedings of the National Academy of Sciences of the United States of America, 110(30): 12343—12348
Labonté J M, Suttle C A, 2013. Previously unknown and highly divergent ssDNA viruses populate the oceans. The ISME Journal, 7(11): 2169—2177
Li W K W, 1994. Primary production of prochlorophytes,cyanobacteria, and eucaryotic ultraphytoplankton:measurements from flow cytometric sorting. Limnology and Oceanography, 39(1): 169—175
Mann N H, Clokie M R J, Millard A et al, 2005. The genome of S-PM2, a “photosynthetic” T4-type bacteriophage that infects marine Synechococcus strains. Journal of Bacteriology, 187(9): 3188—3200
Roux S, Tournayre J, Mahul A et al, 2014. Metavir 2: new tools for viral metagenome comparison and assembled virome analysis. BMC Bioinformatics, 15(1): 76
Smith E M, Kemp M W, 2001. Size structure and the production/respiration balance in a coastal plankton community. Limnology and Oceanography, 46(3): 473—485
Steward G F, Preston C M, 2011. Analysis of a viral metagenomic library from 200 m depth in Monterey Bay,California constructed by direct shotgun cloning. Virology Journal, 8(1): 287
Stroupe M E, Brewer T E, Sousa D R et al, 2014. The structure of Sinorhizobium meliloti phage ΦM12, which has a novel T=19l triangulation number and is the founder of a new group of T4-superfamily phages. Virology, 450—451:205—212
Sullivan M B, Coleman M L, Weigele P et al, 2005. Three Prochlorococcus cyanophage genomes: signature features and ecological interpretations. PLoS Biology, 3(5): e144
Suttle C A, 2005. Viruses in the sea. Nature, 437(7057): 356—361
Thomas T, Gilbert J, Meyer F, 2012. Metagenomics-a guide from sampling to data analysis. Microbial Informatics and Experimentation, 2(1): 3
Weigele P R, Pope W H, Pedulla M L et al, 2007. Genomic and structural analysis of Syn9, a cyanophage infecting marine Prochlorococcus and Synechococcus. Environmental Microbiology, 9(7): 1675—1695
Wilhelm S W, Suttle C A, 1999. Viruses and nutrient cycles in the sea: viruses play critical roles in the structure and function of aquatic food webs. Bioscience, 49(10): 781—788
Williamson S J, Allen L Z, Lorenzi H A et al, 2012.Metagenomic exploration of viruses throughout the Indian Ocean. PLoS One, 7(10): e42047
Winter C, Garcia J A L, Weinbauer M G et al, 2014. Comparison of deep-water viromes from the Atlantic Ocean and the Mediterranean Sea. PLoS One, 9(6): e100600
Wu S T, Zhu Z W, Fu L M et al, 2011. WebMGA: a customizable web server for fast metagenomic sequence analysis. BMC Genomics, 12(1): 444
Yoshida M, Takaki Y, Eitoku M et al, 2013. Metagenomic analysis of viral communities in (Hado) pelagic sediments.PLoS One, 8(2): e57271
Zhao Y L, Temperton B, Thrash J C et al, 2013. Abundant SAR11 viruses in the ocean. Nature, 494(7437): 357—360
Zhao Y, Zhao L, Xiao T et al, 2011. Spatial and temporal variation of picoplankton distribution in the Yellow Sea,China. Chinese Journal of Oceanology and Limnology, 29(1):150—162
Zhu W H, Lomsadze A, Borodovsky M, 2010. Ab initio gene identification in metagenomic sequences. Nucleic Acids Research, 38(12): e132