基于基因遗传算法对畸形外囊菌在中国适生区的分析*

2012-12-17 09:42李宗亮陆晨晨于向鹏狄露露金海如
关键词:适生区平均温度降水量

李宗亮, 陆晨晨, 于向鹏, 刘 洁, 刘 静, 狄露露, 金海如

(浙江师范大学化学与生命科学学院,浙江金华 321004)

畸形外囊菌(Taphrina deformans(Berk)Tul)是桃缩叶病的病原菌[1],属于子囊菌亚门,能阶段性形成子囊及子囊孢子.它能造成桃树叶片早落、嫩枝枯死,影响果实品质、产量及其经济效益.这种病菌不但会侵染桃树引发缩叶病,而且可以危害李、梅和杏等果树.

由于外来入侵生物是导致生物多样性破坏和社会经济损失的主要原因之一[2],生物入侵逐步成为社会关注的焦点.外来物种一旦在某一个地区入侵成功,人们需要花费大量的精力去检测该物种的危害性,并寻找根除它的方法[3].防止外来有害生物入侵的重要手段之一是阻止该物种进入其潜在的适生区[4].因此,明确外来物种的适生区对防止生物入侵有着重要的作用.

外来物种在目标地的适生性高低,直接决定了该地区是否存在被该物种入侵的可能性.越来越多的生态研究者认为,外来入侵生物会对当地的生态环境结构带来不可逆转的改变及巨大的经济损失[5].因此,明确畸形外囊菌在中国的适生区,对进一步检测和控制该入侵物种具有现实指导意义.

1 材料与方法

1.1 物种材料

畸形外囊菌的分布数据通过文献记录、数据库和标本馆(http://www.gbif.org/)等途径得到,并用Google Earth查阅其具体的地理坐标,共获得104个分布点(见图1),并将得到的坐标转换成模型所需要的格式保存.

图1为畸形外囊菌的全球数据库现有分布,主要分布地区为亚洲东部、北美洲、欧洲、非洲中部和大洋洲东部等,这些地区都属于温带地区.

图1 畸形外囊菌的地理分布图

1.2 基因遗传算法模型

基因遗传算法(GARP)模型是一种基于遗传算法的规则组合预测模型系统,用来预测物种潜在的地理分布范围[6].该模型在保护濒危物种、生物多样性保护区设计的优先性评估、外来入侵物种扩散潜能及全球气候变化对物种分布区的影响等研究中得到了广泛的应用[7].在多变的环境条件下,GARP模型被证明是预测物种适生区的一个非常成功的工具[8].

在GARP系统中,物种分布数据分为2部分[6]:一部分初始数据称为外部检验数据(extrinsic test data),用于完全独立的模型质量检测;另一部分数据用作训练数据(training data)和内部检验数据(instrinsic test data),其中,训练数据用作建立模型,而内部检验数据用作内部的模型质量检验.

1.3 环境数据

本研究环境数据采用CuCL2数据包,其中包含23种环境数据:年平均光照时间、最冷月份的平均光照时间、最暖月份的平均光照时间、霜冻时的平均光照时间,年平均降水量、最冷月份的平均降水量、最冷季度的平均降水量、最干旱月份的平均降水量、最干旱季度的平均降水量、没有霜冻时的平均降水量、最暖月份的平均降水量、最暖季度的平均降水量、最湿月份的平均降水量、最湿季度的降水量,年平均温度、最冷月份的平均温度、最冷季度的平均温度、没有霜冻月份的平均温度、最暖月份的平均温度、最暖季度的平均温度,年平均风速,平均降水量的标准偏差和平均温度的标准偏差.

1.4ROC 曲线

受试者工作特征曲线(简称ROC曲线)分析方法最初应用于雷达信号接收能力的评价[9],后广泛应用于医学诊断实验性能的评价[10-12].ROC曲线是以预测结果的每一个值作为可能的判断阈值[13],由此计算得到相应的灵敏度和特异度,以假阳性率(1-特异度)为横坐标、以真阳性率即灵敏度(1-遗漏率)为纵坐标绘制而成,以其曲线下的面积(AUC)的大小作为模型预测准确度的衡量标准,其范围为[0,1][14],AUC 的值越高,说明模型的预测准确度也就越高.

2 结果与分析

2.1ROC 曲线

图2为GARP模型运算的ROC曲线及其曲线下的面积(AUC).随机ROC曲线的AUC值为0.5.AUC的值越大,说明模型的准确性就越高.本研究中AUC的值为0.89,诊断价值为较高.

图2 GARP模型的ROC曲线

2.2 畸形外囊菌在中国的适生区分布

物种预测分布模型会对畸形外囊菌分布区的环境参数进行提取并统计.根据畸形外囊菌分布区的环境参数,GARP模型会自动对全球各个地区的环境进行拟合.拟合度越高的地区,畸形外囊菌的适生可能性就越大;反之,适生性就越小.

图3是GARP模型拟合的畸形外囊菌在中国的适生区.颜色从纯白到纯黑,表示适生的可能性从小到大,颜色越深,代表该地区畸形外囊菌的适生概率越大.从图3可以看出,畸形外囊菌在中国的适生区主要分布在东部地区:河北南部、山西南部、广东南部、山东全部、河南全部、安徽全部、江苏全部、上海全部、浙江全部、海南全部、福建大部分、江西大部分、台湾西部沿海、云南东部、湖北东部和湖南东部.

2.3 数据分析

图3 基于GARP模型的畸形外囊菌在中国的适生区

本研究中,GARP模型每一次运行时随机抽取50%的坐标数据作为训练数据,25%的坐标数据作为外部检验数据,剩下的25%作为模型运行后的内部检验数据,模型对数据进行了20次重复运算.以独立模型外部的检验数据为基础的卡方检验显示,GARP模型的运算在统计上是高度显著的(P=0.01);以内部检验数据检验模型预测结果,检验结果以AUC值的大小来确定模型预测结果的准确度.

3 讨论

ROC曲线下的面积为AUC值,以此反映诊断实验的价值.一般认为:AUC值在 0.5~0.7时,诊断价值较低;在0.7~0.9时诊断价值中等;大于0.9时诊断价值较高[15].AUC值可对诊断实验的准确度进行检测,因而成为目前公认的诊断实验最佳评价指标[16].本研究中,GARP模型预测的AUC值为0.89,诊断价值较高,因此预测结果具有较高的准确度.

气候因子在决定物种地理分布方面的重要地位已经被研究者们广泛接受,世界的生物区系就是根据全球气候数据进行划分的.影响物种分布的因素有很多种,例如海拔高度、地形和物种的栖息地环境等[17].尽管还有很多其他的因子同样影响物种的分布,但根据气候因子划分生物区系仍然是宏观生态学最成功的理论之一[18].

畸形外囊菌在菌丝生长过程中能使宿主细胞内的叶绿体遭到破坏,叶片表面表现皱缩、肥肿、变为黄褐色或红色等症状,造成叶片当年第2次萌发,这样会直接影响到当年桃子的产量及第2年花芽的形成[19],造成桃子的减产.因此,确定畸形外囊菌在中国的适生区,对预防和有效控制桃树缩叶病具有一定的现实指导意义.

[1]王欣,侯林洲,李怡萍.桃缩叶病的发生与防治[J].陕西农业科学,2006(1):128.

[2]Ficetola G F,Thuiller W,Miaud C.Prediction and validation of the potential global distribution of a problematic alien invasive species:the American bullfrog[J].Divers Distrib,2007,13(4):476-485.

[3]Hulme P E.Beyond control:wider implications for the management of biological invasions[J].J Appl Ecol,2006,43(5):835-847.

[4]徐汝梅.生物入侵——数据集成、数量分析与预警[M].北京:科学出版社,2003:129-144.

[5]Wittenberg R,Cock M J W.Invasive alien species:a toolkit of best prevention and management practices[M].Oxon:CABI,2001.

[6]Stockwell D,Peters D.The GARP modeling system:problems and solutions to automated spatial prediction[J].Int J Geogr Inf Sci,1999,13(2):143-158.

[7]Guisan A,Thuiller W.Predicting species distribution:offering more than simple habitat models[J].Ecol Lett,2005,8(9):993-1009.

[8]贾文明,周益林,丁胜利,等.外来有害生物风险分析的方法和技术[J].西北农林科技大学学报:自然科学版,2005,33(增刊):195-200.

[9]Leshowitz B.Comparison of ROC curves from one-and two-interval rating-scale procedures[J].J Acoust Soc Am,1969,46(2B):399-402.

[10]Goodenough D J,Rossmann K,Lusted L B.Radiographic applications of receiver operating characteristic(ROC)curves[J].Radiology,1974,110(1):89-95.

[11]Metz C E.Basic principles of ROC analysis[J].Semin Nucl Med,1978,8(4):283-298.

[12]Zweig V H,Cambell G.Receiver operating characteristic(ROC)plots:a fundamental evaluation tool in clinical medicine[J].Clin Chem,1993,39(4):561-577.

[13]Phillips S J,Anderson R P,Schapire R E.Maximum entropy modeling of species geographic distributions[J].Ecol Model,2006,190(3/4):231-259.

[14]Wiley E O,McNyset K M,Peterson A T,et al.Niche modeling and geographic range predictions in the marine environment using a machinelearning algorithm[J].Oceanogr,2003,16(3):120-127.

[15]余松林.医学统计学[M].北京:人民卫生出版社,2002:164-178.

[16]Vanagas G.Receiver operating characteristic curves and comparison of cardiac surgery risk stratificafi0n systems[J].Interact Cardiovas Thorac Surg,2004,3(2):319-322.

[17]Hodkinson I D.Species response to global environmental change or why ecophysiological models are important:a reply to Davis et al[J].J Anim Ecol,1999,68(6):1259-1262.

[18]Lawton J H.Are there general laws in ecology? [J].Oikos,1999,84(2):177-192.

[19]黄丽丽,康振生,罗志萍.桃缩叶病组织的光学和电子显微镜观察[J].西北农林科技大学学报:自然科学版,1993,21(增刊2):29-34.

猜你喜欢
适生区平均温度降水量
基于物种分布模型的画稿溪国家级自然保护区桫椤保护现状及影响因素*
1958—2019年新兴县汛期降水量的气候特征
关于规范中最低日平均温度定义的探讨与建议
成都市年降水量时空分布特征
基于MaxEnt和ArcGIS的乌檀生长适应性区划研究
兰州地区区域加权平均温度模型构建方法研究
南方地区圆拱形和锯齿形大棚内温度四季差别探究*
气候变化下濒危植物半日花在中国的潜在分布
巴拉圭瓜多竹适生区分布研究
1956—2014年铁岭县降水变化趋势分析