潘雅楠,张虹,2,章鹏飞,裴苏婷,范建友,刘守金,2
1.安徽中医药大学药学院,安徽 合肥 230013; 2.安徽省中医药科学院中药资源保护与开发研究所,安徽 合肥 230013; 3.霍邱县中医院,安徽 霍邱 237400
杠板归为蓼科蓼属植物杠板归Polygonum perfoliatumL.的干燥地上部分,具有清热解毒、利水消肿、止咳功效,用于咽喉肿痛、肺热咳嗽、小儿顿咳、水肿尿少、湿热泻痢、湿疹、疖肿和蛇虫咬伤[1]。杠板归生长对土壤要求不高,且分布广泛,野生资源丰富,但随着市场需求增加,仅靠野生自然资源已难以满足市场需求[2-3]。
近几年,物种分布模型在国内外物种分布预测中应用广泛,其利用物种分布数据和相关环境变量,根据一定的算法可预测物种潜在分布区。物种分布模型种类众多,在通过已知分布位点预测潜在分布区方面,最大熵(MaxEnt)模型较其他模型有更好的性能表现[4]。本研究采用MaxEnt模型筛选影响杠板归分布的主要环境变量,通过杠板归样点分布数据和主要环境因子找出其概率分布的MaxEnt,预测适宜分布区,旨在为科学利用杠板归野生资源,以及合理布局杠板归栽培用地提供理论依据。
1.1.1 地理分布信息
用于模型构建的杠板归地理分布数据主要来自中国数字植物标本馆(http://www.cvh.org.cn/),包括全国第四次中药资源普查的部分野外调查数据,共计2 976条相关信息。
1.1.2 环境因子
选取气候、土壤、地形和植被类型四大类共55个变量作为影响杠板归地理分布的环境因子。环境因子数据来源于“中药资源空间信息网格数据库”(http://www.tcm-resources.com/)。气候类型数据43个,包括12个月的月降水量和月平均气温,以及19个综合气候因子;土壤类型数据8个,包括酸碱度(pH值)、土壤的阳离子交换能力、土壤含沙量、土壤含黏土量、土壤亚类、土壤有效水含量等级、土壤质地分类和有机碳含量;地形数据3个,包括海拔、坡度、坡向;植被类型数据1个,为植被亚类。将环境因子数据导入ArcGIS软件进行预处理,并利用conversion工具转换为ASCII格式备用。
1.1.3 分析软件
利用MaxEnt3.3.3软件(www.cs.princeton.edu/~ schapire/MaxEnt)构建杠板归地理分布与环境因子关系的模型,在ArcGIS软件中加载模型运算结果,利用ArcMap10.2制图。
1.1.4 地图数据
本研究所用中国地图国界矢量图及中国行政区划图来源于国家基础地理信息系统网站(http://nfgis. nsdi.gov.cn/),分辨率1∶400万。
1.2.1 地理分布信息预处理
筛选重复分布信息,去除只到区或乡的不具体信息及不准确地名,相近地理分布信息(位于相同区/乡的数个地理分布信息)只保留1个,最终获得用于软件分析的地理分布信息476条,地理分布情况见图1。将分布点的经纬度信息按照MaxEnt软件格式要求转换成植物名、经度和纬度三列表并保存为.csv格式备用。
图1 杠板归全国样点分布
1.2.2 模型建立和环境因子筛选
建立MaxEnt模型构建杠板归地理分布与环境因子之间的关系。设置模型参数,选择响应曲线用于反映环境因子适宜度范围,刀切法用于评价环境因子的重要性,随机选取用于测试集的杠板归分布数据占25%,训练集的数据占75%,最大迭代次数为106,其他参数为软件默认值。将ASCII格式的55个环境因子及.csv格式的杠板归地理分布数据导入MaxEnt软件进行运算,输出类型为Logistic。根据模型运算结果,去除贡献率为0的环境因子,多次运算直至结果中无贡献率为0的变量。由于气候变量之间存在交叉或潜在相关等不同程度相关性,最终需综合考虑刀切法和贡献率结果,筛选出影响杠板归地理分布的主导环境因子。
1.2.3 模型精确度评价
采用受试者工作特征(ROC)曲线验证模型灵敏度和特异率,以曲线下面积(AUC)为精确度评价指标。0.5≤AUC<0.6表明模型结果失败,0.6≤AUC<0.7结果较差,0.7≤AUC<0.8结果一般,0.8≤AUC< 0.9结果良好,0.9≤AUC<1.0结果极好。
1.2.4 适宜分布区预测
根据MaxEnt模型模拟运算杠板归分布最终结果,将该结果ASCⅡ格式文件导入ArcGIS软件与中国地图叠加,用conversion工具完成格式转换,再对转换并加载的图层进行切割处理,最终获得杠板归分布概率区划图。杠板归适宜分布区根据适生指数(P值)分为4个等级:P<0.05为非适生区,0.05≤P<0.25为低度适生区,0.25≤P<0.5为中度适生区,0.5≤P< 1.0为高度适生区。
经多次运算,杠板归生态分布模型均AUC>0.9,筛选贡献率为0的变量后,得到最终ROC曲线(见图2)。训练集AUC=0.955,测试集AUC=0.931,结果表明模型精确度极好,可信度高。
图2 杠板归分布预测模型ROC曲线
将55个环境因子导入模型,依次运算7次去除贡献率为0的变量后,最终剩余25个环境因子。各环境因子贡献率从高到低排序见表1,选取贡献率≥2%的环境因子;刀切图结果见图3,选取各变量独立训练增益>1.4的变量。综合取两者都较高的环境因子作为影响杠板归地理分布的主导环境因子:最湿月降水量、年均降水量、6月份降水量、11月份降水量、最湿季降水量、9月份平均气温、植被亚类。7个主导环境因子的贡献率之和为77.6%。
表1 影响杠板归分布各环境因子的贡献率
图3 杠板归分布预测模型刀切图
ArcGIS软件加载MaxEnt模型预测结果显示,杠板归潜在分布区横纵跨度均较大,气候类型包括温带季风气候、亚热带季风气候及热带季风气候,适宜分布区主要在东北平原、华北平原、长江中下游平原和四川盆地,高度适生区主要为福建、浙江、江西、重庆、广东(除南部)、湖南(除东部)、广西北部、贵州北部、湖北西部、安徽南部、陕西南部、江苏南部,中度适生区主要为广东南部、广西中部和西部、云南中部、贵州中部和南部、四川西部、湖南东部、湖北北部、河南南部、安徽中部、山东南部和东部、河北东北部、辽宁南部和东部、西藏东南部。高度适生区及中度适生区均适宜开展杠板归的高产、高效栽培。分布区划见图4。
图4 杠板归适宜分布区划
本研究采用MaxEnt软件构建杠板归地理分布模型,ROC曲线训练集AUC值为0.955,显示模型预测结果极好,可以较准确反映杠板归适宜分布情况。但预测结果不代表实际分布,首先,模型运算随机选取测试集可能存在误差,ROC曲线只能在一定程度上反映模型精确度;其次,本研究收集的样点分布信息不完全准确,部分地理分布信息非近年更新,可能已发生变动。另外,物种生态分布除受环境因子影响外,还包括生物因子和人为因素,如田间及果园内的杠板归常作为恶性杂草被根除。因此,本研究模型预测结果仅为实际分布提供参考。
对比《中国植物志》[5]、样本分布位点与模型预测结果,三者的杠板归地理分布范围高度吻合,然而,《中国植物志》记载的黑龙江、吉林、辽宁、河北、山东、河南、甘肃、四川、台湾、海南等地虽有分布,但并非其适宜分布区。预测结果中,贵州适宜分布区范围与谭济苍等[2]研究结果一致,但预测位置更广,除黔东北及黔北区域,还包括黔东、黔西北及黔中部分地区。另外,《中国植物志》及样本分布位点未涉及区域(如西藏、山西),模型预测结果中也有分布,说明该分布模型可在已知分布基础上预测潜在分布。
本研究结果表明,影响杠板归生态分布的关键因子主要为气候因子而非地形或土壤因子,推测与杠板归分布范围广、海拔跨度大、对土壤要求不高等有关。本研究最终选取主导环境因子均为降水量、气温和植被类型,可能缘于杠板归的生物学特性——适宜光照、水分充足的温暖环境,年均温度12~16.5 ℃,年均降水量775~1 400 mm,生长范围内植被类型单一,植被丰富的原始森林或茂密的次生林少有分布[2-3]。有研究表明,杠板归种植最适宜区年均降水量为843.4~954 mm[2],低于杠板归生长的平均水平,说明降水量过多不利于杠板归生长。杠板归花期6-8月,多数种子于9月下旬至10月成熟落地,6月份降水量和9月份平均气温对杠板归种子发育和成熟有至关重要的影响,11月份降水量则决定种子存活率。 基于上述研究结果,为促进杠板归高产、高效栽培,建议选择高度适生的福建等地,栽培应注意幼苗期除草,保证结实期阳光及水分充足,做好排水工作,避免积水。另据何瑾等[6]研究结果,杠板归药材质量与产地有关,应当注意环境因子与药材质量关系。本研究结果所得杠板归的适宜分布区是否能同时保证杠板归药材质量,可结合不同产地栽培杠板归的有效成分含量开展进一步研究。