翟治芬,严昌荣,张建华,张燕卿,刘 爽
(1.中国农业科学院 农业环境与可持续发展研究所,北京 100081;2.农业部规划设计研究院,北京 100125;3.中国农业科学院 农业信息研究所,北京 100081)
节水灌溉技术是我国未来农业高效用水的主要方式[1]。随着现代农业的发展,节水灌溉技术的应用受到越来越多的关注,其主要包括喷灌、滴灌、膜灌、沟畦灌4种。由于不同节水灌溉技术的适用条件和适用范围存在较大差异,且实施节水灌溉的地区自然、经济、社会条件千差万别,灌溉的对象也多种多样,造成节水灌溉技术在实际推广中常常出现节水效果不理想,农民接受率低等情况[2]。因此,在节水灌溉技术推广前,需依据不同地区、不同作物的要求,对农业节水灌溉技术进行优选。现阶段我国节水灌溉技术的优选方法主要是通过专家实地考察和推荐的方法,该方法存在速度慢、劳动强度大和不经济等缺点,影响了农业节水灌溉技术的推广和普及。
近年来,国内外学者在节水灌溉技术优选方面进行了研究。贺延国等[3]采用实码加速遗传算法进行PP建模,简化了投影寻踪技术的实现过程,为投影寻踪技术在节水灌溉工程中的广泛应用提供了新的有力工具。陈欢等[4]采用基于变异系数权重的属性识别模型对节水灌溉方案进行优选,减小了确定权重时的主观性。卢玉邦等[5]和张庆华等[6]分别运用层次分析理论和方法,提出了用于节水灌溉方式优化选择的项目综合评价方法。赵振霞等[7]和高峰等[8]采用模糊系统和神经网络相结合,利用遗传算法对模糊神经网络进行优化,该模型最大限度地避免了模糊综合评判中权重矩阵取值的人为干扰。Schuck等[9]利用美国科罗拉多洲历史上严重干旱的数据,研究了干旱程度如何影响农户节水灌溉技术的选择,结果表明干旱程度显著提高了农户采用更有效的喷灌技术的比例。Moreno等[10]研究了节水灌溉技术的选择与农作物选择的联合估计。Montazar等[11]应用层次分析法为3个不同区域优选灌溉技术。对于节水灌溉技术优选研究,前人多采用层次分析法、模糊综合评价法、投影寻踪法等传统优选方法,这些方法大多需要构造指标集与优选标准值间的函数关系和计算权重,且随着区域不同建立的优选模型也需要改变;基于神经网络算法的优选模型虽然克服了这些缺点,但存在收敛速度慢且容易陷入局部极小值的缺点,使得在应用中受到一定的限制。另一方面,大多优选模型未对指标进行优化和筛选,致使非关键指标过多,影响了优选结果的准确性。
蚁群算法(Ant colony optimization,ACO)具有较强的全局搜索能力、信息处理的隐并行性、鲁棒性和可规模化等优点[12]。支持向量机(Support vector machine,SVM)作为一种新的机器学习算法,以最小结构风险代替了传统的经验风险,求解的是一个二次型寻优问题,得到的是全局最优点,解决了在神经网络方法中无法避免的局部极值问题,且支持向量机的拓扑结构由支持向量决定,避免了传统神经网络拓扑结构需要经验试凑的不足,在解决小样本、非线性及高维模式识别问题中表现出特有的优势[13]。因此,本文采用蚁群算法进行评价指标的优化和筛选,并通过支持向量机建立了农业节水灌溉技术性优选模型,以山西省43个县为对象进行试验,分别对每个县可能种植的小麦、玉米、大豆和棉花选择适宜的节水灌溉技术(喷灌、滴灌、膜灌、沟畦灌、不宜种植该作物)。试验结果表明该优选模型具有良好性能,与当地实际情况相符合,可为决策者提供科学依据,对节水灌溉项目规划设计中选择适宜的节水灌溉技术有较大的现实意义。
基于蚁群算法和支持向量机的节水灌溉技术优选算法流程图如图1所示,该算法针对小麦、玉米、大豆、棉花4种作物分别训练4种优选模型,由数据预处理、蚁群算法筛选评价指标、应用支持向量机对节水灌溉技术进行优选3部分组成。
分别输入小麦、玉米、大豆、棉花4种作物的训练样本,为了消除指标之间量纲、量级等不同的影响,且使各个指标具有可比性,在分析之前需对数据进行归一化处理。对于越小越优型指标选用式(1)处理,而越大越优型指标选用式(2)处理,数学定义如下:
图1 本文模型流程图Fig.1 Flow chart of proposed model
蚁群算法主要功能为节水灌溉技术评价指标的筛选[14],其主要步骤为:
(1)初始化蚁群参数。将评价指标看作节点,样本看作蚂蚁,假设n为所有的评价指标数,m为待评价的样本数,即蚂蚁群体的数目,将m只蚂蚁均匀分布在n个节点上。蚂蚁k根据各条路径上的信息素浓度选择节点转移,并不断更新信息素及转移概率。t时刻,蚂蚁k由节点i转移到节点j的概率公式为:
式中:tabuk为禁忌表,记录蚂蚁k已走过的节点,以禁止蚂蚁选择已选择的评价指标;α为残留信息τij的相对重要程度;β为期望值ηij的相对重要程度;ηij表示蚂蚁k从节点i转移到节点j的期望程度;τij表示链接节点i-j路径上的信息量。
(2)适应度值的计算。将评价指标选择算法的适应度函数定义为:
式中:D为候选指标集的维数;d为指标子集x的维数;P为支持向量机输入指标子集x下的评价正确率;λ为评价正确率在评价函数中所占的权重系数,计算公式如下:
可见,f(x)越大表明选择的指标子集性能越好,即利用较少的指标获得了较高的优选正确率。
(3)局部搜索。若对应解中某位是否进行变异的概率为:r<r0,则对应解中该位标记值取反。重新计算新解的适应度函数,如果新的适应度函数值大于局部搜索前的值,则将新的适应度函数值取代原来的解,否则原解不变。选取适应度较高的前m个蚂蚁进行局部搜索,且m=0.1×n,r0=0.1。
(4)信息素更新。选取质量较好的前m只蚂蚁进行信息素的更新。假设在第k次迭代结束以后,蚂蚁对信息素τij进行更新,公式如下:
式中:ρ为信息素蒸发损失系数;Δτij为该路径上信息素的增加值。
(5)终止蚁群算法。最优解的搜索过程是通过定义域上所分布的蚂蚁按照转移概率不断地选择路径,以试图找到更好的解,在其中嵌入领域搜索机制,当迭代次数T=Tmax时算法终止,最终找到最优解。
利用蚁群算法筛选后的指标对节水灌溉技术样本进行选择,过程如下:
(1)选取核函数与参数。目前应用较多的3种核函数分别是:p阶多项式分类器、径向基函数和Sigmoid函数。径向基函数可将数据非线性地映射到高维特征空间,具有处理特征变量和分类变量的非线性关系的能力,且径向基函数的参数少,降低了模型选择的复杂程度[15],因此本文选择径向基函数作为支持向量机的核函数。
(2)支持向量机训练与测试。分别输入4种作物的测试样本,根据蚁群算法筛选的指标提取数据,并采用径向基核函数对支持向量机进行训练,并根据训练所得参数测试样本输出最佳节水灌溉技术优选正确率。
山西省地处华北西部的黄土高原东翼,地理坐标为:北纬34°34′~40°43′、东经110°14′~114°33′,海拔为1000~2000m,地形较为复杂,山地和丘陵占总面积的三分之二以上。该省属温带大陆性季风气候,年均气温为3~14℃,南北温差大;年均降水量为400~650mm,但季节分布不均匀,6~8月降水量约占年降雨总量的60%以上。对山西省43个县进行了调研和数据收集,调研区域如图2所示。
通过实地调研和查阅文献,构建了初始节水灌溉技术优选指标体系,包括了生产、生态、经济、气象、社会和土壤共6类因素,共30个指标,如图3所示。由于部分指标之间有较高相关性,且不同的作物需要选择不同的指标,因此采用蚁群算法对初始指标体系中的指标进行筛选,以获得针对不同种类作物的最终评价指标。这样,节水灌溉技术优选指标体系所包含的指标既能反映优选的目标,又少而精,以免增加优选的难度和复杂性[16]。
图2 山西省调研区域Fig.2 Research area in Shanxi Province
图3 节水灌溉技术优选指标体系Fig.3 Index system for selecting water-saving irrigation technology
本研究中,有关生产、生态和经济基本资料数据为2008~2010年连续三年的实地调研结果,其中经济因素指标及技术重复使用年限、节能率、节水率和节地率等12项指标为数值型指标,而运行管理难易程度、消耗劳力程度、与农艺技术结合程度、技术施工容易程度、对地下水利用影响程度、对自然环境影响程度和对农田小气候影响程度等各项为区间型指标,每个指标分为5个等级:1为低,2为较低,3为中等,4为较高,5为高;气象数据来源于“中国气象数据共享服务网”,统计时段为2001~2010;社会数据来源于2001~2010年《山西省统计年鉴》;土壤基本数据来源于“全国土壤基本信息调查”项目2008年的调研结果。地形地貌类型分为3类:1为平原,2为丘陵,3为山地;土壤肥力分为5个等级:1为低,2为较低,3为中等,4为较高,5为高。
通过收集到的山西省43个县的区域数据作为样本,利用蚁群算法和支持向量机以实地调查获得的节水灌溉技术为目标分别对小麦、玉米、大豆、棉花4种作物进行指标的筛选和训练及测试试验。其中优选结果分为5类:1为滴灌,2为喷灌,3为膜灌,4为沟畦灌,5为不宜种植该作物。
选定相应待选指标,蚁群参数初始化设置为蚂蚁群体数量M=37、信息启发因子α=3、期望启发因子β=2、信息素蒸发损失系数ρ=0.8,则信息素残留因子1-ρ=0.2,信息素增加强度Q=1。分类器支持向量机采用径向基核函数K(x,y)=,根据试验发现核参数σ=0.85,惩罚因子C=100时分类效果最佳。利用蚁群算法分别对小麦、玉米、大豆、棉花4种作物进行指标筛选,每种作物分别运行10次,每次运行的迭代次数为20次,指标筛选蚁群算法迭代过程如图4所示。
图4 蚁群算法筛选指标的迭代过程Fig.4 Iterative process of index selection using ACO
从图4可看出,第1次迭代的适应度函数值为0.316,第3次的为0.563,迭代到第8次时适应度函数上升到最高为0.976,当迭代到第20次时结束,同时输出指标筛选结果。运行10次蚁群算法中,指标筛选最佳结果如表1所示。
从表1结果可看出:
(1)在指标数量方面,初始节水灌溉技术优选指标体系包含30个指标,当小麦的适应度函数值为0.976时,优选出12个指标,指标减少率为60%;玉米适应度函数值为0.937时优选出16个指标,指标减少率为46%;在适应度函数值分别为0.912和0.916时,大豆和棉花优选出17个指标,指标减少率均为43%。
(2)在指标子集方面,小麦的指标子集优选出12个指标,其中生产因素类指标包括了消耗劳力程度X3、与农艺技术结合程度X4;生态因素有节能率X6;经济因素包括单位面积灌水成本X12、水分生产效率X14、灌溉水利用率X15和效益费用比X16;气候指标有年均积温X20、年均降雨量X22;社会因素为年均水资源总量X27;土壤因素包括地形地貌类型X29和土壤肥力等级X30。说明在小麦生产的过程中,种植区域的基本条件及种植的经济效益是选定节水技术的决定因素。玉米的指标子集保留了16个指标,比小麦的指标子集多4个,分别为:对自然环境影响程度X10、对农田小气候影响程度X11、年均风速X23和农民年人均收入X24。这是因为玉米多采用膜灌技术,地膜的使用对自然环境造成一定污染,同时对农田小气候产生影响,风速太大将限制喷灌技术的应用,农民人均收入高的地区可采用投资量较大的灌溉技术。大豆和棉花的指标子集比玉米的指标子集数量多1个经济指标,即投资回收期X17。这是因为棉花和大豆分别为经济类作物和油类作物,价格较高,采购设备时投资回收期是个重要指标。
蚁群算法通过对相关性较高的指标进行去除,实现了指标的优化和数据的降维,在很大程度上消除了数据的冗余。
表1 蚁群算法对4种作物的节水灌溉技术指标筛选结果Table 1 Selected indexes of four kinds of crops for water-saving technology by using ACO
为了测试基于蚁群算法和支持向量机的节水灌溉技术优选模型的实际效果,提取蚁群算法筛选出的指标,以山西省43个县实际调研结果为标准,在小麦、玉米、大豆和棉花4种作物条件下分别对33个县进行训练,另10个县进行测试,其中测试输出结果分为5类:1为滴灌,2为喷灌,3为膜灌,4为沟畦灌,5为不宜种植该作物。测试的具体结果如表2所示。
表2 本文优选模型测试结果Table 2 Test results of proposed optimization model
从表2可看出,通过10个县的测试,本文算法根据小麦、玉米、大豆和棉花4种作物分别优选出了相应的节水技术。在小麦节水灌溉技术优选方面,阳高、山阴和昔阳3个县节水灌溉技术优选结果都为不适宜种植该作物,沁水、霍州和芮城结果为膜灌,而清徐、襄垣、五台、文水优选结果为沟畦灌,其节水灌溉技术优选结果与当地的实际情况完全吻合。在玉米节水灌溉技术优选方面,阳高、山阴、五台、文水、昔阳节水灌溉技术优选结果为膜灌,清徐、襄垣、霍州优选结果为沟畦灌,沁水和芮城为滴灌,该优选结果中只有清徐与实际情况有出入,在清徐县中最优选择为膜灌而非是沟畦灌,这主要是因为清徐县的积温、地形地貌类型和沟畦灌的增产效果等指标数据偏大的缘故。在大豆节水灌溉技术优选方面,清徐、沁水、五台、芮城结果为喷灌,阳高和昔阳结果为膜灌,襄垣、山阴、霍州结果为滴灌,文水结果为沟畦灌,与当地实际情况对比,发现文水应该选择滴灌节水技术,因为该县农民年人均收入较山西省其他县高,且年均蒸发量大,更适合于滴灌技术。在棉花节水灌溉技术优选方面,阳高、襄垣、山阴和昔阳结果为不适宜种植该作物,清徐、五台、文水结果为膜灌,沁水优选为喷灌,而霍州、芮城选择为滴灌,与当地实际情况完全符合。
通过测试试验发现,只有清徐县的玉米作物和文水县的大豆作物的节水灌溉技术选择结果与当地实际情况有出入,而其他县的节水灌溉技术选择结果与当地实际情况全部吻合。因此,本文提出的基于蚁群算法和支持向量机的节水灌溉技术优选模型实用性较好。
(1)针对不同的作物,利用蚁群算法寻优的特点进行了指标的优化和筛选,试验结果表明,在指标数量方面,从初始节水灌溉技术优选指标体系的30个指标中,小麦优选出12个指标,指标减少率为60%;玉米优选出16个指标,指标减少率为46%;大豆和棉花优选出17个指标,指标减少率在43%。因此,蚁群算法的应用有效减少了指标数量,降低了数据维数。
(2)通过山西省10个县的试验发现,只有清徐县的玉米作物和文水县的大豆作物的节水灌溉技术选择结果与当地实际情况有出入,而其他县的节水灌溉技术选择结果与当地实际情况全部吻合。
(3)本文提出的节水灌溉技术优选模型,既充分考虑了专家的经验和直觉思维的优点,又降低优选过程中人为地不确定性因素的影响,具有运算速度快、准确率高、过程方便简捷的特点,对节水灌溉项目规划设计中选择适宜的节水灌溉技术有较大的现实意义。
[1]李小辉.简论农业节水灌溉技术[J].赤峰学院学报:自然科学版,2009,25(1):114-115.Li Xiao-hui. Agricultural water-saving irrigation technology[J].Journal of Chifeng University(Natural Science Edition),2009,25(1):114-115.
[2]孟夏.节水灌溉适宜技术选择方法研究[D].济南:山东农业大学,2008:41-58.Meng Xia.The disquisition of choosing the watersaving and irrigation technology in order[D].Ji′nan:Shandong Agricultural University,2008:41-58.
[3]贺延国,付强,邢贞相,等.东北半干旱地区节水灌溉技术组装模式优选研究[J].灌溉排水学报,2006,25(2):81-84.He Yan-guo,Fu Qiang,Xing Zhen-xiang,et al.Optimizing the model of water-saving irrigation technique assembling in semi-arid irrigating district of northeast China[J].Journal of Irrigation and Drainag,2006,25(2):81-84.
[4]陈欢,叶少有.基于属性识别模型的节水灌溉方案优选[J].合肥工业大学学报:自然科学版,2009,32(12):1893-1895.Chen Huan,Ye Shao-you.Optimization of water saving irrigation modes based on attribute recognition model[J].Journal of Hefei University of Technology(Science Edition),2009,32(12):1893-1895.
[5]卢玉邦,郭龙珠,郎景波.综合评价方法在节水灌溉方式选择中的应用[J].农业工程学报,2006,22(2):33-36.Lu Yu-bang,Guo Long-zhu,Lang Jing-bo.Application of integrated appraisal method to water-saving irrigation pattern selection[J].Transactions of the CSAE,2006,22(2):33-36.
[6]张庆华,白玉慧,倪红珍.节水灌溉方式的优化选择[J].水利学报,2002(1):47-51.Zhang Qing-hua,Bai Yu-hui,Ni Hong-zheng.Optimal choice of water saving irrigation mode[J].Journal of Hydraulic Engineering,2002(1):47-51.
[7]赵振霞,白清俊,唐涛.基于模糊神经网络的节水灌溉适宜技术优选模型研究[J].水利科技与经济,2010,16(3):294-296.Zhao Zhen-xia,Bai Qing-jun,Tang Tao.Optimization model of water-saving irrigation techniques based on fuzzy neural network[J].Water Conservancy Science and Technology and Economy,2010,16(3):294-296.
[8]高峰,雷声隆,庞鸿宾.节水灌溉工程模糊神经网络综合评价模型研究[J].农业工程学报,2003,19(4):84-87.Gao Feng,Lei Sheng-long,Pang Hong-bin.Model of fuzzy nervous network integrated assessment of water-saving irrigation projects[J].Transactions of the CSAE,2003,19(4):84-87.
[9]Schuck Eric C,Marshall Frasier W,Webb Robert S,et al.Adoption of more technically efficient irrigation system as a drought response[J].Water Resource Development,2005(12):651-662.
[10]Moreno Georgian,Sunding David L.Joint estimation of technology adoption and land allocation with implications for the design of conservation policy[J].American Journal of Agricultural Economics,2005(11):1009-1019.
[11]Montazar A,Behbahani S M.Development of an optimised irrigation system selection model using analytical hierarchy process[J].Biosystems Engineering,2007,98:155-165.
[12]赵学华,李道亮,杨文柱,等.基于改进蚁群算法的棉花异性纤维目标特征选择方法[J].农业机械学报,2011,42(4):168-173.Zhao Xue-hua,Li Dao-liang,Yang Wen-zhu,et al.Feature selection for cotton foreign fiber objects based on improved ant colony algorithm[J].Transactions of the Chinese Society for Agricultural Machinery,2011,42(4):168-173.
[13]王书志,张建华,冯全.基于纹理和颜色特征的甜瓜缺陷识别[J].农业机械学报,2011,42(3):175-179.Wang Shu-zhi,Zhang Jian-hua,Feng Quan.Defect detection of muskmelon based on texture features and color features[J].Transactions of the Chinese Society for Agricultural Machinery,2011,42(3):175-179.
[14]张智韬,刘俊民,陈俊英,等.基于RS、GIS和蚁群算法的多目标渠系配水优化[J].农业机械学报,2010,41(11):72-78.Zhang Zhi-tao,Liu Jun-min,Chen Jun-ying,et al.Water resources allocation of canal system based on multi-objective about RS,GIS and ant colony algorithm[J].Transactions of the Chinese Society for Agricultural Machinery,2010,41(11):72-78.
[15]张建华,冀荣华,祁力钧.基于径向基支持向量机的棉花虫害识别[J].农业机械学报,2011,42(8):192-197.Zhang Jian-hua,Ji Rong-hua,Qi Li-jun.Recognition of pest damage for cotton leaf based on RBFSVM algorithm[J].Transactions of the Chinese Society for Agricultural Machinery,2011,42(8):192-197.
[16]粟晓玲,康绍忠.石羊河流域多目标水资源配置模型及其应用[J].农业工程学报,2009,25(11):128-132.Su Xiao-ling,Kang Shao-zhong.Multi-objectives allocation model of water resources and its application in the Shiyang Riverbasin[J].Transactions of the CSAE,2009,25(11):128-132.