俞华先,周清明,安汝东,郎荣斌,冯 蔚,边 芯,经艳芬
(云南省农业科学院甘蔗研究所瑞丽育种站,云南 瑞丽678600)
甘蔗是我国重要的糖料作物,甘蔗品种的选育和推广是提升蔗糖产业市场竞争力的重要保障。国家甘蔗品种区域试验是检验甘蔗品种(系)丰产性、稳定性及其蔗区适应性的重要举措。国家区域试验云南瑞丽点地处中国西南边陲,全年仅雨旱两季,基本无霜,属南亚热带湿润生态型蔗区,是我国甘蔗新品种区域试验点之一。
信息熵用于对随机变量的不确定性或信息量的度量[1]。熵[2]是系统无序性(混乱度)的度量,即一个系统越有序,信息熵越低;反之,则越高。变量的不确定性越大,熵值越大,理解它所需要的信息量也就越大。对系统进行评价时,信息熵能够描述其相关指标数据被利用的程度,即可以用来量化评价指标的重要程度[3]。在多目标性状综合评价中,某性状指标的熵越小,则表明其指标值的变异程度越大,提供的信息量越多,其权重越大;反之亦然。近年来,信息熵理论被应用于多个领域,万星火等[4]、周薇等[5]提出基于信息熵理论的综合评价方法;严宝文等[6]应用信息熵理论对农业环境地质系统状态进行评价;许学娜等[7]利用信息熵结合DTOPSIS 法对企业对标评价模型及实证进行研究。信息熵理论在农作物综合评价方面的应用也较多,曹雯梅等[8]应用熵权法对棉花区试品种进行综合评价;苏恒强等[9]提出熵权系数法在土壤环境质量评价中的应用;余健等[10]提出熵权模糊物元模型在土地生态安全评价的应用;安汝东等[11]认为信息熵理论用于甘蔗品种(系)的综合评价是可行的。本文以第9 轮国家区试云南瑞丽试验点12 个甘蔗参试品种(系)2年新植(2012 、2013年)、1年宿根(2013年)的区域化品比试验结果,进行基于信息熵理论的综合评价,旨在为参试品种(系)在瑞丽及其相似蔗区的推广应用提供依据。
国家第9 轮区试参试品种(系)为福农1110、福农0335、粤甘40、粤甘42 号、云蔗05-49、云蔗06-80、云瑞06-189、闽糖01-77、柳城05-136、、德蔗03-83、新台农22(CK1)、粤糖93-159(CK2),共计12 个品种。
2012年在云南省农业科学院甘蔗研究所瑞丽育种站进行宿根试验,该地为海拔780 m 的水浇地,北纬24°01',东经97°51',前作为甘蔗;2013 在瑞丽站所辖的陇川基地进行新植试验,该地为海拔923 m 的水田,北纬24°11'25'',东经97°45',肥力均匀、地势平坦、阳光充足、排灌方便,前作为甘蔗。
采用随机区组设计,3 次重复5 行区,行长6.66 m,行距1.1 m,株距0.12 m,小区面积36.7 m2。按规定标准下种,四周设保护行,试验地田间管理同大田生产一致。
1.3.1 农艺性状 按照国家区试实施方案,3月20日前播种,4 -5月调查苗情,8 -10月调查生长速度,12月分别调查株高、茎径、有效茎等农艺性状,并实测蔗茎单产。以出苗率、分蘖率、宿根萌苗率、株高、茎径、有效茎数、甘蔗产量7 个农艺性状平均值综合评价参试品种(系)的农艺表现。
1.3.2 工艺性状 2012年11月至2013年3月,每月下旬采样,采用两次旋光法[12]进行全面分析。选用出汁率、蔗糖分、纤维分、重力纯度、还原糖分、蔗糖产量6 个指标的平均值综合评价参试品种(系)的工艺表现,并进行工艺性状分析。
1.4.1 样本矩阵R 的构建 用n 表示参试品系的个数(n =12);m 表示调查性状(m =13)。样本评价矩阵R 如下。
1.4.2 无量纲化处理 用比值法对样本矩阵R 进行转换,得到规范化矩阵R'=(rij)n ×m。定量数据越大越好的性状(除还原糖、纤维分外)采用上限测度:rij=Xij(Xij)max;定量数据越小越好的性状(还原糖)采用下限测度:rij=Xij(Xij)min;定量数据要求适中的性状(纤维分)采用中性测度:rij=X0abs(Xij-X0)+X0。其中,i 为第i 个品系(i=1,2,…n);j 为第j 个性状(j=1,2,…,m);rij为第i 个品系第j 个性状指标无量纲化处理变量分值;Xij为性状观察值;(Xij)max为性状指标最大值;(Xij)min为性状指标最小值;X0为性状指标理想值;abs 表示取绝对值。
1.4.3 比重P 用比重Pij构成矩阵R',即R'=Pij。其中,Pij为第i 个品系在第j 个性状指标值的比重,n为品系数(n=12)。根据信息理论,各评价性状的比重如下。
1.4.4 各性状指标的信息熵Ej值 根据熵的定义,第j 项评价指标的熵值如下。
式中,n 为评价品系(材料)的数量(n=12)。Ej∈(0,1),Ej值越趋近于0,表示系统内评价指标的变异程度越大;Ej值越趋近于1,表示变异程度越小。
1.4.5 客观权重Wj及评价品系(材料)的综合评价值Fi客观权重Wj及评价品系(材料)的综合评价值Fi如下。
式中,rij为第i 个品系第j 个性状指标无量纲化处理变量分值;Xij为性状观察值;Pij为第i 个品系在第j个性状指标值的比重;Ej表示第j 项评价指标的熵值;Wj表示第j 项评价指标的客观权重值;Fi表示第j项评价指标的综合评价值。
第9 轮国家区试云南瑞丽点12 个甘蔗参试品种(系)的农艺性状见表1,构成样本矩阵:R=(Xij)n ×m。由表1 可知,12 个参试品种(系)中,云蔗05-49 和云蔗06-80 宿根萌苗率最高,茎径均为中茎,早期出苗率二者均偏少;闽糖01-77 有效茎数最高,但株高不高,茎径不粗;粤甘42 有效茎最少;德蔗03-83 为中茎种,有效径数、甘蔗产量均位于第2 位,但分蘖率低;云瑞06-189 为中茎种,有效径数适中,分蘖率、出苗率分别位于第2、4 位,其余性状指标适中。甘蔗糖分以柳城05-136 最高,粤甘42 最低,二者相差2.26%;蔗糖产量以福农1110 最高,粤甘42 最低,二者相差6.7 t·hm-2。
表1 第9 轮国家区试云南瑞丽点甘蔗参试品种(系)工、农艺性状Table 1 Agronomic and technical characters of tested sugarcane species (lines)in Ruili site of Yunnan in the ninth national regional trial
续表1
根据糖料甘蔗育种目标,纤维分按中性指标处理,最适宜含量为10%,故X0=10%。还原糖分含量越低甘蔗糖分越好,因此采用下限测度。其余11 个性状数值为越大越好,采用上限测度。经过无量纲转化后构成规范化矩阵:R=(rij)n×m(表2)。
表2 第9 轮国家区试云南瑞丽点甘蔗参试品种(系)各性状无量纲化处理结果1)Table 2 Dimensionless processing results of the characters of tested sugarcane species (lines)in Ruili site of Yunnan in the ninth national regional trial
根据熵权法原理,将初始矩阵进行均值化处理得到标准化矩阵R',将矩阵中的数据代入公式(1)、(2)、(3),计算得出熵值Ej及其权重Wj(表3)。由表3 可知,蔗糖产量权重最大,为0.254 5,重力纯度的权重最小,仅0.002 6。
表3 第9 轮国家区试云南瑞丽点甘蔗参试品种(系)各性状的熵值及权重Table 3 Entropy values and weights of the characters of tested sugarcane species (lines)in Ruili site of Yunnan in the ninth national regional trial
根据公式(4),将甘蔗品种(系)工、农艺性状的权重乘以其无量纲化值,得出各指标的权重分值,并通过累加得到各参试品种(系)的综合评价总分值Fi及排序(表4)。由表4 可以看出,12 个参试品种(系)中,Fi值大于CK1和CK2的依次是福农1110、柳城05-136、云蔗05-49、德蔗03-83、云瑞06-189、云蔗06-80,其中福农1110 的Fi最大,为0.940 8,柳城05-136 居第2 位,为0.934 8;粤甘40、福农0335、闽糖01-77、粤甘42 的Fi值均小于CK1和CK2。根据信息熵原理,Fi值越大说明该品种综合性状越好,表明福农1110、柳城05-136、云蔗05-49、德蔗03-83、云瑞06-189、云蔗06-80 的综合性状均优于2 个对照种;粤甘40、福农0335、闽糖01-77、粤甘42 等4 个品种的Fi值在0.796 4 -0.687 0 之间,均低于CK1和CK2,说明其综合性状比2 个对照种差,其中粤甘42 的Fi值最小,仅0.687 0,比CK2小0.132 2,低于19%,建议综合考虑其他蔗区情况再做出淘汰。
表4 第9 轮国家区试云南瑞丽点甘蔗品种(系)综合评价及排序Table 4 Comprehensive evaluation and sorting for sugarcane species (lines)in Ruili site of Yunnan in the ninth national regional trial
本研究表明,信息熵理论综合评价的目标性状权重与文献[13 -20]专家经验评判法确定的性状指标权重大小基本趋势一致,即蔗糖含量的权重值最大。本文蔗糖含量的权重值为0.254 5,与文献[11 -20]的蔗糖含量的权重值相接近;其次是甘蔗产量,权重值为0.194 8;重力纯度权重值最小,仅0.002 6,这与安汝东等[11]研究结果一致,其原因是在引用资料中各品种重力纯度信息熵值最大。根据信息熵理论,评价指标的熵值越大,该指标值的变异程度越小,提供的信息量就越少,其权重也就越小。但重力纯度作为衡量工艺性状的重要指标,其权重似乎难以反映其在工、农艺性状综合评价中的重要性。
本研究评价结果与田间表现吻合,Fi同时优于2 个对照的品种(系)包括:福农1110、柳城05-136、云蔗05-49、德蔗03-83、云瑞06-189、云蔗06-80,其田间综合性状表现较好,蔗糖含量均高于2 个对照。该评价结果可作为甘蔗品种(系)在云南瑞丽蔗区及其相似蔗区推广应用的依据。
[1]贾世楼.信息论理论基础[M].哈尔滨:哈尔滨工业大学出版社,2007:10 -20.
[2]傅祖芸.信息论—基础理论与应用[M].北京:电子工业出版社,2001:396 -399.
[3]杨丽娟.信息熵在农业科技研究中的应用[J].安徽农业科学,2009,37(35):17781 -17783.
[4]万星火,李艳,檀亦丽,等.基于信息熵的赋权法研究及其应用[J].统计与决策,2008(18):153 -154.
[5]周薇,李筱菁.基于信息熵理论的综合评价方法[J].科学技术与工程,2010,10(23):5839 -5843.
[6]严宝文,方立,李靖,等.基于信息熵理论的农业环境地质系统状态评价方法研究[J].西北农林科技大学学报:自然科学版,2007,35(11):223 -229.
[7]许学娜,刘金兰,王之君.基于熵权DTOPSIS 法的企业对标评价模型及实证研究[J].情报杂志,2011,30(1):78 -82.
[8]曹雯梅,路凤银,刘松涛,等.基于信息熵理论的模糊综合评价方法及其在棉花区试中的应用[J].中国农学通报,2013,29(8):212 -215.
[9]苏恒强,陈桂芬,朱春娆,等.熵权系数法在土壤环境质量评价中的应用[J].安徽农业科学,2010(25):13928 -13930.
[10]余健,房莉,仓定帮,等.熵权模糊物元模型在土地生态安全评价的应用[J].农业工程学报,2012,5(28):260 -266.
[11]安汝东,周清明,经艳芬,等.应用信息熵理论综合评价甘蔗新品系[J].中国糖料,2014(3):45 -48,55.
[12]陈刚,黎庆涛,卢家炯. 现代制糖工业分析技术的发展——糖液的分析测定技术[J]. 广西轻工业,2010(10):24 -25,43.
[13]刘少春,吴正焜,陈学宽,等.引进甘蔗品种主要经济性状模糊综合评判[J].甘蔗糖业,2002(1):15 -18.
[14]关中秀,黄忠兴,林宇,等.甘蔗品种的模糊综合评判[J].甘蔗糖业,2003(3):10 -13.
[15]刘家勇,陈学宽,范源洪,等.甘蔗品种模糊综合评判[J].亚热带农业研究,2005,1(1):4 -7.
[16]张革民,刘海斌,容凤玉,等.高糖、高产甘蔗新品种重要性状分析及模糊综合评判[J].中国糖料,2006(1):23 -25.
[17]谭芳,黎焕光,王伦旺,等.用模糊综合评判方法筛选甘蔗优良杂交组合[J].西南农业学报,2012,25(2):396 -400.
[18]赵培方,吴才文,陈学宽,等.DTOPSIS 法对甘蔗新品系的综合评价[J].中国糖料,2008(1):43 -45,47.
[19]昝逢刚,赵培方,杨昆,等.云南省第十套甘蔗区试开远点DTOPSIS 法综合评价[J].中国糖料,2011(1):8 -10.
[20]陆鑫,毛钧,苏火生,等.DTOPSIS 法综合评价甘蔗创新种质[J].中国糖料,2012(1):33 -35,37.