李 静 张换样 秦丽霞 吴慎杰 朱永红 竹梦婕 焦改丽
(山西省农业科学院棉花研究所,山西运城 044000)
在农业数据统计和处理上,虽然有多种统计和检验方式,但在实际工作中,许多人往往忽略了研究对象和其在田间的分布状态,而是采用简捷便利的平均数作为代表数。但在应用过程中,特别是在植物病虫害调查研究中,它受数列中的极端值影响较大,遇到某种特殊资料时,代表数的结果往往与实际不符,从而会使试验结果出现偏差[1-3]。病情指数是建立在病害普遍程度和严重程度基础上的一个综合指标,是作物群体病情数量化的一个测值。而从病情指数的计算公式看,其实它是一个加权平均数,是按算术级数增加的间断性变量,其机械地把1棵II级病株等同于3棵I级病株,其实这种关系在生产中并不一定能够成立。由于其本身是一个将原始资料经过统计代换的量,所以它的总体服从何种分布,往往难以明确[4]。本文通过对采取几种不同统计方式的分析实例进行剖析和应用,旨在求得较为符合生产实际的调查统计结果。
1.1 秩和检验法病情指数仅适用于直观分析,而不适合通常运用的u检验、t检验或F检验(因其总体分布为正态发布或者近似为正态发布)[5-6]。在研究实践中,如果把应统计的资料变为原始等级分组计数资料,并采用秩和检验方式进行统计,则能够在实践中获得较为合理的结果。两组数据间不同病情的统计资料如表1所示。
表1 两组数据间不同病情的统计资料表
它们分别代表植病实验结果中常见的4种类型资料,即发病率相近,植病不相近(例1);植病相近,发病率不相近(例2);发病率和病指均相近(例3);发病率和病指均不相近(例4)。试用上述方法进行统计,以比较各处理与对照间的病情差别和各统计方法的适应性[7]。
检验假设:对照和处理间病情相同。排队:将两组数据按顺序排队,如表中第(2)栏、第(3)栏。编秩号:将两组数据统一编秩号,如“O”级病情组34株,秩号范围1~34,平均秩号为=17.5等,依此类推。计算株数较小组的秩和:以株数较小组为n1,株数较大组为n2,计算n1组内各等级株数与平均秩号乘积(2)×(6)=7,再将此乘积相加为n1组秩和,代号为T。如n1=n2,则分别计算个组的秩和,然后以秩和较小者为T。判断结果:根据U的公式得出结果。
如果U<1.96,P>0.05,则表示处理与对照之间差别无显著意义。判断结果也可根据n1、n2和n2-n1进行判断,结果与第一种方法一致。
采用上述方法得出例2、例3、例4的资料统计结果,依次为U=1.41< 1.96,则P> 0.05;U=0.33< 1.96,则P>0.05;U=1.56< 1.96,则P> 0.05。因此,在 3例资料中,处理与对照之间的病情差别均无显著意义。例1的资料统计结果如表2所示。
1.2 调和平均数方法调和平均数亦称倒数平均数,简单调和平均数的计算公式为:
其中,f1、f2……fr分别代表与变量x1、x2……xr相对应的权数,并且f1+f2+……fr=n[8-9]。
某地5月11-15日百株蚜量系统调查结果见表3,求5 d内每增殖1头蚜虫所需的平均时数。
表2 例1的资料处理、对照病情秩和检验
表3 某地5d百株蚜虫系统调查结果
根据相关数据求得MH=0.075 9h/头。检验:5月11-15日蚜虫增殖数为260+88+362+530+340=1580头,按每增殖1头蚜虫所需时数0.075 9计算,增殖1580头蚜虫所需时数为 1580×0.075 9=119.922h,也即 5 d,与实际情况完全一致。如按算数平均数计算:x=0.0976h/头。检验:1580×0.0976=154.208 h,即 6.425 3d,与实际不符。此外,应用生命表预测昆虫发生量,经常需要计算昆虫的平均存活情况,对于这类问题也多采用调和平均数作为代表值。
1.3 几何平均数方法在原始调查数据中出现偏大或偏小的极端值时,可将这类数据转换成对数,计算对数的平均数,然后再取其反对数。这样算得的平均数就称为几何平均数。常用的算术平均数在资料偏态的情况下,其平均值受极端值影响较大,往往统计后很难真实地反映生产实际,而采用几何平均数运算则能较好地反映出研究的代表性。其计算式为分组资料公式为常用于计算平均增长倍数,能更准确地反映实际情况[10-11]。
例如,为了能够了解花生上蚜虫的增长倍数,笔者在花生田间随机选取20个样点,每点选取10株,每隔2d调查1次虫口密度。第1次调查平均每点虫口密度为120头,第2次为100头,第3次为1894头,求每2d蚜虫的平均增长倍数。
用算术平均数计算结果,第2次比第1次蚜口增长8.33倍,第3次比第2次蚜口增长1.89倍,两者平均增长5.11倍,显然与实际情况不符,如果按这个增长倍数计算,第3次调查时蚜虫数为120×5.112=3133头,与实际虫口1894头相差很大。原因是倍数不具有可加性。现如果按几何平均数计算=3.968倍。经验证,第1次调查时蚜口为120头,4d后增长为120×3.9682=1889头,与实际蚜数仅差5,表明这个平均增长倍数是符合实际的。这是因为倍数在对数的尺度上有了可加性的缘故。
对3种方法利用实例进行分析表明,分析结果相比其他方法更符合实际情况。本文得出的相关结论能够为3种方法在农业试验研究中的应用提供借鉴。