李芳
摘要:在农业科研实践中,试验数据的统计分析是一个重要环节。由于历史原因,很多农业科研工作者还在使用传统手工方式整理分析试验数据资料,阻碍了基层农业科研工作的开展。SPSS是社会科学统计包StatisticalPackageforthe social science的缩写,该软件是由美国SPSS公司推出的大型统计软件包,由于它具有功能强大、交互性好、适用性广等特点,深受广大科学工作者的好评。基于此,本文主要对SPSS软件在农业统计分析中的应用进行分析探讨。
关键词:SPSS软件 农业统计分析 应用
一、前言
现今计算机技术的快速发展,对其成熟的统计分析软件的借助对繁冗的数据进行处理,不但使试验数据资料中的信息可以得到充分的挖掘和利用,而且统计分析效率、精确度和准确性还可以得到极大地提高。虽然SPSS软件被称作社会科学统计包,它同样也适用于自然科学的统计分析。
二、SPSS软件在农业试验统计分析中的应用浅析
社会学统计软件是SPSS的名称,但是也广泛应用于农业领域数据分析中。
作为一种集成化的计算机数据应用处理软件,SPSS是一个组合式软件包,统计分析、数据管理、输出管理、图表分析等等都是其基本功能。SPSS统计分析功能包括均值比较、描述性统计、相关分析、一般线性模型、回归分析、对数线性模型、数据简化、聚类分析、时间序列分析、生存分析、多重响应等几大类。SPSS可以根据数据绘制各种统计图形,具有专门的绘图系统。SPSS利用菜单式操作,使用方便,界面友好,具有比较齐全的统计方法,具有直观的输出结果,对于非统计专业人员而言比较适用。使用SPSS的人员在农业科研人员中要远多于SAS使用的人数。
三、SPSS软件在农业统计分析中的应用
(一)描述性分析
描述性统计分析中描述性分析是最基础的统计分析之一,利用描述性分析,变量的总和、平均数、方差、极差、标准差、最小值、最大值等统计量都可以计算出。比如:对100个小麦麦穗随机抽取,表1为每穗小穗数,进行描述性分析。
建立命名为nw.sav的数据文件,SPSS软件所规定的数据文件格式就是扩展名sav;在AnaIyze菜单中选择Descriptive statistics项的Descriptives…命令,得到Descri叫ves对话框,描述性分析的变量为小穗数;单击。叫ons…按钮,如图1所示的对话框就会弹出,对统计分析的项目进行选定,如标准差(std.Deviations)、平均数(Mean)、最小值(Minimum)、总和(sum)、最大值(Maximum)、方差(Variance)、标准误(S.E.mean)、极差(Range)等;单击Continue按钮回到Descriptives对话框,按OK后如表2所示的结果即会得到。
表2,Descriptive statistics(描述性统计)
除了描述性分析外,还可在Descriptive statistics项中对频数分布分析(Frequencies)、列联表分析(crosstabs)、探索性分析(Explore)等描述性统计进行分析。
(二)组群比较的假设测验
对两个处理的好坏在试验中进行比较,随机分别从两个处理中进行抽样,各自组成个组群,对这两个组群进行测验称组群比较的假设测验。
例如:对月龄大白鼠饲养时使用高蛋白和低蛋白两种饲料,在三个月时,对两组大白鼠的增重量(g)进行测定,两组的数据分别为:低蛋白组:70,118,101,85,107,132,94;高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123。试问大白鼠的增重量利用两种饲料饲养的是否有差别?建立数据文件protein.say,格式如图2所示,其中,饲料类型中的1表示高蛋白饲料,2表示低蛋白饲料;选择Analyze菜单中Compare Means项的Independent-Samples TTest命令,对独立样本的均数差异显著性进行检验,得到 组对话框,把饲料类型设为G rouping Variable,把增重量设为Test Variable(s);单击Define Groups…按钮,在相应的Group输入框中分别填入1和2,如图3所示;单击Options…按钮,得到对话框如图4所示,95%为背景设定置信度,Continue按钮单击,回到Independent Samples T Test对话框;单击OK得到的结果如表3和表4所示,可以从表中看出,120.17和101.00分别为两组的平均增重量(Mean),21.26和20.62分别为标准差(Std.Deviation),Sig.(2-tailed)的值0.072和方差齐性(Equalvariancesassumed)时的t值1.916可知,误差导致的概率大于5%,t值落在置信区间内,不存在处理效应,大白鼠饲养用的两种饲料对它们的增重量差别不显著。还可以在Compare Means项中完成单样本t测验(One-SampleTTest)、平均数分析(Means)、成对比较的假设测验(Paired-Samples TTest)、单因素方差的分析。
(三)单因素方差分析
一维方差分析是单因素方差分析的另一名称,只有一个因素在试验中涉及时,这种统计分析方法就需要使用。根据组内不同的观察值个数,可分为组内观测次数相等的方差分析、组内观测次数不相等的方差分析,以观测次数相等为例进行试验分析。
例如:对安徽、东北、河北、内蒙古、贵州5个地区黄鼬冬季针毛的长度进行测定,随机在每个地区抽取4个样本,表5为测定的结果,对各地区黄鼬针毛长度进行差异显著性比较。对数据文件fur.sav进行建立,其中,东北的代表数字为阿拉伯数字1、内蒙古的代表数字为2、河北的代表数字为3、安徽的代表数字为4、贵州的代表数字为5;选择Analyze菜单中Compare Means项的One-Way ANOVA…命令,有一对话框弹出,设定地区为Factor,设定长度为DependentList;对Options按钮单击,得到对话框,选定Descriptive项,再对Continue单击,回到One-WayANOVA对话框;对PostHoc…按钮单击,对话框弹出,在方差齐性(Equalvariancesassumed)假定中可供选择的多重比较方法有Bonferroni(LSDMCD)法、LSD法和Sidak法等18种,选用LSD法应用于本例中,对Continue单击回到One-WayANOVA对话框;单击OK,得到结果,结果中的Sig.=O,说明黄鼬冬季的針毛长度在这5个地区具有显著差异,需进行多重比较,在平均数多重比较的表格中,内蒙古与安徽、贵州,东北和其它地区,安徽与贵州,河北与贵州的黄鼬冬季针毛长度均达到了显著水平。
四、结语
在农业领域中网络化技术、信息技术数字化的不断渗透,农业数据统计分析工作与计算机技术会得到更快的融合,也会不断推出新的软件,合适的统计分析软件的熟练掌握对农业科技工作者的工作效率会得到极大地提高,在农业生产、科研和管理等方面取得更大的成绩。