郝嘉琪
摘 要:生物统计是数理统计在生物中的应用,尤其在农业领域中发挥着日益重要的作用。文章对生物统计与农业科学试验的联系,以及在农业试验中的分析、应用和数据的处理等方面进行了论述。
关键词:生物统计 农业 试验设计 应用
中图分类号:F32
文献标识码:A
文章编号:1004-4914(2017)06-224-02
一、生物统计学概况
生物统计学是建立在数理统计的基础上,结合生物科学的基本原理,利用数据分析解释生物的各种现象,从而兴起的一门交叉性学科。早在1889年《自然的遗传》一书中就提及“相关”、“回归”等有关统计的概念。从记录统计学开始,经过描述统计学,一直发展到现在的推断统计学,生物统计学逐渐发展了起来。随着社会的进步和科技的发展,生物统计在植物界如农业、林业,动物界如养殖业、渔业,微生物界如发酵产业、分子生物学等领域均有很大的影响力,甚至在人类疾病及遗传等医学领域的重要性也愈加显著。
世间万物都是相互联系的,运用生物统计可研究其相互之间的关系以预测其活动规律。目前,许多国家的相关大学都开设生物统计科目,主要讲授方差分析、回归分析、简单矩阵等课程,以及生物统计在植物育种、作物栽培、作物生产、农林经济管理、养殖业等方面的应用,还有如何利用电脑软件整理、分析相关数据等内容{1}。
二、农业科学试验的过程
生物科学研究,尤其农业科学研究是以实验为基础的科学。在农业生产过程中,为了提高农产品的质量和产量、减少田间害虫群体的数量、合理施用农药化肥等方面,需要提前对试验进行正确、科学且周密的设计,从而达到预期的效果。
对于农业科学中的各项研究,大部分都需要经过若干年的试验周期,而且还必须选择多个地方进行,从而使研究的结果趋于平均化,最后得到具有代表性的结论。这些试验都要运用到“八性”统计思维中的随机性、概括性与代表性等理论{2},在试验过程中搜集、调查得来的数据再做进一步的统计分析、处理,从而得出适宜于农业领域的有效结论。
三、统计与科学试验的关系
试验所得数据只是所有研究对象的一部分,具有变异性,同时观察的数据也可能存在误差,如果直接将其应用于生产中必定会带来难以估计的严重后果。而生物统计能在部分个体的基础上,推断出总体的相关参数,为农业人员提供理论依据,有效解决生产中存在的疑难问题。生物统计是农业科学试验的理论基础,而良好的科学试验设计可以为统计推断带来准确的数据来源。
一是生物统计能将试验调查的数据系统化、条理化,从而便于分析研究;二是生物统计能够分析出农业试验各变量间的相关性;三是生物统计是科学试验方案的原则与依据。生物统计和科学试验二者之间相辅相成,将其相互结合必然成为今后农业科学研究的理论指导体系。
四、生物统计分析
(一)推断统计
推断统计是由样本统计量推断总体参数的统计方法,可分为总体的假设性检验和总体的参数估计两部分。
1.总体的假设性检验。研究的总体是无限的,而有限的样本可以推断出总体是否满足所研究的问题。例如:农业科学中经常涉及肥料品种对农产品产量影响的研究,施用肥料的面积是有限的,此时就可以运用推断统计的总体假设性检验,对施用不同品种肥料的产量进行收集、整理、分析,做进一步的推断。而推断需要对总体做出假设,首先,假设几个总体参数之间或总体参数与一个确定值是相等的,此为无效假设;其次,做出对应于无效假设即相等关系的备择假设,也就是互不相等关系,并确定显著水平。对于上例,无效假设为施用不同肥料对产量的影响没有显著差异。之后,认为无效假设是正确的,计算其概率并与显著水平比较,比较过程中,规定小概率事件在实际中是不可能发生的,由此判断是否接受无效假设。若上述例子中计算得到的概率小于显著水平,认为不可能发生,则否定无效假设,即不同品种肥料对产量的多少有显著影响。
2.总体的参数估计。在农业研究中,需要对新引进品种的种子千粒重、发芽率、肥料利用率等问题进行一个区间范围的估计。由样本的调查结果预测总体相关参数在符合一个特定概率时的区间,便于挑选优良品种,有针对性地投入生产,达到省时省力的作用。
(二)方差分析与回归、相关分析
1.方差分析与田间试验。方差分析适用于存在多种处理、多个重复的试验中,其基本方法为计算多个处理观察值的偏差平方和(SST)及其自由度(fT),再分解为多种影响因子的偏差平方和(SSA、SSe)与自由度(fA、fe),从而计算相关统计量(F0),在显著水平下做出统计推断,并列出方差分析表,直观表明所研究问题的显著性。例如:分别用多种不同的药剂处理小麦种子,比较苗高,检验药剂的品种对小麦苗高影响有无显著性差异。此研究中的变异来源为药剂不同品种间引起的变异,以及试验误差引起的变异。通过方差分析表可看出药剂的品种对苗高是否有影响,哪種药剂更有利于种子生长。
田间试验中,由于同一块试验地的各个区域存在不同的自然环境,如土壤肥力、盐碱性、水分等,且需要设置多个重复,因此将试验地随机划分为多个小区,每个小区的处理各异,这种设计方法叫做随机区组法。例如:对小麦6个品种(1-6)进行比较,每种重复3次(Ⅰ、Ⅱ、Ⅲ),设计的田间排列如下:
而有些田间试验中,由于条件的限制,所有处理不能完全在小区内随机排列,这时就可以将小区划分为不同的级别:主级小区与次级小区。需要大片土地的处理作为主级小区,其内包含剩余处理的各个水平。如有A1、A2两个玉米品种,B1、B2、B3三个水平的施肥量,重复试验2次(Ⅰ、Ⅱ),设计的田间排列如下图。这种设计能有效地利用试验地与材料,节省资源且实施方便。方差分析需要对主因素即玉米品种间、副因素即施肥量水平间、主副因素间的互作效应进行差异显著性检验。
2.回归、相关分析与试验结论。统计学中的关系有因果关系与平行关系两种。施肥量与作物产量间是因果关系,研究因果两者之间的关联程度叫回归分析,而施肥量与种植密度间就为平行关系,共同决定产量,关于平行关系间密切程度的探讨就是相关分析。为了使结果更加明显,通常建立直线回归模型并计算相关系数来表达各因素间的联系。利用以上方法便于研究者对日后的农事劳作进行预测,并制定出一系列的优良决策。
五、生物统计在农业上的应用
农业科学从过去的定性研究到现在逐渐趋向于定量化研究{3},这一过程中不可缺少的是数学工具。生物与数学相互融合产生的生物统计学在农业科学的多方面研究中发挥着巨大作用。
为了提高农产品的品质与产量,我国新引进多种粮食品种。但新品种适宜在什么样的环境下生长、利于作物生长的肥料品种以及施肥量的多少等问题都需要事先用生物统计学进行分析研究。除此之外,农田生态系统中的各种害虫、杂草的生长也会对作物产生不利的影响,农业劳作者一般通过简单喷洒农药的方法来控制。而施用何种农药以及药剂量的多少,既能有效消灭作物天敌又能尽量降低对农作物的损害,同时降低经济损失等等问题,也要依靠生物统计学进行预测和预报。
另外还有学者发现,具备生物统计学知识可以预测一些生物现象的发生,而且准确率较高,然而很多人对此却并不了解{4}。因此在相关人群中普及生物统计学的知识势在必行。
六、数据处理
对农业试验中的调查数据做进一步的分析处理时,会出现数据冗杂繁琐的现象,这就需要一些统计软件加以辅助运算。其中使用最多的是SPSS(Statistical Package for the Social Science)與SAS(Statistical Analysis System)软件。SPSS与SAS是世界上广为流行的统计软件,在农业、经济、人文、医学、教育、自然科学等科研活动中必不可少。它的功能既全面又强大,这是其被广泛使用的重要原因之一。非专业人士也能很快掌握其操作方法并熟练应用。
通过统计软件可以将研究人员所需要的结果完美展示出来,既方便又快捷。但是,完全依靠软件也并不科学,只有生物统计工作者利用软件分析出的结果,再结合生物科学有关理论对其在农业领域中所带来的影响作出总体的分析研究判断,这样才能得出最后的正确结论,从而指导人们的生产活动,最终达到事半功倍的效果。
注释:
{1}彭先恐,张汝斌,王福亭.生物统计在农业科学上的应用[J].河南农学院学报,1980(3):96-105.
{2}胡良平,刘惠刚.统计学思想与三型理论在生物医学科研中的应用[J].中西医结合学报,2007,5(2):216-219.
{3}周季维.应用生物统计学基础(一)[R].云南:云南省农科院情报室.
{4}Oluwatosin Akinsola, Olutayo James, Adebayo Lbikunle, Wasiu Adeyemo. Understanding biostatistics: A study of Nigerian dental resident doctors [J]. Nigerian Journal of Experimental and Clinical Biosciences, 2014:100-104.
(作者单位:西北农林科技大学农学院2014级农学2班 陕西杨凌 712100)
(责编:若佳)