唐志祥
摘要:学习假设检验的第一步是建立原假设和备择假设,初学者对原假设和备择假设如何建立理解不透。首先通过单侧检验的一个实例,采用建立不同的原假设和备择假设会导致矛盾的结论;其次,分析了产生矛盾的原因;最后,给出了建立原假设和备择假设的几个原则。
关键词:假设检验 原假设 备择假设 第一类错误
假设检验包括参数检验和非参数检验两种情形,是统计学中的核心内容之一。在学习假设检验的这部分内容时,第一步根据资料对总体的参数或分布建立假设,然后我们假定在原假设是正确的条件下,利用抽样数据计算统计量对应的数值以及计算更不利于原假设的概率,由此判断是否拒绝原假设[1]。但对于假设如何建立的问题,特别是对单侧检验的假设如何建立,目前仍然没有统一的标准,但不同的建立方式有时会得到相互矛盾的结论[2]。这导致不少学习这门课程的大学生对此十分困惑,不知道究竟怎么建立假设检验的假设,影响了学生对这部分内容的掌握。为此,结合教学中出现的问题,探讨如何建立假设的问题非常有必要。
一、原假设建立不同导致的问题
学习假设检验这部分内容时,首先就是要依据问题建立需要检验的假设,其次就是根据抽样调查获得的数据来检验上述假设是否成立。实际教学中,我们发现对于同一组抽样数据,如果原假设和备择假设设定不同,往往会得到不同的结果,甚至得到的结论相互矛盾,初学这部分内容的经管专业学生往往感觉到无所适从,不知道其中的原因是什么。具体我们以下面的例子进行说明。
例 某经销商准备从厂家采购一批蓄电池,合同规定该蓄电池的充电次数不能低于1000次。已知蓄电池的充电次数服从。从这批产品中随机抽取64个蓄电池进行检测,测得平均充电次数=990次,请问,经销商是否购进这批蓄电池()?
分析:这是一个单侧假设检验的问题,我们可以采用不同的方法建立原假设,检验的统计量为。
方法一:设,取显著性水平,则临界值。
检验的统计量:。因为,所以在显著性水平为5%下,不拒绝原假设,即样本提供的证据还不能推翻原假设,即该厂生产的蓄电池达到了规定的充电次数。
方法二:设。检验的统计量为:。因为,也不拒绝原假设,该厂生产的蓄电池没有到达合同规定的充电次数。
从上面例题看出,在进行假设检验时,运用同一组抽样样本,由于原假设的设定不同,导致了相互矛盾的结果。由于我们教授的学生来自不同的省份,在高中的学习时的数学基础参差不齐,导致对这种看似矛盾的结论十分费解。那么,出现相互矛盾结论的原因是什么?这主要涉及到两个问题,一是这两种检验方法是否都正确?二对同一个问题,我们可以随意设定原假设和备择假设进行检验吗?下面将对这两个问题进一步进行分析。
二、问题的原因分析
上面的两种检验方法,单纯从统计推断的角度来说,两种检验方法都是没有问题的,区别在于方法一运用的是左侧检验,方法二运用的是右侧检验。右侧检验的拒绝域,即时就拒绝原假设,接受绝备择假设;相反,时就接受原假设。左侧检验的拒绝域,即时就拒绝原假设,接受绝备择假设;相反,就接受原假设。通过上面左侧检验和右侧检验接受原假设的区域可以看出,左侧检验和右侧检验有个共同的接受原假设的区域,只要样本观测值落入该区域内,就都不拒绝原假设。由于上述问题中,共同的接受域为,而样本观测值恰好位于该区域内,因而在左侧、右侧检验中都得出不拒绝原假设的结论,由于这个问题中原假设相反,因此,得出了相互矛盾的结论。如果样本观测值落在共同的接受域之外的区域,两种检验方法是一致的。
在现有的部分《应用统计学》教材中,涉及原假设和备择假设如何建立的阐述比较模糊,导致学生误以为假设的设置具有主观性。例如,袁卫等主编的《统计学》(第四版)中认为,将“通常是研究者想收集证据予以反对的假设”设置为原假设;将“通常是研究者想收集证据予以支持的假设” [3]设置为备择假设。郝海等主编的《统计学》认为,“在面对某一实际问题时,由于不同的研究者有不同的目的,即使对同一问题也可能提出不同的假设,无论怎样确定假设的形式,只要它们符合研究者的最终目的便是合理的” [4]。当然,这些关于原假设和备择假设的阐述是正确的。
三、原假设和备择假设建立的几个原则
尽管研究者可以对同一个问题,设置不同的原假设,但不能因此认为原假设的设置具有完全主观性,事实上,原假设和备择假设不是对等的,不能随意调换[5]。假设检验的目的是对备择假设进行检验[6]。一般情况下,我们有1-α的概率拒绝原假设而接受备择假设,或者说此时犯第一类错误的概率为α;当我们不拒绝原假设时,只能说是根据样本的数据还不足以推翻原假设。对如何建立原假设,我们认为可以遵循以下的一些原则。
(一)一般地,轻易不能否定的结论作为原假设
我们通常把成立可能性较大、只有获得了足够的證据支持才能推翻的结论作为原假设。例如,当检验新治疗方法是否比原治疗方法有效时,我们一般是不能轻易否定原治疗方法的有效性,因为经过长期的临床使用,原治疗方法已经被证明是有效的,只有充足的证据才能否定其有效性,因此,应该把“原治疗方法比新治疗方法有效”作为原假设。
(二)拒绝时犯第一类错误后果更严重的结论作为原假设满足
进行假设检验时,无论是否拒绝原假设,我们都会犯错误。原假设是正确的,我们拒绝了是犯了第一类错误;原假设不正确,我们没有拒绝则犯了第二类错误。例如:对于病人去看病,我们可以做出两个对立假设“有病”和“无病”。那么我们如何选择原假设?很显然,把有病当作无病会耽误治疗的良机,造成严重后果;反之,把无病当作有病虽然给患者带来精神负担,浪费不必要的费用,相比于前一种情况,后果相对不太严重。因此,我们应该把设置为有病,这样我们就控制了把有病当作无病的概率,即,所以,:有病;:无病。通过此例说明,设置在某些情况下是实际意义的。
(三)一般把有利于检查者的结论作为原假设
假设检验是服务于实践活动的,在实践活动中就不可避免的带有主观色彩。例如,产品质量检验问题,消费者和出厂抽检产品质量而建立原假设一般来说不同。我们用X表示钢索的承受力,u表示期望承受力,满足条件时,我们认为是合格品。采购商把作为原假设,则拒绝原假设是将不合格的钢索当作合格产品,这类错误的概率可以控制,这将有利于采购商;生产厂商把原假设,则第一类错误是将合格钢索当作不合格钢索,控制这类错误将对生产企业有利。
(四)一般把收集证据希望拒绝结论设置为原假设
不拒绝原假设一般无明确的结论,而拒绝原假设理由是比较充分的,因而在实际检验时,研究人员将希望拒绝的结论设为零假设,希望肯定的命题设为备择假设。例如,进行某种纤维的生产,该纤维的平均强度不超过,现改进生产工艺,希望通过改进工艺来提高其平均强度,检验新工艺是否提高产品的强度,则原假设设为,以便有足够的理由来说明新方法比原方法好。
(五)一般把已有的认知、历史状态建立为原假设
假设检验可以用来检验先前的状态是否发生了变化以及对变化的方向进行定性判断,一般把原来的状态设置为原假设,体现了“原”的含义,既容易理解也好记忆。例如,抽检一批新能源汽车蓄电池的续航里程,国家规定标准是超过2000公里,假设续航里程服从正态分布,x表示续航里程,其中,均未知。那么如何设立原假设呢?我们可以根据该厂生产蓄电池的历史情况进行设置,如果该厂的产品质量一直优良,符合国家标准,我们应该把原假设设置为;反之,如果该厂产品质量历史表现比较差,我们应该把原假设设置为。这两种设置,反映了研究者对产品质量的不同态度,第一种设置反映了研究者一开始就对该产品比较信任,没有充分的证据是不能轻易否定的;第二种设置反映了研究者一开始就对该产品缺乏信任,没有充分的证据也是不能轻易拒绝的。
参考文献:
[1]孙红卫,董兆举,赵拥军.对统计假设检验的误解与误用[J].中国卫生统计,2012,29(1):147-148.
[2]李奇明,徐德义.参数估计与假设检验:原理、方法与误区[J].大学教育,2018,(2):40-42.
[3]袁卫,庞皓,贾俊平,杨灿.统计学(第四版)[M].北京:高等教育出版社,2014.
[4]郝海,崔晓迪.统计学[M].北京:清华大学出版社,2015.
[5]张玉环.淺谈假设检验中原假设和备择假设的建立[J].大学数学,2012,28(2):117-120.
[6]杨桂元,刘德志.参数假设检验中的若干基本问题研究[J].统计与决策,2012,372(24):13-15.
基金项目:2018年度安徽省高等学校省级质量工程项目“《国标》框架下地方应用型大学管理类专业实践教学质量标准研究”;项目编号:2018jyxm0221。
作者单位:安徽师范大学经济管理学院