利用P值方法对图书馆编目业务外包质量检验方法的改进★
朱白
(商洛学院图书馆陕西 商洛726000)
摘要:图书馆编目业务普遍采用外包形式,对所编书目质量如何有效地检验显得非常重要,在已有利用假设检验临界值方法对图书质量检验的基础上,提出另一种P值方法计算拒绝原假设H0的最小显著水平,得到比传统的临界值法给出拒绝域更多的有关信息,并利用Excel中的统计函数计算P值以及确定编目外包质量检验的临界值z1-α,使得P值的得到更容易.
关键词:编目业务外包;假设检验;P值方法;显著性水平
中图分类号:G254
基金项目:★本文系2014年商洛学院人文社科项目“数字化时代高校图书馆网络式管理的研究”(14SKY022)的研究成果之一。
收稿日期:(2015-05-27责任编辑:刘丽斌)
图书馆为了减少投入的运营成本,提升服务效率,以签订合同方式委托外包服务商为其提供相关服务,在图书馆业务外包类型中主要有采访、编目、排架、信息服务、期刊报纸装订、书目数据库建设、后勤物业管理等几种业务外包形式[1]。而在这些类型中,编目外包是近年来被图书馆广泛采用的一种形式。在图书馆与编目外包商签订的合同中都有所编书目质量合格率说明,由于编目水平影响到一所图书馆检索书目的效率,直接反映了图书馆为读者服务理念的执行力,而检验编目外包书目质量最有力的方法就是统计学中的假设检验,对某一批提交书目进行不重复抽样检验,根据抽检得到的样本信息来判定是否拒收这批书目。
1假设检验P值方法的引入
假设检验是先对总体参数提出某种假设,再由样本信息判定假设是否正确的过程。它的逻辑为带有概率性质的反证法。即先承认待检验的假设成立,然后观察在此假设前提下样本的出现是否属于小概率事件,如果是小概率事件,则有充分理由怀疑或者否定假设,反之,不能否定假设[2]。
在编目外包质量检验方面的研究已有黄发贵教授的论文《推断统计在图书馆业务外包质量检验中的应用》,利用统计学假设检验中的临界值(criticalvalue,根据给定的显著性水平确定的拒绝域的边界值,称为临界值。在确定了显著性水平α后,就可由α的大小确定出拒绝域的边界值即临界值)方法从提出假设、规定显著性水平(levelofsignificance)、抽取大样本、决策四个步骤加以分析,并补充了假设检验中的两类错误和样本大小的确定[3]。这种传统方法是在检验之前先给定显著性水平α,也就是事先确定了拒绝域(rejectionregion,能够拒绝原假设的检验统计量的所有可能取值的集合,称为拒绝域。显著性水平α所围成的区域就是拒绝域),这个固定的显著性水平α对质量检验结果的可靠性起了一定的度量作用,但不足之处是α对检验结果的准确性只提供一个大致范围[4],对于编目外包质量检验这个特定的假设检验问题,不能够给出样本数据与原假设之间不一致程度的精确度量,也就是说,临界值假设检验方法只能给出我们拒绝还是不拒绝原假设,却不能得知拒绝原假设的确切概率是多少,对于同一个选择的α,所有检验结论的可靠性都一样。要测量样本观测数据与原假设H0的偏离程度,就需要引入P值方法。
图1图2
若显著性水平α≥P=0.0256,则对应的临界值zα≤1.945,这表示观察值z0=1.945落在拒绝域内(图1),所以拒绝H0;若显著性水平α
1.945,这表示z0=1.945没有落在拒绝域内(图2),不拒绝H0。据此,P值=P{Z≥z0}=0.0256是原假设H0可能被拒绝的最小显著性水平。如果原假设H0为真,得到的样本结果会像实际观测结果一样极端甚至更极端的概率,称为P值,也称作观察到的显著性水平[5]。
2编目业务外包质量的P值方法检验
假设检验中P值方法有下面四个步骤,以编目业务外包质量检验为例加以说明。
2.1提出原假设和备择假设
备择假设(alternativehypothesis)与原假设(nullhypothesis)是一个完备事件组中相互对立的两独立事件。由于在编目外包质量检验中,我们所关心的是合同中给出的总体书目质量合格率π0=95%是否有显著降低,总想收集证据来支持合同承包商所提供的总体书目质量不合格,所以由一般提出假设的方法将总体书目质量合格率低于π0=95%即总体书目质量不合格作为备择假设H1,而将它的对立面总体书目质量合格率不低于π0=95%即总体书目质量合格作为原假设H0,这个假设是一个左边检验,有H0:π≥95%;H1:<95%。
2.2确定检验统计量及其分布并由样本数据计算检验统计量的值
在规定了显著性水平α=0.05(原假设为真却拒绝了原假设的概率,即犯第一类错误的概率或者该批书目的不合格率)的前提下,编目业务外包质量检验是左边检验,另外由α=0.05查标准正态分布表得临界值z1-α=-zα=-1.645,z1-α在原点左边小于零。
说明:p表示抽检样本合格率(样本比例),n为样本容量,1-π0表示总体书目不合格率,观察值z0=-0.49的含义是:样本比例p与检验的总体比例相比,相差 0.49个抽样标准差。
2.3构造决策准则
由1的引例知若显著性水平α≥P值,z0落在拒绝域内,拒绝原假设H0;若显著性水平α
2.4计算P值,做出决策
由于编目业务外包质量检验是一个左边检验(z0<0),代入P值公式,P值=P{Z≤z0} =Φ(z0)=1-Φ(-z0),P值为左侧尾部面积。
P值=P{Z≤-0.49}=Φ(-0.49)= 1-Φ(0.49)=1-0.6879=0.3121,即拒绝这批图书的最小显著水平为0.3121,比较P值与α大小,α
图3
用P值法进行假设检验的流程总结如图4。
图4
3利用Excel中的统计函数计算编目外包质量检验中的P值
功能强大的统计分析软件有SAS、SPASS等等,但是这些专业软件由于系统巨大,一般非统计专业人员操作不容易,且价格昂贵,普通大众难以承受。微软公司推出的办公软件包Office的重要成员之一Excel是一个功能多、技术先进、使用方便的表格式数据综合管理和分析系统,它提供了丰富的函数,可以进行数据处理、统计分析和决策辅助。以下就利用Excel中的统计函数说明计算编目外包质量检验中的P值。
(1)进入Excel2007表格界面,直接点击公式“fx”(插入函数)命令。
(2)在选择类别中选择“统计”,在选择函数中选择“NORMSDIST”,将检验统计量Z的观察值z0=-0.49输入光标处,然后单击“确定”,即弹出对话框,得到计算结果为0.312066949即左侧面积,这与P值法计算得到的数值是一致的。也可以利用Excel中的统计函数确定编目外包质量检验的临界值,在选择函数中选择“NORMSINV”,将1-0.05或0.95输入光标处,单击“确定”,zα=NORMSINV(1-α),计算结果为1.644853627,z1-α=-zα=-1.644853627,这与由标准正态分布表查得的也是一致的。
P值与α大小比较进行决策和上面的P值方法检验是一样的,α
4P值法进行假设检验的优越性
(1)P值的结论更清晰和具体。检验的结论使用0-1之间的概率来表示,不再简单使用“拒绝”或“不拒绝”的表达方式,P值能够表达对原假设H0可信度以及拒绝H0的依据的强度。若P值非常小(小于0.001),有非常强的证据说明H0非真;若P值较小(小于0.05),有较强的证据说明H0非真;若P值更大(大于0.1),只有极少的证据说明H0非真。
(2)P值的运用方便灵活。对于一个给定的样本数据,其P值是确定的,但对于不同的α值,结论可能不同。决策者可以根据所能承受的风险以及抽样成本自行决定显著性水平α进行决策,可能会做出不一样的决策。
(3)P值为实施决策提供了更多的信息。临界值法是事先给出一个显著性水平,并以此为依据进行决策,如果拒绝原假设,只知道犯第Ⅰ类错误的概率不超过α,但究竟是多少却不知道,例如当取α=0.1时知道要拒绝H0,再取α=0.05也要拒绝H0,但不知道将α再降低一些是否也要拒绝H0,P值法给出了原假设H0可能被拒绝的最小显著性水平,P值也就是犯第Ⅰ类错误的实际概率,与其选取适当的α值,不如将检验统计量实际的显著性水平P值算出来,P值法比临界值法给出了有关拒绝域更多的信息。
(4)P值的计算更容易。尽管P值可以通过计算查表求出,但实际数据的检验统计量的P值可能表中没有,计算一个精确的P值不是很容易,计算机的使用使得P值的计算十分容易,在统计软件的辅助下,计算P值就比传统的查表更容易。
参考文献
[1]韩超.高校图书馆编目业务外包的质量控制研究[D].保定:河北大学,2007:1.
[2]朱建平,孙小素.应用统计学[M].北京:清华大学出社,2009:166.
[3]黄发贵.推断统计在图书馆业务外包质量检验中的应用[J].江西图书馆学刊,2006,36(1):31-32.
[4]袁卫,庞浩,曾五一,等.统计学[M].北京:高等教育出版社,2009:155.
[5]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008:214.