文/于忠萧
我国的纺织工业在国际贸易中占用重要位置,棉纤维作为纺织工业的重要原料,它的品质数据不仅关系到棉花生产的发展和优良品种的培育,而且还影响着全国棉纤维品质的控制。如今,在棉纤维测试仪大量依赖进口的背景下,国产棉纤维测试仪的发展引人关注。为科学评估国产棉纤维测试仪的检测水平与进口棉纤维测试仪的检测水平,本文利用国产快速棉纤维性能测试仪(HVI-XJ-128PRO)与进口大容量棉花测试仪(HVI1000)对棉花样品进行测试,分析其结果是否存在显著差异。测试指标包括马克隆值、反射率Rd
、黄度+b
、长度、长度整齐度以及断裂比强度,记录测试结果,测试数据作为观测样本。SPSS Statistics是一款应用于调查统计、市场研究、医学统计、政府和企业数据分析的统计分析软件工具,迄今已有50多年的成长历史。广泛分布于通信、医疗、银行、保险、证券、制造、科研教育、市场研究等多个领域和行业,是一款专业统计软件。本文使用SPSS统计软件对数据进行检验,给出检验结果,并对进一步改进优化国产快速棉纤维性能测试仪提出合理化建议。
反证法:为了检验一个“假设”成立与否,就先假定这个“假设”是成立的,然后看由此会推出什么样的结果。如果出现了一个不合理的现象,那么就表明原先的假定不正确,也就是说,“假设”不成立。因此,我们就拒绝这个“假设”。如果由此没有推出不合理的现象发生,则不能拒绝原来这个“假设”,称原假设是相容的。
它又区别于纯数学中的反证法,因为这里所谓的“不合理”,并不是形式逻辑中的绝对矛盾,而是基于人们实践中广泛采用的一个原则:小概率事件在一次试验中可以认为基本上不会发生。
t
统计量进行检验,故称为配对t
检验。配对t
检验常用于检验两个相关的样本是否来自具有相同均值的正态总体。实质是检验两相关样本之差的均值和零之间的差异大小,本质属于一种特殊的单样本t
检验。假定总体服从正态分布N(μσ),μ、σ均为未知参数,设x
、x
、……、x
和y
、y
、……、y
分别是来自两个独立分布X
和Y
的随机样本。令d
=x-y
,若X
和Y
样本之间差异很小,则可以认为d
、d
、……、d
服从均值为0的正态分布 N(μ,σ) 。原假设:H
∶μ=0(即认为两种仪器所测数据平均数值无显著差异)。备择假设:
H
∶μ≠
0 (即认为两种仪器所测数据平均数值存在显著差异)。由于总体方差未知,用样本方差代替总体方差,构造统计量:
若|T
|≥t
,则拒绝H
,认为X
和Y
之间存在显著差异。否则,不拒绝H
,认为X
和Y
之间无显著差异。在传统方法中,通常采用查表的方法来确定临界值,而在计算机软件的计算中,通常是计算P
值,当P
值小于给定的显著性水平时,则拒绝原假设,否则接受原假设。t
检验配对设计时,除实际因素外,各主要影响因素在每一对子内必须十分相近,方可较好地发挥配对设计的优势。现有中储棉德州公司直属库棉花仪器化公检业务进口样品1978套,随机抽取其中的棉纤维样品36套作为样本用于本次检验测试。所有棉样,在验收测试前最少48小时环境平衡。测试前,两台仪器均已进行调试并通过校准。仪器必须在标准恒温恒湿环境下[(20±2)℃和(65±3)%RH)]进行操作,每个样品在一台HVI1000(记为43号)仪器检验完毕后,再由XJ128PRO(记为128号)仪器重新检验。检验项目及过程均按照仪器化检验操作规程执行,检测的样本数据见表1。
表1 样本指标检测值
以马克隆值为例,用x
、x
、……、x
表示使用43号仪器(进口棉纤维检测仪)测得的数据,y
、y
、……、y
表示使用128号仪器(国产棉纤维检测仪)测得的数据,样本量n
=36,计算出成对观测数据的样本差d
、d
、……、d
。因此检验国产棉纤维测试仪马克隆值的检测数据与进口棉纤维测试仪马克隆值的检测数据是否存在显著差异,就归结为在显著性水平α(α一般取0.05)下,检验假设:H
∶μ=0(即认为国产仪器与进口仪器马克隆值检测数据无显著性差异)。
H
∶μ≠
0(即认为国产仪器与进口仪器马克隆值检测数据存在显著性差异)。其他物理指标检测过程类似。
t
检验,对每组配对数据做差值,进行正态性检验,过程如下:以马克隆值为例,43号机器测得数据减去128号机器所测数据,记为马43_128。类似的,其他指标分别记为Rd
43_128、+b
43_128、长度43_128、整齐度43_128、强度43_128。P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图。通过P-P图能直观地检验数据是否符合某个指定分布。当数据符合指定分布时,图中各点近似呈一条直线。为此我们利用P-P图对以上差值数据做正态性检验,结果如图1~图6所示。图1 马43_128的P-P图
图2 Rd43_128的P-P图
图3 +b43_128的P-P图
图4 长度43_128的P-P图
图5 整齐度43_128的P-P图
图6 强 度43_128的P-P图
由图1~图6可知,差值数据大部分都满足正态性检验,其中Rd
43_128和+b
43_128两种颜色级指标数据正态性拟合结果较差。根据中心极限定理,当样本量足够大(>30)时,不管总体是否符合正态分布,其样本均值的抽样分布仍然是正态的,此时我们考虑的是均值是否可以代表数据的集中趋势,只要数据不是强烈偏态分布,一般而言配对t检验都是适用的。为此我们列出了Rd
43_128和+b
43_128两组数据的直方图,如图7、图8所示。图7 Rd43_128直方图
图8 +b43_128直方图
从两者的直方图可以看出,+b
43_128这组数据显然不是强烈偏态分布,但Rd
43_128好像符合强烈偏态的表现,我们又计算了两者的偏态系数,也印证了我们的猜想。如表2所示,+b
43_128数据的偏度系数小于1,满足适用条件。而Rd
43_128这组数据的偏度系数绝对值大于1,属于强烈偏态分布。此时主要考虑数据异常值的影响,通过箱线图可发现28号差值数据疑为异常值,我们移除28号样品数据后再对Rd
43_128做检验,结果如表3所示。表2 Rd43_128与+b43_128的偏态系数表
表3 Rd43_128移除异常值后的描述统计表
此时,剔除异常值的数据列Rd
43_128已经满足了偏度系数要求(绝对值小于1),并且进一步可验证也满足了数据正态性。t
检验工具(另α=0.05),对表1中的6组数据(配对2为剔除异常值后的数据)进行配对t
检验,结果见表4。表4 配对样本t检验检验结果
如表2所示,从最后一列检验p
值可以看出,马克隆值、长度以及整齐度等检测指标的p
值都高于给定的显著性水平α=0.05,因此没有理由拒绝原假设H
,即认为在马克隆值、长度和长度整齐度的指标检测方面,国产快速棉纤维性能测试仪(HVI-XJ128PRO)与进口大容量棉花测试仪(HVI1000)并没有显著性差异,检测水平没有统计学差异。而在颜色Rd
、黄度+b
和强度等3项指标的检验p
值都明显小于给定的显著性水平 α=0.05 ,因此我们只能拒绝H
,即认为国产快速棉纤维性能测试仪(HVI-XJ128PRO)与进口大容量棉花测试仪(HVI1000)在颜色Rd
、黄度+b
和断裂比强度指标的检验结果中存在显著性差异。t
检验的原理高效合理地分析了国产快速棉纤维性能测试仪与进口大容量棉花测试仪在哪类数据检验方面存在统计学差异,但检验过程也存在一些不足,比如很难保证两台机器的调试和状态完全相同、两台进口仪器是否存在数据差异、缺少对比数据等,这些问题都是在以后优化试验时我们可以考虑的方向。总体上看,随着近几年国产棉纤维测试仪的迅速发展,国产棉纤维测试仪的检测水平已经接近于进口仪器,在马克隆值、长度以及长度整齐度等指标的测试方面达到了进口仪器的测试水平,无明显差异。但在颜色Rd
、黄度+b
、断裂比强度等指标的测试调校方面与进口仪器存在统计学差异。进一步来看,由表4检验结果可以得出,配对2和配对3的平均值都大于零,即说明在颜色Rd
和黄度+b
这两项指标的检测过程中,国产仪器(HVI-XJ-128PRO)的检测值偏低,调度偏保守。同理可知,国产仪器(HVI-XJ128PRO)断裂比强度的检测值偏高,调度偏激进。在全国棉纤维测试仪大量依赖进口的背景下,建议仪器厂商在颜色Rd
、黄度+b
、断裂比强度等指标测试上面做进一步优化改进,消除进口仪器与国产仪器之间的统计学差异,深入推进棉纤维测试仪器国产化进程。