杨 硕 潘志强 高 威 周玉龙 王斗文
(1. 辽宁省大连沙河口区政府,辽宁大连 116021;2.辽宁省大连西太平洋石化公司; 辽宁大连 116003;3.中国合格评定国家认可中心,北京 100062;4.中国石油大连石化质检计量中心;辽宁大连 116032 ; 5.辽宁省大连海关技术中心,辽宁大连 116001)
生活饮用水的感官性状指标应按GB 5749和GB/T 5750.3实施,GB 5749中规定,感官性状指标应为无嗅无味以及无肉眼可见物。GB/T 5750.3的水质分析质量控制,其要求过程是通过对有证参考物质(或控制样品)的检验结果来评价分析工作的精密度。
然而,感官性状的指标是不能直接确定其特性,若将其定量分级将是一项十分复杂的、不易完成的工作[4]。本文认为,这是一种离散型随机变量(0和1)的概率分布,即服从以二进制观察来完成的两点分布。
CNAS-GL014中明确指出,评价小组的评价近似于仪器设备性能的评价,评估方法主要是围绕结果的重复性、再现性和一致性测试所采用的试验设计、统计技术和评价标准来开展的[5~6]。
客观的说,CNAS-CL01[7]中的技术环节和要求在我国相关领域的统计应用方面上较为薄弱,尤其在涉及到饮用水的质量动态监控上亟待加强。为确保感官性状指标检查体系的符合性,与其他领域的质量监控一样,应具备应对风险和机遇的监控意识[8~9],一段时间内,针对来自某地区生活饮用水的嗅味和肉眼可见物评价,展开质量调查并采取相应的措施,对表1中的数据集和结果进行了AD统计监控[10~11]。
在较长一段时间内,针对所抽取的代表性瓶装饮用水样品,某地区组织了不同评价员的感官性状指标鉴定。考虑到感官评价员的疲劳、评价批次间的疲劳等因素和感官评价员的舒适情况对检验结果的影响,则允许目测之间有足够的时间间隔。详见表1。
表1 不同类型瓶装饮用水的抽样检查
根据表中所示,这种分布的特点是感官目测独立重复进行,每次检查只有两种结果,每次结果呈独立性,发生概率在各次目测中不变,充分体现了二项分布的特征,其理论方差为
文献3的接受/拒收两种概率的定性观察分析,首先需进行随机组合,转换为比例响应(p)的调查方案,然后做最终结果的量化评估。在此基础上,实质上就是定性分析系统赋予的精密度性能研究。
表中的h/k一致性设计[12]归属于单向分类且排除二阶效应的t检验,将感官性状样本随机安排到各个单元组中,仅考虑一个因素作用,属于目测分析的完全随机化实验。从表中的嗅和味参数检查来看,第7个评价员的h值接近临界,且给出非灵敏响应的k=0;另有第5评价员的k值超出临界。这些均表明该两个评价员的性能与总体评价体系非具一致性。
AD统计监控为拟合优度检验。在表1复杂的处理过程中,大量隐藏和潜在的交互和干扰效应、以及数据变换所产生的非正态现象(尽管有时承认其不对称的潜在分布意义),使得混杂变异源非因果关系的强关联而造成模型拟合的失败。有鉴于上述,本文强调了正态性的检验,此意味在期间精密度条件下的数据集宜通过i.i.d.(随机变异独立同分布)的AD统计来进行判断。这种正态性判断宜建立在目标变量的h值变换诊断,基于Weibull累积分布函数的线性化,利用的递推来度量随机样本与理论PDF的兼容性。表1通过AD检验能最大限度避免人为偏性和试验变异的误估,有助于系统改进和模型拟合选择的解释和处理。表中嗅和味、以及肉眼可见物的阳性诊断,分别有AD(h)=0.242和AD(h)=0.623,管理中心做了认真地调查后,并未发现有特殊原因或可查明原因出现,认为整个检查体系的受控状态成立。
表2为系列比例响应(p)的质量变化趋势,其中的控制限建立来自以及z值视为p响应的标准值。
表2 z值与h值的动态监控
根据表2的统计结果,建立了质量趋势动态监控图,详见图1,其中:
图1 性状指标比例响应及其变换值的质量趋势动态监控
给出了p值的质控图,其×符号为上下控制限。
给出了p值变换后的散点图,其z和h的符号分别为○和●。
两个性状指标的p值控制图显示,其系列值均处于上下控制限内,且围绕各自的中心线(0.035和0.045)而随机发散。同样,p值变换后的系列z/h结果也随机分布在临界限内(±2和±1.67),若质疑系列结果围绕0周围的随机发散,可视为有限的目测次数所致。在经调查未找到明确证据表明方法操作上有误时可不做剔除,只能在后续观察增多的跟踪监控中予以关注变异的趋势,以便随时加强对感官性状所开展的检查和纠正措施。
从以上的图1监控可以确认,两个性状指标的阳性检查总体呈正常变异的随机性趋势,这从AD(z)和AD(h)的检验得到佐证:嗅和味的阳性检查系统有AD(z)=0.763和AD(h)=1.048;肉眼可见物的阳性检查系统有AD(z)=0.767和AD(h)=0.768。
感官性状阳性检查结果转换成比例响应(p),然后纳入到质量趋势动态监控的控制限内。较之其它度量的标准差变异,稳健性(robust)统计给出的s(IQR)要小。鉴于两个指标阳性p响应的AD正态性假设成立,故嗅和味、以及肉眼可见物的不确定度有(0.022+0.027)=0.05。
本文的受控体系假定,是建立在随机抽样变异的代表性模型上,若能配合拟合优度的检验,宜对比例响应(p)转换值实施正态性的AD统计,以避免对受控体系合理假设的严重扭曲。
文中受控体系的建立和评价非一成不变,需随时提交后续的检查数据,持续跟踪和更新才会有助于质量目标的优化。建议立足于top-down整体理念[13],对出现的各种变异趋势做统一监控,努力将其维持在可接受的决策误差水平上。