和普查一样准确的抽样统计

2020-01-08 14:29□汪
统计科学与实践 2020年2期
关键词:道奇检验理论

□汪 为

在抽样统计理论出现以前,人们在生产实践中就发现,应用抽样技术可以从有限信息中进行有效推断,掌握全局情况。早在宋代,中国先民就采用抽样方法来检验商品。当时商贸繁华,采用原来的逐一检查耗时耗力,已经不能满足时人所需,宋人发现用抽样方式检验产品,不仅一样可以掌握产品情况,而且耗时大幅缩短,检验效率极大提升。尤其在军用器械生产上,抽样检验在保证质检成效的同时,大大降低了破坏性检验的数量,对宋代军备乃至战事都有重要影响。在绍兴三十年的诏书中,朝廷就军械制造要求地方“须管造作精致,仍仰逐处常切点检,候造致数,将逐处包样进呈试验……以每旬所造兵器名件,请监丞躬亲看验,点定封记”,既要求对每批产品抽选一定数量进行试验,又必须定期(十天一个周期)对全部产品进行抽样检验,通过定时定量进行双条件重复抽样,充分保证官造兵器质量。宋人虽然不谙其中涉及的概率统计理论,进行的抽样操作却完全符合现代抽样原理,也是世界上有文献记载的最早的批次抽样应用。

到了明代,抽样技术在各行各业的应用更加普及,抽样方法也更为完善细致,抽样检验被广泛应用于代表当时最高技术的冶炼行业,在万历年刊发的的《工部厂库须知》中,对铜矿质量做了非常规范详尽的抽样检验要求——“每融铜,先抽一百包,堆放两边,内点二包敲断,验其成色,秤足两百斤,分东西二炉熔化”……“每百斤内除正耗一五斤三两外……多耗者,令补足”,即先从总量中随机抽一百包铜进行一级抽样,再从抽中的一百包铜中随机“内点两包”进行二级抽样,然后从两包中抽两百斤进行检验,如果未达标准,退回提供者补足相差部分。可见,明代在应用抽样调查进行质量检验上已经形成一套非常完备的逐级抽样方法。

虽然工匠很早就发现了抽样技术的妙用并将其应用到生产的方方面面,但鲜少理论研究,直至H.F.道奇在上世纪20 年代首次提出“生产方风险”和“使用方风险”概念,并在此基础上和罗米格共同发表了关于统计抽样检验理论的第一篇经典论文——《一种计数抽样检验方法》,抽样统计理论纪元方才开启,抽样理论的提出不仅轰动了学界,也改变了质检等重要工序,影响了工业流程设计和现代工业发展。抽样检验在质检上无可替代的优势甚至对二战带来深远影响,深深被军用产品可靠性与不可逆检验两难困扰的联军军备部门了解抽样检验理论后,将其视作解决难题的指路明灯——迅速组织统计人员配合陆军研制出抽验检验标准“陆军军械表”(Army Ordnance Tables),找到了恒定标准下的最优不可逆测试路径。后来各国在此基础上合力研发指定的“MIL-STD-105D”,与道奇1942 年发表的《抽样检验表》并列为计数调整型抽样与挑选型抽样体系经典。1974年,国家标准化组织将“MIL-STD-105D”作为国际标准,并命名为“ISO-2859”,即被视为世界规范的ISO体系的前身。

抽样理论在工业生产上大放异彩后,迅速被应用到社会调查中。罗斯福新政后,劳工部联合人口普查局应用抽样理论进行了美国首次失业与经济活动调查。彼时美国正处于近瘫痪状态的大萧条中,人们流离失所,政府亟需了解全国范围内失业人口数量、分布情况,方能重启经济。传统的调查难以满足如此大范围、大信息量的快速调查,同时社会学家意识到普查中许多失业者不会回应,如果沿用原有方式不仅耗时耗力而且存在许多未知错误,唯有设计科学、执行规范的抽样调查才可以胜任此次任务。在劳工部推动下,美国人口普查局设计了首个全面失业调查方案,他们根据内曼提出的假设检验理论,随机选择了2%的邮递路线,由负责这些线路的邮差向所辖范围内所有住户发放问卷。之后普查局联合邮政管理局,在没有计算机的情况下整理问卷,统计出失业数据。后续的研究表明,2%的随机调查结果比之前采用的各类调查都准确的多,在美国劳工部和人口普查局带动下,各个政府部门都开始 采纳用随机抽样调查来获取数据,在普查中也会包含一些精心设计的抽样调查。随后,乔治·盖洛普和路易斯·比恩将在政府部门应用成熟的抽样调查引入政治性民意调查领域。

现在,抽样调查已经被社会广泛接受并应用在各个场合,人们通过抽样调查数据制作的消费价格指数、采购经理人价格指数等研判经济走势,工厂采用道奇开创的连续型抽样检验理论、链式抽样和跳批抽样理论管控产品质量……在大数据时代,抽样统计依然不可替代,帮助我们在浩荡的数据海洋中,拨开纷繁复杂表层数据的迷惑,让关键数据、核心数据脱颖而出,洞见真相。

猜你喜欢
道奇检验理论
坚持理论创新
神秘的混沌理论
理论创新 引领百年
相关于挠理论的Baer模
电梯检验中限速器检验的常见问题及解决对策探究
关于锅炉检验的探讨
小议离子的检验与共存
道奇25周年版蝰蛇亮相
期末综合复习测试卷