宋贽 陶桂洪 惠淑荣 张阚 李丽锋 于淼
摘要:以应用统计课程为依托,基于网络教学平台,以稻米中总砷含量的统计监控为研究背景,设计用于稻米总砷质量监测的非参数控制图。介绍质量控制图的设计理论、思路和應用方法,提高学生利用统计方法分析解决问题的能力。
关键词:应用统计;实验教学;质量控制图;总砷含量
中图分类号:G424.1 文献标识码:A 文章编号:1674-1161(2019)06-0086-03
应用统计学是一门重要的专业基础课程,然而,由于实验室建设、实践基地建设和师资力量不足,课程存在“重理论、轻实践,重方法、轻应用”的问题,教学偏离实际。以应用统计课程为依托,在学生掌握统计学基本原理、方法的基础上,以设计稻米中总砷含量的质量控制图为例,从案例背景、目标、内容和实施方案,介绍质量控制图的设计理论和应用方法,培养学生解决实际问题的能力。
1 稻米中总砷含量监测研究进展
在质量控制和管理中,统计质量控制起核心作用。我国人民的主食以稻米为主,砷长期在人体内积累,易造成砷中毒,导致皮肤、肾等机体的癌变。及时进行稻米中总砷含量的系统监测和风险预警,是保障居民生活质量的重大举措。
传统上,研究分析人员假定已知过程分布的函数形式,并基于已知过程分布构造监控过程参数的控制图,即参数控制图。随着大数据信息化时代的到来,大多数的数据流常因流程复杂而难以确定确切的分布,因此许多研究者主张使用非参数的质量控制图。非参数控制图大多基于不同时间点采集的过程数据的秩信息,或者基于数据分类。Qiu比较全面地分析了传统控制图的稳健性,以及非参数控制图的优点和局限性。
对于正态总体,正态理论基础上的检验许多都是一致最优势检验(Uniformly Most Powerful Test,UMPT),但很多情况下UMPT不一定存在。此时,可用局部最优势检验(Locally Most Powerful Test,LMPT)。例如,最常用的非参数Wilcoxon秩和检验法就是对于logistic分布的LMPT。但是,由于过程分布是未知的,较优的方法是给出不同检验,针对不同类型的分布具有较高的势,然后使用受控样本数据得到关于过程分布信息,如尾重、偏度等。选择合适的非参数检验过程称为“自适应”,是指根据受控数据样本判断过程分布类型,然后选择适合的检验进行推断。目前,已有很多学者对自适应检验进行研究,但用于稻米中总砷含量监测的自适应非参数控制图尚未见报道。
2 稻米总砷含量监测控制图的设计
2.1 设计目标
针对稻米中总砷含量分布的变化,设计能够根据可控样本信息(过程分布的尾重、偏度等)自适应选择非参数检验统计量的质量控制图,解决其没有有效的利用样本信息的缺点,提高非参数控制图的效率,为稻米中总砷含量的有效监测及风险评价提供全新的理论方法。
2.2 设计思路
基于可控样本,根据尾重和偏度两方面指标,对稻米中总砷含量的分布进行分类,一般可分成4大类:对称短尾、对称中尾、对称长尾、偏态分布。如何找到各个类别之间的分界点,是研究的关键点。可以先根据已有文献初步确定各个类别的阈值,再结合专业理论和大量统计模拟,通过控制图的性能表现,设计出对不同类型的过程分布性能有较好自适应的非参数控制图。
选择合适的非参数统计量至关重要。不合适的检验会降低自适应控制图的性能。对不同类型的总体分布设计自适应控制图,使其性能更好。具体来说,使用什么选择统计量,选择哪些具有不同检测优势的检验统计量,有没有定性方法可循,都是需要详尽研究的内容。经过前期研究发现,对于不同类型的过程分布,基于该分类里代表性分布的局部或者渐近局部最优势检验,能够取得比较好的检测性能。例如,logistic检验统计量对于中尾对称分布的位置参数和尺度参数检验具有较高的势。
2.3 实施方案
1) 考虑未知过程分布情况,利用已有样本(至少50个可控样本),通过公式估计过程分布的分位数,得到尾重和偏度两个重要指标。由尾重和偏度对过程分布进行分类,如对称短尾、偏态长尾等,选择适合的非参数检验统计量。
2) 选择合适的非参数检验统计量是本案例的关键问题。针对不同类型的过程分布,选择相应的渐近局部最优势检验,对该类型分布具有较高的势,从而提高非参数控制图的检测效率。例如:对对称分布来说,如果短尾,选择Gastwirth检验;如果中尾,选择正态计分检验或者Logistic计分检验;如果长尾,选择Bu ning和Thadewald提出的LP3检验。对于非对称分布来说,可以选择Hogg-Fisher-Randles计分检验或者Savage计分检验。
3) 非参数检验统计量是基于检验的渐近性质,如渐近势函数。但是在实际应用时,都是有限样本甚至中小样本,稻米中总砷含量监控的大样本是不现实的。基于中小样本的结论和渐近理论可能会有一定差异,需要通过大量统计模拟辅助研究,得到有限样本的修正方法,及时调整设计方案,以便更适合实际应用。
4) 利用R、Fortran和Matlab软件,基于统计模拟和计算技术,比对控制图和已有非参数控制图的总体分布和不同类型漂移下的性能,以选择不同监控任务时的最优控制图。实验方案的技术路线如图1所示。
3 结论
应用统计课程的实验教学内容应选择具有一定现实背景的学习材料,设计能够理论联系实际的实验教学案例,从而提高学生的学习兴趣和分析解决实际问题的能力。提出个基于质量控制图监控稻米中总砷含量的实验研究案例,从案例背景、目标、内容和实施方案4个方面进行详细论述,使学生在学习统计方法的同时,实现对统计知识的应用,提高学生的学习兴趣,初步培养学生独立科研的能力。
收稿日期:2019-09-26
基金项目:沈阳农业大学教育教学研究项目(2018-84,2018-31,2018-236,2018-98,2018-143);中华农业科教基金教材建设研究立项项目(NKJ201801008);辽宁省普通高等教育本科教学改革研究项目立项优质教学资源建设与共享项目(2018—77);沈阳农业大学综合改革一般项目(2018-yjs-11)
作者简介:宋 贽(1982—)女,讲师,从事应用统计教学研究。
通信作者:陶桂洪(1980—),男,讲师,从事高级数学教学研究。
参考文献
[1] 王丽.农田土壤重金属污染现状及防治对策[J].新农业,2019(3):21-21.
[2] 王梦令,梅汝焕,厉旭云,等.在线课程和现场实验相结合提高学生的综合能力[J].实验室研究与探索,2017,36(5):174-177.
[3] 熊强.统计学专业实验课程设置的改革与探索[J].教育教学论坛,2018(21):210-211.
[4] SONG, Z., MUKHERJEE, A., LIU, Y.,al. Optimizing joint location-scale monitoring - an adaptive distribution-free approach with minimal loss of information[J], European Journal of Operational Research, 2019(274):1019-1036.
[5]宋贄,何川,张久军.一种可用于检测过程尺度参数的非参数控制图[J].数理统计与管理,2019,38(4):652-660.
[6] QIU, P. Some perspectives on nonparametric statistical process control[J].Journal of Quality Technology, 2018,50(1):49-65.
The Application of Quality Control Chart in the Teaching
of Applied Statistics Course
——Take the Monitoring of Total Arsenic Content in Rice as an Example
SONG Zhi, TAO Guihong*, HU Surong, ZHANG Kan, LI Lifeng, YU Miao
(College of Science Shenyang Agricultural University, Shenyang 110866, China)
Abstract: Based on the course of applied statistics and based on the network teaching platform, the statistical monitoring of total arsenic content in rice taken as the research background, a non-parametric control chart for total arsenic quality monitoring in rice was designed. This paper introduces the design theory, idea and application method of quality control chart, and improves students' ability to analyze and solve problems with statistical methods.
Key words: applied statistics; experiment teaching; quality control chart; total arsenic content