中国科学技术大学统计与金融系 苏 淳 (邮编:230026)
2018年高校招生全国统一考试理科数学试卷I的第20题是一道关于产品检验的题目.题目开宗明义, 面对的是大批量的产品. 产品成箱包装, 每箱200件. 每箱先抽检20件,根据检验结果决定是否对余下的所有产品作检验. 命题者怕在这里引起误会, 不可谓不仔细地斟酌了词句, 特别强调了要决定的是“是否对余下的所有产品作检验”, 说明这里的选项只有两个: 要么对余下的所有产品都作检验(全检), 要么就都不检验(全不检), 不存在部分检验的问题.正是在这种思路的指导之下, 诞生了对于第(2)小题(ii)的官方解答.
站在统计学的角度来看, 这种解答是没有问题的. 因为它考虑的是实际需求. 要检验的是大批量的产品, 不仅仅是一箱, 而是许多许多箱. 所以只需对“全检”与“全不检”的费用作一比较, 以决定是否需要全检.
问题尴尬的是, 它是出在“数学试卷”中的题目, 而且它自身又带有明显的“数学特点”, 这就让人难以弄清它到底是要考“统计”, 还是要考“数学”了.
题目中的第(1)小题要求学生用极大似然估计估计出产品的不合格率, 没有出现“极大似然估计”这个统计学上的名词, 完全用的是数学语言, 求函数的极大值点. 学生理所当然地把它作为数学题来做, 求导数, 求导函数的零点, 观察导函数的符号, 确认p0=0.1就是函数f(p)的最大值点.
既然这里是考数学, 那么一以贯之, 通题就应当都按数学问题处理. 至少别人按数学问题做了, 不能算错.例如, 有人这样解答第(2)小题(ii):
在r=180时,E(Y)达到最小. 所以应对剩下的产品“全检”.
这种求最小值的处理方式与第(1)小题的精神一致. 都是用数学中的最值作为问题的解答. 既然(i)中可用最值点作为不合格率的估计, 那么(ii)中也可以按最值的标准取舍检验方案.
更何况, 这里还涉及到逻辑中的如何否定“全称命题”的问题. 无论怎么说, 对“全检”的否定是“不全检”,包括“部分检”与“全不检”. 正如不少中学教师指出的, 这是中学数学教学中反复强调的, 而且也是作为高考所要考核的内容的. 不能在同一张卷子中体现不同的要求.
事实上, 第(2)小题(ii)的官方解答中所采用的取舍标准只有具备产品检验经验的人才知道, 因为只有面对在大批量产品时,才会只在“全检”与“全不检”之间进行选择.
在我国的本科专业分类中已经把统计学独立出来, 作为与数学并列的一级学科, 就是因为“统计不是数学”.数学的一个基本特征是:“一个问题只有一个答案”, 统计学则不然, 对同一个问题, 可以有不同的答案. 例如前面说到的, 对同一个参数, 可以用频数估计, 也可以用极大似然估计, 它们往往会有所不同. 在当前大数据时髦的今天,面对同样的数据, 得出不同结论的情况就更为常见.
中学里既然把统计放到数学中来学, 那就有一个如何教如何学如何考核的问题. 尤其是在出高考题时, 更需要考虑周全. 前些年我在参与出高考数学安徽卷时, 一直把握一条原则, 就是大题尽量考概率. 因为概率是数学, 一是一, 二是二,不会遭遇尴尬. 统计则不然, 需要谨慎而又谨慎.