摘要:文章对2023年高考新课标Ⅰ卷的第9题进行探究,给出两种解法,并对选项C进行深入探讨,得到一个相关推广命题的两种严格证明.
关键词:新高考;样本的数字特征;平移不变性;情境
中图分类号:G632文献标识码:A文章编号:1008-0333(2024)28-0095-04
2023年新高考Ⅰ卷第9题是多项选择题,试题考查样本数据的基本数字特征:样本的平均数、标准差、中位数、极差概念的理解.不仅注重试题的基础性,而且使基础知识的考查和能力的考查有机结合,较好地体现了统计中数字特征的核心内容和基本思想方法的考查,对于考生运用数学知识,寻找合理的解题策略有较高的要求.笔者对此题进行解答,对并选项C进行深入探讨,与大家分享.
1试题的呈现与解答
题目有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则().
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
解法1对于选项A:设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,则
n-m=x1+x2+…+x66
-x2+x3+x4+x54
=2(x1+x6)-(x2+x3+x4+x5)12.
因为不能确定2(x1+x6)与x2+x3+x4+x5的大小关系,所以无法判断m,n的大小,故A错误.
对于选项B:不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为x3+x42,故B正确.
对于选项C:因为标准差反映数据的离散程度和波动程度,直观上看,去掉数据的最小值x1,最大值 x6,标准差不会变大.特别地,当x1<x6,且x2=
x3=x4=x5时,x1,x2,…,x6的标准差大于零,x2,x3,x4,x5的标准差等于零,此时x2,x3,x4,x5的标准差小于x1,x2,…,x6的标准差,故C错误.
对于选项D:不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.
故选BD.
解法2本题作为多项选择题也可以用排除法作答:取x1,x2,…,x6为1,1,1,1,1,7,则x2,x3,x4,x5的平均数为1,x1,x2,…,x6的平均数为2,故A错误;
x2,x3,x4,x5的标准差为0,x1,x2,…,x6的标准差显然大于0,故C错误.
故选BD.
2选项C的深入探究
选项C表明:样本数据x1,x2,…,x6去掉最大值和最小值后,标准差不大于原来的标准差.这个事实看起来自然,但应如何严格证明呢?
《高考试题分析》第150页至151页提供了一种证法,为了比较不同证法之间的差异,将其证明过程摘录如下(作为证法1)[1].
证法1(1)若x1,x2,…,x6全相等,则x2,x3,x4,x5的标准差等于x1,x2,…,x6的标准差,都为0.
(2)若x1,x2,…,x6不全相等,不妨设x1≤x2≤x3≤x4≤x5≤x6,且x-=16(x1+x2+…+x6)=0(否则可把数据整体向左平移x-).此时必有x1<0,x6>0.记x1,x2,…,x6标准差为s1,x2,x3,x4,x5的标准差为s2.
(ⅰ)若x1<0≤x2≤x3≤…≤x6,则
x6=-(x1+x2+…+x5)≤-x1=|x1|,
且当2≤i≤5时,有0≤xi≤x6.
故x2≤15(x2+…+x6)=-15x1<-x1=|x1|.
故∑5i=2x2i<2(x26+x21).
(ⅱ)若x1≤x2≤0≤x3≤…≤x6,则
当3≤i≤5时,有0≤xi≤x6,且
x3≤14(x3+…+x6)=-14(x1+x2)
≤-12x1<-x1=|x1|.
故∑5i=2x2i<2(x26+x21).
(ⅲ)若x1≤…≤x5≤0≤x6,与(ⅰ)类似可得∑5i=2x2i<2(x26+x21).
(ⅳ)若x1≤…≤x4≤0≤x5≤x6,与(ⅱ)类似可得∑5i=2x2i<2(x26+x21).
综上,在(ⅰ)-(ⅳ)的情况下,有∑5i=2x2i<2(x26+x21)成立,从而
s22=14∑5i=2x2i-(-x1+x64)2=16∑5i=1x2i+112[∑5i=2x2i-2(x21+x26)]-(x1+x64)2<16∑5i=1x2i=s21.
因此在(ⅰ)-(ⅳ)的情况下,x2,x3,x4,x5的标准差小于x1,x2,…,x6的标准差.
(ⅴ)若x1≤x2≤x3≤0≤x4≤x5≤x6,则
x23≤x22≤x21,x24≤x25≤x26.
从而s22≤14∑5i=2x2i≤16∑5i=1x2i=s21,
二者相等当且仅当s22=14∑5i=2x2i=16∑5i=1x2i,也即x1=x2=x3=-x4=-x5=-x6.
因此在(ⅴ)情况下,x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,当且仅当x1=x2=x3=-x4
=-x5=-x6时,x2,x3,x4,x5的标准差等于x1,x2,…,x6的标准差.
综合上述讨论,x2,x3,x4,x5的标准差小于或等于x1,x2,…,x6的标准差.
评注证法1有几个难点:①为什么可取x-=16(x1+x2+…+x6)=0?②“否则可把数据整体向左平移x-”是什么意思?③等式s22=14∑5i=2x2i-(-x1+x64)2省略较多的步骤,较难看懂.④证明过程要分多种情况进行讨论,思维难度大.
有没有更易理解的证法呢?下面考虑
x1≤x2≤…≤xn(n≥3)个数据的情形:
命题设x1≤x2≤…≤xn(n≥3),记x=x1+x2+…+xnn,x-=x2+x3+…+xn-1n-2,s21=
1n∑nk=1(xk-x)2,s22=1n-2∑n-1k=2(xk-x-)2,则s22≤s21.
为了更好地证明上述命题,先给出三个引理:
引理1设x1,x2,…,xn的方差为s2x,y1,y2,…,yn的方差为s2y,其中yi=xi+b(i=1,2,…,n),b为非零常数,则s2x=s2y.
引理1的证明设x1,x2,…,xn的平均数为x-,则x-=1n∑ni=1xi,s2x=1n∑ni=1(xi-x-)2.
因为yi=xi+b(i=1,2,…,n),
所以y1,y2,…,yn的平均数为
y-=1n∑ni=1(xi+b)=1n∑ni=1xi+b=x-+b.
从而s2y=1n∑ni=1[(xi+b)-(x-+b)]2
=1n∑ni=1(xi-x-)2=s2x.
评注引理1实际上是教材(人教A版2019年版)必修第二册213页练习题的第2题,此性质称为方差的平移不变性.
引理2设x1,x2,…,xn的平均数为x-,方差为s2,x21,x22,…,x2n的平均数为m,则s2=m-x-2.
引理2的证明因为m=1n(∑nk=1x2k),所以
s2=1n∑nk=1(xk-x-)2=1n[(∑nk=1x2k)-nx-2]=1n(∑nk=1x2k)-x-2=m-x-2.
引理3对于x1≤x2≤…≤xn(n≥3),且x1+x2+…+xn=0,则∑nk=1x2k≤n2(x21+x2n).
引理3的证明因为x1≤x2≤…≤xn,且x1+x2+…+xn=0,当x1=xn时,则x1=x2=…=xn=0,引理显然成立.
当x1≠xn时,则必有x1<0<xn.
设A(x1,x21),B(xn,x2n),则直线AB的斜率为
k=x2n-x21xn-x1=xn+x1,
直线AB方程为y=(xn+x1)x-x1xn.
由于函数y=x2是下凸函数,可知点(xk,x2k)
(k=1,2,…,n)在割线AB的下方或在割线上,于是
x2k≤(xn+x1)xk-x1xn.
所以∑nk=1x2k≤(xn+x1)∑nk=1xk-nx1xn=-nx1xn≤n×x21+x2n2=n2(x21+x2n),等号当xk∈{x1,xn},且x1+xn=0时取得.
下面证明命题.
证法2由x1≤x2≤…≤xn(n≥3),根据方差的平移不变性(引理1),不妨设最大值xn=A,最小值x1=-A(A≥0).
记x-=x2+x3+…+xn-1n-2,
y-=x22+x23+…+x2n-1n-2,
s22=1n-2∑n-1k=2(xk-x-)2,
由引理2,得s22=y--x-2.
因为x1,x2,…,xn的平均数为
(n-2)x-+A+(-A)n=(n-2)x-n,
x21,x22,…,x2n的平均数为(n-2)y-+2A2n.
由引理2,可得x1,x2,…,xn的方差
s21=(n-2)y-+2A2n-[(n-2)x-n]2.
因为A是最大值,所以A2≥y-,且n≥3.
于是s21-s22=(n-2)y-+2A2n-[(n-2)x-n]2-(y--x-2)=2(A2-y-)n+4(n-1)x-2n2≥0.
所以s22≤s21,命题得证.
证法3由x1≤x2≤…≤xn(n≥3),则
x=x1+x2+…+xnn=1n∑nk=1xk.
设yi=xi-x=xi-1n∑nk=1xk(i=1,2,…,n),
则有y1≤y2≤…≤yn(n≥3),且
y1+y2+…+yn=∑nk=1yk=∑nk=1xk-nx=∑nk=1xk-n×1n∑nk=1xk=0.
记y=y1+y2+…+ynn=1n∑nk=1yk=0,
y-=y2+y3+…+yn-1n-2,
s2y1=1n∑nk=1(yk-y)2,
s2y2=1n-2∑n-1k=2(yk-y-)2.
由引理3,可得y21+y2n≥2n∑nk=1y2k.
由引理2,得
s2y2=1n-2∑n-1k=2(yk-y-)2=1n-2∑n-1k=2y2k-y-2.
所以s2y2=1n-2∑n-1k=2(yk-y-)2=1n-2∑n-1k=2y2k-y-2
≤1n-2∑n-1k=2y2k
=1n-2
[(∑nk=1y2k)-(y21+y2n)]
≤1n-2·[(∑nk=1y2k)-2n∑nk=1y2k]
=1n-2×n-2n∑nk=1y2k
=1n∑nk=1y2k=1n∑nk=1(yk-y)2=s2y1.
又根据方差的平移不变性(引理1),可得
s21=s2y1,s22=s2y2.
所以s22≤s21.
当n为奇数时,取等条件为所有数均相等;当n为偶数时,取等条件为一半数为最大数且另一半数为最小数.
综上所述,命题得证.
评注①当x1≤x2≤…≤x6时,由命题可知,x2,x3,x4,x5的方差不大于x1,x2,…,x6的方差,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差(取等条件是一半数为最大数且另一半数为最小数),所以原试题的选项C是错误的.②对比三种证法,证法2与证法3不需要分类讨论,证明更具一般性,证法2的证明过程直观、简洁;证法3所用的引理3,结合下凸函数、直线方程与均值不等式等相关知识,证法新颖独到,别具一格.此外,证法3还说明了证法1中“且x-=16(x1+x2+…+x6)=0(否则可把数据整体向左平移x-)”的原因.
3结束语
《普通高中数学课程标准(2017年版2020年修订)》中多次出现“情境”一词,《中国高考评价体系》也规定了高考的考查载体——情境,并以此承载考查内容,实现考查要求.数学情境是高考评价体系中最重要的创新之一,是实现“价值引领、素养导向、能力为重、知识为基”的考查目标的载体.数学试题情境一般取材于学生生活中的真实问题,贴近学生实际,具有现实意义,具备研究价值.本题的情境是学生所熟悉的,源于比赛或评比中常用的“去掉一个最高分,去掉一个最低分”的计分方式,引导考生从数学上思考这种计分方式的合理性.对于选项C,去掉最高分和最低分后,新样本的标准差总是不大于原标本的标准差,且在很多情形下,小于原样本的标准差,这符合考生的直观判断,也说明了在比赛去掉最高分和最低分后,总的来说可能降低数据的分散程度和波动性,从而提高评分的合理性.
参考文献:
[1]
教育部教育考试院.高考试题分析:数学(2024年版)[M].北京:语文出版社,2023.
[责任编辑:李璟]