“成对数据的统计分析”是“概率与统计”版块的重要组成部分,高考通过该内容的相关试题,考查同学们的数据分析、数学建模、逻辑推理、数学运算和数学抽象等核心素养。从2024年高考命题情况来看,全国卷在客观题中考查了概率和计数方法,在解答题中重点考查的是概率与统计的综合应用,独立性检验的问题有考查到,但是难度不大,一元线性回归分析没有考查。因此,能够准确地理解相关概念与统计原理、能够准确地运用公式进行计算、能够准确地用规范的统计语言进行表述是得分的关键。下面结合新旧教材的对比变化及课标要求,对成对数据的统计分析高考备考做一些指向。
指向1.关注新考点,对新教材新增内容重点考查
例1(多选)下列结论不正确的是()。
A.两个变量x,y的线性相关系数r决定两变量相关程度的强弱,且相关系数|r|越小,相关性越强
B.若两个变量x,y的线性相关系数r=0,则x与y之间不具有线性相关性
C.在一组样本数据(xi,yi)(i=1,2,3,…)中,先剔除部分异常数据,再根据最小二乘法求得线性回归方程为y=bx+a,这样相关系数r变大
D.在一组样本数据的散点图中,若所有样本点(xi,yi)(i=1,2,3,…)都在直线y=0.8x+1上,则这组样本数据的样本相关系数为0.8
解析:对于选项A,|r|越大,x与y之间的线性相关性越强,所以A错误。
对于选项B,若r=0,则样本数据不具有线性相关性,所以B正确。
对于选项C,去掉异常数据,则相关性变强,|r|变大,所以C错误。
对于选项D,若所有样本点(xi,yi)(i=1,2,3,…)都在直线y=0.8x+1上,则这组样本数据完全相关,且正相关,所以这组样本数据的样本相关系数为1,所以D错误。
故选ACD。
考点解读:在同学们对变量的相关关系有了一个宏观的认识和几何直观的感知之后,从样本相关系数r这一特征数值入手更具体地对变量相关关系的正负及强弱进行定量分析,体现了知识应用的完整性和思辨能力的完备性。因此,作为新教材统计内容的一个显著变化,在新高考中对其重点考查是显而易见的。
指向2.关注变化点,对新教材变化内容规范考查
例2(多选)假设变量x与变量Y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型{Y=bx+e,E(e)=0,D(e)=σ2。要利用成对样本数据求参数b的最小二乘估计^b,即求使Q(b)=Σni=1(yi-bxi)2取最小值时b的值,若某汽车品牌从2020年到2024年的年销量为ω(万辆),其中年份对应的代码t为1~5,如表1:
根据散点图和相关系数判断,它们之间具有较强的线性相关关系,可以用线性回归模型描述。令变量x=t-t,Y=ω-ω,且变量x与变量Y满足一元线性回归模型{Y=bx+e,E(e)=0,D(e)=σ2,则下列结论正确的有()。