廖枢华
回归直线方程是新课改新增的内容之一,在必修3中直接给出了求回归方程的有关公式,让学生学会利用公式.在选修数学2-3的第42页中,利用配方法给出了回归直线的推导.但是由于推导过程比较麻烦,而且不是在必修3中出现,很多教师都只是按照课程要求指导学生利用回归方程的公式求回归方程.由于不知道公式的来源,这样做只会给学生一种应试教育的感觉.让学生觉得学习只是为了考试,学数学很乏味.刘坦老师的文章《回归直线方程的另一种推导》[1]中的方法简洁明快,但超出了高中学生的学习要求,史雄老师的文章《关于回归直线方程的另一种简单推导方法》[2]中都是利用导数以及求二元一次方程的思想求出回归方程的两个参数.如果学生在必修3之前学习了导数,这是一个简易的方法.然而导数是选修2-2中的内容,一般我们都是把必修学完,才学习选修的内容.基于此,本文先利用样本中心确定回归直线的位置,再利用“从整体上看,各点与此直线的距离最小”的思想获得一元二次函数,依据一元二次函数的特征求得斜率.该方法可以让学生轻而易举地了解回归方程的来源.
一、确定回归直线的位置
平均数反映一组数据的集中趋势.能够利用所有数据的特征是它的优点之一.除此之外,平均数能使得误差平方和达到最小.如果利用平均数代表数据,则可以使二次损失最小.对所给的样本数据的横坐标与纵坐标分别取平均值x-、,则坐标点(x-,)称为样本中心.依据平均数的意义,样本中心(x-,)反映了样本数据的集中趋势,所以回归直线一定通过样本中心(x-,).
二、求回归直线的参数
设回归直线的方程为y=bx+a.由于点(x-,)在回归直线上,所以有=bx-+a.如果确定了回归直线的斜率b,便可以通过=bx-+a得参数a=-bx-.
如何确实斜率b呢?依据数学必修3“从整体上看,各点与此直线的距离最小”得Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2,使得Q最小.把a=-bx-代入Q中
Q=(y1-bx1-+bx-)2+(y2-bx2-+bx-)2+…+(yn-bxn-+bx-)2
=(y1--bx1+bx-)2+(y2--bx2+bx-)2+…+(yn--bxn+bx-)2
=[(y1-)-b(x1-x-)]2+[(y2-)-b(x2-x-)]2+…+[(yn-)-b(xn-x-)]2
=(y1-)2-2×b(x1-x-)×(y1-)+[b(x1-x-)]2+(y2-)2-2×b(x2-x-)×(y2-)+[b(x2-x-)]2+…+(yn-)2-2×b(xn-x-)×(yn-)+[b(xn-x-)]2
=∑n1i=1(yi-)2-2b×∑n1i=1(xi-x-)(yi-)+b2×∑n1i=1(xi-x-)2.
=∑n1i=1(xi-x-)2×b2-2∑n1i=1(xi-x-)(yi-)×b+∑n1i=1(yi-)2.
Q为关于b的二次函数,因为样本数据各不相同,所以∑n1i=1(xi-x-)2恒大于0,即二次函数Q(b)开口向上,有最小值Q,当且仅当b为对称轴.因此,
b=--2∑n1i=1(xi-x-)(yi-)12×∑n1i=1(xi-x-)2
=∑n1i=1(xi-x-)(yi-)1∑n1i=1(xi-x-)2.
本文利用回归直线恒过样本中心的特点以及二次函数求最值的方法而得到回归直线的两个参数公式.该方法思路清楚,推理简单,并且还能加深学生对回归直线的理解——回归直线恒过样本中心.本人认为教材应该使用本文方法介绍回归直线方程.
参考文献
[1]刘坦.回归直线方程的另一推导[J].数学通讯,2003(23):10.
[2]史雄.关于回归直线方程的另一种简单推导方法[J].新课程学习(基础教育),2010(2):104.
(责任编辑黄桂坚)endprint
回归直线方程是新课改新增的内容之一,在必修3中直接给出了求回归方程的有关公式,让学生学会利用公式.在选修数学2-3的第42页中,利用配方法给出了回归直线的推导.但是由于推导过程比较麻烦,而且不是在必修3中出现,很多教师都只是按照课程要求指导学生利用回归方程的公式求回归方程.由于不知道公式的来源,这样做只会给学生一种应试教育的感觉.让学生觉得学习只是为了考试,学数学很乏味.刘坦老师的文章《回归直线方程的另一种推导》[1]中的方法简洁明快,但超出了高中学生的学习要求,史雄老师的文章《关于回归直线方程的另一种简单推导方法》[2]中都是利用导数以及求二元一次方程的思想求出回归方程的两个参数.如果学生在必修3之前学习了导数,这是一个简易的方法.然而导数是选修2-2中的内容,一般我们都是把必修学完,才学习选修的内容.基于此,本文先利用样本中心确定回归直线的位置,再利用“从整体上看,各点与此直线的距离最小”的思想获得一元二次函数,依据一元二次函数的特征求得斜率.该方法可以让学生轻而易举地了解回归方程的来源.
一、确定回归直线的位置
平均数反映一组数据的集中趋势.能够利用所有数据的特征是它的优点之一.除此之外,平均数能使得误差平方和达到最小.如果利用平均数代表数据,则可以使二次损失最小.对所给的样本数据的横坐标与纵坐标分别取平均值x-、,则坐标点(x-,)称为样本中心.依据平均数的意义,样本中心(x-,)反映了样本数据的集中趋势,所以回归直线一定通过样本中心(x-,).
二、求回归直线的参数
设回归直线的方程为y=bx+a.由于点(x-,)在回归直线上,所以有=bx-+a.如果确定了回归直线的斜率b,便可以通过=bx-+a得参数a=-bx-.
如何确实斜率b呢?依据数学必修3“从整体上看,各点与此直线的距离最小”得Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2,使得Q最小.把a=-bx-代入Q中
Q=(y1-bx1-+bx-)2+(y2-bx2-+bx-)2+…+(yn-bxn-+bx-)2
=(y1--bx1+bx-)2+(y2--bx2+bx-)2+…+(yn--bxn+bx-)2
=[(y1-)-b(x1-x-)]2+[(y2-)-b(x2-x-)]2+…+[(yn-)-b(xn-x-)]2
=(y1-)2-2×b(x1-x-)×(y1-)+[b(x1-x-)]2+(y2-)2-2×b(x2-x-)×(y2-)+[b(x2-x-)]2+…+(yn-)2-2×b(xn-x-)×(yn-)+[b(xn-x-)]2
=∑n1i=1(yi-)2-2b×∑n1i=1(xi-x-)(yi-)+b2×∑n1i=1(xi-x-)2.
=∑n1i=1(xi-x-)2×b2-2∑n1i=1(xi-x-)(yi-)×b+∑n1i=1(yi-)2.
Q为关于b的二次函数,因为样本数据各不相同,所以∑n1i=1(xi-x-)2恒大于0,即二次函数Q(b)开口向上,有最小值Q,当且仅当b为对称轴.因此,
b=--2∑n1i=1(xi-x-)(yi-)12×∑n1i=1(xi-x-)2
=∑n1i=1(xi-x-)(yi-)1∑n1i=1(xi-x-)2.
本文利用回归直线恒过样本中心的特点以及二次函数求最值的方法而得到回归直线的两个参数公式.该方法思路清楚,推理简单,并且还能加深学生对回归直线的理解——回归直线恒过样本中心.本人认为教材应该使用本文方法介绍回归直线方程.
参考文献
[1]刘坦.回归直线方程的另一推导[J].数学通讯,2003(23):10.
[2]史雄.关于回归直线方程的另一种简单推导方法[J].新课程学习(基础教育),2010(2):104.
(责任编辑黄桂坚)endprint
回归直线方程是新课改新增的内容之一,在必修3中直接给出了求回归方程的有关公式,让学生学会利用公式.在选修数学2-3的第42页中,利用配方法给出了回归直线的推导.但是由于推导过程比较麻烦,而且不是在必修3中出现,很多教师都只是按照课程要求指导学生利用回归方程的公式求回归方程.由于不知道公式的来源,这样做只会给学生一种应试教育的感觉.让学生觉得学习只是为了考试,学数学很乏味.刘坦老师的文章《回归直线方程的另一种推导》[1]中的方法简洁明快,但超出了高中学生的学习要求,史雄老师的文章《关于回归直线方程的另一种简单推导方法》[2]中都是利用导数以及求二元一次方程的思想求出回归方程的两个参数.如果学生在必修3之前学习了导数,这是一个简易的方法.然而导数是选修2-2中的内容,一般我们都是把必修学完,才学习选修的内容.基于此,本文先利用样本中心确定回归直线的位置,再利用“从整体上看,各点与此直线的距离最小”的思想获得一元二次函数,依据一元二次函数的特征求得斜率.该方法可以让学生轻而易举地了解回归方程的来源.
一、确定回归直线的位置
平均数反映一组数据的集中趋势.能够利用所有数据的特征是它的优点之一.除此之外,平均数能使得误差平方和达到最小.如果利用平均数代表数据,则可以使二次损失最小.对所给的样本数据的横坐标与纵坐标分别取平均值x-、,则坐标点(x-,)称为样本中心.依据平均数的意义,样本中心(x-,)反映了样本数据的集中趋势,所以回归直线一定通过样本中心(x-,).
二、求回归直线的参数
设回归直线的方程为y=bx+a.由于点(x-,)在回归直线上,所以有=bx-+a.如果确定了回归直线的斜率b,便可以通过=bx-+a得参数a=-bx-.
如何确实斜率b呢?依据数学必修3“从整体上看,各点与此直线的距离最小”得Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2,使得Q最小.把a=-bx-代入Q中
Q=(y1-bx1-+bx-)2+(y2-bx2-+bx-)2+…+(yn-bxn-+bx-)2
=(y1--bx1+bx-)2+(y2--bx2+bx-)2+…+(yn--bxn+bx-)2
=[(y1-)-b(x1-x-)]2+[(y2-)-b(x2-x-)]2+…+[(yn-)-b(xn-x-)]2
=(y1-)2-2×b(x1-x-)×(y1-)+[b(x1-x-)]2+(y2-)2-2×b(x2-x-)×(y2-)+[b(x2-x-)]2+…+(yn-)2-2×b(xn-x-)×(yn-)+[b(xn-x-)]2
=∑n1i=1(yi-)2-2b×∑n1i=1(xi-x-)(yi-)+b2×∑n1i=1(xi-x-)2.
=∑n1i=1(xi-x-)2×b2-2∑n1i=1(xi-x-)(yi-)×b+∑n1i=1(yi-)2.
Q为关于b的二次函数,因为样本数据各不相同,所以∑n1i=1(xi-x-)2恒大于0,即二次函数Q(b)开口向上,有最小值Q,当且仅当b为对称轴.因此,
b=--2∑n1i=1(xi-x-)(yi-)12×∑n1i=1(xi-x-)2
=∑n1i=1(xi-x-)(yi-)1∑n1i=1(xi-x-)2.
本文利用回归直线恒过样本中心的特点以及二次函数求最值的方法而得到回归直线的两个参数公式.该方法思路清楚,推理简单,并且还能加深学生对回归直线的理解——回归直线恒过样本中心.本人认为教材应该使用本文方法介绍回归直线方程.
参考文献
[1]刘坦.回归直线方程的另一推导[J].数学通讯,2003(23):10.
[2]史雄.关于回归直线方程的另一种简单推导方法[J].新课程学习(基础教育),2010(2):104.
(责任编辑黄桂坚)endprint