李 丹
(华中师范大学 数学与统计学学院,湖北 武汉 430079)
自从高中新课程标准确立了统计学在高中数学中的重要地位之后,人们对其愈益重视,但是在教学中也相应出现一些需要思考和解决的问题。统计学与高中生长期接触的确定性数学不同,并非纯粹的数学公式推导与计算,其思维方式也自有特点,只有对统计学的学科特征有所理解,才能够在教学中完成新课程标准中对于统计学学习的要求——不仅掌握各种统计技术,更要形成统计思维。因此,如何在高中统计教学中实现这一教学的双重目标,正是本文要探讨的问题。
其实,已有研究已经在强调高中教学要注意数学与统计学的不同。如针对教学内容,王奋平通过对中、英高中教材概率统计内容中有关学习要求、知识量以及概率论与数理统计安排顺序的比较研究,提出统计学教材的编写应当适当增加概率统计的内容、概率论与数理统计的融合以及按照知识模块来组织教材结构[1]。针对教学过程,王建波通过对高、初中统计差异、高中的统计概念、相关性分析和案例教学的研究,提出高中教师在教学中应注重与义务教育阶段衔接,让学生体会统计思维与确定性思维的差异,并把握线性相关性,引导学生形成对数据处理过程进行初步评价的意识[2]。针对学生学习过程,张德然,茆诗松从宏观思维方式到具体的包含随机性思维的数学题目的分析提出了适合学生形成统计思维的方法,让学生从理解随机性到认识随机性思维下的推理过程,让学生结合实际生活来运用和发展随机性数学思维[3]。总之,如何在教学内容、教学过程和学生学习中培养统计思维的问题,已经引起了一些一线教师和学者的关注,但即便如此,相关研究还主要是围绕高中统计的教学教法来谈问题,尚未进入到对统计学自身的学科特性中去思考。因此,虽然人们都知道统计学是以实际事物为对象,与数学有不同的规律[4],如果不对其特性进行探讨,很难在教学中体现学科规律性。但事实是能自觉依据统计学的学科特点来分析如何从事高中统计教学的研究仍然不足,这就为研究的深化留下了空间。
高中的统计学是统计学的一部分,而非高中数学体系中的一个简单的拼盘。所以,理解统计学的学科特性,是教好和学好统计学的前提。如布鲁纳所说,懂得基本原理可以使得学科更容易理解,而在教学中强调结构和原理则有助于教授学科的基本结构[5]。那么,如何去探寻统计学的特点呢?不妨让我们到统计学的发展中去寻找答案。因为统计学的学科特征,正是在其发展与演变的过程中,尤其是在其初期发展和几个重大的关键转变期所形成的。所以,了解统计学的历史,对于我们了解其基本特征,提高高中统计教学质量会有重要帮助。此外,我们还需要对统计思维的概念给出一个明确的定义,以方便后续的研究。所谓统计思维,是指人们自觉运用数字对客观事物的数量特征和发展规律进行描述、分析、判断和推理的思维方式。这里最难的就是如何自觉地形成这种思维方式。此前,高中生所熟悉的是直接针对数字的运算处理,而不习惯于通过对数据的描述、分析、判断和推理去理解复杂的社会事实。因此,要从数学思维转入统计思维,就要求师生双方都必须正确认识统计这门学科。
M·克莱因说过,对于统计学来说,如果仅仅进行收集、统计并不是一种新思想,它的新颖之处在于统计方法能够作为一个重要的方法来处理社会科学问题[6]。
陈希孺指出,大量的原始数据如果不经过整理、分类、排比、分析,并通过适当的形式表示出来,就好比一堆没有经过冶炼的矿物[7]。格朗特1662年发表的《关于死亡公报的自然与政治观察》称得上是统计学历史上的第一块里程碑,也是关于描述性统计的开山之作。该著作的创新在于把大量的数据根据研究对象的种类进行分类,并整理成意义清晰的表格,并举例处理了数据的可行性问题和分析统计比率以及得到生命表。这些工作,对于早期的统计发展起到了非常重要的作用。如果说,这些工作还主要是针对人口问题,那么,统计学的发展则源于对范围更加广泛的社会科学研究的定量化思考。W·佩蒂的“政治算术”就是统计学在这方面的最初运用,他通过“数字、重量和尺度”的研究,拓宽了人们对政治与社会经济现象的理解。由此,统计的发展便与社会科学建立起了紧密的联系。统计科学中的数量性体现在对社会现象的数字抽象,即通过对数据进行数学分析,得到研究所需要的信息。这是一个对复杂的社会现象进行不断抽象、提炼、浓缩和普遍化的过程,强调通过数据来解释社会,因此,统计中的计算方法其实只是理解研究对象的工具,而数据所反映出来的社会事实,才是统计学的实质和基础。可见,统计思维中的数字与形象思维和逻辑思维中的数字是有所区别的,形象思维的数字是一种符号“表征”,统计思维的数字则是其所揭示的某类社会现象的内在规律和性质;逻辑思维的数字强调计算,统计思维的数字则是对相关现象进行分析和判断的手段[8]。而且,由于社会现象的复杂和多面性,统计中对于数量的分析结果在不同的背景环境中可能有不同的解释,呈现出意义的多样性。记住这些特点,对于我们厘析统计学和数学思维中数量性差异,意义极大,也是我们养成统计思维的基础。
魁特奈特在1835年发表的《论人类及其能力的演化或社会物理学实验》中提到了“普通人”的概念。其启示性在于:将社会现象定量后,接下来要思考的就是如何去描述数据的特征,即寻找数据的社会意义——代表性。要想从数据中得到相关现象的代表性信息,最简单的就是算术平均数,算术平均数有着“取大补小”的特点,因此,当一组数据中出现一些数比其他数大很多或小很多时,算术平均数就不是一个具有代表性的数据。为了探求数据的代表性,又出现了中位数的理论,就是将一组数据按一定的顺序排列后取中间位置的那个数。这在一定程度上弥补了算术平均数的缺陷,但是,中位数所能代表的信息比较少,我们无法清除其他数据与之的差异性。而众数又是另一种平均的体现,它表示一组数据中出现次数最多的数字。算术平均数、中位数和众数都可以反映一组数据的部分平均的特征,可是对于整组数据在这样的平均值下的分布情况还不清楚。后来人们开始寻找整组数据与平均值的关系,于是出现了离差,即单项的数据与平均值的差值。为了更好地反映数据的特征,统计学家又提出了标准差,也就是一组数据中每个数据与该组数据的算术平均数之差的平方和的平均值的根。张献民提到统计平均数就是将被研究的同类现象的某个数量指标的各个体数量差异抽样化,用一个概括的指标综合说明现象有代表性的典型水平[9]。并且,代表性不仅体现在代表性数据,还表现为代表性的思想。后来发展的大数定理、中心极限定理、正态误差理论和最小二乘法等,其实都是代表性思想的发展。
统计学的代表性思想还体现在抽取样本数据的过程中。拉普拉斯提出的“比例法”可以称得上是抽样方法的起点,但是当时抽样调查的理论和方法还没有发展起来,直到1895年挪威统计学家凯尔把代表性抽样作为一般方法提出后,抽样调查才被大家所熟知。所谓代表性抽样,就是指从总体中抽出的一组可代表该总体(在选定的指标上)的样本,是个“小型化”了的总体。1924年国际统计协会对抽样方法做出了界定,即随机抽样和目的性抽样两种,主要思想都是抽样数据的代表性的体现。可见,学习统计学,就要理解其对代表性的追求。
阿布兹诺特在1710年发表的论文《神定法则: 男女出生性别比例恒定的规律性》,试图使用二项分布模型对男女出生性别比例为1的假设进行检验(实际上也是一个符号检验),不少著作认为这是现代假设检验理论的最早起源[7]。假设检验就是提出一个总体的特征假设,然后利用样本对总体的统计特征提供信息,并建立一个统计量来判断假设是否成立。建立这样的假设检验的模型是基于对总体符合正态分布的基本假设。继高斯提出观测误差符合正态分布后,统计学家魁特奈特将正态分布的规律推广到社会科学中的更多数据。假设检验中建立的统计量是一个随机变量,应当服从概率中的某一分布。而后,费歇尔提出方差分析,把F分布引入到统计的假设检验中。而判断假设是否成立的依据是小概率事件原理,即小概率事件在一次实验(观察)中是几乎不可能发生的。因此,古典概率逐渐走出以赌博游戏为主要研究对象的小狭范围,并推动了推断统计学的发展。推断统计是在搜集、整理观测的样本数据基础上,对有关总体作出推断,其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的以概率形式进行表述的推断。这些假定模型都是对现实社会在不同程度上的简化过程,并且是基于样本随机现象的事实。所谓随机现象,即是在一定条件下进行试验或观察会出现不同的结果,而且在每次试验之前都无法预言会出现哪一个结果。社会科学研究中就经常会碰到这种现象,这也为对此一问题的推进提供了空间。正是因为社会中存在着大量的随机问题,才促使统计学家运用概率研究的方法去深化思考。推断统计领域扩大的基础是随机现象存在的范围。统计假设检验是基于随机现象的研究,也是人们基于经验进行假设后进行的探讨。
概率和统计中同样都有假设检验,概率关注其计算过程,而统计更加关注假定模型的意义构建以及对结果的现实意义分析。概率论和统计学都是研究随机现象,概率论更注重用已知的条件分析结果,而统计更加关注的是已存在结果背后的原因以及基于这个原因对未来进行推测,统计在过程中更加关注一个归纳推理的过程。因此,推断统计中我们需要特别注意其随机性和假定性的特点,这样才能在得到结果的情况下更加合理地去解释背后的数字意义。
高中阶段对统计学知识的掌握主要涉及到两个方面,即统计方法的操作和统计思维能力的培养。在《普通高中数学课程标准(实验)》(教育部,2003)中强调让学生经历“收集数据——整理数据——分析数据——作出推断”的数据处理过程,这里强调对具体统计方法的掌握。但我们知道,支配各种不同方法的是不同的统计思维,如果不对方法技术的相应思维基础进行理解,统计学的方法就容易混同于数学的计算,让学生知其然却不知其所以然。所以,教授统计知识,需要更多地思考如何让学生形成用统计方法分析问题的意识,培养他们的统计思维,这就需要培养学生对统计学四个特征的理解。
我们首先需要对小学、初中和高中阶段的统计知识有一个结构上的整体把握,以便能从中找出各自的知识递进关系及其与不同统计思维的关联。统计学的教学内容在不同阶段的要求不同,相关内容所体现的学科特性也不同。小学和初中阶段主要是描述性统计,其所突出的是统计学的数据含义和代表性追求,高中阶段的重点是推断统计的初步,突出的是统计学的随机性和假定性内含。而平均数的教学贯穿于整个小学、初中和高中,因为它是统计学的学科基础。这样,在高中阶段的统计教学中,就应该注意在学生前期学习的基础上,着力培养其对随机性和假定性等原理的掌握,不仅要求他们掌握相关技术,更着重要求理解技术背后的精神和理论。
对数据不同于一般数学的理解是统计学的基础,因此,对其理解应贯穿在整个学习过程中。统计学数据的深度理解可以分为:对统计数字的关注、探讨数字的意义、对统计数字的质疑、对数字的判别分析、统计数字所对应的社会现象及其分析。
小学阶段主要是平均数、中位数和众数的学习,这个过程是让学生接触到统计学中的数字,关注不同数字的意义,培养学生对统计数字的关注并试图去理解不同的统计数字。初中阶段则是在理解统计数字的意义上进行探讨,初步运用样本估计总体的思想来理解统计数字,从少量的数据上升到大量数据,扩宽统计中数据的理解范围。
高中生的认识和理解能力相对提升,此时学生要学习对数据进行质疑和分析。高中讲授的随机抽样不仅是一种方法,还可以视为减少误差而采取的措施,此时,统计中不可避免的误差问题可以在随机抽样教学中提出来。随机抽样中的简单随机抽样、分层抽样和系统抽样都是希望最终获得的统计数字误差最小。这也是让学生理解统计中的误差,培养他们对统计数字的质疑,让他们理解统计中经由任何抽样方法得到的数据都只有相对,而非绝对的准确性。高中阶段讲授的以样本估计总体和两个变量的相关关系就是对数据进行推断的初步分析,了解样本的数字特征可以在一定程度上反映总体的数字特征,这个过程对学生数字分析能力的要求更高,而这个过程需要结合统计学中其他特征共同实现,但对于数据的理解是基础。因此,对数据的理解将贯穿整个高中统计教学,学生对于数据的理解层次的提高是教学中要着力解决的问题。
要注意让学生体会统计思维中的数字与确定性数学思维中的数字的区别。确定性数学中的“数”与“量”是两个简单的组合,而统计思维中的“数量”是结合在一定的背景下进行的一种分析。例如:一份报纸卖三元钱.确定性数学中会注意到“一份”和“三元”,那么接下来可能就是思考通过计算能够得到什么样的结果,它关注的是计算过程和结果。而在统计思维中,我们需要思考的则可能是这是一份什么主题的报纸,为什么需要三元钱,和与其他报纸相比有什么值得购买之处等等,这里更加注重的是对数据所反映的研究对象的相关社会性特征的分析。
从对小学、初中和高中阶段关于统计知识的归纳中发现,统计平均数的思维一直贯穿始终,根据不同阶段学生的认知水平的提高而将要求提高,其体现统计中求平均思想的本质没有变。因此,教学中教授平均数时就不仅要传授相关计算方法,更应当培养学生理解平均数的思想,并在理解其意义的基础上进行应用。教学中,要强调不同平均数的代表性以及其应用的条件。当然,要理解相关内容,还是需要学生处于一种假设环境中去亲身感受。因此,高中区别与此前平均数教学之最重要的地方,就是要让学生能够理解代表性的意义。
对统计学每一个特征的理解都是基于一个生活背景,并且这个过程更加注重学生自己根据问题去发现和探索。统计来源于对日常生活的总结和提炼,也有利于学生感受其作用。布鲁纳指出,学习的方式在学习统计过程中能够比较好地发挥其作用,布鲁纳的情节教学运用于统计教学时主要体现在案例的设置分析,让学生在一个个案例所设定的情节中进行学习[5]。这对于理解和掌握统计学尤为重要。
在高中阶段的代表性教学还体现在获得代表性数据,也就是如何运用抽样调查获得数据。要让学生理解抽样的代表性,首先需要学生理解为什么要进行抽样,如何进行抽样。这个过程需要学生自己思考,也需要教师用具体的案例设置情节对学生进行引导。例如,我们要调查某高中15岁学生的身高,如何设计调查过程?调查某市的15岁学生身高,如何设计调查?调查全国15岁学生的身高,如何调查?让学生思考这一系列问题后,再提出怎样去获得能尽可能代表我们需要代表的总体的数据。只有经历了类似的训练,学生才能对以抽样调查来体现代表性的方法有更加深刻的体会。
随机现象是概率论研究的对象,也是推断统计中的一个重要部分。学生习惯了确定性思维的学习,对随机性现象的理解要有一个过程,也就是说,仅仅知道随机概念,还是未必能理解现实生活中的随机现象。张德然认为,所谓随机性数学思维是以随机性问题为载体,通过发现问题、解决问题的形式,达到对现实世界的空间形式和数量关系的本质的一般性的认识的思维过程[3]。我国高中数学教材安排是先统计后概率,这与大多数国家中学阶段的概率和统计内容安排顺序不同,这可能是考虑到高中的统计内容只局限于简单的概念和性质,不需要较为复杂的概率知识[1]。但是,回顾统计学的发展,要理解和形成统计思维,就需要理解统计的知识结构,而这个结构的构建是需要概率知识作为一种支撑的。因此,在高中阶段,学生先学统计再学概率,在知识接收上会有一定的结构性障碍,不利于完整的统计思维的形成。另外,高中统计在教授“样本估计总体”时涉及到了频率图,并且让学生尝试从频率图中得到结论。但我们知道在统计学的发展中,是先有正态分布曲线,然后才发现频率图和正态分布曲线的相似性,它们存在着一种知识理解上的递进关系。不知前者,又如何理解后者?因此,在学生没有理解概率分布的情况下,便无法很好理解频率图与正态分布之间的关系。可见,对于每一个教学内容的组织,都需要去贴近统计学的逻辑特点,只有在教学体系组织上体现出统计学的知识递进关系,才能让学生更好地理解与掌握。
统计中的分析和判断带有很明显的不确定,需要结合数据背景才能够解释结果。学生要形成随机性思维,需要他们自己在发现问题解决问题的过程中形成一个认知图式,且是区别于确定性数学的认知图式。
统计学的假定性表现在整体数据的假设和分析模型的假设两个方面。在高中阶段,整体数据的假设其实是体现在每个过程中的,尽管教材通常不会去刻意强调我们所进行的分析是基于对现实生活现象进行简化的假定这一点。统计学分析模型的假定性在高中阶段主要是回归分析,教材设计的内容主要是让学生明白如何建立模型,却忽略了假定的过程的交待。但是,恰恰假定的思想在推断统计中非常重要,它是区别于确定性数学,可以进行主观判断的基础。在教学的过程中需要特别注意统计学中的假定思想,推断统计的分析是建立在高度浓缩的信息以及假定的基础上。高中阶段两个变量的相关关系的教学过程中,我们在理解了两个变量之间的相关性后,还需要让学生知道在其中一个变量变化后不一定导致另一变量的变化,其结论是建立在假设的基础之上,因此要将统计中的相关关系区别于因果关系。
统计学中的假定性理解在高中教学目标中没有明确提出,有可能导致教师对于假定性的忽略。因此,笔者建议在教授推断统计时要首先由假设检验开始,这也符合学生对事物的认知特点,对一个新鲜事物我们会先有一个最初的判断,然后再进行验证并得到最后的结论。例如我们看到一个果子,一眼看上去和梨子长得很像,但也有不同的地方,但我们还是初步判断它为梨子,然后再进行验证,最后的结果可能是梨子也可能不是。因此,高中对于这部分的教学需要让学生根据自己的经验进行假设,然后进行验证.这个阶段注重验证分析的过程,并让学生体会和理解假设是我们进行推断和分析的基础,如果假设改变,可能结果也随之变化。
总之,统计学的四性——数据特性、代表性、假定性和随机性,非常凝炼地概括出了统计学的发展史,揭示了统计学的学科特征,这无疑为高中教学更好地教授和学习统计学,理解其神髓,提供了入门的钥匙,这把钥匙的功用在于:学习统计学,首先要理解统计的思想及其原理,要养成统计思维,以此为基础,方法和技术的教与学才有根基。高中阶段无疑是形成统计思维的基础和关键阶段,因此,在整个教与学的过程中,都必须好好地把握这一点。
参考文献:
[1]王奋平.中、英高中教材概率统计内容比较研究——以英国AQA数学课本和北师大版数学课本为例[J].数学通报,2012,51(4):32-36.
[2]王建波.高中数学新课程统计内容的问题关注和教学建议[J].课程·教材·教法,2011,31(3):51-54.
[3]张德然,茹诗松.高中概率统计教学中关于随机性数学思维的培养[J].课程·教材·教法,2003,(9):39-42.
[4]刘超,吴喜之.统计教学面对的挑战[J].统计研究,2012,29(2):105-108.
[5]布鲁纳.教育过程[M].北京:文化教育出版社,1982.
[6]M·克莱因,西方文化中的数学[M].上海:复旦大学出版社,2004.
[7]陈希孺.数理统计学简史[M].长沙:湖南教育出版社,2002.
[8]惠琦娜.从统计思维培养看统计教学改革[J].统计与决策,2010,(3):168-170.
[9]张献民,统计平均数的统计学机理研究与应用[J].统计与信息论坛,2006,21(5):43-47.