大数据背景下统计学教学改革与创新研究

2018-01-05 11:22胡云霞
现代商贸工业 2018年35期

胡云霞

摘 要:2017年12月17日国家统计局与贵州省人民政府签署共办大数据统计学院战略合作协议,开创了大数据统计学人才培养新模式。大数据时代下,统计数据由格式化、标准化的结构型样本数据变为非结构型总体数据,数据特征的变化,对传统统计学理论知识和教学方式方法提出了挑战。大数据背景下,统计学课程要及时引入大数据思维,修订传统统计学教学内容,创新教学方法,锻炼学生大数据搜集、筛选、分析和挖掘等实践操作能力,探索理论与实践相结合的综合考核体系,以提高大数据背景下统计学的教学效果和水平,增强学生自主学习、综合运用理论知识和实践创新能力。

关键词:统计学;大数据;教学改革;创新

中图分类号:G4 文献标识码:A doi:10.19311/j.cnki.1672-3198.2018.35.086

十九大报告中,习近平主席两次提及“大数据”和“数字中国”,2017年12月8日在中共中央政治局就实施国家大数据战略进行的集体学习中进一步指出,要推动国家大数据战略,加快建设数字中国,以数据为纽带促进产学研深度融合,打造多层次、多类型的数据人才,推动实体经济与数字经济融合发展,因此,大数据已经提升到国家战略高度。统计学作为一门提供搜集、整理、展示和分析统计数据内在规律的方法论学科,在大数据时代发挥着不可低估的作用。大数据具有数据全面、数据流庞大、类型繁杂、价值密度较低、动态性和高时效性等特点,这对以传统统计数据为研究对象的统计学提出了挑战,统计学理论知识和教学方式方法亟待更新和改进。

1 大数据对统计学教学的影响

1.1 研究对象和内容发生变化

传统统计学中,受搜集数据的条件和方法限制,统计数据往往是通过抽样调查获得的样本和结构数据。大数据背景下,统计数据主要基于现代信息技术与工具自动记录、储存、动态连续扩充的各种类型的数据,包括所有格式的办公文档、图片、文本HTML、各类图像和音频、视频信息等,数据大多属于非结构型、半结构型或异构型,难以用传统的统计方法加以分析和表现。不同的网络信息系统也没有统一的数据识别方式和数据分类标准。大数据是全面、复杂、多层次、多类型、良莠不齐的,统计学的研究对象从样本数据,格式化、标准化的结构型数据扩充到了总体数据和所有类型数据。

1.2 数据处理方法和手段发生变化

传统的统计学是针对样本容量不大的部分数据,对其进行收集、整理和分析的。大数据因其数据规模巨大,目前主流统计软件工具很难在合理时间内实现数据获取、整理、分析并获得洞见。大数据是对痕迹的自动记录,本身不具有甄别和筛选功能,会受到大量没有实际意义、无价值甚至虚假信息的干扰,如果处理不当就会得出错误结论。不同于传统统计数据的固定性,大数据是连续动态扩充的,具有阶段性特征,同样的关联物在不同时间段结论会有偏差。大数据时代获得的是总体数据而非样本数据,传统的推断统计学方法中的假设检验和参数估计,对大数据不再适用。虽然诸如因子分析、聚类分析、相关与回归分析等传统统计分析方法仍然可以应用与大数据领域,但它们在处理规模较大的数据集合时,效率无法达到用户预期,且难以处理复杂的数据。这些都对统计数据的处理方法和手段提出了挑战。

1.3 对学生自主学习、实践操作应用能力提出更高要求

目前统计学教材里主要运用已经加工整理过的二手数据进行统计分析,学生无需自己搜集反映实际问题的原始数据,被动盲目地学习理论知识,对数据背后的实际问题了解也只流于表面。大数据背景下,数据的搜集、分类、筛选、分析更具有挑战性。掌握如何获得海量数据并进行整理分析,要求学生具有更强的自主学习和应用操作能力。一是要求学生具有随时从现代信息网络和数据源接口获得即时数据的能力,变被动给予为主动获取。大数据时代,数据流转更新迅速,用二手数据难以及时准确反映现象本质规律。二是要求学生在掌握传统统计分析方法的同时,还要及时关注前沿非结构型数据分析理论和方法,打下扎實的整理分析数据的理论知识基础。三是要求学生不仅要掌握主流的统计分析软件,如excel、spss、eviews等,还要掌握处理大数据的计算机编程软件。

1.4 传统的统计学教学方式弊端凸显

传统统计学教学方式是以“老师”为中心,“重理论,轻应用”,老师在课堂内讲,学生通过课后复习和作业实现知识的内化。这种教学模式下,教师和学生“各自为政”,隔离式地完成教与学的任务。老师是课堂内的主人,负责将统计学知识以填鸭、满堂灌的方式进行讲解,学生没有积极主动参与其中,对所学知识也似懂非懂,知其然不知其所以然。学生的自主学习能力没有得到很好地培养和锻炼,难以适应大数据时代主动学习的要求。现有统计教学内容偏重理论,过多的时间花在解决“三多两难”,即概念多、原理多、公式多、难理解、难记忆问题上。教材的案例也更新不及时,缺乏新意和吸引力。

2 大数据背景下统计学教学改革

2.1 将大数据思维引入统计学课堂

大数据是信息网络时代必然趋势,大数据时代,数据的体量、结构与传统数据明显不同,其搜集、整理、分析方法也随之变化,统计学教学中应与时俱进,引入大数据思维,增强学生大数据意识。

传统统计数据收集是根据研究目的,科学设计调查方案,精心组织和实施各个环节,有针对性地收集数据,投入成本高且所获数据量有限。大数据时代,给我们提供了巨量、全方位的数据,我们的重心从如何获得有限数据,转移到如何从海量数据中,利用统计方法分类、筛选,剔除垃圾数据、无价值或不重要数据。传统的统计学理念是“获得”数据,大数据时代是“筛选”、“删除”数据。

传统的统计分析思维是从“假设”到“验证”,即根据研究目标提出相应假设,再通过实证分析验证假设的准确性,这种假设和验证受限于研究者的思路和数据质量,结论的科学性和可靠性值得商榷。大数据背景下,分析思维变为“探索”到“总结”,它可以不受任何假设限制,直接从数据中探索规律,再加以总结,得出结论。这些转变极大地拓宽和丰富了统计分析理论和思路。

当然,大数据时代,并不意味着传统的统计方式方法就不重要,从必要性、安全性及经济性角度考虑,并不是所有数据都可以或有必要从大数据中获得的,即使是大数据也必须辅之以统计分析才能得出相应结论。这就要求我们在统计教学中既要夯实传统统计学基础,又要传递大数据思想,锻炼学生利用互联网信息技术和各种数据源收集数据,探索从大数据中进行再筛选、再选择的统计方法。

2.2 调整更新教学内容

统计学是以数据为研究对象,大数据时代颠覆了传统数据概念,统计学教学内容必须适应时代要求,与时俱进,适时调整和更新教学内容。

2.2.1 修订传统统计学教学内容

多数传统统计理论是在样本数据的基础上提出的,而大数据时代的数据属于总体数据,传统的统计学内容侧重点应做相应调整。例如,在总体数据下,抽样分布、假设检验与参数估计等基于样本数据理论的重要性明显减弱,而数据梳理和分类方法,结构化数据与非结构化数据如何对接,以及如何发现高维数据中的结构模式和相关关系将越来越重要。传统统计学中关于抽样误差的界定也应重新描述。传统抽样数据中既包括抽样误差又包括非抽样误差,抽样误差是可以根据抽样分布理论进行计算和控制,非抽样误差通过科学合理的组织方式可以得到较好的制约和防范。大数据属于总体数据,不存在抽样误差,只有非抽样误差,但因体量庞大,繁杂多样,其非抽样误差较难控制。对传统统计学教学内容进行调整是不置可否的,但具体调整哪些,如何调整,调整程度都有待进一步探讨。

2.2.2 增加与大数据分析相关的计算机内容的学习

EXCEL、Eviews、SPSS等是当前统计学课程采用的主要教学软件,它们能较好地对传统数据进行建模、分析、预测,但难以对大数据进行分析和挖掘。在统计软件的学习上除了要求学生掌握基本的统计软件操作外,应考虑先修与大数据分析有关的计算机专业课程,如数据库开发与设计、Hadoop、Hive等计算工具处理大规模多源异构数据和脚本语言Python。同时,要随时引导学生关注前沿大数据分析方法和理论,增强大数据分析能力。

2.2.3 转变教学方式方法

大数据时代对学生自主学习和综合应用能力提出了更高要求,以往机械的、以教师为中心、“填鸭式”的教学方式已经不适合。统计学课程的教学要充分利用网络资源,发挥学生的自主性,创新教学方式。《国家教育事业发展“十三五”规划》明确提出,全力推动信息技术与教育教学深度融合,鼓励教师利用信息技术提升教学水平、创新教学模式,利用翻转课堂、混合式教学等多种方式用好优质数字资源。统计学课程教学中,教师可以通过慕课、微课的形式对各章内容进行梳理,引导学生学习、复习。利用微课实现统计学与其他相关课程及当前经济热点的对接,如金融学、投资学、市場营销、电子商务等都涉及统计学知识,在统计学教学中,可结合学生专业背景,将相关专业课程案例以微课的形式展示出来,提高学生学习兴趣,引导学生思考。教师以项目为载体,布置任务,学生 以团队的方式,通过网络搜集数据,合作完成数据的分类、筛选、分析,最终得出结论,让学生实实在在地接触实际问题背后的数据,掌握统计学解决问题的方式方法,实现以“学生为中心”的教学方式的转变,增强学生自主学习和综合应用能力。

2.2.4 注重实践操作教学

统计学是一门实践性较强的学科,大数据背景下,要求学生有较强的动手和创新能力。针对统计学教学中普遍存在的“重理论,轻应用”问题,一方面适当增加实验课时,让学生熟练掌握软件操作,提高数据分析能力;另一方面,课堂之外结合当前经济热点和大数据概念,组织学生开展各种专题研究和调查活动,指导学生单独或合作完成软件的选择、数据的搜集、数据的筛选与分析、结果的总结与展示等全过程,锻炼学生动手能力、实践操作能力、沟通能力和组织合作能力。

2.2.5 创新课程考核方式

建立合理有效的统计学课程考核体系,既有利于学生在学习中积极性的提高,又能帮助教师明确教学目标,提高课堂教学效果。在统计学课程考核中,要改进传统的只注重理论知识,靠死记硬背,考后即忘的应试考核方式。考核既要考查学生对基础知识和计算技巧的掌握,又要反映学生综合应用理论知识解决大数据实际问题能力和创新能力。因此,统计学课程考核可以从理论和实践两方面反映。其中理论成绩包括平时作业,章节测验与期末考试,章节测验和期末考试可采用开卷形式,以应用分析题为主。实践成绩包括实验报告,案例分析,论文写作等,侧重考查学生大数据综合应用与实践创新能力。

3 结束语

数据作为统计学研究的主体,在大数据背景下已发生了颠覆性的变化,给统计学课程的教学提出了新的要求。大数据时代下,统计学课程的教学思维、教学内容、教学方式和考核方法都需要调整更新,以适应新时代的发展。通过改革创新,提高大数据背景下统计学的教学效果和水平,增强学生自主学习、综合运用理论知识和实践创新能力。

参考文献

[1]朱怀庆.大数据时代对本科经管类统计学教学的影响及对策[J].高等教育研究,2014,(3):35-37.

[2]张引,陈敏,廖小飞.大数据应用的现状与展望[J].计算机研究与发展,2013,(50):216-233.

[3]周晓宏.管理专业统计学教学模式研究[J].价值工程,2009,(2):123-125.

[4]孟生旺,袁卫.大数据时代的统计教育[J].统计研究,2015,(4):3-7.

[5]潘保国.大数据时代地方高校统计学专业实践教学体系的构建[J].高教学刊,2016,(19):46-47.