“属性数据分析”的课程案例和课程考核改革

2023-04-20 08:43:23
大众科技 2023年11期
关键词:职业规划案例考核

徐 锋

“属性数据分析”的课程案例和课程考核改革

徐 锋

(桂林理工大学理学院,广西 桂林 541006)

属性数据在生活中经常遇到,其分析方法是统计学专业学生必须了解和学习的。文章基于目前“属性数据分析”课程的教学现状,特别是课程案例的局限性,收集了一些贴合大学生生活的案例数据,以便引起学生的共鸣,提升教学效果。同时,提出结课考核采用过程考核联合结课论文汇报的形式进行最终考核,以充分了解学生对课程知识的掌握程度。

属性数据;课程案例;统计分析;课程考核

引言

随着大数据时代的到来,传统统计学受到了巨大的冲击,在面临挑战的同时,也迎来了新的机遇。互联网的发展,使得数据以多种形式出现,不断涌入的多形式、大量的非结构数据对传统统计方法提出了巨大的挑战,同时更多更好的统计方法也应运而生,针对属性数据分析的方法也在日渐丰富。在以前计算机还未高速发展的时候,大规模数据的收集和存储难以实现,互联网的非结构化数据也不多,数据形式主要由定量数据占主导地位。如今计算机、互联网高速发展,非结构化数据呈指数暴增,数据形式主要由定性数据占主导地位。特别是互联网,产生大量、高频的舆情数据,对平台情感语句进行分析就涉及属性数据分析的方法,从而使属性数据的分析方法变得越来越实用、越来越受欢迎。在其他领域诸如生物医学、社会科学、心理科学和金融信用评估等,也常常涉及属性数据的分析方法。

近些年,属性数据分析方法的应用日益广泛。过去,人们将定量数据的分析方法应用到属性数据中,如今绝大多数相关学者已经意识到这个是不合适的[1]。在大数据时代,数据分析的重要性毋庸置疑,特别是对属性数据的分析。为了顺应时代的需要,各大高校纷纷为统计学专业的学生开设“属性数据分析”课程。然而目前市场上针对属性数据分析的教材相对较少,特别是国内教材,很多都是来自国外的译本,教材上的案例数据也都是国外的例子,对于学生而言缺乏兴趣。在课程考核方面以当前流行的提交结课论文的形式作为考核方式,这是统计学专业数据分析类课程使用最多的一种考核方式,但也有一定的不足。这种考核方法在一定程度上无法反映出学生的真实水平,无法判断学生是否真正掌握了相应的方法。鉴于教材的课题案例和考核方式不足以体现学生掌握课程知识这两点,笔者收集了一些贴合大学生生活的数据,可以用于课程案例的讲解,帮助学生更好地理解属性数据分析的方法,也结合实际情况对考核方式提出新的方法。

1 “属性数据分析”课程案例

目前国内高校使用得较多的教材是《属性数据分析引论》。这本教材浅显易懂,没有复杂繁琐的理论推导,很适合应用统计学专业和经济统计学专业的学生,教师只需要适当地补充一些必要的统计量的统计推断即可。但是教材的课程案例大部分是医学方面和西方国家的例子,比如心肌梗死与曾经吸烟是否存在关联性等。这些案例对医学学生而言非常好,但是对非医学学生而言仅是一个例子,不能让学生感同身受地理解。倘若有一些例子能够让学生感同身受,让学生觉得有趣,看到例子就想知道最终的结果,这样势必更能吸引学生的注意力。笔者收集了一些和大学生生活息息相关的案例数据,以便能够帮助该专业学生了解属性数据分析的课程案例,提升课程的教学效果。例如,大学生喝奶茶的频率与性别是否存在关联性,数据如表1所示。

表1 大学生喝奶茶的频率与性别的交叉分类列联表

检验大学生喝奶茶的频率与性别之间是否存在关联,可以采用皮尔逊卡方检验和似然比检验方法对原假设H0:大学生喝奶茶的频率与性别之间是独立的进行检验。皮尔逊统计量和似然比统计量分别为:

属性数据分析除检验两个变量之间是否存在关联性外,还有一个值得人们特别关心的问题,即发生某件事的可能性。通常情况下,是通过建立logistic回归模型来回答。在诸多的教材中,案例数据是来自西方一些社会问题,比如问及个体是否相信有来世与性别之间是否独立的问题中进行交叉划分的列联表案例数据。笔者在上课的时候问及所在班级是否对该案例感兴趣,答案是否定的。但是学生对自己所关心的问题通常比较感兴趣。诸如笔者调查收集的关于大学生具有明确职业规划是否和年级有关的问题,数据如表2所示。

表2 大学生具有明确的职业规划是否和年级有关

表3 拟合基线—类别logit模型的参数估计值

根据概率公式:

表4 大学生具有明确的职业规划预测概率表

从表4可以看出,无论哪个年级,个体对自己的职业规划通常是“不确定”的概率更大。反映到整个年级上,也即一个年级大部分的学生对自己的职业规划都是模棱两可的,似乎有点目标但好像又不太坚定。教师需要对这部分学生进行正确的引导,让其向“有”明确目标的方向靠近。对比四个年级学生的职业规划预测,总体上大二的学生“有”明确的职业规划的占比最高,其次是大四的学生。这也符合实际情况,大二刚上完职业规划课,学生对未来作了一定的规划,但是到了大三时又放弃了,而大四即将毕业面临找工作的难题又重新规划了职业方向。

从以上的案例分析中可以发现,更贴合大学生生活的案例更能引起学生的共鸣,在授课的时候更能吸引学生的注意力,可以使学生参与到课堂的谈论中,也能激发他们去寻找身边的案例并收集数据进行分析的兴趣,从而提高他们的数据分析能力。

笔者也收集了其他一些与大学生生活比较贴近的数据,调查对象来自桂林理工大学的在校生。收集的问题有:(1)大学生骑共享单车上课是否与性别有关,数据见表5;(2)大学生每周运动次数与性别和年级的关系,数据见表6;(3)大学生点外卖次数与性别和年级的关系,数据见表7。

表5 大学生骑共享单车上课是否与性别有关

表6 大学生每周运动次数与性别和年级的关系

表7 大学生点外卖次数与性别和年级的关系

从表5可以发现,经常骑单车(一周4~5次)的男生要比女生多,而在不经常骑(一周小于3次)的情况下,出现了相反的现象,女生比男生多。初步认为骑单车上下课与性别之间是存在一定的关联性的。表6和表7分别反映了大学生的运动量和点外卖次数与性别和年龄之间是否存在关联性。总体上,女生的运动量和点外卖的次数是均小于男生的。初步认为他们两者之间是存在关联性的。这些例子与大学生生活更加贴近,更能够引起他们的兴趣,从而提升教学效果。

2 “属性数据分析”课程考核初探

统计类课程考核方式丰富多样。以往的考核是闭卷考试形式,通过公式的推导证明某个结论以及一些小样本数据的计算来检验学生对数据分析的掌握程度。随着时代的发展,数据量的增加,针对大样本的统计分析方法显然不再适合闭卷考试。一是针对大数据的方法通过笔算不太可能完成。二是大样本的渐近公式比较复杂,通过让学生证明其结论已不太现实也没有必要,即使可以也不能真正体现学生的数据分析能力,这与社会需要是脱轨的。

目前,数据分析类课程大多都是以“过程考核+提交结课论文”的形式进行考核的。这种方式更能全面地考查学生数据分析的实操能力,更能评价一个学生对课程的掌握程度。然而,这种提交结课论文的考核方式在考核的时候也存在两个弊端:第一,很多学生提交的论文都是互相借鉴,拉不开差距,很难判断学生是否真正的掌握了课程知识;第二,论文只是书面上的呈现,无法给普通大众讲解,不能完全体现学生对数据分析结果的解释能力。数据分析的结果是需要面对有这方面需求的企业老板,需要用通俗易懂的语言为需求方描述。

针对目前考核方式的弊端,建议可以采用结课论文汇报的形式进行考核,即提交结课论文后,制作PPT在教室演讲自己的结课论文内容,可以以小组为单位进行汇报[2]。在考核的过程中,可以添加学生互评的环节。学生对汇报者提问问题,汇报小组进行作答。这样能够真正考察学生对本课程的掌握程度。通过这样的考核,能够体现学生从收集数据、分析数据到最后得出结论的一系列过程,更重要的是能够将数据分析的结果用通俗易懂的语言讲出来,这对学生将来到社会做相关方面的工作尤为重要。这样的考核方式能够使教师充分了解到学生是否真正掌握了课程知识,更重要的是,学生在数据分析的过程中遇到不懂的问题也能够及时得到教师的帮助。

随着社会的进步,统计学理论知识不断更新,统计学的教学要求也在不断变化,越来越多的学者对统计学相关课程展开了研究。例如,薛艳[3]针对大数据时代探讨了在大数据背景下统计学专业的教学体系;吴群英等[4]探讨了大数据背景下应用统计学专业的培养方法;朱建平等[5]针对大数据时代对传统统计变革给出了自己的思考。如今计算机和互联网快速发展,高维、高频的大规模数据对传统的统计方法提出了挑战。随着数据量的激增,统计软件的操作也变得尤为重要,数据分析类课程要让学生掌握理论知识,更重要的是提升学生解决实际问题的能力。从收集数据到数据处理,再通过统计软件估计模型,最后对模型结果进行解释,这一系列的过程缺一不可。具备了实现这一系列过程的能力的人将更能被社会所认可。汇报结课论文正是能够体现这一系列过程的考核方式,这种考核方式能充分地体现学生的数据分析能力以及运用所学的知识解决实际问题的能力。

3 结束语

生动的课程案例能够提升学生对知识的渴望,使学生不断地想要知道答案。鉴于目前“属性数据分析”课程案例的局限性,文章收集了一些课程案例数据,并举例说明了贴近学生生活的案例对于课程教学的重要性。同时,提出了以结课论文汇报的方式进行“属性数据分析”课程考核,该考核方式不仅能够体现学生对数据分析一整套流程的熟悉程度,还能提升学生运用所学的知识解决实际问题的能力。

统计学的教学需要不断地变革以应对时代的发展,要不断地把新知识运用到教学中,以便学生能够更好地适应社会的需求,这便对统计学专业的教师提出了更高的要求,统计学专业教师只有不断地学习,使自己的知识水平能够达到社会发展的需要,才能更好地教导学生,为社会培养出符合时代发展需要的人才。

[1] 雷斯特. 属性数据分析引论[M]. 张淑梅,王睿,曾莉,译. 北京: 高等教育出版社,2008.

[2] 徐锋,杨清华. “分类数据分析”的教学现状和改革初探[J]. 教育进展,2021,11(6): 2396-2399.

[3] 薛艳. 大数据时代统计学专业教学体系的改革[J]. 教育教学论坛,2015(4): 110-111.

[4] 吴群英,蒋远营,张浩敏,等. 大数据背景下应用统计学专业改革探讨[J]. 教育教学论坛,2016(43): 101-103.

[5] 朱建平,张悦涵. 大数据时代对传统统计学变革的思考[J]. 统计研究,2016,33(2): 3-9.

Course Cases and Course Assessment Reform for "Attribute Data Analysis"

Categorical data is often encountered in daily life, and its analysis methods are essential for students majoring in statistics to understand and learn. The article is based on the current teaching status of the "Attribute Data Analysis" course, especially the limitations of course cases, some case data tailored to the lives of college students have been collected to resonate with students and improve teaching effectiveness. At the same time, it is proposed that the final assessment of should be conducted in the form of a process assessment combined with a final paper report, in order to fully understand students' mastery of course knowledge.

categorical data; course cases; statistical analysis; course assessment

G642; C812

A

1008-1151(2023)11-0108-04

2023-02-13

广西自然科学基金青年项目(2021GXNSFBA220013);桂林理工大学课程教综合改革项目“‘属性数据分析’课程内容和考核方式改革研究与实践”。

徐锋(1989-),男,江西上饶人,桂林理工大学理学院副教授,研究方向为统计过程控制。

猜你喜欢
职业规划案例考核
案例4 奔跑吧,少年!
少先队活动(2021年2期)2021-03-29 05:40:48
论社会适应能力视角下的大学生职业规划
内部考核
童话世界(2020年10期)2020-06-15 11:53:22
大学生职业规划与就业问题研究
随机变量分布及统计案例拔高卷
创新完善机制 做实做优考核
当代陕西(2019年9期)2019-05-20 09:47:40
指导大学生做好职业规划的策略研究
活力(2019年21期)2019-04-01 12:18:54
发生在你我身边的那些治超案例
中国公路(2017年7期)2017-07-24 13:56:38
公立医院 如何考核?
中国卫生(2016年2期)2016-11-12 13:22:24
如何在地理教学实践中引导学生进行职业规划
地理教学(2015年19期)2016-01-06 12:00:46