王平
摘 要: 研究高校各类课程之间的关联关系是信息化教学的手段之一,而分析课程成绩之间的相关性是研究高校课程关联关系的重要方法。针对传统的Pearson相关系数易于受到异常点影响的问题,提出一种基于鲁棒相关系数的成绩关联分析方法。该方法首先建立样本标准差的鲁棒估计器,在此基础上计算相关系数的鲁棒估计,最后将其用于不同课程成绩之间的相关性分析。
关键词: 相关系数; 鲁棒估计; 课程成绩; 关联分析; 信息化决策
中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2015)19?0143?03
Abstract: Study on the incidence relation among the various courses in colleges and universities is one of information?based teaching measures, and analysis of the correlation between course grades is one of the important methods of researching the incidence relation among courses. Aiming at the problem that the traditional Pearson correlation coefficient is influenced by outliers easily, a score correlation analytical method based on robust correlation coefficient is proposed. With the method, the robust estimator of sample standard deviation is established. Based on this, the robust estimation of correlation coefficient is calculated, which can be applied to correlation analysis between different courses.
Keywords: correlation coefficient; robust estimation; course grade; correlation analysis; information decision?making
0 引 言
在我国高校课程设置的合理性至关重要,它直接影响人才的培养。高校是我国培养高层次人才的重要基地,只有高校教授知识培养出优秀的人才,才能让这些人才应用他们所获得的知识来更好地服务社会,因此,高校培养的人才的质量直接决定着服务社会的质量[1]。要想提高培养人才的质量,就必须在关注学生获得知识内容的同时,更加关注这些学生是如何获得知识,又是通过怎样的课程体系获得的,并且关注其获得知识的结构性和完整性。只有合理地设置课程,才能使学生渐进的、有系统的、有一定的宽度和深度的学习,才能培养其良好的研究能力和动手能力,同时合理地设置课程还能使学生的学习具有扎实的理论基础和前瞻的专业思维,在其学习和探究本学科知识的过程中促进该学科的发展,更好的服务社会,而不是仅仅拿到了一纸文凭,毕业就业后眼高手低,浪费国家资源。
综上所述,如何将课程设置得更加合理、更加科学是每一所高校都在研究的课题,目前已有很多人针对课程之间的关联性进行分析研究,进而为合理而科学地设置课程提供一定的参考和决策支持。其中相关系数法是一种比较有效的分析评价方法,然而传统的相关系数法假设所有的课程成绩都是学生学习效果的正常反映,没有考虑到成绩中可能存在的异常点问题。而实际上,在课程考试中,总会有学生因身体不适或者发挥失常导致成绩偏低,或者学生对某门课程有特殊专长,成绩格外好,这些都不是体现课程之间关系的准确体现,称之为课程相关分析中的异常点问题。异常点会导致课程成绩相关系数偏离实际数值,不能正确反映课程之间的关联关系。
针对此问题,本文结合相关系数的鲁棒估计方法[2],提出一种基于鲁棒相关系数的高校课程相关分析方法。该方法首先对数据进行预处理,然后利用鲁棒相关系数评价课程成绩之间的关联关系,最后对某专业课程与基础课程进行分析,表明该方法的有效性。
1 鲁棒相关系数
同样的,数字电子和模拟电子两门课程密切相关,但传统的Pearson相关系数指出仅有0.519 2的相关程度。绘制出其成绩分布曲线,如图1所示,分析发现两门课程的成绩分布总体相似,但是有个别学生由于发挥失常,成绩非常低,导致两门课程相关系数较低。而利用鲁棒相关系数时,可以综合考虑这种因素,求出的相关系数为0.753 4,可以很好地指出两门课程的密切关联程度。
进一步分析前10门基础课程和专业课程自动控制原理的相关关系,其结果如表4所示。
从表4中可以看出,当使用传统的Pearson相关系数时,程序设计语言、模拟电子、数字电子、电机与电器、化工原理与自动控制原理的相关系数在0.5以上,具有显著相关性;而当使用鲁棒相关系数时,高等数学、模拟电子、数字电子、电机与电器、化工原理与自动控制原理的相关性显著。两种方法的区别在于是高等数学还是程序设计语言与自动控制原理的相关性更强,根据教学经验可知,自动控制原理中涉及到较多数学公式的推导,高等数学与其的相关性强更符合实际情况。在表4中,马克思主义、体育与自动控制原理课程的相关性均很弱,但是本文的鲁棒相关系数相比于传统的Pearson相关系数更低,能够更好地说明问题。
3 结 论
通过对我校某专业课程成绩数据上的分析结果表明,本文提出的方法比传统的方法能够更准确地估计出不同课程之间的关联关系,有利于提高课程教学效果。通过分析学生课程成绩来挖掘课程之间的内在关系,进而提高学校的教学质量和教学效果,同时为学生选课提供指导,也为学校提供一种信息化的决策手段。
参考文献
[1] 杨明霞.课程相关性分析探讨:教育技术学课程关联分析[D].上海:华东师范大学,2008.
[2] 邓晓刚,田学民.基于鲁棒规范变量分析的故障诊断方法[J].控制与决策,2008,23(4):415?419.
[3] 潘丽娟.SPSS相关分析在学生成绩分析中的应用[J].中国管理信息化,2013,16(15):109?111.
[4] 宋小敏,张国防,邢淑兰,等.基于数据挖掘的课程相关性分析方法[J].山西财经大学学报,2012,34(3):240?241.
[5] 程光文,李文芳,陈清山.应用典型相关分析法分析医学生学习成绩[J].西北医学教育,2002,10(3):146?147.
[6] 蒋盛益,李霞,郑琪.数据挖掘原理与实践[M].北京:电子工业出版社,2011.endprint