韩玲
摘要:教学测评是高校教学过程中的重要环节,是评估教学效果的有效手段。其中,试卷质量的高低直接影响对该课程的教学考核。教师命题时,从内容到分值往往带有一定的主观性,其合理性也值得商榷。粗糙集理论认为在决策系统中,不同的条件属性对分类的作用不尽相同,利用条件熵计算出各条件属性的重要性。将试卷的各类题型作为条件属性,根据属性重要性大小修正各题型的分值,提高试卷命题质量。
关键词:教学质量评价;粗糙集; 评价指标;信息熵
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)17-3961-03
Correction of Teaching Evaluation Index Based on Rough Set Theory
HAN Ling
(School of Computer Science and Technology, Huaibei Normal University, Huaibei 235000, China)
Abstract: Teaching evaluation is an important link in teaching process of colleges and universities, is the effective means for the evaluation of teaching effect. And the examination paper quality decides directly on the teaching evaluation. The teachers set up the paper with subjectivity, from the content to the scores. Its rationality is also questionable. In decision system, effect of different condition attributes on the classification is different in Rough set theory. Conditional information entropy was used to calculate the importance of attribute. All kinds of questions as a condition attributes according to the attribute importance, correct the test score to improve the quality of a examination paper.
Key words: teaching quality evaluation; rough set; evaluating index; information entropy
目前,我国各类学校已逐步进入“数字化校园”时代,实现从教学环境、教学资源到教学活动的数字化,创建电子校务、教育资源、及网络服务的数字化虚拟大学教育环境,最终实现提高教学质量、科研和管理水平与效率的目的。
现在,许多高校都建立了教务平台,学生、教师和管理人员共同参与教学活动。教务平台开通后产生了大量的数据,而其中蕴含着大量有价值的信息。如何从大量的、动态的、不确定的、模糊的甚至是有噪声的数据中快速、有效地挖掘出潜在的、有利用价值的知识?数据挖掘方法和技术是一有效的手段。粗糙集理论与方法是诸多数据挖掘技术中较为有效的一种方法。
1 粗糙集理论相关知识
粗糙集理论是处理不精确、不一致、不完整等各种不完备的信息有效的理论工具。一方面有成熟数学基础、不需要先验知识,另一方面易于掌握和使用。它直接从给定问题出发,通过不可分辨关系和不可分辨类确定问题的近似域,从中发现隐含的知识,揭示潜在的规律[1]。
粗糙集理认为知识就是人类所固有的分类能力。分类是推理、学习与决策的关键问题。因此,粗糙集理论假定知识是一种对对象进行分类的能力[2]。这里“对象”构成了所讨论的论域。
定义1 信息系统 S=(U,A,V,f)。S为知识库,U为论域,A为属性有限有限集合,V为属性的值域,[V=a∈AVa], [f=UO×A→V]为信息函数,[?a∈A,x∈U,f(x,a)∈Va]。
如果属性A=C∪D,C∩D=[?],C为条件属性集,D为决策属性集,信息系统也称为决策系统[3]。决策系统是最为常见的信息系统。
分类的依据是属性的值,在多属性中,它们对分类的重要性是不同的,甚至有些属性是冗余的。常用的度量属性重要性方法之一是根据信息熵来定义。
信息论认为,信息量的大小是由所消除的不确定性的大小来度量。文[4]中说明:如果将决策表中属性去掉,条件信息熵将单调递增。在决策表中,删除某个属性所引起条件信息熵的变化大小可以作为属性重要性的度量。
决策系统S=(U,C∪D,V,f)中,U/C={X1, X2,……Xn},U/D={Y1, Y2,……Ym},定义p(Xi)=|Xi|/|U|,i=1,2, ……,n,p(Yj)=|Xj|/|U|,j=1,2, ……,m。
定义2属性集R的熵:
[H(Xi)=-i=1np(Xi)logp(Xi) ]
描述了粗糙集所包含的知识的不确定性。
定义3决策系统S中,决策属性D集相对于条件属性C集的条件熵:
[H(D|C)=-i=1nP(Xi)j=1mp(Yj|Xi)logp(Yj|Xi), 其中,p(Yj|Xi)=|Yj?Xi| /|Xi|, i=1,2,......,n, j=1,2,......,m]endprint
条件熵值越大,条件属性相对于决策属性的不确定程度越高,即根据C所进行的划分U/C,能确切划入U/D类的对象数越少[5-6]。
定义 2.4在决策表中,从C中删除属性r,条件信息的增量为:
[SGF(c,C,D)=H(D|C-{r})-H(D|C) ]
SFG(c,C,D)的值越大,说明在删除条件属性c后,所造成的不确定性越大,所以其重要性越大。
2 属性重要性对试卷分值的修正
教学质量测评中一个重要环节是对考试的测评,高质量的试卷直接反映出学生的学习情况和教师的教学水平,试卷上所包含的知识点量和分值是否合理性都是值得探讨问题的。
本文以最近一次程序设计实验课考试结果为例进行讨论。实验课成绩由上机考试和平时成绩综合得出。全班62人参加考试,试卷分为基本概念题、理解题和程序设计题三部分,分值各占卷面1/5、1/5、3/5。平时成绩由学生平时实验课上的表现和实验报告算出。考试成绩和平时成绩各占总评的40%和60%,四部分分数分别为8分、8分、24分和60分。
表1是学生成绩原始表,将表1中概念题、理解题、编程题的分数按照它们的分值转换成百分制得到表2,再按照学校相关规定将成绩划分5个等级:优(90-100分)、良(80-89分)、中(70-79分)、合格(60-69分)和不合格(0-59分),分别用1、2、3、4和5表示。由此得成绩决策表表3。
对属性重要性作归一化处理,再乘以100作为该题的分值。属性重要性的计算结果表明平时成绩对成绩等级的划分贡献最大,平时成绩真实、全面反映了学生实验课程的学习情况,分值应该最大,应分配45分左右;而编程题可考查学生的程序设计动手能力,分值应该适当增加到30分左右;基本概念可在理论考试中检查,分值不用增加;理解题是考查学生对概念的理解程度,这也有助于灵活运用所学知识设计程序,所以分值增到20分左右是合理的。在期末考试中,可以考虑适当修改考题分值。
3 总结
试卷质量的高低直接影响对该课程的教学考核,通过对试卷、成绩数据的挖掘,使试卷从内容到分值更趋于合理,提高了试卷的命题质量。高质量的试卷能全面、真实反映学生的学习状况,院系能更好掌控学生后续课程的教学节奏,有效开展教学工作。学生能更清楚了解自己的优势与不足,扬长避短,提高学习成绩。教师也能发现教学中存在的问题,在今后的教学工作中加以改进。
参考文献:
[1] Pawlak Z.Rough Sets[J].Communications of ACM,1995,38(11):89-95.
[2] 史忠植.知识发现[M].北京:清华大学出版社,2002.
[3] 胡寿松,何亚群[M].北京:北京航空航天大学出版社,2006.
[4] 李明,黄文涛,刘智云.关于决策表约简的CEBARKNC算法改进[J].计算机应用,2006,26(4):864-866.
[5] 吴尚智,苟平章.粗糙集和信息熵的属性约简算法及其应用[J].计算机工程,2011,37(7):57-59,61.
[6] 陈媛,杨栋.基于信息熵的属性约简算法及应用[J].重庆理工大学学报:自然科学版, 2013,27(1):42,46.endprint
条件熵值越大,条件属性相对于决策属性的不确定程度越高,即根据C所进行的划分U/C,能确切划入U/D类的对象数越少[5-6]。
定义 2.4在决策表中,从C中删除属性r,条件信息的增量为:
[SGF(c,C,D)=H(D|C-{r})-H(D|C) ]
SFG(c,C,D)的值越大,说明在删除条件属性c后,所造成的不确定性越大,所以其重要性越大。
2 属性重要性对试卷分值的修正
教学质量测评中一个重要环节是对考试的测评,高质量的试卷直接反映出学生的学习情况和教师的教学水平,试卷上所包含的知识点量和分值是否合理性都是值得探讨问题的。
本文以最近一次程序设计实验课考试结果为例进行讨论。实验课成绩由上机考试和平时成绩综合得出。全班62人参加考试,试卷分为基本概念题、理解题和程序设计题三部分,分值各占卷面1/5、1/5、3/5。平时成绩由学生平时实验课上的表现和实验报告算出。考试成绩和平时成绩各占总评的40%和60%,四部分分数分别为8分、8分、24分和60分。
表1是学生成绩原始表,将表1中概念题、理解题、编程题的分数按照它们的分值转换成百分制得到表2,再按照学校相关规定将成绩划分5个等级:优(90-100分)、良(80-89分)、中(70-79分)、合格(60-69分)和不合格(0-59分),分别用1、2、3、4和5表示。由此得成绩决策表表3。
对属性重要性作归一化处理,再乘以100作为该题的分值。属性重要性的计算结果表明平时成绩对成绩等级的划分贡献最大,平时成绩真实、全面反映了学生实验课程的学习情况,分值应该最大,应分配45分左右;而编程题可考查学生的程序设计动手能力,分值应该适当增加到30分左右;基本概念可在理论考试中检查,分值不用增加;理解题是考查学生对概念的理解程度,这也有助于灵活运用所学知识设计程序,所以分值增到20分左右是合理的。在期末考试中,可以考虑适当修改考题分值。
3 总结
试卷质量的高低直接影响对该课程的教学考核,通过对试卷、成绩数据的挖掘,使试卷从内容到分值更趋于合理,提高了试卷的命题质量。高质量的试卷能全面、真实反映学生的学习状况,院系能更好掌控学生后续课程的教学节奏,有效开展教学工作。学生能更清楚了解自己的优势与不足,扬长避短,提高学习成绩。教师也能发现教学中存在的问题,在今后的教学工作中加以改进。
参考文献:
[1] Pawlak Z.Rough Sets[J].Communications of ACM,1995,38(11):89-95.
[2] 史忠植.知识发现[M].北京:清华大学出版社,2002.
[3] 胡寿松,何亚群[M].北京:北京航空航天大学出版社,2006.
[4] 李明,黄文涛,刘智云.关于决策表约简的CEBARKNC算法改进[J].计算机应用,2006,26(4):864-866.
[5] 吴尚智,苟平章.粗糙集和信息熵的属性约简算法及其应用[J].计算机工程,2011,37(7):57-59,61.
[6] 陈媛,杨栋.基于信息熵的属性约简算法及应用[J].重庆理工大学学报:自然科学版, 2013,27(1):42,46.endprint
条件熵值越大,条件属性相对于决策属性的不确定程度越高,即根据C所进行的划分U/C,能确切划入U/D类的对象数越少[5-6]。
定义 2.4在决策表中,从C中删除属性r,条件信息的增量为:
[SGF(c,C,D)=H(D|C-{r})-H(D|C) ]
SFG(c,C,D)的值越大,说明在删除条件属性c后,所造成的不确定性越大,所以其重要性越大。
2 属性重要性对试卷分值的修正
教学质量测评中一个重要环节是对考试的测评,高质量的试卷直接反映出学生的学习情况和教师的教学水平,试卷上所包含的知识点量和分值是否合理性都是值得探讨问题的。
本文以最近一次程序设计实验课考试结果为例进行讨论。实验课成绩由上机考试和平时成绩综合得出。全班62人参加考试,试卷分为基本概念题、理解题和程序设计题三部分,分值各占卷面1/5、1/5、3/5。平时成绩由学生平时实验课上的表现和实验报告算出。考试成绩和平时成绩各占总评的40%和60%,四部分分数分别为8分、8分、24分和60分。
表1是学生成绩原始表,将表1中概念题、理解题、编程题的分数按照它们的分值转换成百分制得到表2,再按照学校相关规定将成绩划分5个等级:优(90-100分)、良(80-89分)、中(70-79分)、合格(60-69分)和不合格(0-59分),分别用1、2、3、4和5表示。由此得成绩决策表表3。
对属性重要性作归一化处理,再乘以100作为该题的分值。属性重要性的计算结果表明平时成绩对成绩等级的划分贡献最大,平时成绩真实、全面反映了学生实验课程的学习情况,分值应该最大,应分配45分左右;而编程题可考查学生的程序设计动手能力,分值应该适当增加到30分左右;基本概念可在理论考试中检查,分值不用增加;理解题是考查学生对概念的理解程度,这也有助于灵活运用所学知识设计程序,所以分值增到20分左右是合理的。在期末考试中,可以考虑适当修改考题分值。
3 总结
试卷质量的高低直接影响对该课程的教学考核,通过对试卷、成绩数据的挖掘,使试卷从内容到分值更趋于合理,提高了试卷的命题质量。高质量的试卷能全面、真实反映学生的学习状况,院系能更好掌控学生后续课程的教学节奏,有效开展教学工作。学生能更清楚了解自己的优势与不足,扬长避短,提高学习成绩。教师也能发现教学中存在的问题,在今后的教学工作中加以改进。
参考文献:
[1] Pawlak Z.Rough Sets[J].Communications of ACM,1995,38(11):89-95.
[2] 史忠植.知识发现[M].北京:清华大学出版社,2002.
[3] 胡寿松,何亚群[M].北京:北京航空航天大学出版社,2006.
[4] 李明,黄文涛,刘智云.关于决策表约简的CEBARKNC算法改进[J].计算机应用,2006,26(4):864-866.
[5] 吴尚智,苟平章.粗糙集和信息熵的属性约简算法及其应用[J].计算机工程,2011,37(7):57-59,61.
[6] 陈媛,杨栋.基于信息熵的属性约简算法及应用[J].重庆理工大学学报:自然科学版, 2013,27(1):42,46.endprint