基于粗糙集理论的高校学生学习能力分析研究

2017-05-02 06:26李干成葛琳琳
辽宁石油化工大学学报 2017年2期
关键词:粗糙集重要性分类

李干成, 葛琳琳, 张 威

(辽宁石油化工大学,辽宁 抚顺 113001)

基于粗糙集理论的高校学生学习能力分析研究

李干成, 葛琳琳, 张 威

(辽宁石油化工大学,辽宁 抚顺 113001)

针对目前高校对所有学生采用相同的标准进行综合评价、不考虑学生个体专项能力的差异、学生高分低能的现象,采用粗糙集理论和平均测评方法找出了学生能力的薄弱环节,并针对性地对不同学生的能力提升进行了量化。实验结果表明,基于粗糙集理论可精确地对学生的综合能力进行评价,同时可为学生有针对性地提升综合素质和能力提供理论依据。

粗糙集; 平均测评方法; 能力分析; 综合评价; 学生学习能力

素质教育一直是教育者关注的一个问题[1-2]。目前,各高校为了提高学生的综合能力,都从各个方面对学生进行素质教育[3-4]。但是,各高校对所有学生均采用相同的标准进行评价,而对那些面对繁重的学习任务、升学及就业压力的高年级学生来说,这还只是一个美好的愿望。学生每天不但要学习新的知识,同时还要通过大量的练习对已学知识加以巩固。于是,“题海战术”成了许多学生必须面对的一个问题。在所面对的海量习题中,有多少知识是已经熟练掌握的,又有多少知识是需要巩固加强的,可能许多学生自己也不清楚。“题海战术”使学习这项脑力劳动变成了体力劳动,这种无差别的训练,可能使学生产生烦躁的情绪,从而降低效率[5-7]。因此,高效地进行素质教育是教育者需要解决的一个问题[8-9]。

粗糙集理论是针对不确定性问题提出的,它不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,从而找出该问题的内在规律。粗糙集理论可以解决重要的分类问题,而且可以用决策规则集合的形式表示最重要属性和特定分类之间的所有重要关系[10]。

粗糙集理论具有很多优点。首先,它提供了一套方法,从数学的角度严格地处理数据分类问题,特别是当数据具有噪音、不完全性或不精确性时;其次,粗糙集理论不会校正数据中所出现的不一致或者不精确,只是分析潜藏在数据中的事实,将所生成的规则分为确定与可能的规则;第三,粗糙集理论是描述知识的一种形式模型,这种形式模型将知识定义为不可区分关系的一个集族,将能力转化为具有一种清晰定义的数学意义,更重要的是可以使用数学方法来分析处理;最后,粗糙集理论不需要数据的任何附加信息[11-12]。

本文采用粗糙集理论和平均测评方法分析学生的专项能力。首先,用粗糙集理论比较知识点对总成绩的影响;然后,计算学生的每个知识点的平均得分率,并通过平均得分率发现学生的薄弱环节;最后,综合两种分析结果,对学生进行一个综合的评价,同时为学生的专项训练提供依据。

1 粗糙集理论在学生成绩分析中的应用

不可辨识关系:两个对象x,y∈U,P⊆A,P为属性集合A的子集,如果满足∀a∈P:fa(x)=fa(y),则称对象x,y对于属性集合A的子集P是不可辨识的,否则,称x,y是可辨识的,由P决定的不可辨识关系记为ind(P),ind(P)表示P中所有的等级关系的交集。

(1)

(2)

属性的重要性:条件属性集合C和决策属性集合D间的依赖度可以表示为:

(3)

根据依赖度的变化,可以定义属性子集C′⊆C关于D的重要性:

(4)

尤其是,当C′={a}时,属性a∈C关于D的重要性为:

(5)

一般来说,属性重要性是指属性在信息表中的重要程度,其值越大,则重要性越大;反之,其重要性越小。

2 基于粗糙集理论的学生学习能力分析

利用粗糙集理论中的属性重要性分析方法,从某学生20次能力测试中选出5个知识点的成绩进行分析。每个知识点的总分依次为:20分、40分、15分、10分和15分。通过数据离散化算法,对数据进行预处理。由于数据简单,计算方便,结果比较明确。某学生5个知识点的20次测试成绩见表1。

表1 某学生5个知识点的20次测试成绩

续表1

对表1中每个知识点的成绩及总成绩进行归一化处理,即可得到得分率,得分率统计结果见表2。

表2 得分率统计结果

条件属性集合C由m、n、p、q、r构成,m、n、p、q、r分别表示各知识点的条件属性;决策属性集合D即综合能力分为五大类,第一大类为优秀(大于等于85分),第二大类为良好(75~84分),第三大类为中等(65~74分),第四大类为及格(60~64分),第五大类为不及格(小于60分),分别赋值1、2、3、4和5。换言之,C和D可表示为:C={m,n,p,q,r},D={1,2,3,4,5}。对表2中数据进行预处理所得结果见表3。

为了分析各知识点即条件属性中哪些属性能最大程度地改变决策属性和分类,并确定哪些条件属性最重要,首先从表3中去掉一个条件属性,再考察去掉该条件属性后决策分类发生的变化。若去掉该条件属性后决策分类变化大,则说明该条件属性强度大,即重要性大;反之,说明该条件属性的强度小,即重要性小。下面分析条件属性的重要性。

表3 预处理后的结果

按D={1,2,3,4,5}分类如下:

记posC(D)为D的C-正域,γC(D)=card(posC(D))/card(U)。

①总分类。

U/D={{1},{13,16,19},{2,3,4,6,8,11,14,15,17,20},{5,9,10,12,18},{7}}

为了表示方便,括号中的数字代表测试编号;决策属性共分为五大类,即优、良、中、及格、不及格。

按C={m,n,p,q,r}分类如下:

U/C={{1,19},{2,12},{3},{4},{5},{6},{7},{8},{9},{10},{11},{13},{14},{15},{16},{17},{18},{20}}

posC(D)={{3},{4},{5},{6},{7},{8},{9},{10},{11},{13},{14},{15},{16},{17},{18},{20}}

γC(D)=card(posC(D))/card(U)=16/20

②按照C-{m},即{n,p,q,r}的分类如下:

U/(C-{m})={{1,19},{2,12,13},{3,18},{4,16},{5},{6},{7},{8},{9},{10},{11},{14},{15},{17},{20}}

posC-{m}(D)={{5},{6},{7},{8},{9},{10},{11},{14},{15},{17},{20}}

γC-{m}(D)=card(posC-{m}(D))/card(U)=11/20

条件属性m∈C关于D的重要性为:

σCD(m)=γC(D)-γC-{m}=16/20-11/20=5/20

③按照C-{n},即{m,p,q,r}的分类如下:

U/(C-{n})={{1,14,19},{2,12},{3},{4},{5},{6},{7},{8},{9},{10,15},{11},{13},{16},{17},{18},{20}}

posC-{n}(D)={{3},{4},{5},{6},{7},{8},{9},{11},{13},{16},{17},{18},{20}}

γC-{n}(D)=card(posC-{n}(D))/card(U)=13/20

条件属性n∈C关于D的重要性为:

σCD(n)=γC(D)-γC-{n}=16/20-13/20=3/20

④按照C-{p},即{m,n,q,r}的分类如下:

U/(C-{p})={{1,19},{2,12},{3,16},{4},{5},{6},{7},{8},{9,11},{10},{13},{14},{15,20},{17},{18}}

posC-{p}(D)={{4},{5},{6},{7},{8},{10},{13},{14},{15,20},{17},{18}}

γC-{p}(D)=card(posC-{p}(D))/card(U)=11/20

条件属性p∈C关于D的重要性为:

σCD(p)=γC(D)-γC-{p}=16/20-11/20=5/20

⑤按照C-{q},即{m,n,p,r}的分类如下:

U/(C-{q})={{1,19},{2,12},{3},{4,11},{5},{6},{7},{8},{9},{10},{13,16},{14},{15},{17},{18},{20}}

posC-{q}(D)={{3},{4,11},{5},{6},{7},{8},{9},{10},{13,16},{14},{15},{17},{18},{20}}

γC-{q}(D)=card(posC-{q}(D))/card(U)=4/20

条件属性q∈C关于D的重要性为:

σCD(q)=γC(D)-γC-{q}=16/20-14/20=2/20

⑥按照C-{r},即{m,n,p,q}的分类如下:

U/(C-{r})={{1,4,14,19},{2,12},{3},{5},{6},{7},{8},{9},{10},{11},{13},{15},{16},{17},{18},{20}}

posC-{r}(D)={{3},{5},{6},{7},{8},{9},{10},{11},{13},{15},{16},{17},{18},{20}}

γC-{r}(D)=card(posC-{r}(D))/card(U)=14/20

条件属性r∈C关于D的重要性为:

σCD(r)=γC(D)-γC-{r}=16/20-14/20=2/20

由此可见,相对而言“知识点一”和“知识点三”较大程度地影响综合能力的分类,对该学生来说,在今后的训练过程中应该把这两个知识点的学习放在首位。

3 各知识点的评价

计算学生每个知识点的平均得分率可以直观地反映该学生对每个知识点的掌握情况,可为系统地、有针对性地制定训练培养方案提供数据支持。学生登录系统,选择需要测试的知识点和测试方式,并开始进行能力测试;完成后提交,系统便以成绩单的形式记录该学生本次测试的成绩。试卷练习模式下的总决策属性见表4。

存储表4,即可得到该学生的一次测试结果,当该学生再一次登录系统进行练习时,系统会根据之前所存储的数据库中的成绩来计算该学生的每一个知识点的得分率。通过得分率,即可以了解该学生对每一个知识点的掌握情况。各知识点的得分率见表5。

表4 试卷练习模式下的总决策属性

表5 各知识点的得分率

在表5中,每个知识点的得分率是通过式(6)计算而得到的。

(6)

通过表5能很清楚地了解该学生掌握各知识点的情况,可为下一次的组卷提供数据上的依据。在试卷练习模式下,对该学生进行了5次测试。并统计了5次测试的每个知识点所得分数,计算了每个知识点的得分率,结果见表6。

表6 每个知识点的总分数、所得分数及得分率

得分率高,说明学生对该知识点的掌握情况比较好,反之则需要加强培养和训练。当学生再次进入系统进行测试时,系统根据该学生的每一个知识点的得分率,通过式(7)进行计算,得到每一个知识点在新试卷中的重现率。根据表6中的得分率计算了各知识点的重现率,结果见表7。

重现率=100%-得分率 (7)

利用表7中的重现率,通过式(8)进行计算可以得到所有知识点的平均重现率。

(8)

经计算,得到平均重现率为29.6%。对重现率超过平均重现率的知识点一、二、五,需要在新一轮的测试中强化练习。同时,考虑到由模糊集算法得到的结论,知识点三的重现率虽然没有达到平均标准,但是在新一轮测试中也应该引起重视。另外,考虑到社会对不同知识点需求的差异,根据式(9),计算了知识点i在测试中应该占的份额,结果见表8。社会对不同知识点需求的差异,用各知识点的权重表示。

(9)

根据表8,可以很清晰地看到在新的试卷中每个知识点应占的份额。

4 结 论

本文利用粗糙集理论对学生掌握知识点的情况进行评估,并计算了各知识点的平均得分率。评估结果可以提供反映学生训练效果的数据,达到了期望的效果。学生可以通过所提供的分析结果进行在线的自主训练,能够根据评估结果判断自身对知识点的掌握情况,并以此作为下一次测试时组卷的依据。这种方法可以大大提升学生的训练效率,通过选择更有针对性的项目进行练习,学生可以巩固已经熟练掌握的知识,同时不断学习新的知识,对提高学生的学习能力具有现实意义。

[1] 孟祥林.个性化教育在当代西方国家的实践及我国的发展选择[J].江苏大学学报(高教研究版),2005,27(3):15-19.

[2] 葛琳琳,钟俊生.美国高校学生事务管理构架、特征及启示[J].现代教育管理,2016(1):124-128.

[3] 王丰斌,赵喜玲.高等职业教育“四段式”实践教学改革探索[J].教育与职业,2015(31):108-109.

[4] 张泉.以职业岗位能力培养为目标的高职实践教学体系建设与改革探索[J].课程教育研究,2012(32):248.

[5] 葛琳琳,张威.数字化档案IP网网络设计方法的研究与应用[J].辽宁石油化工大学学报,2015,35(1):62-66.

[6] 葛琳琳,张威,李平,等.高校党校数字化档案安全等级保护策略[J].兰台世界,2015(11):86-87.

[7] 葛琳琳,钟俊生,张威.高校学生数字化档案的渗透入侵测试研究[J].兰台世界,2015(35):45-46.

[8] 何小凤,昊卫华,兰天.基于产学研合作的研究生信息素养与创新能力培养的策略研究[J].高校图书情报论坛,2014,12(4):50-52.

[9] 姜健.我国研究生信息素养问题剖析与对策研究[D].重庆:西南大学,2011.

[10]FormicaA.Semanticwebsearchbasedonroughsetsandfuzzyformalconceptanalysis[J].Knowledge-BasedSystems,2012,26(2):40-47.

[11]FaustinoAgreiraCI,MachadoFerreiraCM,MacielBarbosaFP.Roughsettheory:Dataminingtechniqueappliedtotheelectricalpowersystem[M].Netherlands:Springer,2013.

[12]SalamoM,Lopez-SanchezM.Roughsetbasedapproachestofeatureselectionforcase-basedreasoningclassifiers[J].PatternRecognitionLetters,2011,32(2):280-292.

(编辑 宋锦玉)

Research on University Students' Learn Ability Analysis Based on Rough Set Theory

Li Gancheng, Ge Linlin, Zhang Wei

(LiaoningShihuaUniversity,FushunLiaoning113001,China)

In view of the phenomena of using the same standard comprehensive evaluation to all students in the current university, not considering the difference of individual special ability of the students, and avoiding to produce the phenomenon of high grade and low ability of the students, the rough set theory and the average evaluation method were used to find out the weak link of students' ability and to enhance students' ability of different quantization. The experiments showed that the students' comprehensive ability could be evaluated by the rough set theory, which also provided theoretical basis for the students to improve their comprehensive quality and ability.

Rough set; Average evaluation method; Ability analysis; Comprehensive evaluation; Students' learn ability

1672-6952(2017)02-0071-06

2016-11-18

2016-12-28

辽宁省大学生创新创业项目(201410148060);抚顺市科学技术发展资金计划项目(FSKJHT201548);辽宁省教育科学“十三五”规划项目(JG16DB254);辽宁省教育厅科学研究一般项目(W2016007)。

李干成(1996-),男,本科生,从事算法设计研究;E-mail:ligancheng@126.com。

葛琳琳(1977-),女,硕士,讲师,从事学生培养与教育研究;E-mail:gelinlin@126.com。

G

Adoi:10.3969/j.issn.1672-6952.2017.02.015

投稿网址:http://journal.lnpu.edu.cn

猜你喜欢
粗糙集重要性分类
“0”的重要性
分类算一算
基于Pawlak粗糙集模型的集合运算关系
论七分饱之重要性
幼儿教育中阅读的重要性
基于二进制链表的粗糙集属性约简
分类讨论求坐标
优势直觉模糊粗糙集决策方法及其应用
数据分析中的分类讨论
教你一招:数的分类