基于模糊聚类分析的试题分类方法研究

2017-11-21 20:49张伟向明霞李东
科技视界 2017年21期
关键词:题库试题聚类

张伟 向明霞 李东

【摘 要】随着计算机网络技术的不断发展,无纸化测试在职业资格鉴定的使用日趋广泛,如何对试题题目进行分类以保证试卷的科学性成为题库建设面临的新问题。本文使用基于模糊聚类分析的方法,通过分析题目的难度、解题步骤等多项要素特征,实现对试题题目的分类。

【关键词】试题分类;模糊聚类

电子题库易于管理、保密性高等特点使得无纸化测试逐渐取代了传统的纸质测试。试题分类是建立电子题库的重要环节。试题分类是否科学对于试题的选取效率、试题的组卷质量以及考试的公平性都有重要影响。传统的题库根据试题题目内容所属的知识点进行分类,这种方法忽略了对题目难度以及试题结构的考量,难以保证生成试卷的科学性以及考试的公平性。

本文针对试题题目的难度系数、解题步骤、知识点以及考生对该知识点的掌握程度四个因素进行综合考量,通过确定特征集、计算相关矩阵、构建聚类图等四个步骤完成了对试题题目的分类。

1 基于模糊聚类分析的试题分类方法

模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观事物进行聚类的分析方法[1]。模糊聚类分析包括:确定要分析的数据样本集、确定要分析数据的n个特征、构建每个数据的模糊原始数据矩阵、构建数据间的关系矩阵、构建等价矩阵、限定。

1.1 确定因素集

知识点及对知识点的要求掌握程度是决定试题题目难度的两个要素,考试大纲是出题的基本依据,参照计算机二级C语言考试大纲,我们得出考试大纲考察考生对各个知识点不同层次的掌握,包括了解、理解、熟练运用三个层次,因此我们将知识点掌握层次用分为三类了解、理解、熟练运用。题目的解题技巧也是反映试题难度的重要要素,本文将题目的解题步数作为对题目進行分类的一个参照要素。单个题目失分率从以往测试该题目的答题样本中依据难度系数计算理论CTT[5]计算获得,是反映试题难度的重要因素,本文也将其作为对试题题目进行分类的一个参照要素。综上所述,本文总共将知识点、知识点掌握程度、解题步数、失分率四个因素作为对试题题目进行聚类分析的因素集A(A1,A2,A3,A4),其中A1(1,2,3…n)为n个知识点,A2(1,2,3)为对知识点掌握的三个层次,A3(1,2,3…i)为解题的i个步骤,A4(a)a为失分率。

1.3 试题集分类与聚类图

通过多个截级矩阵构建聚类图,如图1所示:

2 案例分析

2.1 收集原始数据

通过前期准备,我们收集到一个题目数量为30的试题集,以及一组对该试题集的答题记录数据。由于篇幅所限,这里展示部分原始数据,如表1所示:

2.2 模糊聚类分析

通过计算格贴近度计算关系矩阵,如表2所示:

2.3 设定截级并分类

我们将两组数据间的关系强弱通过截级Rλ的大小来划分,通过设定截级的大小,来确定数据间关系的强弱,并通过关系的强弱对数据进行分类。

通过设置不同的截集值,画聚类图,如图2所示:

3 结语

试题的分类是建立题库系统的重要环节,试题能否科学分类是决定试卷能否公平组卷的必然条件。随着我国经济的快速发展,市场对工人技能水平的职业化要求不断提高,面向不同工种的职业化鉴定题库不断建立,如何确保建立题库的科学性以及考试的公平性是目前面临的新问题。本文针对传统试题分类考虑因素过少,难以实现不同试卷的难度相近这一问题,基于模糊聚类分析方法,通过综合考量试题题目的失分率、解题步骤、所属知识点以及考试大纲要求考生对该知识点的掌握程度四个因素,对试题进行分类,有效的解决了这一难题。

【参考文献】

[1]杨纶标,高英仪.模糊数学原理及应用(第四版)[M].广州:华南理工大学出版社,2005.

[2]宗阳,郑勤华,张玄,伊燕平.学习分析视角下MOCC形成性测试难度系数[J].远程教育杂志.2016.5.

[3]陈友玲,任晓杰.大规模定制环境下基于工序难度系数的工时估算[J].计算机集成制造系统.2014,2.

[4]林雪明.试题难度系数确定数学模型的建立与实现.杭州应用工程技术学院学报,2001.3.

[5]郭敏兰,兰雨晴,金茂忠.一种海量题库难度系数和区分度动态优化模型.计算机工程应用,2007.7.

[6]艾小伟,王有远.基于统计学习的试题难度系数修正算法.计算机工程应用,2008.12.endprint

猜你喜欢
题库试题聚类
2021年高考数学模拟试题(四)
“勾股定理”优题库
“轴对称”优题库
“轴对称”优题库
“整式的乘法与因式分解”优题库
2019年高考数学模拟试题(五)
《陈涉世家》初三复习试题
2019届高考数学模拟试题(二)
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像