蔡佳
(陕西国际商贸学院 基础课部, 咸阳 712046)
大学英语考试作为英语教育的重要环节,目前主要参考《大学英语四级考试大纲》。以对学生英语能力完成准确客观的测量为目的,促进大学英语教学水平的提高。大学英语考试面向全校学生,是一项大规模标准化考试,为确保考试成绩的参考价值,需保证试卷整体质量,需根据教育测量理论的试卷质量的要求完成设计。传统组卷算法已无法与教育信息化的需求相匹配。优化智能组卷方法是大学考试实现自动化的重点[1]。
完成智能组卷的重点在于构建满足实际需求的组卷模型,应用高效优质的组卷算法。智能组卷以人工智能为技术支撑,通过计算机程序从试题库中自动选择试题,根据要求组合试卷,考试系统的核心目标之一是实现智能化操作,是计算机辅助教学的优势所在。效率和质量作为智能组卷的两个重要评价指标,其实现与否主要取决于组卷算法。设计的算法要全局寻优,能够做到快速从题库中抽取一组满足考试要求的试题,涉及到快速收敛问题。本文对大学英语考试智能组卷问题的研究正是基于差分进化算法,支持软件系统的开发与优化。提出了一种优化组卷问题的数学模型,满足大学英语考试中的精确组卷需求。将差分进化算法应用于该数学模型中,给出一种新型智能组卷算法。
差分进化算法(DE)以群体智能为基础,是一种随机并行的优化算法,遵循达尔文的进化原则,即“适者生存、优胜劣汰”。差别进化算法具有独特的记忆能力,可以对当前的搜索情况实现动态跟踪,完成自适应寻优,根据实际需要自动调整搜索策略,具有较强的全局收敛性和鲁棒性,能够突破常规数学规划方法的限制,完成复杂环境中的优化问题的求解,在试题库智能组卷方面有极大的优势。
通过对问题中变量间的关系进行分辨、联系,把实际问题转化为数学模型,并运用计算机完成求解,从而实现智能组卷的过程,数学模型决定了组卷质量。所以做好智能组卷的基础工作首先是建立数学模型[2]。
应用计算机技术,按照一定的教育测量理论规定,组成某种学科题目的集合称之为题库。智能组卷系统的试题都来自题库,题库中题目的质量起到决定性作用,根据经典测量理论(CTT)的题目量化指标,对影响试卷质量的指标进行分类归纳,包括:可信度反映考试结果的稳定程度,程度高表明考生分数可排除偶然性因素的影响,使考生实际水平能够真实的测量出来。可信度的影响因素包括试题数量及难度、题目用语准确性等;有效度反映实际的考试结果同预期考试目标匹配的程度。有效度高的试卷,能够准确地测试出考生知识掌握的程度。在考试目标明确的前提下,提高试卷有效度需保证试题与课程标准一致;试题难度以试卷能否有效考查出学生的知识和能力水平为依据(分数在中等难度呈正态分布,较高难度呈负偏态分布,较低难度呈正偏态分布),因为试题难度值的确认需在考试成绩公布后统计得到,组卷时需比较准确的估计试题难度;试卷区分度实现鉴别不同层次考生能力的目标。试卷区分度高能有效区分不同知识水平及不同能力的学生,区分度和难度关系密切,好的区分度离不开合适的难度[3]。
2.2.1 构建矩阵模型
结合英语考试实际情况,依据组织一份试卷时的考虑因素(如确定满分值、知识点分布、数量、试题难度及考查的能力层次等指标),本文构建的智能组卷数学模型由 9 项核心属性,将一份试卷的参数指标分解成一个9 维空间向量,一道试题由 9 个参数指标(指试题编号,分值,答题时间,知识点,题型,难度系数,区分度,能力层次,使用频率)决定,由9维向量空间 (a1,a2,…,a8,a9)的特征决定。(n×9)的矩阵如下式所示,其中n表示试题数。
2.2.2 矩阵参数指标
1)试题编号作为试题的唯一标识,由(a11,a21,…,an1)表示,对计算机处理极为重要。
4)大学英语教学的能力层次根据《大学英语课程教学要求》主要分为三个(即一般要求、较高要求、更高要求)[4],各能力层次对应相应的编码(如第i道试题的能力层次编码由ai4表示),应根据指定的能力层次要求,完成试题的选择。
9)使用频率。第i题单位时间内(可以是年或学期)使用的次数用ai9表示,使用频率较高,则学生易于考过该题,从而影响对考生能力的真实测评,组卷时要充分考察使用频率,替换使用频率较高的试题[5]。
差分进化算法作为一种进化算法,是以实数编码为基础的,本文的数学模型的构建主要围绕变异、交叉和选择这三种操,其与遗传算法的最大区别在于变异操作上,差分进化算法中的变异操作是以染色体的差异向量为基础进行的,其余操作则和遗传算法基本相同[6]。
变异操作主要通过差分方式实现,是差分进化算法的重要操作。方法是随机从当前种群中选取两个相异个体,缩放其差向量,然后通过与其他待变异个体的向量运算,进而生成新的个体。
由上式可知,变异操作实际是将两个不同父代个体的差值加权后,再加到第三父代个体,然后得到一个新个体。差分化算法具极好的几何意义。
在多重约束条件下,组卷问题实质是求最优解问题,满足条件的最优解不止一个。计算机智能组卷依据数学模型进行软件开发。差分进化算法在大学英语考试智能组卷中应用的流程,如图1所示。
图1 智能组卷程序流程图
a.初始化组卷参数,包括组卷算法数学模型的参数(包括等难度系数、知识点、题型、区分度、答题时间、使用频率,能力层次等)和差分进化算法参数(包括种群的大小、最大迭代次数、变异算子、交叉算子等)。
d.计算个体适应度值。适应度通过数值表示,用来评估相对于整个群体,个体向量质量的指标。计算适应度数值需要适应度函数(评价函数)。DE算法的适应度函数可随意设定区域,不需要连续可微的限制,适应度函数取非负值,可提高适应性能好的个体被选择的机率,使设计尽可能简便化,降低计算的复杂度。
e.判断是否满足算法终止条件。最大进化代数作为算法的终止条件,还需其他判定准则。通常情况下,程序终止发生在目标函数值小于阈值(阈值常选为10)时;或者经判断发现,连续若干代种群中的最优值都没发生显变化,程序终止。
f.差分进化操作。依据算法模型进行变异、交叉、选择操作。
通过利用不同规模的真题库,进行算法的模拟检测。检测结果表明,同基本遗传算法相比,在组卷成功率与质量方面,该算法具备更优的性能。
大学英语考试实现自动化的重点工作就是智能组卷,保证智能组卷最大程度的与考试需求相匹配,使随机智能组卷过程科学合理。在基于差分进化算法的智能组卷过程中,探索最优解用变异算子来实现,局部开发通过交叉算子实现,利用选择策略保优,使种群完成最优进化。相比其他算法,BE算法高效稳定,具有鲁棒性强、原理简单、收敛性好、受控参数少等特点。根据大学英语教学和考试的需求,可快速构建智能组卷系统。但同时也需进一步完善优化,DE算法缺少相关理论基础的支撑,为了进一步提高智能组卷系统的科学性合理性,需对DE算法进行扩展,同时注意有效融合其他算法,将是未来智能组卷算法的研究方向。