于建芳++徐振国++刘剑
摘 要 首先介绍计算机自适应测试的国内外研究现状,然后简要介绍自适应测试的理论基础,最后结合目前计算机自适应测试系统的不足,总结其未来的发展趋势。
关键词 计算机;自适应测试;项目反应理论
中图分类号:TP315 文献标识码:B
文章编号:1671-489X(2015)06-0028-02
1 国内外研究现状
在自适应测试领域,国内外都进行了许多研究。国内影响力较大的有北京师范大学的余胜泉教授对自适应测试系统进行了探索,归纳了自适应测试系统的特点。他提出了适应性学习模式,包括三个关键环节:学习诊断、动态地组织学习内容以及学习策略。并且研究了系统中各模块的功能。
首都师范大学的研究者王陆教授主持的个性化学习支持系统和游戏化虚拟学习社区都是自适应测试系统在辅助教学方面的实践,为网络学习提供了一个很好的平台,主要研究了学生的学习风格和性格对学习的影响。他研制了面向小学课程学习的个性化课件生成系统,该系统能够实现教学策略的个性化、创造力、教学活动序列的多样化以及科学地对学生进行分类。
华南师范大学的陈品德博士等人提出了体现自适应特征的学习支持系统结构模型,提出应从两个方面来考虑,即适应性的内容呈现和适应性的导航支持,并基于这两方面,开发了支持自适应学习的环境。
浙江大学教育学院、教育技术研究所张剑平教授在适应性学习支持系统方面也颇有研究,曾申请了国家社会科学基金教育学课题项目“远程学习机制及其在适应性学习支持系统中的应用”,完成该项目的同时,还发表了许多相关研究成果。
从近十年国内有关自适应测试系统的研究论文的研究内容来看,国内对于自适应测试系统的研究主要集中在四大方面:自适应测试系统的整体性建模;系统各个组件的研究;先进技术与自适应测试系统的结合;自适应测试系统的比较研究。但国内自适应测试系统的产品还有待于开发,多数还是集中在理论研究。
国外针对自适应测试系统进行的研究与实践的案例比比皆是。较早开展适应性测试系统这方面研究的国家是美国,美国匹兹堡大学的研究者等研究者早在20世纪90年代末期就建立了一个专门的自适应超文本与超媒体网站,这是世界上第一个验证自适应效果的自适应教学系统。此外,世界上其他一些国家也做了很多自适应的研究,如德国、英国、澳大利亚、加拿大、奥地利等国家也一直在追踪自适应的研究。在理论层面,取得较丰富成果的方面有适应性学习的概念、特点、模式、关键因素、适应性测试系统结构等,在技术层面能提供个性化服务的自适应测试系统也如雨后春笋般涌出。
德国学者格哈德主持研究的自适应项目,是一个基于网络的关于编程语言入门学习的自适应学习支持系统,这是一个智能可交互的网络教学系统,并且在德国特里尔大学的教学活动过程中取得很好的试验效果。美国密苏里大学的研究学者设计与开发了一个自适应智能代理系统,它是一个基于网络的、分散的、多代理的测试系统,能够自适应内容呈现以及自适应导航支持。
2 自适应测试的理论基础——项目反应理论
项目反应理论的基本假设及反应模型 项目反应理论(Item Response Theory,简称IRT)基于三个假设:能力单维性假设;局部独立性假设;项目特征曲线假设。IRT模型是一种数学模型,通常按照参数个数对模型进行分类,含有一个参数(难度)的为单参数模型,含有两个参数(难度和区分度)的为双参数模型,含有三个参数(难度、区分度和猜测系数)的为三参数模型,其中三参数模型是最复杂的。项目反应模型能够从概率的角度来解释被试者对题目的应答情况。
项目反应理论优点 与经典测量理论相比,项目反应理论具有的明显优点有:被试能力参数和项目参数具有不变性的特征,考生的能力值与所施测的项目无关,这是项目反应理论与经典测量理论最大的区别;被试能力参数与项目难度参数具有统一的量表;可以针对不同被试精确估计每个项目及测验的测量误差。在测试过程中,可以对能力水平不同的被试施测不同的测验题目,并且测验不受时间地点的限制,缩短测验长度,同时还提高了测验的精度。
参数估计方法 常用的参数估计的方法有近似技术、最小卡方估计技术、极大似然估计、贝叶斯估计、边际极大似然估计。其中,极大似然估计和贝叶斯估计是两种最常用的方法。
终止规则 终止规则分为两种:固定测验长度和不固定测验长度。固定测验长度是指当实测数目累加到预设值时即停止,如当实测数目为25时停止测验。不固定测验长度指的是当测验满足事先设定的标准误精度时终止测验。
3 自适应测试系统研究的不足
目前的自适应测试系统固然有诸多优点,但是同时也不可避免地存在一些不足,有待于完善的地方。
用户模型的构建不完善 用户模型构建是适应性测试系统建设过程的最重要部分之一,是保证实现自适应测试的前提和基础。但是当下许多自适应测试系统中的用户模型构建有待完善,有些系统只考虑了认知水平,忽略了学习风格;而有的系统则只考虑了学习风格,忽略了认识水平。用户模型设计时考虑的因素全面性不足。
针对性和智能性弱 不能根据学习者自身情况提供有针对性的、智能化的交互界面,不能根据学生的能力提供有针对性的指导,学生在测试系统中不能准确找到自身的定位。
缺乏对网络教育的实际性影响 大多数对于自适应测试系统的研究都是在论述如何将自适应的思想应用于网络教学,但对网络教育产生的真正意义上的影响不大。
缺乏灵活授导 自适应测试系统虽然属于人工智能领域的范畴,但它受既定“经验”的制约,缺乏对不同学习者的个性化指导,对不同的学习者几乎采用相同的指导方案,不能很好地实现因材施教。
轻视“学生为主”过程设计 自适应测试系统应该以学生为中心,但目前有的测试系统在师生角色上还是不够明确,有待于完善。
人机交互不足,缺乏沉浸式体验 目前多数自适应测试系统都缺乏沉浸式体验功能,学生不能切身体验到人机交互的感觉,这是因为被试者与系统以及被试者之间的相互交互不能动态适应,系统资源共享力度不够。
对学习者需求的研究和个性化学习方案的适应性不足 研究者更多的还是关注网络课程自身的建设,忽略了对学习者需求及其个性差异的研究。此外,现有的适应性测试系统在个性化学习方案的设计上适应性不够,这也会影响学习效果。
4 自适应测试系统研究的未来发展趋势
自适应测试系统的研究是近几年来教育技术领域的研究热点,通过对国内相关研究文献的统计和分析,总结出自适应测试系统的研究呈现如下发展趋势。
研究重点的转变 目前,自适应测试系统的研究重点已由整体的理论研究转向局部组件的设计。在未来,随着自适应测试系统及其组件产品的不断增多,研究重点将转变为自适应测试系统标准化问题的研究,标准化问题会对不同的自适应测试系统间的通信及数据交换产生直接影响。
关注模型的转变 在之前的研究中,学者多用现有的一些量表来推测学生的学习风格,从而构建学习风格模型。但在未来,仅仅单纯地研究学生模型是不够的,位置模型和设备模型的设计与开发也将是未来自适应测试系统的一个研究趋势。
适应焦点的转变 目前的测试系统自适应引擎组件主要是适应测试内容,在未来对测试情景的适应也将是一个重点。测试情境指的是自动感知被试者的地理位置、设备情况等。
涉及领域的转变 自适应测试系统研究最初只是简单地涉及到教育学和计算机科学,但随其研究和应用的不断深入,已经开始涉及一些高级计算机科学,如数据挖掘技术和语义网络技术。而且自适应测试绝不会止步于此,在未来,必将有更多的计算机最新成果会被不断地应用到自适应的研究中,如神经网络技术、智能识别技术和机器学习技术等。
5 结束语
虽然目前计算机自适应测试系统存在许多不足,但它克服了经典测量理论的局限,以人工智能为基础,以学习者为中心,最大优点是参数不变性,使它在试卷编制、高效测验等多方面得到重视,在教育测量与评价中得到越来越广泛的应用。在未来,自适应测试必将拥有更加广泛的发展空间。
参考文献
[1]余嘉元.项目反应理论及其应用[M].南京:江苏教育出版社,1992:20-36.
[2]丁树良.项目反应理论新进展专题研究[M].北京:北京师范大学出版社,2012:9-38.
[3]许祖慰.项目反应理论及其在测验中的应用[M].上海:华东师范大学出版社,1992:41-56.
[4]李昕.自适应测试与辅导系统设计与实现[J].现代教育技术,2013(4):86-109.