陈小峰
(淮南师范学院,安徽 淮南 232038)
学生模型是ITS(Intelligent Teaching System,智能教学系统)核心组成部分之一,ITS的主要功能是实现个性化学习.而学生模型创建的好坏直接关系到ITS为学生提供个性化服务的水平.只有设计出科学合理的学生模型,才能全面细致地分析学生学习特点和自身特性,制定科学合理的教学策略,达到个性化教学的目的.本文主要针对ITS学生模型设计方法进行研究,提出了一种认知型学生模型的设计方法.
随着对学生模型的研究,研究者提出了多种构造学生模型的方法,常见的有以下几种:
①覆盖模型:将学生的领域知识看作专家知识的一个子集.专家知识可以被分解为各个模块或项目,学生模型描述学生对各项目的掌握程度.通过这一技术,易于找到学生的知识结构缺陷,并向学生推荐应学习的内容.
②偏差模型:是在覆盖模型基础上发展起来的,把学生的错误概念表示为专家知识的偏差.通过建模学生的错误,系统能够给出具体的不久措施.
③认知型模型:认知能力是学习过程当中的一个重要能力,覆盖模型和偏差模型只能显示出学生的学习水平.认知模型不仅可以对学生的知识水平和学习情况进行反映,而且也是对学生认知能力的反映,这一点对学生及教师都非常重要.
认知学习理论认为,学生学习的实质,是在以学生为认知主体的基础上,对外界刺激主动形成认知结构的过程.因此,我们在设计ITS过程当中,以激发学生的学习兴趣和学习动机为首要的目的,将教学内容与学生原有的认知结构有机的联系起来,不再是单纯灌输学生知识.
每个人的情况有所不同,因此,在学生进行系统信息注册时,我们需要确定学生的学习风格,我们会要求学生根据自己的情况去选择学习风格,或者通过系统设置的问卷进行调查,综合两者的数据后,得到一个较为客观的结果,这样可以避免学生自身把握不准的偏差影响分析结果,便于更好的体现学生的个性特征,从而更准确地实现个性化教学指导.
在课程设置上,我们将课程的章节根据难以程度定力积分和等级制度,通过这种形式去调动学生学习的热情,满足学生学习的成就感.而教师也可以利用学生反馈回来的信息,以学生的实际情况为依据进行课程内容的更新设置,更好的实现因材施教.
利用学生的六种认知能力(知道、领会、运用、分析、综合、评价),诊断学生在学习过程当中的学习情况,并在以后的学习中,对学习状态进行修改,不断提高数据的准确性,以利于教师与学生对其学习情况进行全面的了解.
通过学生学习过程当中的状态的变化,将这些动态的变化反馈到学生模型当中,利用数据挖掘技术对相关的信息进行挖掘,为学生的学习与教师的教学提供有用的信息,为学生的学习活动进行检测提醒.
在教学系统的使用过程当中,日志记录了学生的所有活动,利用数据挖掘技术对这些日志进行分析,就可以推断出学生的背景、兴趣、心理特征等个性化资料,为个性化教学提供依据.本学生模型应用的Web日志挖掘技术包括数据采集、数据预处理、模式分析和应用等环节.
学生在访问远程教育网站时,留下了许多数据信息,包括用户的IP地址,用户ID,请求方法,访问时间,传输协议,错误代码等属性.本系统的数据采集是利用挖掘技术从学生学习留下的数据信息中取出与探索目标相关的数据子集,为后面的个性化教学实施提供素材和资源.
从学习者的访问日志中得到的原始日志记录并不适于挖掘,必须进行适当的处理才能进行挖掘,其中的步骤主要包括数据清洗、用户识别、会话识别、路径补全和事物识别.
3.2.1 数据清洗
数据清洗包括删除一些对于分析没有意义的数据,去掉SC-Status中的出错记录,及用户请求方法中非“GET”的记录.网页上的图片在日志中也记录为单独的请求,这对于挖掘用户兴趣一般没有意义,通常去掉它们.
3.2.2 会话识别
一个会话(Session)就是用户从进入到离开网站的一系列浏览请求.在跨越时间段较大的Web日志中,用户可能多次访问了该网站,会话识别的任务就是把属于同一用户的同一次访问请求识别出来.本系统使用了时间戳的方法,例如,我们将时间戳设为30分钟,30分钟内同一用户只在同一页面浏览内容,都只把前面的所连续访问的页面作为一个页面集,超过30分钟则视为一个新的会话.
3.2.3 路径补全
由于存在客户端缓存,当用户使用浏览器的后退功能时会产生路径信息不完整的描述.路径补全就是把用户会话中的访问路径补全,从而更好的反映用户的访问过程.例如如果学习者的历史访问记录上有多个页面都包含与当前请求页面的链接,则将请求时间最接近的作为当前请求的来源,如果引用信息不完整,可以利用站点的拓扑结构来代替.
3.2.4 事务识别
在本系统中,我们将事务定义为教学内容页面和为达到页面而经历的所有辅助页面《提供链接、进行导航的页面》的序列之和.本系统采用最大向前引用路径来定义事务.例如,一个学习者请求的页面顺序是①→②→③→④→③→⑤,这表明学习者在访问完④以后退回③再链接到⑤,所以,这个访问序列生成两条访问路径①→②→③→④和①→②→③→⑤.
模式分析是利用挖掘算法挖掘出新颖的、潜在的及最终可以被理解的信息和知识.常用的模式分析有统计分析、关联规则、聚类和分类、序列模式及依赖关系建模等,在本系统的学生模型中,我们根据需求,采用聚类和分类技术对学生进行分析.
分类技术可以给出识别一个特殊群体公共属性的描述,这种属性可以用于分类学习者.例如:在/P1/P2页面学习的学生中有30%是物理专业的.
聚类分析可以从Web访问信息数据中聚类出具有相似特性的学习者,有利于开发和设计未来的教学模式和学习群体.例如:在学生的学习过程中,通过分析Web日志我们发现一类学生在学习的过程中,对知识页面浏览的时间较短,但测试成绩较高.我们则可以把这部分的同学归为学习水平较高的一组,并通过调整教学策略,在该用户的下一次的学习中,适当增加测试难度或提供其它的相关课外学习资源,以供其更深入全面的学习课程,实现个别化的教学指导.
我们设计的推理机的功能主要体现在两个方面,一是拥有领域知识、学生模型知识,二是具有选择教学策略知识来解决问题的能力.通过产生式规则来表示教学策略知识,使用基于产生式系统的推理规则来设计推理机.
产生式系统是认知心理学研究人类心理活动中信息加工过程的基础,其求解问题的过程和人类思维很相似,可用来模拟人类求解问题的思维过程.基本形式为:IF X Then Y.其中,X代表前提或原因,Y代表结论或现象.基本组成如图1所示:
图1
在本系统中,规则库是学生在学习过程中所有可能出现情况的应对策略的存储器,其信息存放于数据库表1中.动态数据库用于存放系统推理过程中各种当前信息的数据结构,如问题的初始状态、中间推理结论和最后结果等,其信息存放于数据库表2中.当规则库中的某条前提可与动态数据库中的某些已知事实相匹配时,该产生式就被激活,并把它推出的结论放入动态数据库中,作为后面推理的已知事实.
表1 规则表
表2 事实表
完整、准确的规则库是系统高度智能化和个性化的前提,根据我校对系统的教学要求,积极进行调查研究,听取教师和学生的建议,我们进行了规则的制定,以下是其中的一些规则示例:
(1)IF分析能力低THEN未通过(2)IF识记能力低THEN未通过(3)IF操作能力低THEN未通过
(4)IF分析能力一般AND识记能力一般AND操作能力一般AND总体认知能力较高THEN通过
(5)IF未通过AND试题难度<0.7 THEN重学本章内容
(6)IF未通过AND试题难度>=0.7 THEN重做测试题
图2
产生式系统的运行过程如图2所示,就是推理机不断运用规则库中的规则,作用于动态数据库,不断进行推理并不断检测目标条件是否满足的过程.当推理到某一步,目标条件被满足,则推理成功,系统运行结束;或者再无规则可用,但目标条件仍未满足,则推理失败,当然系统也运行结束.成功的推理可以为学生提供科学合理的教学策略,达到个性化教学的目的.对于不成功的推理,在使用过程中我们应总结原因,并不断完善规则库,使系统日趋科学.
本学生模型通过Web日志挖掘技术及学生自主选择等方式确定学生的个性化资料,结合产生式规则库和推理算法,智能呈现相应的的学习内容和学习流程,具有一定的实用价值.学生模型基于模块设计,具有一定的通用性,把此模型加入到教学软件中对提高教学软件的智能特性大有益处.
〔1〕杨卉,王陆.在智能教学系统中两层动态学生模型的研究[J].电化教育研究,2005(1).
〔2〕孙中红.个性化智能网络教学系统学生模型的研究[J].中国电化教育,2009(10).
〔3〕曲红亭,申瑞民.基于数据挖掘的个性化学习导航系统的设计与实现[J].计算机工程,2003(5).
〔4〕李铮,赵桂钦.ICAI系统学习者建模的研究[J].计算机工程与科学,2002(03).
〔5〕杨静,高琳琦.顾客偏好的动态挖掘算法杨[J].信息与控制,2007(01).