陆 峰
(长江大学计算机科学学院,湖北 荆州 434023)
基于因子分析的自适应学习平台算法研究
陆 峰
(长江大学计算机科学学院,湖北 荆州 434023)
为解决网络学习平台的自适应问题,采用因子分析方法,对决定学习内容难度和学习者能力的各影响因子进行分析,并对各影响因子进行定量分析计算,得到兼顾学习内容难度和学习者能力的智能自适应效果。实践应用证明,该算法可以提供较好的内容适配过程,是一种可行的算法。
因子分析;自适应学习平台;难度水平;学习者能力
随着网络技术的不断发展,远程教育、终身学习、终身教育等理念也随之深入人心,使得越来越多有着不同文化背景、文化层次、水平能力的人使用互联网获取所需知识和信息。“以不变应百变”的互联网内容体系面临着巨大的挑战,如何给具有不同文化层次、水平能力的人提供与之适应的内容资源已成为当前学术研究的热点。自适应学习平台的构建即是在线学习(E-learning)领域为解决该问题做出的探索。下面,笔者采用因子分析法[1]对自适应学习平台进行可行性算法分析,对系统中的绝对影响因子——内容素材和学习者能力进行细化分析,并对各自细化影响因素进行量化捕捉。
图1 系统功能层级图
系统包含5个主要功能层级:数据库层、学习者能力获取层、数据挖掘层、内容适配层、表示层,其功能图示如图1所示。
用户进入系统后其数据流程描述如图2所示。
2.1学习内容难度系数D的计算
学习内容难度初始系数分为5个等级[2]:D={d1,d2,d3,d4,d5}={很难,难,适中,简单,很简单},且有:
如何来动态调整确定学习内容的难度系数,并把其归属到何种等级是需要探索的重点,笔者把其影响因子确定为3个:{专家制定,教师制定,学生制定}={D1,D2,D3},其中:
图2 系统用户数据流图
式中,m、i、j分别代表参与制定的专家、教师和学生代表人数;Rm、Ri、Rj分别代表相应给出的难度系数,均受D值约束。
因专家群体,教师群体和学生群体所占权重不同,分别分配以不同权重值W1,W2,W3,且W1+W2+W3=1, 0 系统中,W1、W2、W3的值是可调整的,且因为系统用户的动态性(包括群体能力水平的不均衡和个体的不均衡),系统中的学习内容难度也是随之动态变化的。 2.2学习者能力水平系数A的计算 学习者能力水平系数分为5个等级:A={a1,a2,a3,a4,a5}={很高,高,一般,低,很低},且: (系统中,临界值可以初始化调整) 如何来确定学习者能力水平,并把其归属到何种等级也是需要探索的重点。笔者把其影响因子确定为6个:{内容问卷,内容测试,内容学习时长,知识链接点击数,搜索引擎使用数,鼠标无目标运动和点击数}={F1,F2,F3,F4,F5,F6},其权重分配相应为{w1,w2,w3,w4,w5,w6},且w1+w2+w3+w4+w5+w6=1,且均为0~1正值,下面分析各因子计算方法。 1)内容后置问卷确定系数F1为捕捉学习者的当前学习能力,每个学习内容单元后都置有问卷,问卷内容简单。学习者自身对内容理解的程度记为X1={完全理解,理解,一般,不完全理解,完全没理解},其对应水平能力系数初始记为{f1,f2,f3,f4,f5}。系统采用统计学方法,对所有参与该学习单元问卷结果进行统计,计算出的具体比例值作为矫正系数F1的计算依据。 如当前学习者问卷选项为{理解},对应水平能力系数为{f2},而在统计人数中,有比例为f的人选择了{一般}及以下,则F1应被理想化矫正为: f越靠近(f3+f4+f5)的值,则说明F1越的值越靠近f2。 2)内容后置测试反馈确定系数F2为捕捉学习者的当前学习能力,每个学习内容单元后都置有测试环节,其对当前学习单元的内容进行简单测试,以反馈学习者的知识掌握情况,学习者测试的具体得分值转化为百分制后归一值即为系数F2。 3)内容页面学习时长确定系数F3学生在利用系统进行学习时,每个单元学习内容页面上所停留的时间(学习时长)是其能力水平的一个直观外显。在此信息中,系统需要过滤一些干扰信息,如停留时间过长或过短,过长可能因为没有专注学习,转移了注意力,过短则可能因为突发事件导致其中断学习等。 F3=b4-(b4-b3)×(1-b) 4)内容页面知识链接点击次数确定系数F4系统采用统计方法,对所有学习者点击次数进行记录,统计出多于当前学习者、少于当前学习者及等于当前学习者点击次数的比例,各自记为a,b,c,有a+b+c=1,且均为0~1正值,则当前学习水平能力系数可近似计算为: 5)内容页面搜索引擎使用次数确定系数F5内容页面搜索引擎是为学习者提供的又一学习辅助功能,由此所确定的系数F5和F4的计算方法相似,在此不作赘述。 6)鼠标无目标活动和点击数确定系数F6系统利用统计学方法,把所有学习者的相应操作信息进行线性运算处理统计,即把上述几种信息视为线性相关变量,计算出当前学习者所处的位置状态,即为其在此维度上表现出的学习能力水平,其计算原理和F4的计算方法相似,在此不作赘述。 假设6个影响因子{F1,F2,F3,F4,F5,F6}通过计算取值分别为{0.8,0.8,0.7,0.8,0.65,0.8},其权重分配相应为{w1,w2,w3,w4,w5,w6}={0.15,0.3,0.2,0.15,0.1,0.1},可以得出: 计算结果为0.765,表明当前学习者能力水平居于a2层级,即为{高}水平能力。 2.3内容适配过程 通过上述方法进行确切计算,系统通过规则库的推理,对学习者所反映出的能力水平高低,推出相对应级别的学习内容。系统规则库可简化描述为: If User=a1then Pushd1 … If User=a5then Pushd5 自适应学习是E-learning领域中研究的热点。笔者采用因子分析法对自适应学习平台进行可行性算法分析,对系统中的绝对影响因子——内容素材和学习者能力进行细化分析,并对各自细化影响因素进行量化捕捉。系统在获取两者系数之后,进行自动适配,使得学习者能够在能力不断变化的同时获得对应难度的学习内容,提高学习者的学习效率。 [1]游家兴.如何正确运用因子分析法进行综合评价[J].统计教育,2003(56):10-11. [2]Chih-ming Chen, Hahn-ming Lee, Ya-hui Chen. Personalized E-learning system using Item Response Theory[J]Computers & Education,2005,44:237-255. [3]Huang Chenn-Jung, Chu San-Shine, Guan Chih-Tai. Implementation and performance evaluation of parameter improvement mechanisms for intelligent E-learning systems[J].Computers & Education,2007,49:597-614. [编辑] 洪云飞 10.3969/j.issn.1673-1409.2011.04.027 TP391 A 1673-1409(2011)04-0083-033 结 语