姬昊
摘要:随着互联网技术在教育领域应用的不断深入,远程教育作为一种新型教育模式得到了迅速的发展。然而,在这种便利的教学模式下如何进行高效的学习受到了越来越多的关注。由于学习用户之间存在着鲜明的个性特征差异,所以用户行为分析对解决如何对不同行为的学习用户制定相应的学习策略对于提高远程教育质量至关重要。本研究旨在基于对远程教育用户的学习行为进行相关分析研究,研究实现核心思想为根据用户在远程教育系统使用过程中产生的各种数据信息,通过相应的数据采集、数据挖掘以及统计分析等方法来分析不同用户行为的差异性。
关键词:远程教育;用户特征;行为分析;数据处理
1 引言
网络远程教育是随着现代信息技术的发展而产生的一种新型教育方式[1][2]。计算机技术、多媒体技术、通信技术的发展,特别是因特网的迅猛发展,使网络远程教育技术有了质的飞跃,成为高新技术条件下的远程教育。远程教育以网络教育手段为主,兼容面授、函授和自学等传统教学形式,是一种由多种媒体优化组合的教育方式。同时,相对于面授教育而言,远程教育是一种师生分离、非面对面组织的教学活动,是一种跨学校、跨地区的教育体制和教学模式,远程教育的主要特点包括:学生与教师分离;采用特定的传输系统和传播媒体进行教学;信息的传输方式多种多样;学习的场所和形式灵活多变。与面授教育相比,远距离教育的优势在于它既可以突破时空的限制、提供更多的学习机会,也能够扩大教学规模、降低教学的成本;同时便利了学习过程。
然而在我国远程教育实践过程中仍然存在很多问题,严重阻碍了远程教育的发展[3][4][5]。在诸多问题中,远程教育的教学质量问题是政府、社会及办学者所关注的重点。由于其入学门槛相对较低,学生素质多样化,学生之间存在着鲜明的个性特征差异,同时学习时间分散,以业余时间为主,导致学习过程难以监控、学习效果不便诊断,此外,目前常见的远程教育系统模式单一,师生交互性差,教育资源大都以静态的形式存储共享在系统平台上,学生只能被动的接受统一、固定的学习内容,知识选择灵活性差,不能根据学生的具体需求个性化的定制学习内容,从而影响学习效果。
2 用户行为分析
2.1 特征预处理
用户行为[6]是指主体能在网络上产生流量的行为,如MSN聊天,迅雷下载,Web站点访问,在线观看视频等。本课题首先对影响用户在学习过程中各个方面的主要因素进行归纳和研究分析,包括对用户潜在的固有特征进行统计,例如籍贯、性别、年龄、婚否、血型等;以及通过用户对自身相关能力的描述,例如创造力、环境适应能力、观察力等因素。然后通过统计分析、心理学等相关专业学科知识对影响用户行为的每个因素进行详细的预分析和初步的判断,为后续的数据信息处理奠定基础。
2.2 用户模型构建
用户模型是个性化服务的核心部分,反映了用户与系统交互、绩效行为和学习历史记录等主观及客观的信息。为满足用户的个性化需求。实现个性化学习服务,系统必须先了解学生的性格特点、知识水平、兴趣偏好和学习风格等信息。为了能准确描述这些用户信息,需要为每个用户建立用户模型,用户模型包含如下信息:
图1 用户模型
(1)个人特征信息。
个人信息记录用户的性别、籍贯、年龄、所从事专业等基本信息。
(2)社交信息。
社交信息描述用户与其它用户之间的关联关系信息,用户可以建立学习小组或加其他用户为好友并互动从而进行协作学习。
(3)学习风格。
学习风格是指在学习过程中,每一个用户都会表现出不同的学习倾向,包括学习动机、态度、情绪和认知倾向,以及对某种学习策略、学习方法的适应程度等。
2.3 行为分析
远程教育用户的行为受到外界因素和内部因素两方面影响,在这两方面影响下用户产生了资源信息需求,并根据需求完成信息寻求行为,在用户进行信息行为的过程中,他的这种行为作为外部因素影响了其他的用户,导致其他用户产生新的信息需求。由于社会化网络是通过人和人之间的联系建立起来的,具有很强的社会性,所以在两类印象因素中,外部因素对社会化网络用户的行为变化起了重要的作用。
外界影响因素是指个人以外的外界环境对行为所产生的影响,包括:群体行为影响、他人推荐、舆论导向;内部因素是指用户的个人特征对行为所产生的影响,包括:文化程度、社会角色、人格特性、遗传因素。产生的行为表现按照对信息的需求程度分为三类:积极检索、被动检索、信息浏览。
图2 行为模型
3 数据处理
3.1 数据采集
对用户行为进行分析,离不开用户在远程教育学习过程中的一些原始数据的支持。采集的数据信息包括对用户固有特征信息、远程教育办学机构以及课程资源信息以及用户在学习过程中产生的行为数据信息。
在收集用户固有特征信息过程中,对于用户的基本信息,可以通过从用户基本注册信息数据库表进行获取;远程教育办学机构学校口碑、教学管理以及资源品质等信息可以通过社会评价以及学生往期选课标准进行获取;而用户学习行为信息需要通过特定的数据记录结构来进行捕获,捕获对象例如用户学习过程中的搜索关键字、访问URL、学习时长等信息;若需要更为详细的特征信息可以通过调查问卷等采样方式进行获取。
(1)用户属性数据库中存储了用户的属性信息,是用户注册账号时填写的个人信息,数据表的具体设置如表1所示。
(2)根据上一节建立的用户行为模型,提取用户相关行为数据。行为数据库存储用户的相关行为信息,包括用户的浏览行为、选课行为、操作行为等。数据表信息如表2和 表3所示。
3.2 数据分析
要得到可信的数据分析结果,往往需要采集的数据信息规模需要很大而且多样化,因此需要对已采集信息进行处理。处理过程中,可以首先清除掉数据信息集中的“无效数据”,例如属于严重背离常理的数据,或者是敷衍调查的无用数据;其次对过滤好的数据信息通过数据挖掘、数理统计以及相关性分析等方法进行处理,来计算用户行为因素出现频率、概率以及因素之间的相关性。
对于用户输入的查询语句,为实现语义查询,必须进行一定的处理,进行中文处理的关键是词法分析。本文采用了中科院分词系统ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System),对用户输入的信息进行分词处理,以尽可能返回用户最满意的搜索结果集。
计算用户属性与影响因素之间的相关系数,选择相关系数值较大的影响因素作为回归预测模型的自变量,相关系数计算公式为:
(1)
对影响因素的关联度进行分析,找出关联度较大的因素作为分析模型的自变量,其计算步骤为:
(1)求关联度两极差,
记为 ,再根据 求两极最大差和最小差,分别记为 , ,再计算关联系数:
(2)
(2)计算关联度:
(3)
4 结束语
本文提出了一种通过对远程教育用户的行为进行的用户行为分析研究。根据用户在远程教育系统使用过程中产生的各种数据信息,通过进一步的数据采集、数据分析以及统计分析等方法来分析不同用户行为的差异性,该研究可有效的帮助远程教育工作者一定程度上提高用户学习效率,提升远程教育用户学习质量。
参考文献:
[1]张尧学.高校现代远程教育调查与思考[J].中国远程教育,2004(08X):18-22.
[2]韦进.现代远程教育条件下学习支持服务系统建设的实践和探索[J].现代远距离教育,2002,2:31-33.
[3]章东飞.试析我国远程教育发展现状与存在问题[J].成人教育,2010(012):50-51.
[4]蒋立兵,于凌云.远程教育发展现状与存在的问题分析[J].教育技术导刊,2006(1):41-42.
[5]施志毅.从教育服务的市场机制选择谈现代教育服务业发展中的几个问题[J].中国远程教育,2007(11S):22-24.
[6]Han-Ching Wu,Shou-Hsuan,Stephen Huang.User Behavior Analysis in Masquerade Detection Using Principal Conponent Analysis.8th Internationl Comference on Intelligent Systems Design and Applications.2009.