李 雯
(中北大学 电子与计算机科学技术学院,山西 太原 030051)
随着计算机网络技术的飞速发展,在线教学系统被大量应用到实际教学中,并已被学生和用户广泛接受,各种教学技术和教学模式经过几十年的发展也逐渐成熟。相比传统教学模式,远程教学系统突破了传统学习方式在时间和空间上的限制,使教与学不再受地域、时间的限制,但其依然存在诸多不足之处,例如:在线教学系统对个性化教学支持不够等等。随着应用的深入,一些原来课堂教学中没有出现的问题也暴露出来,例如:学生和教师分离的问题、学生学习评价的问题。因此,如何进一步改进远程教学系统和改善教学效果,已经成为当前教学研究领域的热点。
在线教学系统中最主要的问题是无法满足学生个性化学习的需要,由于在线教学系统学习者动态且不可控,而且教师和学生之间缺少交流,导致传统的教师人工介入很难在在线教学系统中真正运用,而学习者本身所具有的主观性、模糊性和随机不确定性等特点,又导致传统的学习模式很难满足要求。因此,如何完成对远程学习者学习行为模式的智能识别,挖掘其个性化学习习惯,并据此对在线学习模式进行动态调整,是建立真正的智能化在线个性学习系统的关键问题。
云计算在智能控制和预测、数据挖掘、概念提升以及数据聚类、系统评估、评价决策分析等领域已经得到了成功运用,这种先进技术和理念在教学领域的引入,可以提供海量的分析样本和强大的逻辑计算能力,从而为学习行为模式的智能快速识别提供了技术上的可能,很多在线学习系统改进方面的技术难题有望得到解决。
本文在云计算和模式识别的研究背景下,针对现有在线教学系统进一步改进中所存在的困难和问题,展开了对学习行为模式识别相关技术和理论的研究和应用工作,提出了一些解决问题的思路和方法。
1970 年,Carbonell等人(Bolt Beranek and Newman,BBN公司)开发出教授南美洲地理情况的SCHOLAR系统,该系统研究了教学法策略和人类的似真推理,被认为是第一个有代表性的智能教学系统。尽管教育界对于能够识别学习者并提供个性化教学的教学系统一直保持着极大的兴趣,但由于早期计算机系统的性能对于适应性诊断和反馈来讲是非常有限的,很难满足智能教学分析的需要,因此这期间的研究,主要侧重于以实验性系统的教学理论研究。
进入21世纪后,伴随着教育技术的进一步发展,尤其是云计算等先进技术的广泛应用,智能教学研究继续向前发展。已有研究机构在具体的识别算法等方面开展了一些研究,如个性化信息需求特征的定义、个性化信息挖掘算法、个性化信息获取系统以及智能评价系统的研究等,并取得了一些成果。例如,南加州大学的RIDES(rapid ITS development environment)是智能教学系统开发工具,北卡大学的INSTRUCT(implementing the NCTM school teaching recommendations using collaborative telecommuni cations)、斯坦福大学的 MMAP(Middle school mathematics through applications projects)是协作型教学模式的教学系统等等。
传统的研究方式一般仅局限于单一教学系统的研究,因此即使建立了相对完整的分析算法,但受限于分析样本数量有限,得到的结果价值往往比较有限。所以,可以考虑将学习行为模式分析的范围从单一的教学系统扩展到互联网所有的教学系统中,利用云计算技术,将存放于不同区域、不同环境中的教学资源和功能通过服务的方式连接起来,通过建设统一的学习行为分析公有云来对学习者的学习行为进行分析,从而提高分析结果的准确性。这种分析方法本质上是采用了概率和数理统计的思路,通过利用云计算对海量数据的处理能力对大量样本的学习行为模式进行分析,从而区分出各种学习行为模式之间的差异,并从总体上区分出正面的学习行为模式。图1描述了基于云的学习行为分析网络架构。
图1 学习行为模式分析系统的网路架构
在线教学系统的重要基础是网络,网络基础设施的情况直接影响着在线教学系统的应用效果。通过不同的基础网络将教学资源和学习行为数据分开,将教学系统架构在各自的私有云基础之上,把学习行为分析数据建设在公有云基础上。一方面,可以提供一个相对高速和可控的网络环境,满足教学资源访问和维护的需要。另一方面,可以减少建设独立的学习行为分析系统所需的软硬件投资。具体的学习分析功能在云端进行,并通过统一的服务调用中心为各个教学系统提供服务。教学系统只须将其学习行为数据提交到位于云端的学习行为分析系统,就可以充分利用云计算对海量数据的分析和处理能力,无须关心学习者的学习行为数据是怎么处理、怎么存放的,只要根据返回的分析结构对教学资源进行动态调整即可,从而实现了学习行为分析服务对各教学系统的透明性。
由于在线教学系统中学习者的不确定性、可变性等特点,很难对其进行定性分析,但可以从学习者的学习行为入手,通过分析各种学习者使用教学系统获取知识的过程及其学习过程所产生的影响(知识运用熟练程度、知识感兴趣范围等),再利用云计算提供的对海量数据的分析和处理能力,对其进行定量分析,从而将随机性和模糊性的问题转化为可以进行规则处理的数学模型。
下面,笔者将就基于云的在线学习行为模式识别的一般实现过程进行阐述。通常情况下,在线教学系统的学习行为模式分析由以下几个步骤构成,如图2所示。
图2 学习行为模式分析过程
为了实现对各种学习行为数据的采集和后续分析,首先应该建立相应的学习行为支撑数据库。这个数据库不仅需要将来自不同的私有教学云中的学习行为数据关联起来,还需要支持跨学科的数据合并,并能够满足未来数据库扩展的需要。数据库建设完成后,就可以通过公共的数据采集服务接口来进行数据采集,还可以针对不同的教学系统,使用不同的数据采集接口,这样就可以针对学科分类设计针对性的数据采集接口,以便能够按照数据分析的要求将需要的数据收集上来。
一般从统计的角度来说,采集的数据可以分为连续性数据和非连续性数据两种。连续性数据反映了数据变化的过程,而非连续性数据反映数据变化过程方面不如连续性数据更精确。因此,在采集数据时,应该尽可能采用连续性数据,以便提供尽可能多的可用于过程改进的信息,例如:学习者学习规律(作息规律、学习时间量的比例、学习时间的分配、学习专注度、复习规律等)、学习者学习评价信息(各知识点考核得分、答题偏向性)等等。
另一方面,非连续性数据同样十分重要,例如:学习者信息(姓名、年龄、性别、区域、教育背景)、学习者兴趣信息(文学、艺术、技术)、学习动机信息(目的、时间)、个性倾向(外向和内向)、学习偏好(理论型、实践动手型、理论与实践相结合型)等,这些信息可以为数据的分类处理提供依据。
以《计算机基础》学科的数据采集为例,通过收集学生对某些知识的兴趣程度,可以得出一个学生是否对足球感兴趣,那么教学系统在出题的时候就可以引用一些计算机在足球领域运用方面的知识,从而提高学习者的学习兴趣。
数据挖掘,通过数据采集服务收集到的学习行为数据包含了丰富的信息,但这些信息是离散的,为了把这些信息集中起来以反映内在的规律,就需要对数据进行挖掘,在数据挖掘前还需要剔除容易引起误差的数据,减少某些变形和失真,从而提高后续分析的准确性。一般采用的手段包括数据格式化、数据泛化、数据分类等技术,从而帮助后续模式识别。
所谓数据格式化,是指把采集自多个异构数据源的数据进行格式规范化处理,比如把日期格式统一、空值转换等等,从而保证后续数据分析的一致性。
数据泛化是把一个从相对低层概念到更高层概念且对数据库中与任务相关的大量数据进行抽象概述的一个分析过程,可以用于对大量数据进行有效灵活的概述。简单来说,统计在某次考试范围内所有考生答对题的总次数,就是数据泛化的一个过程。
数据分类指的是按照一定的分类规则对采集到的数据进行分类,从而使其聚合到某一个特定的数据范围内。在一个具有一定相似性的数据集合中,用户需要的数据只占这个集合的很小一部分,但是整个集合的数据在某种程度上都存在一定的相似,因此找出目标数据与其他数据的区别特征,进而应用这种特征区分这些数据,就可以达到个性化服务的效果。例如:可以通过对学习者身份的智能分类和识别(按访问者使用的IP地址、访问时间段及用户名等信息分类),并对其行为习惯的归类和分发,比如按照相同教育背景来对学习者的学习行为数据进行聚合分类,便于后续对该类型学习者的学习行为习惯进行共性和差异分析。
学习行为模式识别的基本原理是有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”。其分析方法是根据模式所测得的特征向量Xi=(xi1,xi2,…)T(i=1,2,…,N),将一个给定的模式归入 C 个类 ω1,ω2,…,ωc中,然后根据模式之间的距离函数来判别分类。其中,T表示转置;N为样本点数。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。在我们的识别系统中,一般会把学习者的学习评价信息等易被度量的学习行为作为特征向量。
通过模式识别得到的学习模式并非完全可靠,可能会得到一些错误的结论。因此,我们有必要通过各种技术手段对学习模式进行评价,从而找出误差较小的正向模式。利用云计算强大的计算能力,可以通过假设检验的方式来对学习模式的应用效果进行评价,从而找到相对较优的正向学习模式。
本文对基于云计算的学习行为模式进行了探讨,提出了学习行为分析云的基础网络架构以及利用云计算进行学习行为模式分析的基本思路和步骤,通过引入先进的云技术,实现了对海量学习行为数据的收集和分析,从而对学习行为模式进行分析。
笔者相信,随着云计算、分布式计算、自然语言识别、模式识别等技术的进步,教学技术的发展将进入一个新的快速发展期。我们应该充分利用技术发展所带来的好处,推动国内远程教育相关理论和应用在新技术背景下取得更大的发展。
[1]许高攀,曾文华,黄翠兰.智能教学系统研究综述[J].计算机应用研究,2009,26(11).
[2]西奥多里德斯等著,李晶皎等译.模式识别[M].北京:电子工业出版社,2006.
[3]李红波,胡建兵.网络学习的评价模式[J].电化教育研究,2004(5):47-50.
[4]杜永萍,黄萱菁,吴立德.模式学习在QA系统中的有效实现[J].计算机研究与发展,2006(3).
[5]黄荣怀,刘黄玲子,李向荣.计算机辅助评价的发展趋势[J].电化教育研究,2002(5):15-21.
[6]彭绍东.人类教育革命的概念、划分标准与基本规律(下)[J].电化教育研究,1999(1):27-29.
[7]中国云计算网.云计算的定义和特点[EB/OL].http://www.chinacloud.cn/show.aspx?id=74l&cid=17.