苏延平
(闽南理工学院信息管理学院,福建石狮362700)
随着大数据、云计算等技术的快速发展,数据交换共享平台的应用受到广泛关注。目前,数据交换共享平台的应用已经非常广泛,例如数字化校园数据交换共享中心、金融数据交换共享平台、政务数据交换共享平台等。国务院发布的《国家中长期科学和技术发展规划纲要(2006-2020年)》中将信息支撑技术列为优先发展课题,而数据交换共享平台是支撑技术的典型代表。由于应用的场景环境、数据的存储介质、数据格式、所使用数据库的类型等都存在差异,因此有可能产生信息传输和交换信息不顺畅问题的出现[1-2]。为了整合异构数据,研究如何提高数据交换共享平台的效率具有重要的意义。本文以教育教学数据资源的数据交换共享平台应用为例,对数据交换共享平台的体系结构展开研究[3]。
数据交换共享平台能够通过网络整合分散的信息,进行信息的交换,达到数据的共享,提高数据信息的利用率。数据交换共享平台的功能主要是数据集成、信息集成和可靠通信。数据集成是对各数据接口进行识别,集成其中的文件、数据库和接口,之后实现数据的交换共享;对系统间提出/应答请求和发送/接收信息,达到可靠通信的目的,使得数据传输中出现的断点能够续传,实现同步和异步消息的正常通信,从而达到高速传输的目的[4]。在教学数据交换共享平台的研究中,主要是数据的整合和数据的分析应用两个方面。
数据整合及体系结构研究包括异构数据发布、冲突以及整合问题。其中,异构数据发布是在异构数据库中将异构数据提取出来,对其进行处理,用达到要求的格式发出。异构数据的发布应用层的用户是看不见的[5]。异构数据冲突是指在对数据命名、格式组织和数据结构等方面产生的冲突,当出现冲突时将其解决,使数据在应用中得到统一数据视图。异构数据整合是将以上过程的数据整合起来,用户得到统一的物理或逻辑视图。经过一系列的操作,屏蔽掉数据的异构性,使应用程序能够统一访问和处理异构数据。
数据分析及应用是对学习者学习过程中的学习行为、学习平台中的领域知识库的建立以及教学管理者管理教学中产生的数据进行分析和挖掘。其中学习行为数据的分析是通过数据分析技术进行的,得到学习者的学习特点数据,对因材施教提供有力帮助。教学管理数据分析用于分析学习者学习过程数据,了解学习者在学习过程中的学习特点、知识掌握的程度,为管理员和教育者提供分配和管理教学资源提供有力依据。
根据各个数据共享交换平台的功能和性能需求,设计一个跨平台的体系结构,不需要改变用户需求交互模型,就可以对底层的数据模型进行配置。通用的数据共享交换平台体系结构如图1所示。
图1 通用的数据共享交换平台体系结构图
目前,大多应用是基于Web的服务,此数据交换共享平台的体系结构能够屏蔽各应用系统的异构性,提高不同应用系统的服务质量。平台建立独立的连接系统,支持跨平台和跨系统的数据交换共享。该数据交换共享平台体系结构基于J2EE体系结构,采用SOA思想,数据交换共享采用BEA ALSB(企业服务总线),构建分布式数据共享交换平台[6-8]。根据不同的服务类型,数据交换共享平台由实体服务(服务提供商)、BEA ALSB和服务请求者三部分组成,它们之间通过HTTP(S)和SOAP协议互相通信。此平台具有良好的可扩展性,能够提高数据共享效率和可靠性。
各类线上线下教育教学的不断发展产生了大量的数据。如何从海量的教育教学数据中挖掘可能有用的信息,一直是教育工作者关心的问题。本部分从教育教学数据共享交换平台出发,展开基于数据共享交换平台的智能导学系统的研究。
在智能导学系统中,追踪每个教育者、学习者的教育教学数据行为,将收集到的学习信息和网络日志信息存储在数据库中,把这些数据信息作为输入数据,供数据挖掘和个性化分析使用,提取其中的共同特征和个体特征,以规则集的形式存储到关系型数据库中[9-10]。教学策略集中记录经验丰富的教学经历数据,以不同权重的知识数据来表示。
当用户注册线上教学系统时,页面跳转到一个为学习者提供个性化推荐的页面,根据规则调度工具,对教学策略进行分析,基于数据共享交换平台的智能导学系统为不同的用户提供个性化的学习环境,学习者通过学习实现学习目标。根据不同用户的特征评估修改系统特征参数以及参数所占的权重,更好地反应不同用户的特征,鲁棒性增强。
基于数据交换共享平台的智能导学系统的知识库主要包括教学中的知识点数据和教学所使用的资源数据,不同知识以及知识之间的关系组成知识库,由知识点之间的关系表示。知识库包括知识点属性库和知识树库。知识点是教学内容的集合,比如概念、规则、定义等。每个知识点指向相关的教学材料,例如视频材料、试题库材料、课件等。它们的特征和关系由属性描述。知识点的属性构成唯一的网络结构,相似度高的知识点分配到一个子集中,不同知识点之间的关系通过课程、所属单位、知识点等呈现出来。知识库模型如图2所示。其中虚线所包围的部分表示虚拟层,包含一节该课程的章节信息等。知识点包含的字段有课程代码、章节编号、知识点编码,知识点间以树形结构进行组织,并将数据存储到知识库中。
图2 知识库模型图
智能导学系统中用户访问知识库留下大量浏览数据信息,将这些数据提纯、分割,通过使用序列挖掘方法对用户的行为进行挖掘,丰富教学策略数据库,为用户提供个性化推荐服务。经过数据挖掘,系统能够找到最优的知识点序列,设置最优解为默认路径。推荐评估模型如图3所示,通过决策树算法实现个性化推荐和评估,通过分析和评估优化教学策略。
图3 个性化推荐评估模型
智能导学系统个性化推荐模型能够形成教与学之间的对接,为学习者的学习建立良好的学习体系,对不同的学习者提供个性化推荐学习,并使教育者及时获得学习情况反馈。通过智能导学系统引导网络学习,提高了教学效率,极大地提高学习者的学习兴趣。
随着大数据应用的不断发展,数据共享交换平台作为大数据应用的载体得到广泛关注。基于数据交换共享平台应用的场景、存储数据的介质、数据格式、所使用的数据库类型等存在差异的情况,设计了数据共享交换平台的体系结构。论文以智能导学系统为例,以教育教学数据资源数据交换共享平台为基础,建立基于数据共享交换平台的智能导学系统架构,在此基础上建立所属知识库,设计基于数据交换共享平台的智能导学推荐评估模型,此应用能够为学习者的学习建立良好的学习体系,为学习者提供个性化推荐学习,调动学习者的学习积极性。此研究可以为后续的数据交换共享平台研究与应用提供一定的理论和应用参考。