田红梅, 汪顺和, 梁 靖
(安徽广播电视大学,合肥 230022)
远程培训生成性学习资源的采集与整合策略
——以安徽省中小学教师全员远程培训为例
田红梅,汪顺和,梁靖
(安徽广播电视大学,合肥230022)
摘要:以安徽省中心小学教师远程培训为例,介绍了远程培训中生成性学习资源的内涵,从必要性、技术、策略三个方面阐述了采集与整合生成性学习资源的基本思路,指出了采集与整合生成性学习资源的意义。
关键词:远程培训;生成性学习资源;主题采集系统
一、远程培训生成性学习资源内涵
安徽省中小学教师教育网不仅连续五年承担了“国培计划”中西部远程培训项目,而且自创建以来,持续承担并完成了安徽省中小学全员远程培训的任务。十年间累计培训中小学教师近75万人次。2014年就有13.68万名中小学教师参加了安徽省全员远程培训,培训结束后统计平台中的生成性学习资源,累计学科发帖回帖总数494 587个,发表评论数299 485次,上传文章43 407篇,其中优秀文章1 162篇,共享教学资源20 361个,“学科视频答疑” 录像24个,提交作业数80 774篇,其中优秀作业4 285篇。
(一)生成性学习资源的定义
远程培训的生成性学习资源是指培训过程中学科专家、班级辅导者和参训学员自主创作,并上传的带有个性特征的数字化学习资源,如文本、图像、视频和音频资源等,是参训成员在培训中学习、反思、彼此互动过程中产生,具有过程性和情景性的特点,强调参与培训成员的个性化特征,凸显潜在的创造价值。[1]每届远程培训历时一年,从线上学习至线下班级活动的开展,再到送培送教活动的组织实施,远程培训充分彰显了突破时空教学的远程优势。在每一步骤的培训环节中,学科专家、班级辅导者、参训学员积极参与,深度互动,形成了大量的生成性资源,包括辅导专家发表的问题解答、针对学员问题的发帖、在线学科视频答疑;班级辅导者推荐的优秀文章、发布的班级简报、开展的班级线下活动材料;参训学员问题探讨、学科作业、参加微课大赛的作品、平台中上传的意见、建议与观点主题帖等。
(二)生成性学习资源的类型
生成性学习资源类型见下页表1。
二、生成性学习资源采集与整合的基本思路
(一)采集与整合的必要性
远程平台中生成性学习资源内容丰富,表现形式多样,是集文字、图像、声音、视频为一体的多媒体信息。它们按照非线性文本组织模式,将信息单元储存于节点,通过含有URL地址的统一资源定位符,体现各个节点之间的概念逻辑关系,形成一种网状结构。既可以按线性顺序查阅,又可以进行跳跃式浏览,具备无序性、开放性、动态性、多样性的特点。
(二)生成性学习资源采集与整合的技术要求
根据参训学员的多样化需求,设立明确的采集主题,构建采集与整合生成性学习资源系统,满足系统设计的技术要求,构思系统运行的流程。
1.生成性学习资源的采集技术
培训平台中的信息资源,大部分是采用超文本标记语言(HTML)的Web网页。具有明显的等级层级关系的超文本,通过链接跳转,把网络资源分类体系的结构方便地显示出来。网络信息采集系统按照指定网页链接层数、重试次数、下载超时时限,定时定制下载要求,完成指定的网页URL的信息搜集工作[2];系统还应追踪敏感站点的页面变化,特别是学段、学科的变化,并支持以推送短信的方式,将网页的变化通知用户。
表1 生成性学习资源类型
2.生成性学习资源的分析与过滤技术
生成性信息资源采集系统必须提供强有力的技术手段控制信息的发布,有效去掉垃圾信息及无用信息,这些技术包括:针对超链接中的文本、超链接结构、主机地址进行设定的超链接过滤技术,通过超链接过滤能去除70%以上的垃圾信息;将采集的资源分成HTML、图像、PDF、ZIP等多种形式的下载资源类型过滤技术,可以定制需要下载的类型;提供正确表达式过滤条件,除了关键词,还为高级用户提供多种选择的结构过滤技术;允许用户提供一批文章作为过滤条件的内容过滤技术,从而规避抄袭现象,仅下载与这批文章重合率小于60%的信息资源。
3.生成性学习资源数据库管理技术
下载数据是过程,目的是重新整合并发布。高水平的数据库管理技术是研制数据库结构、各数据库关系、安全保存、快速获取的基础,同时具有良好的发布系统,才得以充分发挥下载数据的作用。发布系统的基础是科学的信息整合。信息整合有两种方案,一种是直接提供原文;另一种是提供线索建立链接。这样不仅增强了系统的交互性,还为参训教师提供了有效路径指导。
4.生成性学习资源的整合与评价技术
根据学段与学科设置,依据成熟的中小学教师专业知识分类体系,对所采集的信息资源进行重新分类,这是远程培训开展个性化信息定制服务、建立专门数据库的基础和前提。只有具备高水平的生成性信息资源,才能保证高水平的信息服务。由于下载数据文件类型多,来源不同,势必质量参差不齐,内容鱼龙混杂,因此需要建立良好的数据质量管理机制,确保具有高水平的管理人员对数据质量进行整合,高水平的学科专家对信息内容进行评价。
5.生成性学习资源的发布与推送技术
实时、动态、科学分类的发布技术,可以确保数据的全面及时,同时辅以良好的查询界面、查询中良好的个性服务,让中小学教师查找更加方便快捷,达成采集与整合系统的数字服务目标。Push技术具有自动搜集的功能,并且定期推送信息,主动、直接传递中小学教师感兴趣的信息。参训教师设置信息订单,由Push服务器选择生成性学习资源,推送给参训教师读取,这就更需要信息整合发布技术。
(三)资源采集与整合的技术
1.基于Mutil-Agent的分布式主题信息采集系统
(1) Mutil-Agent主题信息采集系统的概念和特征。Mutil-Agent系统(MAS)是由一组具有一定资源和能力,相对独立且相互作用的Agent组成的计算机系统,这些自主的Agent通过协作方式实现整体的功能,达到共同的目标。基于主题的信息采集系统,可以自动判断网页信息是否和主题具有相关性,如果主题和网页信息相关,即进行分析、存放网页信息。[3]具体功能表现在两方面:一方面是结构分布式,即同网络的分布一致,系统中的Agent分布于网络的各个分支资源节点上,通过协作来实现系统的整体采集功能;另一方面是工作协调性,即系统中的Agent之间通过相互间的协作,共同完成参训学员多样的信息需求,Agent之间存在相互协作和通信的机制。
(2)基于Mutil-Agent的分布式主题信息采集系统分析。分布式主题信息采集系统的关键在于对参训教师提出的信息需求进行正确的主题分析。围绕中小学教师的专业能力构成、课程标准比对、学科教学特点、中小学教师的实际需求、工作中切实遇到的难点与困惑等主题,进行知识单元的抽取。
从功能上划分,面向主题的信息采集系统由三部分构成:信息采集子系统、信息分析子系统和Agent管理子系统,如图1所示,各个子系统内部又包含功能独立的多个智能Agent组成。Agent管理子系统主要是由信息查询协作Agent和Agent管理器组成。
图1 基于Mutil-Agent的主题信息采集结构
2.基于SOA的网络信息资源采集系统
(1)面向服务的SOA架构及其基本概念。SOA(Service Oriented Architecture)面向服务的架构是一种体系结构风格。它采用面向服务的软件封装技术,用服务接口(Service Interface)和服务实现(Service Implementation)的方式呈现。本质上是一种基于组件的模型,不同的服务之间通过定义良好的接口和契约进行通信,把不同的应用程序的功能单元联系起来。[4]SOA的基本三要素是:服务描述、服务发现和服务调用,它们在不同的服务实例中由不同的实体承担。Web Services是实现SOA的多种技术之一,由于具有平台无关性、松散耦合性、易集成性及自描述性等优势,因此成为实现SOA的最佳方案。[5]
(2) Web Services实现技术和面向服务的采集系统架构。Web Service是建立在开放标准和独立于平台的协议基础之上的分布计算单元,是实现SOA的架构技术。WebSpere不仅是一个包含了编写、运行和监视的全天候的随需应变的Web应用程序,同时也指包含跨平台、跨产品解决方案所需要的整个中间件基础设施,如服务器、服务和工具。WebSpere的信息集成功能允许我们创建不同来源的结构化和非结构化信息的一致和统一的视图,例如可以创建跨越所有信息资产的自由格式搜索,这些信息资产包含Web站点、关系数据库、文件系统、门户网、写作系统和内部管理系统。根据面向服务体系结构的思想,结合项目的实际需求分析,设计出了一个基于SOA的生成性学习资源采集架构,如图2所示。
图2 基于SOA的远程培训生成性学习资源采集架构
(四)生成性学习资源采集与整合的策略
1.人工采集整合
人工采集是指远程培训生成性信息资源采集人员通过参考咨询服务、参训教师提升专业能力的需求、辅导专家的资源分类设计要求,手动将历年培训学习平台中的生成性学习资源,保存到本地服务器,经过重新加工、处理、转换后提供给参训教师查询使用。
2.自动化采集整合
自动化采集是指通过先进的自动化采集软件,将历年来的培训学习平台中,满足参训教师需求的文献信息资源采集到本地服务器,经过加工、处理、转换后供参训教师使用。自动化采集整合采用SDI(Selective Dissemination of Information)定理情报服务等先进技术,SDI采用脱机批量处理的工作方式,每次检索处理一批用户提问,用户不直接与计算机系统接触,仅向检索中心提交提问单,由检索中心按照用户要求组建成提问档,之后通过相应的软件平台进行自动化采集。
三、生成性学习资源采集与整合的意义
(一)降低学习峰值时段的服务器负载,提高检索速度
从实际的项目开展情况来看,项目开展中存在网络使用高峰。时段上集中在线上学习阶段,时间上集中在每一天的中午和晚上,特别是平台中查询检索的功能,更增加学习高峰时的服务器负载,降低了检索速度。如果将学员感兴趣的学习主题通过网络采集后存储到平台中的一个模块中,则学员只需要在平台局部进行一次查询访问,就可以较为全面获取相关的学习资料,从而减少学员对平台数据的占用时间,降低了学习峰值时段的服务器负载。
(二)将前期培训信息与当下培训资源融为整体,实现知识增值
为了提高教师师德素养和业务水平,在安徽省教育厅颁发的《关于安徽省“十二五”中小学教师培训工作的实施意见》文件中,明确了“提高有效教学能力,促进学生有效学习”的培训目标。围绕五年来每年不同的培训主题(表2),采集整合五年来培训学习平台中的生成性学习资源,进行集成、重组和融合,在培训学习平台中生成一个分系统,实现参训教师直接访问的效果。整合、集成后的生成性学习资源是各异构信息资源的有机集成和关联存储,不是简单的汇集和堆放。 摈弃其中零散的、无序的、劣质的信息,通过信息采集与整合系统,进行筛选、分类、整合,形成系统和有序的生成性学习资源,再转而通过培训学习平台向参训的中小学教师进行发布,不仅实现教师专业知识的增值,而且成为安徽省中小学教师教育网资源建设与服务的一项重要内容。
表2 安徽省2010-2014年全员远程培训的参训人数统计表
总之,每年一届的远程培训生成性学习资源的采集整合,是一项长期而又复杂的任务,不仅需要实施动态地与参训教师沟通,从参训中小学教师的视角去发现信息采集的缺陷和不足,更重要的是确实了解参训教师迫切提高专业能力的需求,在聚合的基础上,对生成性学习资源进行加工整合,形成体系化的学习资源,激励中小学教师对自身智慧的挖掘,为参训教师营建良好的学习资源使用环境,提高安徽省中小学教师教育网为中小学教师服务的能力。
参考文献:
[1]万力勇,赵呈领.用户生成性学习资源:数字化学习资源开发与利用的新视角.电化教育研究[J].2014(5):53.
[2]网络资源采集与数字资源长期保存学术研讨会论文集[M].北京:国家图书馆出版社,2013:39.
[3]杜素芳.基于主题的教育信息定向采集系统的设计[J]. 计算机光盘软件与应用,2014(13):236.
[4]李泽城,杨昆,袁磊.基于服务式GIS的昆明市区交通网络分析信息查询系统研究与实现[J].数字技术与应用,2015(1):73.
[5]薛玉军,肖明清.基于ATML的自动测试系统软件体系结构[J].空军工程大学学报(自然科学版),2014(5): 22.
[责任编辑李潜生]
The Generative Learning Resources Acquisition and Integration Strategies in Distance Trainin——A Case Study of the Primary and Middle School Teachers' Distance Training in Anhui Province
TIAN Hong-Mei,WANG Shun-he,LIANG Jing
(Anhui Radio and TV University, Hefei 230022, China)
Abstract:The connotation of generative learning resources in distance training is introduced.The basic thoughts in generative learning resources acquisition and integration are explained from its necessity, technique and strategy, the significance of the acquisition and integration is identified.
Key words:distance training; generative learning resources; topics acquisition system
中图分类号:G728
文献标识码:A
文章编号:1008-6021(2016)01-0055-04
作者简介:田红梅(1972-),女,安徽合肥人,工商管理硕士,工程师。主要研究方向:人力资源管理和信息管理。
收稿日期:2015-09-30