韩丽屏
摘要:在网络技术、信息技术和多媒体技术的迅猛发展之下,支撑通信的硬件设施也在不断完善,通过互联网迅速、方便地与世界无界限沟通的用户比例持续增加。为广大学习者自由寻找新型数字化教学资源提供了开放、快速、交互的渠道。为随时随地学习提供了极大便利的同时,同时如何有效地找到适合的教学资源,加强资源的分析处理,避免同类资源的重复开发,促进现有资源的高效运用也成为权威资源开发部门和各大院校亟待解决的问题。文章通过分析、比较现有教学资源信息分析处理的基础上,研究如何将Web挖掘技术引入有效教学资源获取的智能分析处理中,构建基于Web挖掘的海量信息分析方法,快速获取网络世界中海量教学资源,分析归类形成资源库,以便智能获取有效教学资源信息。
关键词:Web挖掘:教学资源;智能分析
Web挖掘是建立在对网络上大量信息分析的基础上,利用数据挖掘算法有效地收集、选择和存储所需要的有价值信息。在日益增多的信息中发现新的概念和相互间的关系,以实现信息处理的自动化,数据收集和数据的分析处理对学校建立智能的教学资源库有着重要的意义。为了能准确、智能化地获取所需的数字化教学资源,需要通过互联网准确发送搜索请求,实现查询需求的网络化表达,而这就需要依靠Web挖掘技术来实现。
(1)互联网的飞速发展,冲击传统教学资源获取形式,越来越多的学习者通过互联网的途径获取有价值的知识。
(2)高校、教育机构、官方教育部门和个体学习者纷纷将教学资源开发成数字化形式,方便高效使用,已经形成了现有网站中大量的教学资源。
(3)有效获取教学资源需要先进信息技术的支持,否则开发者与使用者无法形成实际意义上的“供求”关系。
(4)提出运用Web挖掘技术高效获取网站中的海量资源信息,快捷运用现有资源,避免重复开发,从大量信息智能分析的角度,为新型“高效教和自主学”提供技术层面的支持[1]。
1 基于Web挖掘的教学资源分析方法现状
1.1互联网发展现状
伴随着互联网发展日趋成熟,越来越多的学习者可直接通过网络形式获取大量自身所需的信息,这其中网络教学、网络资源开发、网络教育平台也迅速成为除传统课堂教学之外学习者获取知识的最有效途径。
1.2高校教学资源开发现状
随着网络技术的迅猛发展,各地学校已经意识到信息技术在数字化教学资源建设中的重要性,纷纷加大力度进行数字化信息技术的运用,但在具体教学资源开发推进过程中,也遇到了制约发展的瓶颈:由于缺乏统一的标准和权威平台的支持,形成现在各个院校之间“各自为阵”的局势,很多重复性、低使用率的建设工作一再进行,浪费了大量的人力和物力,使得海量的教学资源的开发陷入低使用率和低推广率的尴尬境地[2]。
2 基于Web挖掘的教学资源分析方法研究的内容和方法
2.1项目研究的内容
在网络技术、信息技术和多媒体技术的发展之下,支撑通信的硬件设施也在不断完善,通过互联网迅速、方便地与世界无界限沟通的用户比例持续增加,为广大学习者自由寻找新型数字化教学资源提供了开放、快速、交互的渠道。为自由学习提供便利的同时,如何有效地找到适合的资源,加强资源的分析处理,促进现有资源的高效运用也成为权威资源开发部门亟待解决的问题。
本文通过研究现有的网络教学资源获取方式以及分析方法的特点,找出不足,探讨在海量数字化教学资源获取过程中的智能搜索和智能分析方法,从而构建基于Web挖掘的教学资源智能分析模型,并思考如何将海量教学资源构建为教学资源库的方法。2.2项目研究的目标 文章主要研究如何将Web挖掘技术运用在海量网络教学资源的有效获取中,分别进行Web挖掘的新技术和新理论的研究、如何建立专门针对网络教学资源构建所需的智能分析方法、如何建立“基于Web挖掘的教学资源智能系统模型”,为Web挖掘在资源获取中的具体实施提供有利支撑。
2.3拟解决的关键问题
(1)解决教学资源获取中大量依赖人工获取的问题。在现行的教学资源获取中,人们多是借助搜索引擎等工具进行“半自动化”的搜索,获取的资源模较大且质量差,实际能用的有价值信息仍需通过人工区分归入资源库中,形成真正有“教学资源”。而网络信息量巨大,动态更新速度快,依赖人工手动搜索的形式加重了人力负担,又无法跟上网络动态更新速度。
(2)解决获取的教学资源缺乏智能化分析处理的问题。由于现行的网络信息获取和分析多采用类似搜索引擎的网页搜索與分析技术,存在收集与分析分离、对所收集的教学资源信息无法进行深层次分析和处理。本文提出寻找智能分析手段的想法,以适应网络信息日益增长和动态变化的特点。
(3)解决教学资源获取和分析的模型问题。本文将Web挖掘技术与教学资源库建立的特点相互结合,尝试建立智能分析模型[3]。
3 基于Web挖掘的教学资源分析采取的技术路线及关键技术
3.1 Web挖掘的技术方法
Web挖掘技术实现了海量网络信息中有效资源的智能挖掘。Web挖掘不仅是对文字内容的查找,更是对网络中不同媒体资源分析和搜索的过程。网络资源类型的多样性决定了挖掘任务的多样性。智能搜索出的资源会根据不同媒体形式采取不同呈现方式。在Web挖掘中根据挖掘对象不同分为Web内容挖掘、结构挖掘和使用挖掘3方面。
Web内容挖掘是指从Web的文档内容及描述信息中可有效地对大量文本内容进行总结、分析、聚类和关联分析。
Web结构挖掘是指通过挖掘到的资源的内部结构和链接关系,开展进一步的分析,研讨该资源蕴含的更多有效和有用的知识,以便获取更多与搜索主题相关的链接和逻辑结构,从而获取拓展的知识结构。Web结构挖掘主要运用于分析阶段。
Web使用挖掘是针对用户访问Web时在服务器上留下的访问记录进行挖掘,获取用户访问Web页面的模式,分析用户潜在需求特点进行挖掘,也可称作Web用户日志挖掘。
针对Web的内容挖掘主要任务是提高教学资源的质量,并帮助用户过滤落后、无用的资源:针对Web的结构挖掘是发现不同类型教学资源之间的联系并判断资源的重要性,实现资源的自组织和自适应功能:针对Web的使用挖掘则有利于改进资源库中资源聚类的结构和组织形式,以提高库的有效使用性[4]。
3.2研究所用技术路线
通过建立“基于Web挖掘技术的教学资源智能分析模型”,串联整个项目研究过程(见图1)。
3.3选用的主要实验手段
在“数据层”的建立中,我们选择从高校教学资源网、教育机构网站、教育部门专题网站、热门个人网站以及新媒体网站中获取教学资源的初始化信息。
在“挖掘层”的建立中,对初始信息资源库中的素材进行Web的内容挖掘、Web的结构挖掘、Web的应用挖掘。 在“分析层”的建立中,将挖掘的教学资源进行识别和聚类,主要功能是将经过挖掘处理后的模式和知识形式化描述。在题网站、热门个人网站以及新媒体网站中获取教学资源的初始化信息。
在“应用层”的建立中,用户可以通过一定的软件平台查看挖掘分析结果,也可运用可视化技术直观展示结果。
3.4采取的关键技术
目前Web挖掘的主要技术包括统计分析、关联分析、序列分析、分类分析和聚类分析等,统计分析是指充分运用概率学、统计学的原理,对资源的各项属性进行有效分析统计,找出内部的相关性和规律性;关联分析是指挖掘隐藏数据中的相互关系,通过分析记录集合推导出属性间的相关性;序列分析有类似于关联分析的部分,也是为了分析数据之间的相互关联性,但它更多地是为了分析出数据之间前后关系的规律;分类分析首先按照特定标记对记录集合进行分类,然后按照特定标记分类的记录集合更丰富、更细致的特征描述;聚类分析是一种以探索性分析为主的分析方法,它主要是按照信息的某种相近、相似程度,将一组未分类的信息分成互补相同的类型[5]。
4 研究特色
4.1挖掘技术
本项目在挖掘技术的研究中尝试将Web挖掘技术运用于网络教学资源的有效获取中,便于形成自动和智能的资源获取形式。Web挖掘技术源自传统的数据挖掘技术,但又不是单纯的数据挖掘,而是结合网络技术和信息技术的新特点而产生的交叉型技术和理论体系。这一技术的出现实现了互联網海量信息、数据和资源的有效分类和智能搜索。本项目基于这一技术特点并结合各大院校对教学资源迫切需求的现状,尝试将Web挖掘运用于网络资源的获取中。
4.2分析方法
本文在智能分析方法的寻找中,针对现行的网络信息获取和分析多采用类似搜索引擎的网页搜索与分析技术,存在收集与分析分离、对教学资源信息无法进行深层次分析和处理的问题。提出寻找智能分析手段的想法,以适应网络信息日益增长和动态变化的特点。
4.3模型建立
本文力求建立“基于Web挖掘的教学资源智能系统模型”,为Web挖掘在资源获取中的具体实施提供有力支撑。针对各学校教学资源库在建设和使用过程中对资源的不同使用需求进行分析和获取,并且预测资源真实的使用周期,建立基于Web挖掘技术的教学资源分析模型。
[参考文献]
[1]赵玺基于海量冗余网页过滤的Web挖掘技术研究[J]..科技通报,2013 (4):21-22
[2]刘东慧,姜薇.基于事件本体的Web不良信息挖掘[J].山东大学学报(工学版),2012(5):35-40.
[3]尤建新,孟银薇基于Web数据挖掘的网站知识获取及应用[J].上海大学学报,2014 (3):261-273
[4]徐昊,谢文阁一种隐式关联面面的挖掘方法[J].计算机系统应用,2014(9):167-169
[5]陈永当,王钰鑫,鲍志强,等基于用户访问信息的数据挖掘方法及其算法[J].计算机工程与应用,2012 (15):133-179