云计算的多源信息挖掘实验教学研究

2015-04-27 01:27邱奕敏武汉科技大学信息科学与工程学院武汉430081
山东工业技术 2015年4期
关键词:本体数据挖掘语义

邱奕敏(武汉科技大学信息科学与工程学院,武汉 430081)

云计算的多源信息挖掘实验教学研究

邱奕敏
(武汉科技大学信息科学与工程学院,武汉430081)

信息服务对现代服务业起着支撑作用。但在云计算环境下,伴随着信息的爆炸性增长,出现了信息异构、冗余、冲突和不可信等诸多问题。针对这些热门问题,通过实验教学的方式辅助学生,利用多源信息挖掘的实验来掌握整合资源的知识,为学生加深专业理解做铺垫。

云计算;多源信息;数据挖掘;实验教学

1 概 述

近年来,云计算技术越来越受到重视,得到了迅速的发展,在企业中的初步推广和应用收到了显著的经济和社会效益,成为目前的研究热点。云计算通常涉及互联网来提供虚拟的信息资源[1,2]。它提供可用的、便捷的、按需的网络访问,将传统的任务处理方式转到网络,进入可以配置的计算资源共享来支持各类应用。作为新世纪的人才,笔者所在的学院开设了有关云计算专业课程,以扩大学生的知识面,紧跟学科发展的脚步。

2 云计算的多源信息

随着应用需求的不断增加,用户希望从海量信息源中快速获取有用信息并进行处理,对软硬件系统和信息源进行操作。然而,这些信息源物理上可能分布在异构环境的多个自治域中,具有不同的数据格式、存储方式、访问控制策略,并在逻辑上存在着很大差异[3],这些差异可能是在数据模型中,或者是数据语义等方面。已有的各种异构数据管理系统,可以利用多源信息服务系统针对不同的访问方法和用户界面做处理,让用户能够访问多种异构数据源,提供一个信息交互处理平台来处理数据查询结果。由于云计算不对用户集中控制,因此用户通过简单的界面,可以得到他所需要的计算资源和信息服务[2,4]。因此,将云计算与多源信息结合起来,能够便捷地实现不同设备间的数据和应用共享,提高当前计算资源的利用率,降低服务的能耗量,并且有效降低计算资源的出错概率。

在云计算环境下,多源信息资源是通过互联网找到可用的信息的。网页和Web服务的集合是目前互联网上的主要信息资源,随着信息资源提供方式的改变,传统的网页集合变为Web服务[5]的集合,面向服务的方式变为目前的重要方式。当前信息资源的发现机制是基于语法上的和基于语义上的,前者利用关键词精确匹配,后者利用语义本体。关键词精确匹配的发现机制通过UDD I来实现。基于语义本体的发现机制则分为单独建立语义和对UDD I进行语义扩展两种。

3 云计算的多源信息挖掘实验教学

由于技术的发展,许多领域都积累了海量数据,通过数据挖掘才能将有用的数据发现和提取出来。因此我们开设云计算的多源信息挖掘实验课程,用以帮助学生加深对数据库、语义、体系结构、网络等领域的理解。将该实验课作为一个辅助手段,提高学生的专业知识,其意义非常重大。

因此,需要从以下方面来加深理解:

(1)由于不同的数据有不同的特点,因此需要用与之相关的算法来挖掘,这就需要学生们在课下做好预习工作,了解常用的挖掘算法,并将其在计算机上用程序实现。

(2)由于挖掘算法和需求的不同,例如有的可能获取的是描述型、容易理解的知识(如,采用规则表示的挖掘方法优于神经网络之类的方法),而有的获取的是预测准确度尽可能高的预测型知识。所以需要学生们根据自己的需要选择挖掘算法,之后就可以实施数据挖掘操作,获取有用的模式。

(3)了解了数据的特点和挖掘算法后,还需要使信息资源和用户需求匹配,即用户需求经过语义处理后可以和信息资源通过本体匹配,实现用户需求和信息资源的语义匹配。这就需要学生们实验时对本体和匹配知识有一定的了解,查询相关的概念和资源,帮助更好的实现多源信息挖掘实验。

(4)由于云计算的多源信息挖掘囊括了很多领域的知识,因此实验教学的难度很大,需要教师和学生的默契配合,实验教师应该根据知识的特点,利用各式各样的例题来帮助学生加强理解;学生也需要对书上的例题多加练习,多在互联网上查询相关的资料。

4 结语

多源信息是目前和未来互联网环境中数据挖掘的重要研究点,云计算的多源信息挖掘机制能保证精准高效的信息查询。云计算的多源信息服务系统研究,虽然是一个较新的研究方向,但由于它的研究主要是从知识管理、软件工程和信息检索应用技术发展起来的,其涉及到的机器学习、信息融合与信息集成已经取得了众多的研究成果。信息检索、语义Web、本体学习、W ebServices的相关方法和技术都可以作为参考和借鉴。这些知识的融合可以帮助学生提高兴趣,加深对专业领域的理解,并能够作为相关知识的一个延续,促使学生紧跟专业发展的脚步。

[1]Peter Fingar著,王灵俊译.云计算21世纪的商业平台[J].北京:电子工业出版社,2009(09).

[2]陈全,邓倩妮.云计算及其关键技术[M].计算机应用,29(09),2009,pp. 2562-2567.

[3]Anastasios Kementsietsidis, Marcelo Arenas. Data Sharing Through Query Translation in Autonomous Sources. In Proceedings of the 30th International Conference on Very Large Data Bases (VLDB 2004), Toronto, Canada, 2004:468-479.

[4]杨善林,罗贺,丁帅.基于云计算的多源信息服务系统研究综述[N].管理科学学报,15(05),2012,pp.83-96.

[5]吴朱华.云计算核心技术剖析[J].人民邮电出版社,2011.

猜你喜欢
本体数据挖掘语义
真实场景水下语义分割方法及数据集
改进支持向量机在特征数据挖掘中的智能应用
基于MFI4OR标准的本体融合模型研究
眼睛是“本体”
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
软件工程领域中的异常数据挖掘算法
“吃+NP”的语义生成机制研究
情感形容词‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的语义分析
汉语依凭介词的语义范畴