王曙霞 焦家林 黄志武
(湖北工程学院计算机与信息科学学院,湖北 孝感 432000)
移动互联终端的海量云数据挖掘技术研究
王曙霞 焦家林 黄志武
(湖北工程学院计算机与信息科学学院,湖北 孝感 432000)
在如今的计算机管理技术不断发展的过程中,用户在使用过程中更加注重信息挖掘速度。传统数据挖掘技术已经不能满足实际需要,对移动互联终端的海量云数据挖掘技术成为研究热点。本文通过对移动互联终端的海量云数据挖掘服务架构的研究,提出云数据挖掘技术建模流程以及云数据挖掘模型体系结构,从而有效提高了移动互联终端的海量云数据挖掘的实用性与速度。
移动互联终端;云数据;数据挖掘
随着计算机信息管理技术的不断发展,对于数据管理要求水平也在不断提高。在计算机信息管理过程中,用户对于信息提取速度更加关注。在互联网移动终端,客户在使用过程中的信息挖掘速度是影响计算机信息管理效率非常重要的一个指标[1]。目前,海量云数据挖掘技术已经成为了人们关注的热点研究问题。算法包括基于马尔科夫算法的数据挖掘方法、基于K均值聚类算法的数据挖掘方法以及基于集中式云数据计算的海量云数据挖掘方法。其中,基于集中式云数据计算是最常见的计算方法。海量云数据挖掘方法的应用十分广泛,作为最实用的研究课题,受到许多有关专家和学者的重视,未来的发展前景十分广阔。在移动互联终端的海量云数据信息管理过程中,数据对象差异比较大并且具有复杂性较大等特点。
目前,移动互联终端海量云数据具有超大规模的存储以及计算能力,云数据具有结构与资源动态的伸缩性,同时通过虚拟化的技术与庞大的资源提供服务。基于移动互联终端的海量云数据特点让数据分析、储存和应用具有商业化发展的特点,让云数据挖掘成为一个非常具有应用价值的研究领域。在业务的不断增长中,企业数据库对于商业数据的积累数量在不断增加,传统的移动互联终端海量云数据挖掘技术已经无法满足如此大量数据对计算能力的需求。且传统的集中式海量云数据计算法在对数据进行挖掘处理的时候,会使算法陷入一个无穷对比的情况,存在时间复杂度高、算法不收敛等弊端,大大降低了信息管理的效率。所以需要建立一个高性能计算能力的移动互联终端海量数据挖掘模式[3]。同时为了适应数据数量的不断增长以及满足实际的跨地区服务需要,企业的数据储存要分布储存在数据中心,构建一个能够处理分布式执行数据、分布式数据储存的数据挖掘模式。
现在大多数的数据挖掘解决方案都是以系统为中心,更加注重系统工程以及算法,但是往往忽略了从用户角度出发的数据挖掘技术应用,增加了用户在使用系统过程中的难度。使得一些数据挖掘工具只能针对技术人员使用,如果对于算法不了解,很难得出好的模型,这对于企业纵向开发数据挖掘技术平台不仅增加了难度,同时也增加了企业成本。移动互联终端的海量云技术从面向服务的方面为数据挖掘提供更好的解决方案。在移动互联终端的海量云数据的存储、应用等过程中都是可以共享的资源[4]。作为一种商业计算模式,能够将移动互联终端的海量云数据挖掘作为一种服务按需出售,同时降低了一些中小企业的数据挖掘成本,为移动终端的海量云数据挖掘商业应用提供更好的平台。移动互联终端的海量云数据挖掘的功能集合包括分析、挖掘、数据选择、数据集成等,并通过对这些功能的混合搭配形成新的复合应用。并且通过虚拟化、接口、集成等技术[5],将软硬件封装打包成为相对应的服务模块,相应基础设施、平台应用等不同的服务请求,从而形成一整套完整的服务模式,因此在移动互联网终端的海量数据挖掘下,能够为用户提供出一整套良好的解决方案,根据数据挖掘的行为和需要,结合云计算的系统体系,设计一套完整的数据挖掘服务结构,如下图1所示。
图1 基于移动互联终端的海量云数据挖掘服务结构
实现移动互联终端的海量云数据挖掘,最重要的是通过对上述的系统框架进行分析,建立一个数据挖掘组件模型。通过对于实际服务应用的数据、识别、描述的关联,构建出一个完整的组件模型。具体的组建流程如图2所示。
图2 移动互联终端的海量云数据挖掘技术服务创建流程
在问题领域中理解并且收集数据挖掘服务的相关信息,对于其核心功能定位同时支撑所需服务数据的产出。通过对于获取数据挖掘的相关业务形成服务数据挖掘项目中的候选项目。同时在功能和数据组成的数据挖掘服务中,对于相关数据建立关联。通过对于整体方法和服务的数据绑定,实现服务定义的功能。通过对服务结构的统一,实现独立的服务组件。
为了实现上述移动互联终端的海量云数据服务创建流程,在模型中的体系结构如表1所示。
表1 移动互联终端海量数据挖掘模型体系结构
在移动互联终端海量数据挖掘模型体系结构中,基础设施层主要提供数据挖掘服务所需的存储资源。基础设施层通过终端接口将各种物理资源接入到网络中,实现互联网与现实物理资源的共享,并且为虚拟化的服务过程提供接口[6]。同时虚拟化层通过虚拟化工具的利用,将移动互联终端的海量云数据下的分布式资源相汇聚,并且进行集中、统一的资源管理,从而实现移动互联终端的海量云数据挖掘中资源的合理分配,将封装资源统一提供给平台层进行开发应用。而平台层作为数据挖掘服务中的核心服务层,为数据挖掘服务的实施和管理提供各种核心的功能,用于任务实施的管理、计算以及调度等等。最终的结果由应用层来进行处理,应用层由接口层和终端层两部分组成,是提供用户认证、管理、请求的主要服务端口。用户可以通过PC机、页面、移动终端等等实现访问与云数据挖掘。
在移动互联终端的海量云数据挖掘技术中,仍存在研究和应用上的不足。根据海量云数据的需信息资源服务模式,本文提出了数据挖掘模型的结构与流程,帮助搭建一个完整的数据挖掘服务体系,并且阐述了数据挖掘的整个过程,从而有效提高了移动互联终端的海量云数据挖掘的实用性与速度。
[1]黄潮.云计算环境下的海量光纤通信故障数据挖掘算法研究[J].激光杂志,2017(1):96-100.
[2]陈炎龙,段红玉.基于改进Hadoop云平台的海量文本数据挖掘[J].湖南师范大学自然科学学报,2016,39(3):84-88.
[3]米允龙,米春桥,刘文奇.海量数据挖掘过程相关技术研究进展[J].计算机科学与探索,2015,9(06):641-659.
[4]胡敏,王鹏,于京杰.基于移动互联网和数据挖掘技术的门诊排队流程设计[J].医学研究生学报,2015(2):192-194.
[5]万祥,胡念苏,韩鹏飞,等.大数据挖掘技术应用于汽轮机组运行性能优化的研究[J].中国电机工程学报,2016,36(2):459-467.
[6]曾志华,李聪.云计算环境下频繁出现异常数据挖掘方法研究[J].计算机仿真,2016(03):339-342.
[7]邓仲华,刘伟伟,陆颖隽.基于云计算的大数据挖掘内涵及解决方案研究[J].情报理论与实践,2015,38(7):103-108.
Research on the Massive Cloud Data Mining Technology for Mobile Internet Terminal
Wang Shuxia Jiao Jialin Huang Zhiwu
(Hubei Engineering University,Xiaogan 432000,Hubei)
In the development of computer management technology,users pay more attention to the speed of information mining.The traditional data mining technology has been unable to meet the actual needs,the massive cloud data mining technology for mobile Internet terminal becomes a hot research topic.This paper studies on the massive cloud data mining service architecture for mobile terminal,puts forward the modeling process and the structure of cloud data mining,effectively improving the practicability and speed of massive cloud data mining for mobile terminal.
mobile internet terminal;cloud data;data mining
T9311
A
1008-6609(2017)10-0026-03
王曙霞(1975-),女,湖北荆门人,硕士,副教授,研究方向为大数据、智能计算、网络安全等。
湖北工程学院科学研究计划项目,项目编号:201615。