云计算的数据挖掘应用分析

2019-10-08 05:07黄青蓉
无线互联科技 2019年14期
关键词:云计算关键技术

黄青蓉

摘   要:在当前的科学技术发展背景下,人们对数据传输的要求已经无法得到满足,在云计算具有的流通性、延展性、稳当性、低廉的成本、数据存储的大容量和处理能力的优势下,云计算能为使用者带来优质的服务,在云数据的基础上缩减在企业数据挖掘的资金投入,这样就能获得更大的利益。文章对云计算的数据挖掘应用进行了具体阐述。

关键词:云计算;数据挖掘方式;关键技术

在当代的社会发展背景下,我国的科技和经济发展取得了巨大的成就,人们手里拿着手机、平板电脑和计算机等电子产品的景象随处可见。由此可见,互联网已经很好地融入了人们的生活,与人们的生活密切相关,并且人们对其产生的依赖性也是不可估量的。随着互联网大数据信息的飞快增长,人们想在海量的信息中提取自己所需要的信息逐渐变得非常困难。如何在众多的数据中精准地找到有效的信息成为当前人们最需要探究的问题。所以,云计算系统应运而生。在传统的数据处理模式下,云计算系统基于云数据另辟蹊径,云计算只需提供一个平台,使用者就可以随时随地地提取自己想要的信息,但在这样大的一个数据模式下,挖掘信息本身就存在一定的难度。

1    云计算概念及特点介绍

云计算自诞生之日起,至今也没有一个准确的概念。但是根据大多数人对云计算的理解,现在总结出了以下两点:(1)简单来讲,云计算就是一个大的储存器,里边有着成千上万的资源,每种类型的资源都有着不同的作用。云计算的优势表现为能将这些不同类型的资源进行整合分配。(2)对于使用者来说,云计算的使用简单便捷、全程对外开放、没有隐蔽性。使用者想利用云计算获取想要的、有价值的信息,不会在意云计算的运行原理以及是谁在背后使其运转的,人们只想要获取信息。但云计算本身是存在安全隐患的,如果一直承载着巨大信息量的数据库,在此基础上加上计算机的数量,会一直存在安全隐患。最后的结果可能会使整个云计算系统瓦解。仅凭借扩展硬件设施是不可行的,需要充分地发挥软件管理的作用。这就需要将系统分散成一个个板块,在其中应用冗余和分布式储存的方法。云计算系统的另一个优势是具有自我检测的功能,它能在不影响正常工作的环境下进行检测,如果检测出来没有效果的节点,它就会自动删除。简而言之,云计算系统的数据非常多,存储能力也非常强,计算能力较强,结合诸多优点,必定能给用户带来舒心、便利、优质的服务。

通过对云计算的研究,发现它一共有5个方面的特点,分别是虚拟化、共用性、规模大且延伸性强、可依赖性高和经济适用。云计算虽然不是实物,但它拥有着数以千万计的数据,能让用户在世界上的任何一个角落通过终端获取自己所需的信息和服务。它没有限制性,可以利用云计算开发出不同的應用,这些应用在不影响用户的正常使用下可同时运转。云计算是可以延伸的,且是动态延伸。在现在的技术支持下,最多能延伸至几十万台电脑,并且整个过程使用者是可见的,是透明的。为了使用户用得贴心,让用户感受到高效的服务,产生信任感,需要发挥云计算固有的优势,使用自动化管理机制,降低企业将承担的巨额成本。对于传统的系统来说,云计算系统的成本更低[1]。

2    数据挖掘的方式

数据挖掘是单调的,是一个需要不断地重复测试、调整和修理的过程,这个过程漫长而复杂,因此,这项工作是比较艰辛的。整个数据挖掘要先进行数据预处理,然后再进行数据挖掘,最后才是评估和表示。数据挖掘有很多种方法。(1)基于历史的主引导记录(Master Boot Record,MBR)分析,基于历史的MBR分析方法最主要的概念是用已知的案例来预测未来案例的一些属性,它一般就是找雷同的案例来作分析和比较。在记忆基础推理法中有两个重要的因素,分别为距离函数与结合函数。距离函数用于找出雷同的案例,用函数把雷同的案例串联起来,等到测试的时候用。记忆基础推理法的好处是它能容纳所有不一样的数据,这些数据不用建立在假设的基础上,另一个优点是其具备学习能力,能从旧案例的学习中来获取关于新案例的知识。记忆基础推理法的缺点首先是需要非常多的历史数据,因为有充足的数据作对比才好预判。其次,在处理数据上比较浪费时间,它不能很好地看出距离函数和结合函数的区别。(2)购物篮分析,也称“市场篮分析”,它用于在大数据下分析客户的购买行为,商家可以利用这些信息向其他客户推荐自家产品,还可以将这些产品进行线上促销。(3)决策树,在分析解决对策和预判方面有强大的能力,用运算的方式表达,可有效解决问题。(4)遗传算法,是学习细胞演练的过程,细胞间可经由不断的选择、复制、交配、突变而产生新细胞。基因算法的运作方式相同,首先,一定要提前建立好一个模式;其次,再利用产生的新细胞使其运作;再次,用适合的函数进行检测,看是否可以和这个新建立的模式相匹配,直到最后,仅剩的那一个细胞才有机会存活。(5)聚类分析,这项技术涉及的范围非常广,基因算法、类神经网络、统计学中的群集分析都有这个功能。它的目的是找出在数据中隐藏的、之前没有被发现的群体。在非常多的案例分析中都会用到这种技术来进行初始研究[2]。(6)连接分析,是把数学中的图形理念当作基础,从记录其关系到发展成为一个新的模式,比如电信行业,可通过分析顾客使用电话时间的长短和次数,来得出顾客的号码是什么,从而做出一个有利于公司发展的计划书。除了电信行业以外,现在越来越多的行业分析人员都会用连接分析法来为自己所在的公司做更有利于企业发展的研究。(7)联机分析处理(Online Analytical Processing,OLAP),严格说起来,OLAP分析并不算是一个特别的数据挖掘技术,但是通过分析数据的工具能让使用者更加清晰地知道数据更深层面的意思和涵义,就像视觉处理技术一样,通过图表或图形将数据以简单、明了的方式呈现,对一般人来说,效果会更直观。这样就能实现将数据变成信息的目标。(8)神经网络法,是不断地学习之前的知识,将知识进行温习和巩固,把例子和学习结合起来使其变成一种新的结果,这种方法属于机械化的学习,学习效率非常高。(9)判别分析法,是当所设想的问题变成现实时,它一般用于解决分类问题。(10)罗吉斯回归分析,当分析的群体不符合一般的假设时,罗吉斯回归分析是很好的第二解决方案。这个方法不是用于预测事物是否会发生,而是用于预测这件事情发生的概率有多大,以便在很大程度上减少失误。

3    数据挖掘在云平台上的应用

伴随着“互联网+城市”的崛起,人工智能、大数据分析、数据挖掘以及物联网等信息化技术已经融入城市生活的方方面面。共享单车这种新兴的项目得以迅猛发展,是因为充分应用到数据挖掘技术。(1)应用关联规则算法分析单车的投放地点与投放数量,确保一天的投放量能满足该地段的用户需求,同时,采取相应的措施对该地段进行监管。(2)跟踪每辆单车,以获得有缺陷车辆的信息,对长期未使用的单车进行维护,从而有助于后期更好地使用。(3)合理应用聚类分析中的K均值算法,用于分析和计算4个季节的单车循环率,以有效地控制每个季节单车的投放与回收数量,提升单车的利用率。(4)考虑气候因素,聚类分析中的K均值算法可用于统计分析晴天、阴天、雨和雪天等气候条件下的单车利用率,有效地优化单车的运营方案。

4    云计算关键技术

云计算的技术有很多,但是如果没有最核心的技术,云计算终有一天也会走向失败。云计算在虚拟化、数据存储、数据管理、编程模式等方面都有自己独特的技术。但在现在的社会发展背景下,最直接、有效的方法是分布式计算法,这个方法包含了两个部分,一部分是关于数据存储的;另一部分是关于数据计算的[3]。这两部分在现在的云计算平台上是必须包含的,它是支持整个数据挖掘的核心,现在GFS,KFS,HDFS等3种分布式文件的系统中是最受欢迎的,谷歌公司的分布式系统就是这部分理论的结合,KFS,HDFS这两种算法已经被运用于商业和学术的领域,由此可见,它的地位并不一般。

5    结语

本文探究了云计算的概念、数据挖掘的方式還有云计算的关键技术,由于现在互联网的普及,数以千万计的冗余数据正在困扰着各行各业的人。和传统的数据系统相比较而言,云计算的优势要大于传统的数据系统。为了让用户用得舒心,让他们感受到高效的服务还有对云计算的依赖性,云计算充分发挥了自身的优势,使用自动化的管理机制,减少人们将承担的成本。对于传统的系统来说,云计算系统的成本更低。云计算系统的数据非常多,存储能力也非常强,计算能力也不在话下,这么多的优点结合,必定能给用户带来舒心的、便利的、优质的服务。随着科技的高速发展,笔者相信云计算技术也会发展得越来越好,日后云计算将会给数据挖掘带来新的进展,带领人们更好地走向未来。

[参考文献]

[1]孙亮.数据挖掘服务模式应用云计算的优化策略探究[J].黑河学院学报,2018(1):23-25.

[2]王勃,徐静.基于云计算的Web数据挖掘Hadoop仿真平台研究[J].电子设计工程,2018(1):43-44.

[3]包科,蔡明.高速接入网云计算平台的大数据挖掘算法探究[J].机床与液压,2017(12):143-144.

猜你喜欢
云计算关键技术
小麦春季化控要掌握关键技术
棉花追肥关键技术
成功育雏的关键技术
老苹果园更新改造的关键技术
跨座式单轨与中低速磁浮信号系统的关键技术
杉木萌芽更新关键技术
实验云:理论教学与实验教学深度融合的助推器