数学在大数据挖掘中的应用探究

2019-04-03 05:40袁志康
读天下 2019年7期
关键词:数据处理数据挖掘大数据

摘 要:大数据技术是互联网信息技术发展下重要的科技产物,大数据通过对不同领域的巨量数据进行统计,从而完成数据整合,形成数据分析。本文主要以大数据挖掘和处理当中所应用到的数学知识为出发点,对大数据技术当中常常运用的数学原理和数学知识进行整理,从而了解数学知识在现实生活当中的应用价值和主要运用方向。

关键词:数学;大数据;数据挖掘;数据处理

与一般的数据处理方式不同,大数据技术所进行的数据分析和数据挖掘当中的对象数据,通常是普通软件在一定的时间之内无法完成统计和整理的数据内容,大数据技术需要另辟蹊径,通过先进的处理模式,完成对于数据的分析,从而实现数据整合。因此在目前阶段,大数据技术具有5V特征,其中巨量、高速、多元、真实以及低价值密度等,是使其领先于其他数据技术的重点要素。

一、 大数据挖掘过程中的数学原理

在进行巨量数据的挖掘时,技术手段需要对庞大凌乱的数据信息进行整理和搜索,从而形成清楚、明确的数据信息类别,其中数学知识当中的聚类分析法,是大数据挖掘过程当中主要采取的挖掘策略。目前大數据技术主要采用灰色关联、目标函数模糊以及区间值算法来实现聚类分析的数据挖掘。

(一) 灰色关联法的应用

灰色关联主要用来对巨量数据当中各项因素之间所呈现出相同或相异的发展趋势、发展程度进行分析比较。在数学知识当中,灰色关联法可以对各项因素之间的关联程度进行归纳,从而了解因素的性质和发展特征。而在大数据挖掘当中,借助因素分析和总结,能够帮助大数据技术实现对于对象数据的动态观察,从而实现对数据发展历程的研究。数学知识在进行灰色关联表达时,通常借助影响因子集和因子间关联映射集来共同构成关联分析系统,表达式为S=(X,R),而在大数据技术当中,技术研究人员则通过对数学原理的开发,形成了基于集合的灰色管理法。灰色管理法是将数学表达当中的因子关系通过几何曲线的方式进行绘制,并根据绘制出的集合形状,开展对于对象数据的整合处理。在处理过程中,所完成绘制的几何曲线与几何形状的整体趋势越接近,表明数据信息之间的因子关联度就越高,二者之间表现为正相关关系。技术研究人员通过这一策略,能够有效地将数据当中残存的数据片段或者数据量较小的数据单元挖掘出来,从而获取其重要的价值信息。

(二) 目标函数模糊法的应用

在实际生活当中,运用模糊聚类方法这一数学知识进行应用和数据处理,主要集中在图片信息、计算机信息等处理领域,而随着技术的发展与进步,模糊聚类方法在一些复杂的数据挖掘当中,也得到了广泛的运用。其中借助目标函数来开展模糊聚类的信息处理方式,已经成为现阶段大数据挖掘技术当中的重点技术。众所周知,大数据挖掘所面对的巨量数据往往信息内容杂乱、信息处理难度高。而基于目标函数的模糊聚类技术则主要能够处理高纬度的信息内容,同时其所具有的伸缩性和高效率特征,也解决了以往困扰数据技术应用和创新领域多年的问题。在具体的应用环节当中,技术研究人员需要首先结合对象样本的数据内容设定目标函数,并借助目标函数的标准化来设定具体的科学指标,从而使数据内容可以整合到一个模糊的矩阵当中。模糊矩阵的处理方式主要为直接聚类以及模糊等价两种方式,两种方式所面对的是数据集整合目的和关键指标聚类的要求,因此技术研究人员可以依照编网法、最大树法,实现对于矩阵信息的提炼,完成聚类。

(三) 区间值算法的运用

区间值算法是聚类算法当中的一个重要的组成部分,在数学知识当中,区间值算法能够实现对于不完整的信息的整理和分析,从而实现信息提取完成聚类。大数据技术在进行数据挖掘时,同样会运用到区间值算法技术,通过对复杂的数据进行挖掘,并从中完成数据的转化,使数据能够具有比较性。在数据挖掘实践当中,区间值算法要求技术研究人员能够通过对数据范围进行固定取值的方式,实现对于数据的科学分析,其中数与区间聚类法,是将数理统计原理融入到区间值的而运算当中,帮助技术研究人员精准判断样本数据对象的挖掘区间,并确定数据之间的信息相互关系,从而完成区间值的确定,实现数据挖掘。

二、 大数据处理技术中的数学原理

在大数据挖掘的过程中,大数据技术还需要及时对所完成挖掘的数据信息内容进行处理。对于数据挖掘工作来说,数据处理技术应当具备极高的时效性,处理技术应当在一定的时间内完成处理任务,保证处理效果。通常情况下,受到原始数据的噪声干扰、数据指标集过于庞大,都可能造成数据处理的失败。因此在现代数据处理技术当中,技术研究人员通过数学知识的运用,来实现数据处理的准确性。通常情况下,为了保证数据处理不受到因素干扰,处理技术当中通常会采用数学知识中的统计学算法,将相关性分析作为基础,对数据进行分组,完成处理。相关性分析法还要求能够结合数据当中的数量变化规律,进行数学建模,并结合已知信息来推导出未知信息,从而实现对于已挖掘到的数据样本的校验和判断分析。

三、 结论

综上所述,在实际的大数据挖掘技术运用当中,有着大量的数学知识和数学原理得到了运用。大数据技术作为对于巨量数据进行整理和分析的技术,其势必要面临数据的趋势、数据的发展和信息的变化,而数学模型和数学统计在这些方面均具有极大的优势,可供大数据挖掘分析进行吸取和借鉴。

参考文献:

[1]李佐军.大数据时代下关联规则兴趣度挖掘在就业分析中的应用[J].软件工程,2018,21(11):25-27.

[2]关雪峰,曾宇媚.时空大数据背景下并行数据处理分析挖掘的进展及趋势[J].地理科学进展,2018,37(10):1314-1327.

作者简介:

袁志康,重庆市,重庆南开中学。

猜你喜欢
数据处理数据挖掘大数据
电容式传感系统数据处理电路的设计
基于ARCGIS 的三种数据处理方法的效率对比研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
高层建筑沉降监测数据处理中多元回归分析方法的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
视频大数据处理的设计与应用
基于大数据背景下的智慧城市建设研究
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书