浅析数据挖掘中的聚类方法及其应用

2018-03-22 11:23:15
数字通信世界 2018年4期
关键词:数据类型数据挖掘聚类

张 豪

(上海大学通信与信息工程学院,上海 200000)

数据挖掘在我国的发展已经有了几十年的发展,但是与国外的发达国家相比较来看,我国的信息化无论是发展水平还是发展速度都要远远落后。但是,伴随着我国社会经济的快速发展,我国的信息化的水平也开始奋起直追,尤其是在很多企业的管理部门得到了非常充分的利用。在这样的情况下,数据挖掘就成为了关键。通过对于信息化的数据进行深度整合与再利用,不仅能够保证我国的企业管理更加的简单高效,而且也能够进一步增强企业各个方面的发展,从而促进更高的经济效益和社会效益。

1 数据挖掘

由于统计在我国的发展时间较短,我国目前对于数据挖掘的认识程度还不够完善。针对这一问题,必须要加强对于数据挖掘,尤其是在大数据信息平台环境下,信息数据的处理更加复杂,对于信息数据的把握也直接影响了企业的发展前景。在数据挖掘的过程中,一定要注意信息化水平的提升,增强的地位,促进能够更加提高对于数据的整合与管理,从而帮助管理层提供科学的决策方案[1]。另外,企业管理者必须要增强对于数据采纳,明确信息数据处理的精细化和深度化,这样才能够改善信息质量,促进企业内部控制制度的有效提升。通过对于科学的审计方法才能够增强企业的经济发展,提高企业整体的工作运行效率,减少不必要的资金投入,更好的促进企业又好又快的发展。

2 聚类方法

聚类作为数据挖掘中主要的方法包括很多种方式,例如分割方法、分层次方法、基于密度方法,基于网格方法。不同的聚类方法都有不同的适用情况,在遇到数据挖掘过程中,特殊的问题要特殊分析。一些聚类方法适用于一维数据类型,在针对数据深入挖掘的过程中,一定要掌握聚类方法的适用情况,明确数据挖掘的目标,选择最合适的聚类方法。由于聚类方法涉及到数据之间的距离计算,通常采用DTW方法和欧式距离算法,不同的算法都有不同的特点,同样也应该针对数据类型进行恰当的选择,一般来说DTW方法计算非常复杂。而欧式距离算法效果更好,但欧式距离算法,对于数据描述,远不如DTW方法,在分析数据类型时,一定要选择适当的聚类挖掘方法。在选择聚类方法时,首先明确数据类型是一维的还是多维的。针对不同的数据类型,选择不同的分割方法。在确定方法之后判断聚类描述情况,对于描述要求较高,则应该采用DTW方法,如果要求效率较高,则应该采用欧式距离算法。每一个方法都有精度之间的差距,效率也会存在较大区别,一定要针对性的进行选择。避免在计算数据的过程中发现方法不合适,更改方计算方法,这样很容易影响数据挖掘的准确度。在数据聚类完成之后。应该要针对算法进行优化通过。实际情况来选择计算精度或者计算效率。聚类方法能够根据不同的指标进行分析,通过不同的影响因素进行综合性的考虑。利用SPSS样本之类的方法,能够快速的将指标因素进行归类,并且通过计算结果还可以总结各类指标的特色。从目前来看,聚类分析不仅可以用于样本之类,而且还可以用于变量聚类,例如不同的指标就是变量,通过对于指标的考虑。以及简单的提取。能够快速深入的将所有的变量指标进行综合,避免了数据信息的丢失。

3 聚类方法在企业营销中的有分析应用

信息化是现代企业在不断发展的过程中必须发展的新技术,对于数据挖掘不仅能够促进企业经济效益的提高,而且也能够在很大程度上减少企业不必要的投资,规避风险。但是目前我国数据挖掘还存在很多方面的问题,尤其是信息化方面的数据挖掘还不够完善。随着社会经济的快速发展,企业与消费者之间的关系也发生了微妙的转变。在过去企业能够选择消费者,而现在是消费者选择企业。企业为了能够快速的促进产品营销的效率,必须针对用户需求进行深入的分析。通过聚类方法能够针对客户不同的消费特点和消费需求进行计算保证对客户细分的效果。通过聚类计算能够针对客户的属性进行统计,而且还可以结合人工智能技术,进行深入分析,例如客户的购买动机通常由需求、认知、学习等因素的影响以及文化社会,家庭、群体等外部因素共同决定。如果针对不同的用户需求进行划分,可以将外内部因素作为分析变量。然后采用恰当的剧烈方式进行计算,能够保证将数据结果相近的用户群体进行归类。此外,用户满意度能够直接影响用户重复购买的机会。聚类方法能够针对客户的差异性,进行全新的分类,不同的差异变量,作为参考指标,包括产品利益,客户相互作用,选择障碍,议价能力等方面,通过将这些分析变量得到有效归类,能够为企业的营销方案制定积极参考。

4 结束语

本文通过对于数据挖掘进行的分析,以及聚类方法进行全面的研究,通过不同情况选择不同的聚类方法,能够有效促进数据挖掘的效果和水平。并且针对性的提出解决对策,通过数据挖掘的聚类计算方法在企业营销中进行应用,为企业快速的寻找目标用户群体提供了重要的参考标准,帮助企业制定准确的营销方案,从而更好的帮助我国企业的发展水平。

[1] 陈子健,朱晓亮.基于教育数据挖掘的在线学习者学业成绩预测建模研究[J].中国电化教育,2017(12):75-81+89.

猜你喜欢
数据类型数据挖掘聚类
详谈Java中的基本数据类型与引用数据类型
探讨人工智能与数据挖掘发展趋势
如何理解数据结构中的抽象数据类型
数码世界(2020年5期)2020-06-23 00:14:36
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
基于改进的遗传算法的模糊聚类算法
一种基于Hadoop的大数据挖掘云服务及应用
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例
基于GPGPU的离散数据挖掘研究