可视化数据挖掘技术

2017-02-23 12:19黄凤
电子技术与软件工程 2016年24期
关键词:技术分析数据挖掘可视化

黄凤

伴随着科研技术的不断发展以及社会的不断创新,网络信息技术强化了社会信息交流的流畅性和拓展性。随着信息的不断增多,如何快速、准确的提取有使用价值的信息,成为 分析可视化数据挖掘技术。

【关键词】可视化 数据挖掘 技术分析

传统的数据挖掘技术在应用过程中,应用者是无法观察到数据挖掘的过程,只能够获得结果,在数据分析与挖掘的过程中使用者并不能直观的观察过程,其往往会导致使用者更与单一性的分析数据挖掘结果,失去数据挖掘的意义。可视化数据挖掘技术结合了计算机与用户的视觉感受,是一种能够直观观察的数据挖掘方式,在数据挖掘过程为用户提供直观性的信息数据,便于用户交互流量数据,从而极大程度提升数据挖掘的效率、准确性、有效性,获得更有使用价值意义的数据结果。

1 可视化及数据挖掘的含义

所谓的可视化,也就是指人借助视觉观察并在思维中形成客观事物影像的过程,这是一种心智处理的过程。可视化能够提升人们对事物的观察准确性并形成一个完整的整体概念。可视化结果能够便于人们理解和记忆,并且对于信息的表达方式、处理方式是其他方式无法替代的。可视化技术普遍是以人所习惯的图形、图像为工具融入到信息处理技术当中,主要是将信息化数据以更加直观的方式让人所接受和理解。通过仿真化、形象化、模拟化等全新技术方式重现出来。可视化不仅可以以客观的现实展现数据内容,还可以为使用者提供富有规律、客观、真实的数据信息。数据挖掘主要是指借助检测和分析数据,获得更多潜在的有使用价值的信息。数据挖掘的定义主要分为狭義与广义。狭义的数据挖掘主要是按照已经处理过或分析过的数据,从当中提炼出有使用意义的信息数据,从广义上分析,主要是在数据库当中分析出富有应用价值的数据信息。可视化数据挖掘对于当前许多企业而言均有着显著的应用意义,尤其是在大数据时代下,数据局逐渐成为现代化企业分析市场需求、掌握企业客户群体的主要手段。

2 可视化数据挖掘的提出

由上述分析可以发现,可视化技术与数据挖掘技术本质上是两个不同的领域,但是都与计算机技术有一定程度的关联性。数据挖掘的过程需要可视化技术的支持,可视化分析本身也是数据挖掘的一个过程。其中,可视化主要是指将某一些无法看见的或抽象的事物通过能够看见的图像或图形可视化出来;可视化主要是采用计算机创建相应的图形,从而理解哪些大量、复杂、无需的数据信息。可视化数据挖掘主要有三个阶段,数据准备、模型生成、知识使用以及流程可视化。

数据准备:数据的准备阶段主要是借助可视化数据挖掘技术将数据预处理的过程展现出来,简单而言,就是将复杂、大量的原始数据通过某种规律进行展现和规划,这里所致的可视化技术主要是包括数据的转换、丢失值得处理、数据的裁剪以及数据的采样等;生成模型:生成模型这一过程中主要是将目标数据库通过数据挖掘操作技术细化数据挖掘每一个细节、过程,并将其展现出来。其中主要包括模型的选择、参数的设计、数据的训练集、数据的挖掘细节以及结果的储存等过程;数据使用。在数据使用这一阶段中,可视化数据挖掘技术的操作目的主要是把数据挖掘的结果通过某种可视化方式展现出来,例如将结果通过树形图形展现出来,从而为数据使用者提供更加真实、可靠、完整的数据分析结果。普遍状况下,数据挖掘的结果抓哟分为分类与关联两种,其都是以人类视觉能容易接受的方式展现;流程的可视化。数据挖掘的流程可视化最终目的是将数据挖掘的整个过程以某种可视化方式显示出来,让用户看懂,这也是为知识分析师、企业管理者提供更多依据进行决策和分析。

3 可视化数据挖掘的主要技术分析

可视化数据挖掘的主要技术主要是以下四种:1、标准2D与3D技术。这一技术主要是用于统计应用,但是不是能应用于多维数据。主要是借助条形图、柱形图和饼图等常用的标准2D、3D技术,这也是可视化的主要方式和结果;2、分层技术。分层技术的基本意义就是按照层次的特征,将多维数据空间划分为多个子空间,并按照各个层之间的关联性,将子空间以层次的结构形式重新进行组建,并以图形的形式显示。分层技术主要依据层次轴、双曲线、锥形图等时机方式进行描述;3、几何变换技术。几何变换技术主要是对数据集进行降维处理。其基本意思就是借助投影、映射将多维数据转变为3D、2D的形式,准便成为人视觉所能够理解的投影。几何变换技术适用于多维数、低数据量的数据库。其实施方式主要有平行坐标法与投影追踪等;4、面向像素技术。面向像素技术主要是分析像素点在屏幕当中的分布状况,其能对于一些数据量庞大的数据库进行细致的分析,进而获得数据的整体结构和分布状况。因为面向像素技术分析的是像素点,所以其能够按照分析目标的不同,选择不同的排列方式,其应用方式主要是递归技术与数据管道技术。

例如,在信贷方面的应用中,信贷数据的挖掘和普通数据挖掘不相同,主要是统计和挖掘一些信用度较高的用户。金融行业的信贷欺骗行为不断增多,这也为可视化数据挖掘技术的应用提供了更多的空间,借助挖掘技术防止信贷欺骗的发生,从而提高信贷企业的经济利益。借助可视化数据挖掘技术,应用异常检测与人工神经网络的方式检测信贷申请的过程,并借助Clementine软件对所获得的数据库进行统一性分析和记录,对具备信贷欠款和拖欠的信贷人统计到一起,并在信用贷款的申请中计算其可能存在的信用欺骗度,首先,是多次申请信贷的记录;其次,个人或企业的经济状况以及信贷类型是否符合企业的记录。对于一些偏离长条的行为进行记录并标记,借助可视化的数据挖掘过程,决策者能够更加准确的掌握是否能够放贷于该个人或企业。

4 总结

综上所述,在大数据时代环境下,做好数据挖掘工作有着非常明显的作用和意义,假设如果无法完成良好的数据挖掘技术工作,便无法展现大数据的优势,导致缺乏针对性的数据信息,从而逐渐降低企业的竞争力。此外,伴随着信息技术与计算机技术的不断发展,数据挖掘技术必然会随之创新,对此,就必须相关工作者及时掌握社会上全新的数据挖掘技术,并将其合理应用。

参考文献

[1]耿学华,傅德胜.可视化数据挖掘技术研究[J].计算机应用与软件,2006(02):85-87.

[2]段晓君,杜小勇,易东云.可视化数据挖掘技术及其应用[J].计算机应用,2000(01):54-56.

[3]张俊.可视化数据挖掘技术的研究与实现[J].重庆工商大学学报(自然科学版),2013(03):58-61+92.

作者单位

江苏省泰兴中等专业学校 江苏省泰兴市 225400

猜你喜欢
技术分析数据挖掘可视化
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
基于并行计算的大数据挖掘在电网中的应用
基于大数据的智能数据分析技术
建筑工程混凝土结构施工技术
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究