令狐永芳
摘要:互联网技术的不断发展以及和人类社会的不断融合,使得互联网技术已经成为人类社会发展必不可少的关键因素之一。同时,其在逐渐发展的过程中演变成一个信息传输的综合体,网络数据也呈现出一种爆炸式增长的趋势,由此人们正式进入了大数据时代。在这个时代背景下,人们通过使用数据挖掘技术,在整合分析大量数据的基础上实现从中发现其隐藏规律以及有价值的信息。本文从其概念剖析入手,在解析其基本数据分析方法的基础上,就其在互联网中的应用进行了详细的分析,希望对今后数据挖掘技术的推广使用带来一定的帮助。
关键词:数据挖掘技术;概念;分析方式;互联网;应用
1.何为数据挖掘技术
信息交互程度的提升以及网络数据的实时分享,从某种意义上来说加速了人们的生活发展,人们在日常生活中可以时刻享受到大数据技术带来的便利。同时在互联网行业不断发展的影响之下,互联网平台得以大规模发展,致使网络数据得到了爆炸式的增长,出现了海量以及复杂性的特征。但是这些数据并非是全部具备使用价值的,其中包括了大量的噪声数据,导致实际的具备价值的数据所占比例相对较少,再加之数据内容可能会存在缺失及分散的现象,继而引发数据质量不一致的问题。在这种情况下,我们就需要使用数据挖掘技术从这些数量庞大的且较为随机杂乱的数据中,借助一定的算法将信息进行提取,在发现其中具备价值以及规律信息的數据基础上,将数据信息库进行重新组合。
所谓的数据挖掘并非是仅仅只有收据的收集,其中更是包括了从海量类型不同的数据中,将其中具备使用价值的信息予以挖掘,并合理使用这些数据做到社会治理数据改善以及数据系统使用率的提升。数据挖掘技术就是针对数量庞大数据进行整合、分析以及分析之后,借助于机器学习方式、人工智能方式以及各种数据挖掘方式进行数据的深度挖掘工作,在发现总结其中隐藏规律的基础上,将之合理应用的一种方式。
2.数据挖掘技术的基本分析方法解析
2.1聚类分析
这种数据分析方式主要就是将物理以及抽象对象的整合予以分类,与此同时针对那些完全相同或者是具备一定相似性的对象组成的分类开展更为深入的分析工作。其最终的目标就是将这些数据进行有效的分类,也就是在深入分析事物之间规律的基础上,从而实现各个领域的智能化学习目标。聚类分析这种方式其中又可以分为硬聚类和模糊聚类两种方式,其中的硬聚类方式就是将分析的对象归属到相近程度最高的类别之中。而其中的模糊聚类方式在划分对象的过程中以取值范围作为依据,同时还会出现同一个对象对应的多个类别的现象。
2.2关联分析
关联分析从其本质上来看和蝴蝶效应较为相似,所谓的蝴蝶效应就是指自然界中的任何一次微小变动都有很大的可能性带来另一个事件的发生。同样这也是关联分析方式的规律所在,相同事物之间具备着不同程度的依赖以及关联性,也正是因为事物之间的这一特点,就可以对事物之间的规律性予以有效的预测。
举个例子,购物篮事件就是这种方式中最具有代表性的应用。就是通过针对顾客购物篮的物品管理规律进行相应的分析,就可以做到初步掌握顾客自身的购买特点以及习惯,并以这些数据作为基础将日常化的营销方案以及策略予以制定。通过使用这种方式就可以取得很好的营销效果。
2.3分类与预测
分类就是针对那些不具备排序规律的标号予以分类,预测则是针对连续值的函数模型开展相应的预测工作。而其中的分类则是数据挖掘技术极为重要的基础之一,借助分类可以将数据集合自身的特征予以明确的表示,从而将各个类别的属性进行相应的划分,其中较为常见的方式之一就是决策树、遗传算法等等。而预测就是将当前已知的分类情况作为基础,并按照其中的发展规律将其未来的发展趋势予以预测,当前较常用的方式主要包括时间序列以及回归分析等等。
3.数据挖掘技术在互联网领域中应用分析
3.1应用于电子商务领域
互联网技术的出现以及普及对于传统的实体行业带来了相应的冲击,由此网购逐渐深入人们的日常生活中,使得我国的营销市场得到了极大的发展。数据挖掘技术应用在电子商务领域中主要是负责挖掘消费者自身的喜好之上。通过数据挖掘技术的应用针对消费者的商品浏览以及购买记录就可以从中挖掘出不同消费者在商品类型、价格上的偏好。当前绝大多数的网购平台都通过数据挖掘技术,在深刻分析消费者自身购买喜好的基础上,为企业制定营销策略提供了精准化的数据支撑,就可以达到电子商务平台的运营投放上的优化。
3.2应用于金融领域
银行业当前已经针对大数据在其经营管理、客户营销以及产品优化等工作中的重要作用有了一个全面清醒的认知。银行业中使用数据挖掘技术往往都是将其自身大数据的巨大价值予以挖掘,并以此作为其产品、服务以及管理工作方面的创新依据。而在金融投资方面则是通过数据挖掘技术的应用针对投资数据进行分析,将隐藏在其中的规律予以发现,并以此作为投资行为的数据导向,最终目标就是降低投资风险的降低。
3.3应用于医疗领域
当前医疗信息化程度的不断提升,导致医院在病人档案、医疗器具等方面管理工作的现代化程度逐渐得以提升,通过数据挖掘技术的帮助可以很好发现存在于其中的问题,实现医院管理质量的不断提升。
与此同时因为医务工作人员自身的诊断方式也从之前的传统依靠人员经验的诊断方式逐渐向着现代化诊断方式发展。通过数据挖掘技术的使用医务人员就可以针对患者的过往病史、临床症状表现以及相似程度较高患者的病史与数据库中的各项信息进行分析以及综合研究,可以很有效的提升相应的诊断正确率,有助于提升医疗服务质量。
4.总结
当前大数据时代的到来,社会中的数据信息呈现出一种爆炸式的增长态势,为了更好的使用其中有价值的数据,就需要借助于数据挖掘技术。通过数据挖掘技术中的聚类分析、分类预测以及关联分析等方式就可以很好实现数据规律的发现以及利用,并且随着技术的逐步发展在互联网领域中的金融、医疗以及电子商务等领域中的应用将会逐渐得以推广。
参考文献
[1]管祥甫,管子涵.计算机文本信息挖掘技术在网络安全中的应用[J/OL].电子技术与软件工程,2019(21):184-185[2019-11-20].
[2]谢翠琴.浅析移动通信中数据挖掘技术的应用[J].电子世界,2019(20):192-193.