分析计算机数据挖掘技术的开发及其应用

2020-05-25 02:46季萌
中国新通信 2020年1期
关键词:开发研究应用

季萌

摘要:在计算机技术迅猛发展、电子业务遍及人们生活的时代背景下,计算机数据挖掘一瞬间成为了各行各业的流行词汇和前沿技术。数据挖掘技术中步骤较为简单的一般利用了统计学知识,如抽样调查、估计和假设检验等。较为复杂的一般需要建立复杂的模型,结合深度学习、模式识别和人工智能的技术。同时,计算机挖掘技术还需要融合其他领域的知识,如金融、股票和证券等,这一系列综合的知识与场景促成了计算机数据挖掘技术的复杂性以及其重大的研究价值。

关键词:计算机数据挖掘;研究;开发;应用

互联网的发展使信息的传递和交互打破了时间和空间的限制,导致信息的爆炸性增长。首先,数据挖掘可以被应用的领域有很多,如最广为人知的金融领域。很多数据挖掘的研究著作都是在市场、证券的语境下。不只是在金融领域,其他必要引入计算机数据挖掘技术领域的专业知识也广泛地出现在数据挖掘研究著作中。其次,作为一门计算机技术,其使用的工具本身也正被学者们更深入地研究,如机器学的各类算法至今仍层出不穷。

一、计算机数据挖掘技术概况

数据挖掘(也称为数据库中的知识发现)是从大量数据中提取和挖掘未知且有价值的模式或规则以及其他知识的复杂过程[1]。概括来讲,进行数据挖掘的主要步骤如下:

(一)数据收集

真正体验过数据挖掘过程的专业人士都会认为,数据收集过程是进行数据挖掘时最艰难也很重要的步骤。首先,数据量要足够,大多数时候要稍微超量。数据量不够将导致数据挖掘模型无法训练精准,预测效果欠佳。其次,数据质量要过关,很多时候收集到的数据原本很多,但在数据清洗阶段后会被清洗到数据量不够,这说明这批数据的质量不过关。由于现在网络上公开的高质量数据库也在逐渐减少,所以推荐在有官方大量数据来源的情况下,进行相关开发和研究。

(二)数据整理

1.数据清洗

消除明显错误的噪声数据以及有残缺不完整的问题数据。首先要判别哪些信息列是显然对预测结果没有影响的,直接删除这些列。然后,大多数时候收集到的数据不是所有列信息都完整的,将没有关键列信息或列信息错误的数据删除。

2.数据规约

很多情况下数据挖掘模型需要对数据进行归一化等规范处理,以使模型的使用更加便利和准确[2]。

(三)数据挖掘过程

通过(一)和(二)的前期准备,我们获得了待分析的数据集,并将其存储于数据库中。接下来就是最关键和最核心的数据挖掘步骤。数据挖掘实际上可以被简单描述为从输入数据得到输出结果(有价值信息)的过程。为实现这一过程,最简单地可以使用统计学的相关技术,复杂一些的将会使用到复杂的数学知识或者机器学习和人工智能等专业的计算机技术。

大多数时候挖掘模型绝不会很简单,复杂的模型才能挖掘出人类个体无法提取到的隐藏价值信息。复杂的模型首先是复合的,不会是单一的一种技术。很多时候会需要最优值求解与多层神经网络的复合,还有很多时候会使用深度学习。而且模型在嵌入数据测试的过程中需要调整,以达到最好的拟合效果。

(四)模型评估与展示

1.模型评估

模型能够基本运行后,最好请该领域专业的分析师或专家来评判该模型的好坏,从而进一步完善模型。

2.知识表示

在模型较为完善且可以为企业或个人所使用后,开发商通常会设计可视化知识图谱,在报告会上为客户展示该模型的核心思想。

二、计算机挖掘技术的具体应用

计算机数据挖掘技术已被广泛应用于金融行业,其预测能力为金融产品用户带来了巨大的收益[3]。除了老生常谈的数据挖掘在市场营销、金融投资、电信行业等方面的应用,下文着重提及了一些较冷门但价值很大且处于前沿的领域研究。

(一)自然灾害预测

自然灾害影响着全球的人类和动物的生命和财产。在许多情况下,原因不在我们的控制之下[4]。在计算机数据挖掘技术的帮助下,政府或其他国家管理人员通过在系统中输入本国的自然和人文概况信息,系统就可以预测出未来一段时间内该国发生各类自然灾害的概率。该应用对于国家制定自然灾害防范措施将具有重要意义。

(二)信息安全管理方面的应用

将数据挖掘技术应用于网络信息安全管理系统,可以实现对网络信息中各类安全事件的深度分类和关联分析,从而提供有效的策略支持,以及描述网络信息安全管理的状况,为提高网络信息安全的主动防御能力提供技术支持。在信息安全管理方面,可以应用计算机数据挖掘技术构建互联网信息数据安全体系。同时,由于计算机数据挖掘技术更新速度快,更有利于信息安全管理体系的及时完善,使互联网信息安全管理体系更好地发挥信息安全保障作用。

(三)公共卫生医疗体系的应用

当前公共卫生医疗体系的现状是大多数以线下公共卫生平台为主,依照传统的公共卫生医疗体系管理模式,没有实现将其与现代科技技术融合。所以,为实现公共卫生医疗服务的便利性,改变传统的管理模式,更多地依赖线上平台进行公共医疗服务。同时在线上公共卫生医疗服务平台,依托计算机数据挖掘技术实现各项数据和信息的收集整理,節省人力物力,减少资源的浪费。而且将计算机数据发掘技术应用于公共卫生医疗体系,保证公共卫生医疗服务的全面覆盖,数据接收的及时性和提高信息更新速度,提升公共卫生医疗服务水平。

结语:

计算机数据挖掘的研究对于各领域的发展具有重要意义。越来越多的领域将会把计算机数据挖掘技术纳为本领域未来发展的研究重点,因而对于数据挖掘技术的研究不应只限于金融一个领域。发散思维,将数据挖掘应用拓展到多个领域将会是不错的创新创业出发点。同时,从电子信息专业方面展望,计算机数据挖掘技术的深度研究将是被崇尚和鼓舞的事业。

参考文献:

[1]李智峰,段蔓.浅谈计算机数据挖掘技术的开发及应用探究[J].信息技术与信息化,2019(05):231-232.

[2]赵起超.数据挖掘与数据仓库技术的应用和前景分析[J].黑龙江科技信息,2016,(13):190-190.

[3]温淑斐.大数据背景下的企业集团财务管理[J].经济研究参考,2016(38):87-90.

[4]KimYM,HwangMN,KimT,etal.Bigdataminingfornaturaldisasteranalysis[J].JournaloftheKoreanData&InformationScienceSociaty,2015,26(5):1105-1115.

猜你喜欢
开发研究应用
谁说小孩不能做研究?
Applications of Deep Mixing to Earthquake Disaster Mitigation
A Thought:What have We Learned from Natural Disasters? Five Years after the Great East Japan Earthquake
对周期函数最小正周期判定法的研究与应用
在线投稿与编辑系统的设计与开发
遵义红色旅游开发对策研究
基于J2EE和Ionic的ITer学习APP设计与开发
单片机在电子技术中的应用和开发
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析