数据挖掘技术在软件工程中的应用研究

2021-03-24 06:05陈超鲍本龙
科学与生活 2021年29期
关键词:数据挖掘技术软件工程应用方法

陈超 鲍本龙

摘要:信息化时代的到来,数据信息不断增多,人们想通过数据信息获取知识就需要技术协助,这使得信息挖掘技术受到人们的广泛关注。人们日常生产和生活中产生的数据多是无规则的零散数据,对企业的研究没有任何帮助,而数据挖掘技术致力于利用大数据技术和机器学习算法整合各类数据问题,使企业可以从零散数据中获取知识。因此,本文将讨论数据挖掘技术在软件工程中的应用内容和方法,希望能够给相关工作者提供参考。

关键词:数据挖掘技术;软件工程;应用内容;应用方法;

数据挖掘技术可以从大量信息中挖掘出有用信息,方便人们对某些问题进行研究,如今信息挖掘技术在很多行业都有应用,软件工程行业也不例外。面对人们日益增长的多样化软件应用需求,软件工程设计者可以通过数据挖掘技术整合用户的需求,按照需求对软件的功能进行调整,提高软件的使用率。利用数据挖掘技术在庞大的用户信息中提炼出更多未被发现的知识,将会使软件设计更符合消费者的需求,而且给软件工程也带来更多的益处。

一、数据挖掘技术概述

数据挖掘简单来讲就是在海量的数据中提取信息,发现之前未被发现的数据或者是被忽略的数据,然后利用这些数据提供有价值的信息。数据挖掘技术是一门综合性学科,它与很多学科都有交叉,因此应用前景非常好。但是由于比较复杂的知识结构和应用操作导致它对知识要求也相当高。数据挖掘技术主要有以下三个步骤,即数据准备、规律表示和结果表达:数据准备是指从许多数据中提取出有用的数据,并对这部分数据进行整合,剔除无效数据,建立所关注问题的数据库;规律表示是指运用信息挖掘技术中的算法发现数据库中隐藏的规律;结果表达是指专业人员对发现的规律用人们习惯的表达方式进行合理的解释,让人们可以理解其中包含的信息,发现其中的商业价值。数据挖掘技术在电信、金融、医疗、保险等领域有广泛的应用,可以用于客户信用查询、服务质量改进依据和提升行业竞争力等方面。随着数据资源的不断增多,越来越多的信息需要用到数据挖掘技术进行分析,这也促使该技术在人们的生产和生活中将发挥更大的作用。

二、数据挖掘技术在软件工程中的应用内容

2.1 软件版本信息挖掘

软件工程版本信息挖掘是信息挖掘技术在软件工程中应用最广泛的部分,软件版本信息被挖掘可以帮助软件开发者发现历来软件版本中出现的漏洞和更改措施,为软件开发者提供新的软件升级思路,对软件版本进行统一管理,使软件更新速度加快,软件漏洞不断减少。目前信息挖掘技术对软件版本信息的挖掘重点是将历来软件的变更信息进行归纳总结,发现软件各个功能模块之间的差异和联系,方便开发者预测软件功能模块下一步需要修复的内容,减少软件后期的运营和维修成本。总之,通过信息技术挖掘软件版本信息,将更好的解决由于软件更新造成的系统漏洞,减轻软件后期运营和维修的负担。

2.2 软件漏洞检测挖掘

软件漏洞检测挖掘的重点是要明确本次信息技术挖掘需要解决哪个漏洞问题,因为不同的漏洞问题所建立的数据库是不同的,可以根据用户的需求来选择先解决哪个漏洞问题。明确了需要解决的漏洞问题就需要收集漏洞信息,对其中存在的问题数据进行清理,然后汇总整合获取的漏洞信息,建立软件漏洞信息库用于发现漏洞隐藏的问题。之后就需要我们采用合理的方法对软件漏洞进行分析,找出出错的地方便于进行漏洞修复。最后需要通过信息挖掘技术对修复过的数据进行保存,然后开发者对修复过的软件进行测试与评价,检验软件修复的效果。如果还存在漏洞,也方便再对数据进行调整。

2.3 开源软件挖掘

开源软件相较于普通软件具有明显的开放性和全面性,信息挖掘技术应用于开源软件能够促进两者共同进步,即信息挖掘技术效率更高,开源软件开发更符合应用需求。而且将信息挖掘技术应用于开源软件的程序代码,能够对开源软件的代码进行复制和拷贝,实现开源软件的代码检测,避免了开源软件由于代码问题而出现漏洞。

2.4 软件执行记录挖掘

软件执行记录挖掘是通过逆向建模来检测软件执行中的代码,对软件执行路径进行数据挖掘以达到维护和验证软件的目的,保障软件程序的稳定性。应用数据挖掘技术对软件执行路径进行数据分析,能够帮助软件开发者了解软件各个功能模块代码之间存在的联系,使软件系统代码能更好的被维护。

三、数据挖掘技术在软件工程中应用的主要方法

数据挖掘技术在软件工程中应用的主要方法包括分类、聚类、关联和软件工程数据检索等,分类法是指运用数据挖掘技术建立一个分类模型,按照数据的属性将其输入相应的模型中,使数据应用更有条理。此方法与估值类似,但是估值输出的常是连续性数值,可以在分类的前一步进行估值。聚类法是通过判断各数据之间的相似性,将数据划分到不同的组中,在确保各组數据完全无关的前提下自动建立数据分组。与分类法最大的区别就在于分类法属于有指导的数据挖掘,而聚类法属于无指导的数据挖掘。聚类法经常被用于数据的预处理中,可以帮助相关工作者发现大数据之间的孤立点,方便后续的分析。关联法主要用于发现大数据之间的关联度,主要用于发现那些事情总是同时发生。软件工程数据检索是软件工程最原始的数据挖掘方法,操作起来较为简单,但是工作效率相较于前几种方法效率并不高。

四、结束语

数据挖掘技术中应用软件工程能够为软件开发提供便利,为软件开发者制定合理的开发流程规划,让软件应用不仅满足消费者的需求而且还能减少软件后期的维修。但是数据挖掘技术需要处理大量复杂无序的数据,明显加大了软件工程中数据挖掘算法的设计难度,所以相关工作者还是需要不断探索数据挖掘技术和软件工程之间最佳的关联途径,为软件开发者提供更科学有效的决策数据。

参考文献

[1]宋钰.数据挖掘技术在软件开发中的应用探究[J].软件,2021,42(09):158-160.

[2]刘知云.关于数据挖掘技术在软件工程中的应用分析[J].电脑知识与技术,2021,(24):27-28.

猜你喜欢
数据挖掘技术软件工程应用方法
基于Web的数据挖掘技术与相关研究
初中英语课堂教学中故事教学法的应用刍议
愉快教学法在初中英语教学中的应用
依托工作室的软件工程实践教学研究
基于工程教育认证的《软件工程》课程教学质量建设研究 
微课在高中地理教学中的应用研究探讨
关于如何创新和完善计算机软件工程管理的探讨