摘 要:现在信息技术在不断的发展和进步,在我们的生活和工作中,信息技术得到了广泛的运用,因此能得到很多不同种类的数据信息。但是,这些数据信息都是比较杂乱的,如果公司想要通过些数据来开展研发工作,会是徒劳无功的。所以,开展数据挖掘技术研究是首要的工作。目前,数据挖掘技术在软件工程项目应用中显得格外重要,它可以把平时工作和生活中应运而生的零散数据转变成具有实用意义的数据信息,我们可以根据数据挖掘技术的根本特点来研究它在软件工程项目中的重要性。
关键词:数据挖掘技术;数据信息
中图分类号:TP311.5文献标识码:A文章编号:2096-4706(2018)05-0025-02
Application and Research of Data Mining Technology in Software Engineering
ZHANG Yu
(Beijing Municipal Institute of Labour Protection,Beijing 100054,China)
Abstract:Now information technology is constantly developing and progresses. In our life and work,information technology will be widely used,so as to get a lot of different kinds of data information. However,the data generated are all messy,if the company wants to carry out research and development work with these data,it is useless,so the development of data mining technology is the first thing to do. At present,the data mining technology is particularly needed in the application of software engineering projects. It can transform the scattered data from the ordinary work and life into very useful data information. We can study the importance of the data mining technology in the software engineering project according to the basic characteristics of the data mining technology.
Keywords:data mining technology;data information
1 数据挖掘技术概述
1.1 挖掘技术的含义
现在是信息时代,我们生活和工作中都会运用信息系统,肯定会得到很多的数据信息,而数据挖掘技术是把这些信息进行重新编辑,现在软件工程需要的数据信息更多,这就要求数据挖掘技术在众多的数据库里面找到具有实用价值的信息。所以,数据挖掘技术在未来的软件工程中会被广泛地运用。数据挖掘技术是目前应用在数据库中的新技术,经过很长时间的发展,数据挖掘技术已经在数据库中占据了相当重要的位置。数据挖掘技术就是对信息进行有效率、有组织的编辑加工处理,让数据信息更有实用意义,但是数据挖掘技术是一个比较复杂高深的技术,期待以后能被大量投入实际应用中。
1.2 数据挖掘技术的运作流程
现在的数据挖掘技术分为四个阶段,分别是数据预处理、数据挖掘、模式评估和知识表示。在实际应用中,我们要事先按照要求采集相关内容的数据,数据清洗可以把原先损失的数据进行修复和还原,数据抽取可以得到与之有联系的数据,然后明确这次挖掘的目的,运用挖掘算法得到想要的数据。每一项技术的发明,都是因为我们需要这种技术去解决问题。
1.3 数据挖掘技术的应用范围
现在数据挖掘技术基本用在银行、交通等拥有很大数据量的地方,这些地方应用数据挖掘技术主要是为了分析营销手段、客户类别等,可以很大程度地提高效率,增加收益。金融方面,比如银行和证券公司,他们的日常数据信息非常多,利用数据挖掘技术可以帮助他们对客户信息进行整理,提高工作效率,降低风险。数据库挖掘技术当然也在军事、互联网这些地方被广泛利用,具有很高的存在价值。
2 数据挖掘技术在软件工程中的使用
2.1 数据挖掘技术在软件工程中的发展
数据库挖掘技术开始是以数据库为基础发展的,随着其不断地进步,现在已经从理论发展到实际应用中,而且在实际应用中产生了更多更深层次的科目与之一起发展。软件工程是一个工程化的学科,可以根据不同的项目任务和资金以及客户的不同要求研究开发一个产品。之前的工程软件开发比较复杂,但是在后期快速地发展起来,并被大量地应用在实际工作中,实用性很强,将来会被应用到更多项目中。数据挖掘技术主要是挖掘软件工程里面的数据库信息,它可以储存很多有研究意义的内容,对未来发展具有深远意义。
2.2 信息挖掘
软件工程可以掌控信息的挖掘,其应用十分广泛。软件工程版本可以将软件开发时处理的信息实现统一,保证数据在软件开发过程中及时进行更新,保证软件开发的质量,顺利完成项目任务。目前,软件开发更改的数据信息也包含在数据挖掘中,可以更好地看出软件内部的区别,以后可以利用这一点在运用中快速找到存在的问题,及时解决,高效地完成目标任务。
2.3 软件漏洞的检测和挖掘
数据挖掘技术中最重要的一项是检测软件漏洞,对它的运用可以发现在软件开发过程中出现的错误,然后对这个错误进行修改,找到解决方法并加以处理,可以很好地保证工程质量和安全等级。数据挖掘技术在检测漏洞的时候,应该很确切地知道漏洞检测的内容,我们要清楚客户的需求,然后根据这些需求找到相应的测试内容,找到合理的办法对软件进行测试,最后得到完美的方案。由软件工程对数据进行处理,找到漏洞信息后,应当处理掉多余的信息,保证数据信息的完整性。在实际运作中,我们应该按照科学方案,正确地使用数据挖掘技术。在软件工程中,我们要运用科学方法对软件工程中的漏洞进行分析,并找出错误点,这样可以让操作者更容易地修复漏洞。目前,数据库挖掘技术主要是对数据信息进行转化,转化后的信息都存到信息库里面,然后再根据需求对软件进行测试,查看是否存在漏洞,方便后续工作的进行。
2.4 开源软件代码的挖掘
开源软件代码挖掘,可以归为软件工程中挖掘技术要运用的对象挖掘类型,开源软件代码挖掘技术通常被应用到代码克隆检测上,可以更容易地把代码的漏洞处理掉,在很大程度上提高了工作的时效性。
2.5 软件执行记录的挖掘
软件执行记录挖掘在数据挖掘技术中的运用也非常重要,在进行数据挖掘时,可以分析大量的数据,研究不同代码之间的关系,我们可以根据软件系统的行踪更好地进行研究和管理,从而保证软件工程的稳定。
3 软件工程中应用数据挖掘技术的方法
数据挖掘技术在应用上可以进行分类。在进行工作之前,我们可以对模型进行分析,然后按照一定的规律对数据进行收集,方便后续的应用。在进行数据挖掘时,我们可以把数据信息更加的细致化地分成不同的类别,聚类划分的对象是不能预测的,此种学习方法是可归为无指导的。在数据挖掘技术中运用的关联方法是非常庞大的数据信息之间的联系,和软件工程代码克隆相似,软件工程的数据检索功能是最初的数据挖掘方式。数据挖掘过程包括数据信息的录入、查找和内容分析,数据的录入过程是把软件工程整理出来的数据信息录入的程序,软件工程的使用者可以把数据下载下来,同时会出现下载记录,这样可以方便地找到相关的客户信息,然后进行客户分析。
4 软件工程中数据挖掘技术未来的发展形势
目前,软件工程运用数据挖掘技术时,所用的数据库本身有着自己的特质,所以在实际运用中可能会对其造成一定的影响,面临一定的困难和挑战。因为软件工程数据是一项非常深层次的学科,运用很难,所以必须勇敢尝试。运用软件工程得到的数据可以分为结构式数据和非结构式数据,这两种不同的类型不能在软件工程中通用,比如一些应用代码如果存在缺陷,会极大地增加软件工程的进展难度。在运用数据挖掘技术时,软件工程中会出现很多不易处理的系统数据,给分析带来一定的难度。软件工程中的数据挖掘技术的最终目的是将设计好的软件交给客户使用,但是处理软件工程里的数据并不简单,在软件工程中运用数据挖掘技术会对产生的结果进行系统评价,在一些比较成熟的项目里这些评价相对比较成熟,而一些刚发展起来的项目的评价系统就不是很完整,所以在软件工程开发方面要处理的数据信息非常复杂。在撰写软件工程代码时会出现一些冲突,直接导致工作效率的降低。现在处于一个信息发展的时代,如何处理数据信息是一个难题,这也给数据挖掘技术也提出了一个新的考验。
5 结 论
软件工程想要得到更好的发展需要经过一个艰难的过程,这也体现了数据挖掘技术的重要性,要尽量满足现在人们多样化的要求。最近几年,数据挖掘技术已经收获了很好的成绩,帮助广大客户得到了期望的数据结果,所以在未来,在软件工程中数据挖掘技术会得到更广泛的应用和发展。
参考文献:
[1] 童凌.软件工程数据挖掘研究进展 [J].中国新通信,2016,18(9):14.
[2] 许曼.浅析软件工程数据挖掘研究进展 [J].数字通信世界,2017(4):66-67.
[3] 薄学.浅析软件工程数据挖掘研究进展 [J].电脑知识与技术,2017,13(26):20-21.
作者简介:张宇(1986.06-),女,回族,北京人,本科。研究方向:软件工程。