陈忠菊
摘 要:随着社会的迅速发展,软件工程运用数据挖掘技术也十分关键。其不仅能够让信息数据得到更为准确的传播,而且还能让数据挖掘的效率得到全面的提升。该文主要针对软件工程运用数据挖掘技术进行分析,并提出了相应的优化措施。
关键词:软件工程 数据挖掘 技术 分析
中图分类号:TP311.13 文献标识码:A 文章编号:1674-098X(2016)06(b)-0080-02
当今时代是信息时代,随着互联网技术的发展,人们步入了大数据时代。毫不夸张地说,在这个大社会环境中,每个人都有自己的数据库,而众多人的数据结合在一起,形成了一个巨大的数据库,应用这些数据可以获取许多信息,而这些信息可以在一定程度上给商家带来所需的信息,因此,大数据在当今时代的地位越来越突出,卖家可以根据这些信息了解买家的偏好以及需求。在这样一种时代背景之下,为了满足人们对信息的需求,数据挖掘技术逐渐发展起来。
1 软件工程运用数据挖掘技术的概况分析
1.1 数据挖掘技术发展现状
所谓的数据挖掘技术指的是在众多繁杂的信息中收集以及提取出自己所需要的、对自己有价值的信息,它作为一门技术是为了软件工程开发而服务的。数据挖掘技术的最终目的是找到并提取对自己有用的信息,而信息提取的过程就是数据挖掘的过程。随着数据挖掘技术的进步,越来越多的行业开始将其应用到自己的领域中,软件工程也不例外。早期中国,信息量不是很大,传统软件工程开发在数据采集方面比较落后,它在验证驱动的过程中需要先假定信息的存在,在此基础上对信息进行采集和挖掘,最后再对假设进行验证,判断是否成立。但是现如今社会已经步入了信息时代,信息数量迅速增多,各种信息交汇在一起,错综复杂,因此信息呈现出又多又乱的特点,如果按照传统软件工程开发的方式对数据进行收集,那么就会使工作量变得很大,很难得以实施。数据挖掘技术基于这样一种现状对验证驱动的方法进行了调整和改进,可以在杂乱的信息中识别有用的信息并提取出来。
1.2 数据挖掘的相关内容
就目前来讲,关联发现技术、人工神经网络、分类树技术、最优集合规约技术以及聚类技术和可视数据挖掘技术等是最常使用的数据挖掘技术。在工程开发过程中,对数据的度量同样具有复杂性和难实施性,因此,在采用数据挖掘技术的同时要配合使用一些特殊的处理技术,例如:分类树处理技术、统计分析处理技术、回归建模处理技术等。不管应用哪种处理技术以及哪种数据挖掘技术,我们应该时刻注意开发商所要达到的目标,以此为指导,我们便能对多种技术进行合理的选择。
2 软件工程运用数据挖掘技术的方法
随着计算机的发展以及网络的普及,人们逐渐步入了信息的时代,在这样一种时代背景之下,人们对数据产生了更多的需求,而数据在很大程度上表现出多而杂乱的特点,这无疑给信息的查找以及提取带来了困难。为了满足人们的需求,数据挖掘技术逐渐发展起来,随着数据挖掘技术的逐渐完善,网络科学技术也得到了长足的发展;另一方面,网络科学技术随着时代的进步也在不断地发展,网络科学技术的发展使得信息数量逐渐增多,这也为数据挖掘技术的产生以及发展提供了基础。
2.1 挖掘执行记录
挖掘执行记录在软件工程中属于数据挖掘的领域,具体指的是根据分析程序的执行路径找到其与程序代码之间的关系,用逆向的方式找到软件程序与各个模块代码之间的关系,以此达到维护整体程序的目的。就目前来看,挖掘执行记录在长久以来虽然取得了一定的成效,但是,对其评价标准却缺少明确的规定,大家对它的评价不够完整并且不成体系。另外,现阶段信息数量多而杂乱,在对信息的表述上也不够统一,软件开发商很难做到对各种表达方法进行对比,因此也难以用定量的方法对数据进行分析。
2.2 检测软件漏洞
软件漏洞的问题一直以来是大家都比较关注的问题。一旦软件出现漏洞,将给企业带来不可估量的损失,数据挖掘技术在软件工程中应用时,要注意对软件漏洞的检测以及及时修补,这也是提高软件工程可靠性以及安全性的重要措施。在进行软件漏洞的检测过程中还要对其安全性能进行相应的评估,对于一些软件威胁病毒要及时地发现,并做好相应的清理工作。同时,还要做好相应的安全防护工作,采用多种模态进行软件运行状态的监控,避免重要信息和参数被侵犯。
2.3 挖掘版本控制信息
挖掘版本控制信息在软件开发中也有不可小觑的作用,就目前来讲,开发商在对软件进行开发时,一般会采用版本控制系统对开发过程进行系统管理以及系统保护。挖掘版本控制信息在软件工程中属于数据挖掘领域。它主要的目的是保证软件的安全性和可靠性,对系统全局性的更新奠定基础。同时,在进行信息的控制过程中需要对其信息进行相应的维护。要采用多种方式保证信息的安全和信息的正确。从而实现版本信息的有效控制。
2.4 挖掘开源软件
挖掘开源软件在软件工程的开发中具有明显的优势,它与前三者不同,具有其自身独特的优势,其特征包括开放性、全局性和动态性。由于其自身所具有的特点,在对该类软件进行开发时要注意同传统的软件区分开来,根据该软件自身的特点对其进行开发,采取适当而又有效的策略和方法。在进行软件的挖掘以及开发的过程中需要结合软件工程的主题进行相应地开发,避免开发出来的软件不具备一定的实用性。与此同时,在进行软件开发的过程中还要挖掘开源软件,其要顺应时代发展的特点,与市场发展趋势相互结合,让开发的软件的应用效率得到完满的提升。
3 软件工程中程序代码的挖掘
3.1 克隆代码的检测
在进行程序代码的挖掘过程中,其原创的可能性较低。通常会采用克隆代码的检测,获取相应的核心数据,然后对代码进行粘贴以及拷贝。之后需要结合企业的实际需要,对数据代码进行小幅度的调动,从而达到相应的检测效果。其检测是为了避免故障的拷贝传播这样的不利情况发生,而且对其检测还能对软件进行演化这个过程里起到不错的维护作用,基本上可以说克隆代码检测这样的存在已经是软件工程这个大领域中最先的数据挖掘需求,目前大概可以整理出四种比较常用的方式,分别为基于文本对比、标识符对比、度量、程序结构的方法。其也可以利用Hash函数这样的一项技术对字符进行相应的变化,从而达到相应的代码检测效果。
3.2 Aspect挖掘
在进行挖掘的过程中,其通常也需要对其Aspect数据进行挖掘。其主要是对程序的一种构造模式。在进行数据的挖掘过程中,其通常需要对各个关注点之间的数据进行相应的分析。同时,对不同的代码进行相应的分类,构造出较为合适的代码数据,让信息节点之间能够得到有效地传递。比如基于度量分析或者是形式概念分析等这类相对而言具有很强针对性的方法。这种方法能够让数据更加具有应用性实质效果。因此,Aspect挖掘在软件工程中的应用十分广泛。
4 结语
软件工程运用数据挖掘技术具有十分深远的意义。在进行挖掘技术的应用过程中,首先需要对挖掘的内容进行有条理的分析。同时还要应用数据挖掘的方法,对其各种执行记录、软件防护、信息控制以及开源软件进行全面的探讨。最后需要对软件的程序代码进行检测和Aspect挖掘,从而实现软件工程中挖掘技术的应用价值。
参考文献
[1] 栾家明.数据挖掘技术在网上银行促销活动中的运用[J].电子世界,2016(11):15-23.
[2] 李家兵.数据挖掘技术在工业上的应用[J].湖南城市学院学报:自然科学版,2016(3):69-72.
[3] 曾倩倩.数据挖掘技术在计算机犯罪取证中的应用[J].通讯世界,2016(12):55-58.
[4] 杜立斐.数据挖掘技术在电力营销系统中的应用[J].中国高新技术企业,2016(21):49-56.