谢比特
(湖南城市学院,湖南 益阳 413000)
随着我国科技的快速发展,软件技术也开始深入各行各业。针对软件技术的实际可控性展开分析和研究,可以发现其应用效果并不显著。在实际应用中通常会出现大量数据,而诸多行业的发展都需要运用数据,因此数据作为高价值的资源会对多个领域经济发展有所促进。基于此,在软件开发企业中,将数据挖掘技术展开有效应用,不仅仅能够提升相关数据资源的应用效果,同时还能够在软件出现问题时及时处理,使效率进一步提升。
近年来借助信息技术生产和搜集数据能力在不断提升,数据库在各行各业的应用都极为广泛。比如说商业管理,政府办公,科学研究以及工程开发等方面都有应用。而且从未来看,这一趋势还将继续发展。在这种情况下,一个新的挑战出现了。随着信息化技术的不断发展,信息过量已经成为人们需要关注和面对的主要问题,那么大量的信息该怎样处理,又怎样将有用的信息从众多信息中找到并予以应用,有效提升信息利用率呢?这个问题值得大家思考并解决,数据已然成为一个企业的重要资源,只有将这些资源有效利用起来,才能够真正为企业的业务决策和战略决策提供有力依据。
数据挖掘(Data mining)也叫做数据采矿,这是数据库中一个非常基础的环节。该项技术能够在大量的数据中找到具有隐藏特殊关系的数据。通常来说,数据挖掘的整个过程可以分为四个部分,分别为:软件库数据选择、被选择数据的预处理、格式化预处理数据并展开挖掘以及获得目标数据。从一开始,数据挖掘技术就是为了应用而研发的,其不仅仅是面对特定的数据库进行简要搜索和调用,还要对这些数据进行有效统计、分析、推理和归纳。这样才能够更好地应用这项技术来找到实践问题的答案,进而发现各项事物之间的关联性。甚至还能够借助已有的数据来对今后的相关活动进行有效预测。
在软件工程开发和策略中存储的有关文档和测试结果等数据就是软件工程数据挖掘技术,该项技术也可以称为数据采矿技术或者资料勘探技术。其主要是通过有效的计算来获得想要的数据。该项技术主要运用在智能技术和自动化技术中,其可以处理非常庞大的数据系统,满足更多的数据分析需求。因此这项技术是一种全新的数据分析模式。
该项技术拥有诸多特点,包括有:数据的复杂性、挖掘结果特殊性、挖掘结果的多元性等等。相对于传统的数据挖掘技术,软件工程挖掘技术更为复杂。因为在其面对的数据中,不仅包括了软件版本和报告,还包括了代码和注释等,通过该项技术挖掘出来的数据结果较为特殊。在大量的软件工程数据中通过处理、表示、提取和分析等一系列程序来获得有用的信息就是数据挖掘技术。但这项技术在展开软件测试时会存在一定问题,这也是因为是自身的特性而导致的。软件工程数据挖掘对人员也有较为严格的技术要求,数据结果较为复杂,采用的挖掘方式也非常复杂。
因为数据挖掘技术具有很强的运算功能一般的数据在运算时需要大量的时间,而且数据过于庞大也会影响运算系统。但在数据挖掘技术之下这个问题就迎刃而解。而且采用该项技术还能够节省时间,且不会出现数据丢失。在庞大的数据计算中,有一部分数据没有具体作用,属于垃圾数据,且垃圾数据的存在会使整个系统的运行效率降低而采用数据挖掘技术就能够将有效数据保留,无效数据去除,确保整体数据质量。
借助挖掘数据技术可以对相关数据进行转换,将原本较乱的数据展开有效处理和整合,并转成试用形式。从这些数据层面来展开分析,可以对数据展开科学化利用。在数据挖掘时,也会清理一些不明确的数据,确保数据更加科学。从多个角度来考察数据的真实性并展开有效整合。将处理好的结果直接提供给管理者并将其应用在软件工程中,就能够使相关数据处理时间大大缩减。
相对于一般的数据来说,软件工程数据要更加复杂。其在应用和处理的过程中可能会面临诸多问题,因此针对这些复杂的数据展开处理是非常困难的。但随着近年来软件工程的快速发展,软件工程数据挖掘的应用也越来越广泛。所以针对软件工程数据挖掘中存在的问题提出解决对策和方法有很重要的意义。通常对这些软件工程数据展开处理具有以下几方面特点,分别为数据复杂性、数据处理非传统性以及数据分析结果精确性等等。
结构化数据和非结构化数据共同构成了软件工程数据。而结构化数据信息又包括了软件工程中产生的问题报告和相关版本信息。非结构化数据则包括软件工程信息处理时产生的代码信息和文本信息。因为这两类数据的内容不同,因此在处理时也需要分开处理,分别采用不同的算法来展开数据处理。尽管是分开处理也不代表这两项数据之间没有关系。实际上他们之间有对应的关系。比如:如果代码中有缺陷,那么版本中同样也会存在相应的缺陷文档。正因为他们之间有对应关系,所以在分析时也应该进行整体分析。如此一来人们就开发出新的算法和分析技术,通过新的方法才能够将结构化和非结构化数据完全挖掘出来。
针对软件工程数据挖掘出来的信息展开分析和评估是数据挖掘的最后一步。软件工程数据挖掘技术挖掘出来的数据最后的宿体就是客户。针对挖掘出来的数据进行格式转变是软件开发者必须展开的工作。之所以要展开格式转变,主要就是为了更好地满足客户对于不同数据的需求。因为要对数据展开格式转变,工作量就大大提升了,因此软件工程数据挖掘的效率也会进一步降低。客户需要的信息是不同的,有的客户需要具体的编程、代码或者例子。有的数据客户可能只需要其中之一。因此要不断改善软件工程挖掘技术,使相应的数据处理效率获得提升。那么该如何让所有的客户都满意呢?这就需要对相关数据挖掘技术获得的信息予以整合和归纳。通过这些技术不仅能够满足客户需求,还能够确保开发者获得更大的利益。
从传统的数据挖掘技术来看,其也有属于自身的数据结果好坏分析标准。这个标准针对传统数据挖掘技术的处理和分析较为准确。但从目前来看,传统的评价标准已经无法满足当前数据分析的需求,采用不同的数据评判标准来评判不同的数据挖掘结果,但各类评判标准之间并没有太大的建议,所以软件开发者需要针对不同类型的数据来做出相对应的评判标准,这样才能够更好地满足更多客户的实际需求。另外要想确保相关数据分析结果更加准确,数据挖掘得到的信息更加合理,就必须要求软件开发者拥有属于自身的意见和想法,并对获得的数据结果是否精确也有一定的判断力。综合上述,要想获得准确的信息就必须采用软件工程挖掘技术,这也是该项技术希望达成的主要目的。因此,最后获得的数据能否满足软件工程数据挖掘结果的要求是最终的评判标准。
因为该项技术是在数据库的基础上展开的。随着当前各项技术的不断发展,这项技术已经从一开始的理论逐步转化为实践,且在实践中获得了较大的应用,发挥了较为重要的作用。软件工程属于工科类,其需要依照不同项目的差异,资金和客户需求来展开产品研发。因为以往的工程软件开发非常复杂,但随着各项技术的不断发展,数据挖掘技术也越来越成熟,在实践中应用范围也越来越广。另外借助数据挖掘技术对软件工程数据库信息进行深入挖掘,这对于软件工程的可持续发展而言有非常重要的意义。
软件工程技术可以有效地掌控相关信息挖掘,其实际应用范围非常广。软件工程技术能够将软件开发时的各种信息予以统一,以此来确保展开软件开发的过程中可以及时更新相关数据,并从根源上确保数据开发的质量,以此来保证各项任务顺利实施。从当前情况来看,目前的数据挖掘技术中还包括了诸多软件开发和更改的数据信息,这样就能够将软件内部的不同之处更直观地体现出来,再结合实际情况来采取有效的解决措施,以此来保证整个项目的目标任务更顺利达成。
在数据挖掘技术中最重要的一点就是要展开对软件漏洞的有效检测,在实际运用时可以发现软件开发存在的漏洞或缺陷,进而对相关漏洞展开有效修复和处理,这样能够更好确保软件工程的安全和质量。同时在采用数据挖掘技术对漏洞展开检测时,有关技术人员应该清楚检测内容,并立足于客户基本需求来找到相对应的测试内容,明确测试内容后再采用恰当的方式来对软件进行测试,最终获得最优质也最有效的解决方案。另外,采用软件工程技术对数据信息展开处理时,在成功找到相关漏洞之后,应该对多余的信息展开有效处理,以此来确保整个数据信息更加完整也更加科学。有关工作人员应该采用科学化的方案来将数据挖掘技术运用到软件工程中,并展开合适的方式来有效分析和处理系统中存在的漏洞,找到漏洞之后,对垃圾数据展开处理。这样能够让操作者更好的展开对系统漏洞的处理和修复。从当前实际来看,数据库挖掘技术就是将相关数据信息能够有效转化,并梳理整合再储存到数据库中。然后由相关技术人员结合具体需求对软件展开测试,通过测试来明确系统中是否有漏洞,并借助这种方式来确保后续工作顺利展开,使软件工程项目能够可持续健康发展。
在应用数据挖掘技术时,需要着重关注软件执行记录。执行记录分析程序的执行路径对于代码关联性分析有极为重要的意义。因此针对软件执行记录展开数据挖掘,可以更好地维护相关软件,同时也更加深入地理解代码的功能。从本质上看,针对执行路径予以跟踪,再逆向构建模型就是执行记录的数据挖掘。一般来说在数据挖掘过程中,包括以下几个步骤:插装、跟踪、记录、分析等等。首先应该在需要测试的软件代码中插装相关信息,并将执行软件的过程有效记录下来。其次通过预处理之后,在对信息展开分析,分析方式有分类、类聚、关联等等。通过这些分析方式将关键信息提取出来,再对其进行跟踪分析,最后绘制出系统功能模型或者整体结构。有关工作人员需要在展开数据挖掘技术中对相关数据展开有效分析,并对不同代码的关系进行探索和研究,确保工作人员能够有效管理软件系统,促进系统的可持续发展。
针对开源软件代码进行挖掘时,需要先将其规划到软件工程中挖掘技术需要作用的对象挖掘类型中。在软件数据挖掘技术中,开源软件挖掘复制代码是非常常见的一种应用方式。在软件工程中,代码复用极为常见。而且在诸多项目中,都可以采用多数通用源代码。这也意味着采用代码克隆检测技术能够很好地完成对软件内部代码以及不同软件之间的代码展开相应的检测,并将有利用价值的代码段予以提取。对这些代码段展开特征分析,可以避免在克隆代码的过程中出现漏洞。同时也能够为相关软件的后期维护和升级提供有力借鉴。因为开源软件代码技术一般都会应用到代码克隆过程中,有效处理代码漏洞。因此采用这种方式也可以进一步提升相关工作的效率。
以上所述,可以明确在软件工程项目中,采用合理、科学的运营数据挖掘技术能够更好促进相关软件工程的可持续发展。以软件应用的实际情况为基础来展开相应分析,能够明确数据挖掘技术未来有很大的发展空间。有关技术人员需要明确该技术的重要性,并不断深入研究,对该项技术予以完善,对该项技术的理论和应用价值予以充分挖掘。采用这种方式从本质上加强该项技术的专业性,并通过技术人员的应用将其作用充分发挥出来,使我国软件工程技术能够获得可持续发展。