赵舰波
(西安外事学院,西安 710077)
传统的数据处理主要是通过数学统计的相关知识或计算机软件来进行,具体方法比如经济数据开发、经济数据分析等。但是在实际操作过程当中我们不难发现,这种形式非常单一,而且具有缺乏精确性、缺乏深度性等缺点。数据挖掘技术和传统数据处理都具有筛选虚假数据的作用,所以如何利用数据挖掘技术提高数据质量,对提高经济统计水平有着不言而喻的重要影响。因此,对相关内容进行研究和分析,并且提出解决对策是非常有必要的。
所谓数据挖掘的技术就是从很多的数据信息中把有用的信息寻找出来。这些庞大的数据信息普遍被认为是不完整的、模棱两可的、嘈杂的、基本都没有进行加工处理过的信息。但是,被挖掘之后的信息是有利用价值的、有用的、新颖的信息,这样的一个变化过程通常就被定义为数据挖掘。数据挖掘包含的范围很广,有统计数据、数据库、网络系统等,在统计界被广泛运用。
转换数据挖掘信息大致的步骤一般可以分为三步,首先是准备数据,然后挖掘信息,最后分析结果。这个方法的主要的作用主要有四个层面,分别是对模型进行分类和预测、数据的聚类和总结反馈数据。数据挖掘也有很多优点:第一,能够处理巨大的数据;第二,能够主动地寻找有用信息;第三,能对过去的事件进行有效的描绘和预测;第四,能够及时敏捷地反映信息。除此之外,也会经常使用一些技术进行数据挖掘。由此可见,把数据挖掘技术应用在经济统计学中十分有必要[1]。
现如今,我们国家对数据挖掘的研讨和运用的发展水平已经相当稳定和成熟,已经能够有效地对经济统计进行服务。虽然数据挖掘技术在20世纪经历的时间比较短暂,但是其在21世纪的发展是十分快速的,而且受到了来自世界各国的密切关注,国外也有很多的计算机公司对数据挖掘技术十分得看中,并且着手积极探索和应用[2]。与此同时,我国在数据挖掘领域也正在进行认真的研究和探讨。在各企业之间的经济统计部门使用过的应用系统中,经济统计信息最主要的过程是收集和处理的过程。除了大型的调查之外,还有很多数据都是处于凌乱的状态,这样的情况会给数据统计工作带来很大的影响,进而出现很多的工作失误。所以,企业和单位要谨慎对待数据挖掘技术,工作人员认真负责。建立宏观的经济数据可以解决统计过程中存在的一些问题:不真实的统计信息,利用率低下,不能进行正常的审核查找,导致系统处于瘫痪状态等。
国家电子政务四大基本的数据库之一就是宏观经济数据库,是一个重点需要建设的项目名单。它涉及的范围十分广泛,包含了科技教育、社会发展、社会经济发展等[3]。在使用宏观数据库的时候,要规范和统一它的使用方法,有利于收集数据,挖掘数据技术,使最终的结果更便捷和精确。要将数据挖掘有机地与宏观数据项结合起来,使经济统计在数据挖掘技术下能得到更好的服务,使经济数据信息能够被人们方便地查找和获取,满足政府获取信息的需要以及社会各管理层的决策需要。挖掘数据技术在社会上的广泛使用,改变了传统的数据信息模式,提高了统计资源的使用价值,为经济发展提供了更好的服务[4]。
在社会经济管理活动中,统计数据的真实性和实用性是管理主体对经济统计数据的两个主要要求。虽然只有这两个主要要求,但确是一种适用性十分好的经济统计技术,能够更好地满足经济统计工作的需求。在具体的经济数据统计活动中,主要的应用形式有以下四种。
1.经济数据的预处理。经济数据的预处理是经济数据统计活动中最基础的一种处理方式。对挖掘技术进行经济统计预处理的原因是由于挖掘技术自己本身会受到各种经济条件的限制,不可能取代经济系统的收集功能,本身只是一种基于提供基础信息的智能分析技术。处理的内容有很多,有处理数据的不准确性、处理数据的不真实性,还有处理信息的错误性,最主要是处理差距很大的数据信息。所谓数据清理,就是对有问题的数据库进行处理和分析,清理数据主要使用了三种方法:预估方法、测平均值方法、平滑方法等[5]。其中,均值法主要使用在没有数值和有噪音数据上,是现代分析技术中模糊理念的一种新的应用形式,再用数据库中的已知的数据弥补未知的数据,达到填补空缺的目的,确保对基础数据分析的挖掘系统和整理能够正常进行,以此可以得出比较精准的统计分析数据。
2.构建决策树。因为就目前状况来看,决策树对情况的反应十分迅速直接,所以在数据挖掘技术中被广泛使用。通常情况下有两个步骤可以构建一个完善而精确的决策树:第一步,要使决策树的方法精简化和有效化,建立一个有效的数据,该数据能进行数据输出分析的模型。第二步,要充分使用被构造完的决策树,对数据进行有效的分析和分类,从一决策最基础的根本开始,然后在慢慢延伸开来,延伸到决策树的各个部位,只有当数据满足了某种条件才会停止运作。在具体运作中想要终止分割,首先要实现具体的两个条件:其一,当两个分割在进行时,如果分割点上的数据一模一样分割就会被终止,决策也就被顺利地完成;其二,无法在继续分类下去但可以在分割数据[6]。但是,以上的情况会给决策带来一些不必要的麻烦,所以为了降低因为使用了某些不合理的方式方法而对决策数据本身带来了消极的影响,就需要在构建完决策树之后,根据具体的使用情况对构建完成的决策树进行修剪工作,使决策树趋向更加完美。
3.有机结合序列模式和决策树法。为了能够确定调查对象,将其进行妥善的分类,采用有序组合序列模式和决策树法分析采矿技术的经济统计。在一个地区连续按照企业在这个地区通过多年来的数据得出的最佳模式,建立各个企业的序列模式,通过上述的结合方法获得企业价值的准确估计,然后在有效的分析中可以根据不同的概率和价值估计传递上述信息的最重要对象,主要的对象是对数值的有效预测和对实际数据的上报工作。如果有不同的概率可以再次重新分类,如果没有出现不同的概率就可以顺利地进行下一个步骤,这样的话可以大大提高工作的效率,可以给相关的工作人员带来便利和高效,大大提高数据挖掘技术在经济统计中的具体应用。同时,也可以根据不同分类方法的差异率来制定不同的方案,当制定出一个优良的方案时,可以给企业带了重要的借鉴,所以企业规模与重要业务事件发生的差异大小就可以以此为依据的。如果没能及时有效地制定出一个更好的方案,那么可以肯定的是会给企业带来一些消极的影响。比如,对企业经济的发展带来抑制影响,降低企业相关人员对工作的热情,使企业处于一个消极低沉的氛围当中。可想而知,一个好的方案是有多么的重要。所以,企业相关的领导人应该积极地采取一些有效的措施,鼓励内部人员认真工作,设立奖惩措施,多举办一些可以提高工作人员兴趣的活动。这样一来,整个工作氛围也会活跃起来,那么工作人员的积极性也会大大地被调动起来。同时,企业不应该只专注自身的内部发展,也要建立与外界的联系,可以多与其他企业进行相互的沟通交流合作,多吸取别人的优势和长处,学习自所没有的先进技术。这样,企业才能又好又快地被发展起来,内部人员的专业素养也会有所提高。
4.根据变化差异做适当调整。对企业进行调查的主要情况是企业的规模变化差异很大,如果企业的变化差异在合理的范围内,比较小的话,就要参考企业以前是否有发生过一些重大的事情,没有的话最好,可以不用进行下一个步骤,如果有了的话就需要再进一步地进行调查和分析来获取更可靠的有效信息。只有根据变化差异来不断的进行适当调整企业,才可以快速地发展起来,找到适合自己的方法和措施,要与自己的实际情况相一致、相统一。只有这样,企业才能对症下药,从自己的问题出发,使企业的变化保持在合理的范围之内,不用增加多余的再检查工作,大大提高了工作效率,让相关的工作人员有更多的时间,去研究自己感兴趣的内容,促进多方面人才的发展。这样,企业拥有了一支庞大的人才队伍,才可以在众多的竞争中脱颖而出,快速成长起来。
综上,现如今,我国对数据挖掘的运用水平已经达到一个相当稳定的状态,且依然在不断努力和研究的过程当中。但是在实践过程中我们发现,数据挖掘技术在经济统计中依然存在数据失真、统计方式不当等问题,造成数据质量不高。因此,我们必须加强对相关内容进行研究和分析,并且提出相应的解决办法,促进我国的数据挖掘技术,从而为我国的经济发展建设做出应有的贡献。
参考文献:
[1]宋淑彩.面向Web的数据挖掘技术在网站优化中的个性化推荐方法的研究与应用[J].科技通报,2012,(28):117-119.
[2]杨群瑛.基于数据挖掘技术的保护设备故障信息管理与分析系统[J].电力自动化设备,2011,(9):88-91.
[3]行智国,吕斌.数据挖掘及其在官方统计中的应用前景[J].江苏统计,2010,(2):11-12.
[4] 王斌会,曲颖.数据挖掘技术及其应用现状[J].统计与决策,2006,(10):122-124.
[5]王启.数据挖掘技术在经济统计中的应用探索[J].数学统计,2014,(45):38-39.
[6]钟玉钦.浅谈数据挖掘技术在经济统计中的应用[J].统计与概率,2008,(2):90-92.