山东省菏泽市定陶区统计局 张丽丽
试析数据挖掘技术在经济统计中的应用
山东省菏泽市定陶区统计局 张丽丽
我国社会经济体制的变更推动着我国社会经济的快速发展,2016年我国国民生产总值已达74万亿,同时在社会经济活动当中,因为不同类型经济发展因素的影响,逐渐形成了一种比较复杂的经济关系体制,经济的快速发展已经开始超过了人类大脑可以分析和理解的范围。因此我们需要对当代先进的统计技术加以有效应用,来对经济发展的趋势进行分析。在我国最近几年的统计学发展过程中,数据挖掘技术慢慢发展成为了经济统计和分析的全新形式,在社会的统计活动当中得到广泛应用。
数据挖掘 经济统计 应用分析
自我国改革开放之后,我国在社会经济的发展速度上不断加快,我国在历经几十年的经济发展建设活动之后,已经积累下了大量的经济发展数据。因为经济数据本身都具备一定的发展性与信息量的庞大性,造成了对统计数据人员在对其中的数据信息进行使用的过程中,只是单纯地局限于对其中树据数字信息的分析和使用,并且对数据信息中的重要统计资料不进行更加深入的挖掘工作。对数据挖掘技术来讲,它作为一种全新的统计方式,它的优势主要表现在对所有的信息数据实施横向或者是纵向的开发,在实际的研究范围上都得到了相应的延伸,并且可以通过对数据的挖掘,可以从基础性的数据当中获得更多更有价值的数据信息,可以更好地为社会中的统计数据提出良好的需求。
数据挖掘技术主要是指通过比较深层次的开发,从大量的数据当中挖掘出比较有价值的信息,并且对所挖掘出来数据进行分析和整理,有效地实现对比较复杂和混乱的数据进行有效的整合。这其中我们所提到的大量数据具有比较强的模糊性、随机性以及不完全性的特性,通过对数据挖掘技术可以将其变成比较有价值和新型的信息。数据挖掘不但是在经济信息中实现信息的变化,同时还是一种具有科学交换特性的数据技术,其中重点涉及了学习、数据分析以及数据库等方面的内容,在统计行业当中得到了非常广泛的应用。
在经济数据统计工作当中,作为一种基础性的数据处理形式,是实现经济数据实现预处理的主要方式,因为数据挖掘技术本身就属于一种为基础性信息提供准确分析的技术,数据挖掘受到了基础数据信息的限制性,它不可能用来代替经济数据中所具有的数据信息收集功能。因此作为数据挖掘系统中的基础性的数据信息,都需要提前进行预处理技术,所处理的内容主要包含了对这些方面数据的不准确性、不真实性以及不同经济数据相互之间出现比较大的差异性[1]。
由于当前我国在社会活动中,对经济数据的统计内容比较庞大,其中对众多的经济数据的统计工作,并不是来源于在官方统计局当中,而是从社会中的一些统计组织或者是一些社会经济个体当中所提供的数据,在对数据信息实施挖掘的过程中,其中这些经济数据主要来源于多方面的数据模式的集合,通过经济数据的集成化来实现对实体经济数据信息的识别工作。
数据转换的方式,主要是指在对其中某种方式的数据变化形式,可以充分满足数据要求变化的方式,转换的方式主要分成数据的泛化和数据的准确性。对于后者来讲其中主要涵盖了数据的最大规范化、最小规范化以及平均值的规范化,但是数据中的泛化主要是指对最高层次中的数据信息对低层次中的数据进行替换,其中主要包含了对数据连续性的处理,但是因为这种方式对实现数据的连续性的处理比较困难,所以说,通常只选择离散的方式,也就是对数据进行区间形式的划分[2]。
决策树属于一种预测性的模型,是对象价值和对象属性相互之间形成的一种映射性的关系。其中每个叶片点对应的从根部的节点到这个叶节点上,所经历的过程上所表现出的对象的数据,同时还可以作为一种预测性分析。在经过了这种环节之后就可以有效实现相关的管理决策人员对数据信息的使用。决策树的方式首先需要建立决策树:第一是通过对相关的数据信息进行大体的分析,通过测试集成来实施模型测试工作,并且进行简单的处理工作,然后再建立起输出模型[3];第二是通过建立起完成的决策树系统,来对数据信息实施简单化的处理,这个过程有称之为“递归”,在完成整个决策树的建立之后,再对决策树中的枝叶信息进行修剪,以此来避免在之后的调试工作中一些不相关数据,对决策树产生的影响。
数据的回归分析,主要指的是通过两种或者多种变量相互之间产生的依赖性,通过数据之间形成的一种定量的关系形成一种的统计学的分析方式。通过对数据回归的分析可以有效的建立起变量相互之间的回归方程,通过相关的因素分析和判断,对其中的变量和次变量之间的关系进行分析,通过这种不同类型方式的实验,实现测量误差降到最低,通过回归的数据分析方式,可以实现对社会市场的占有率、品牌的销售量以及整体的经济发展趋势等进行有效的解释,将其中的两个或者两个以上的数据关系,通过函数的关系进行表达,以此方便与更有效的解决问题[4]。
数据挖掘技术作为一种对数据信息进行深层次加工的统计基础,它本身具备着比较明确的目的性,在实际的使用过程当中,可以通过长时间的积累统计数据,来对基础性数据实施深层次的处理和加工。在实际的使用过程当中,基于数据使用者的具体要求,从不同的分析角度上出发对数据在应用过程中,对数据本身存在的数据信息实施统计和分类,将原本比较混乱的数据库实施科学和系统的归类整理,通过这种方式来保证数据信息管理的高效性和便利性。
对于数据挖掘技术来讲,它属于一种系统型的数据统计工具,并不属于一种单一性的数据分析,可以有效地实现对使用者本身对各种不同类型的信息的需求性,伴随当前我国社会经济的快速发展,其中经济管理部门中需要对社会当中大量的经济发展数据进行统计和分析,并且数据信息所表现出的管理和处理的权限各不相同,这就需要经济管理部门需要针对不同需求的经济管理内容进行统计分析,将其中的数据转换成不同的数据形式,并且可以依照信息的具体来源以及统计信息的计算形式对其可靠程度来进行评估,保证数据统计信息的准确性[5]。
在我国的经济管理部门当中,对职权的管理工作上表现的比较分散,其中不同类型的经济管理部门中,对数据信息的需求量以及需求的类型也是不尽相同的。在很多地区,很多的经济管理部门对其统计活动的传统实施方式,具有比较明显的局限性,很难通过经济管理活动来提供更加优良的服务,在实际的工作当中经常会出现一些重复性统计或者统计不完全的现象,严重影响到了经济数据分析的有效性,通过数据挖掘技术的应用,有效地避免了这方面的问题,只要充分地保证所得数据的准确性,通过数据挖掘技术就可以对其实施有效地整合和处理,从而使数据资源变得更加丰富多样。
本文通过对数据挖掘技术在经济统计中的应用分析,从中得出结论,在受到了不同类型经济发展因素的影响,经济的发展逐渐形成了一种比较复杂化的经济关系体制,经济的快速发展已经开始超过了人类大脑可以分析和理解的范围,我们就需要对当代先进的统计技术加以有效的应用,来对经济发展的趋势进行分析,通过对数据挖掘技术的有效的应用,有效实现了对比较复杂的经济数据的分析,对我国社会经济的发展起到了保障性的作用。
[1] 杨梅冰,梁思思.关于数据挖掘技术在经济统计中的应用[J].时代金融,2015(24).
[2] 董静.试析数据挖掘技术在经济统计中的应用[J].商,2015(31).
[3] 柳枫.基于统计的数据挖掘技术在CRM系统中的应用研究[D].大连理工大学,2013.
[4] 杨杰,黄欣,吕永.数据挖掘技术在建模、优化和故障诊断中的应用[J].红外与激光工程,2015(03).
[5] 杨振舰.可视化数据挖掘技术在城市地下空间GIS中的应用研究[D].河北工业大学,2014.
F222.3
A
2096-0298(2018)01(a)-013-02
张丽丽(1975-),女,汉族,山东省菏泽市人,本科,中级统计师,主要从事统计设计方面的研究。