马长青
摘 要:近些年来经济发展速度快,工作量也大幅度增加。工作中面临的统计数据更是有很大的数量。因此经济统计工作便成为了十分重要的工作内容。要做好经济统计工作,就需要正确的认识到这个工作的重要性。同时还要深刻的认识数据挖掘技术,并且了解数据挖掘技术的特点。然后才可以将经济挖掘技术更好地应用在经济统计中。本文分析了技术挖掘技术的内涵和特点,然后探讨了数据挖掘技术在经济统计中的应用。
关键词:数据挖掘技术;经济统计;集成化处理
在经济统计数据库中有着数量很大的数据。而大部分数据是通过数理统计知识来对其进行利用。这样的方法导致的是形式上的单一和深度上的浅薄。所做的工作仅仅是对目前已有资料的保存和整理。在数据挖掘技术的经济统计过程中如果只是靠这样的传统的经济统计方法来工作是难以对这类数据进行准确的分析。因此要将数据挖掘技术在经济统计中更加广泛的应用。通过数据挖掘技术可以使经济统计所得的数据变得更加有广度和有深度。对数据的分析也可以更加的准确。从而使得数据的质量得到提高。获取的信息也更加的准确和广泛。
一、数据挖掘技术的含义
数据挖掘技术是一门具有多个学科交叉特征的技术。其内容不仅仅包括数据统计和数据库,而且还包括机器学习和神经网络等。在统计行业中应用的范围很广。数据挖掘技术是将大量的数据进行分析和整理,从中找到具有价值的信息。然后再对其进行分析。将大量并且复杂的信息进行整理,使其变的规范和有价值。数据挖掘技术能够让经济统计从业人员和数据的使用者在获取数据信息时更加的便利。数据挖掘技术对大量的原始数据进行不同程度的加工,让这些数据变为有价值的数据,去除了原始数据的模糊性、随机性、不完全性等缺点。
二、据挖掘技术的特点
數据挖掘技术可以处理大量原始数据,使其变得更加有价值。数据挖掘技术具有以下几个特点。
(一)数据挖掘技术可以从容的面对大量增长的经济统计数据。数据统挖掘技术可以不断地扩大自身的数据库。从而使搜索需求达到满足。还可以不断提高在搜索过程中查找数据的准确性。可以使使用者更加快速的找到所需要的数据。
(二)数据挖掘技术可以对使用者输入的关键词进行联想搜索。对不确定搜索内容的使用者有了更加便利的搜索方法。并且可以将使用者所输入的内容查找出的信息进行有序的排列。
(三)数据挖掘技术可以在数据库的大量信息中找到数据与数据之间的关联。然后联系起其他各方面的数据,从而进行预测未来的经济发展方向。
(四)数据挖掘技术可以处理的数据非常巨大。面对大量的数据,数据挖掘技术也可以从容的对其进行处理。
三、数据挖掘技术在经济统计中的应用
数据挖掘技术不仅可以从大量的原始数据中准确的找到具有代表性并且真实的数据,还可以对这些数据进行合理、有效的处理,使其变得有价值。数据挖掘技术在经济统计中的运用越来越广泛。并且自身的技术也在不断完善。数据挖掘技术的主要应用方式有以下几种。
(一)集成化处理应用
数据集成的含义是对大量不同的数据进行整理。使其由复杂、杂乱变的规范和具有整体性。经济在不断发展,信息的来源也变得更加广泛,由此收集到的数据也越来越多,内容也越来越复杂。从而导致的是数据集成变得更加困难。而且数据的来源也具有多种途径,不仅仅是官方的统计,还有其他的来源,这就使得所收集到的数据具有多种模式。将大量的原始数据进行处理时期,使其变的精简和有效。让数据库的大小保持在较小的水平。才可以让数据使用者和相关单位在使用数据时更加方便。
(二)预处理方法
对经济数据进行预处理是经济统计过程中较为基础的一种方法。数据挖掘技术是在基础信息的前提下对数据进行整理和分析。而无法替代经济数据收集系统的功能。因此经济数据收集系统收集到的数据要进行预处理才可以让数据挖掘系统在此前提和基础下进行工作。预处理的内容包括将数据中偏差较大、不准确、不真实的数据进行去除。处理这些数据的方法叫作数据清理。数据清理也包括多种方法,例如:预测法、平滑法、均值法等。均值法是现代分析技术中的一种应用形式。均值法的应用范围是当原始数据有一个数据为空值或者是数据是噪声数据时。利用均值法对其进行处理。具体的方法是将数据库中已知的属性填入原始数据的空缺中。然后使数据挖掘系统在分析时具有完整的数据,从而提高数据的准确度。
(三)决策树方式应用
数据挖掘技术对原始数据进行分析整理后输出便于使用者利用的数据信息。这些输出数据的有效形式可以由决策树的方式进行表现。首先决策树将输出的数据信息进行整理分类,然后再以树状图的方式进行表达。决策树方式可以构建出明确的体系,将数据进行分类和排序,并准确地挑选出使用者所需信息。当决策树中的数据进行多次分类,达到最终目的使标志的决策树的数据分布完成。当然决策树整个完成后,要对决策树进行再一次修整。主要内容是去掉不相关的数据,使整个决策树变得更加统一。
(四)转换方法应用
使用某种方法使数据变为满足数据挖掘进行的形式,这个过程指的是数据转换。数据转换要将数据变得更加规范,同时还要将数据泛化,即将高层次的数据信息替代低层次的数据信息。除此之外,还要对数据进行连续进行处理。由于连续性处理的方法比较困难。所以可以采用概念分层,即将数据进行划分,然后将某些数据用代号来表示从而达到减少数据收集的量。
结语
将经济挖掘技术更好地应用在经济统计中,要做好经济统计工作,正确的认识到这个工作的重要性,同时还要深刻的认识数据挖掘技术并且了解数据挖掘技术的特点。通过数据挖掘技术使数据的质量得到提高,获取的信息也更加的准确和广泛。
参考文献:
[1] 辛金国,柯 芳,李绍君,et al.数据挖掘技术在经济统计中的应用探索[J].统计与决策,2009(9):24-27.
[2] 杨梅冰,梁思思.关于数据挖掘技术在经济统计中的应用[J].时代金融,2015(24):173-175.