数据挖掘技术在经济统计中的实施探析

2022-07-04 09:27邱建舒艾泓宇四川大学华西第二医院
环球市场 2022年13期
关键词:决策树数据挖掘经济

邱建舒 艾泓宇 四川大学华西第二医院

目前,我国市场经济正保持稳步提升的发展状态,且时有爆炸性增长的情况出现,这促使经济统计工作中,涉及的数据规模日渐庞大,与此同时,经济市场的越发繁荣,必然会导致经济数据信息更为繁杂,在这一背景下,市场经济的发展,对经济统计工作的准确性、高效性提出更高要求[1]。正因如此,我国经济统计相关部门,正在持续探索如何提高经济统计工作水平,不断创新统计的模式与方法。数据挖掘技术的成熟,促使经济统计工作取得了新的思路与方法,可以实现经济统计中海量数据的资源整合,且可在最短时间内,对数据进行准确挖掘及分析,促使数据统计质量不断提升,所获取的信息也更为准确、广泛[2]。

一、数据挖掘技术概念及特点

(一)数据挖掘技术的概念

数据挖掘技术是人工智能领域和数据库领域重要的研究内容,属于多学科交叉技术。具体而言,数据挖掘是指从随机、模糊的海量数据中,挖掘、提取出具有一定价值的数据这一过程,主要是在神经网络、统计学、可视化技术、模式识别、人工智能基础上开展。简单来说,数据挖掘技术即从冗杂、海量的数据中,提取有价值信息的技术方法,可以实现数据的智能化、自动化分析,并进行归纳、整合和推理,从而为决策者提供科学数据支持,以便决策者对市场经营策略及时调整[3]。当前信息时代的到来,让数据变化高度复杂,很多时候必须通过数据挖掘,将重要数据提取出来,从而对信息数据予以整合。因此,数据挖掘技术已经成为现代社会重要的分析技术。

因现代社会需要处理的数据量极大,而传统统计分析的方法,是在未明确假设的基础上展开信息挖掘,这样工作效率相对较低,在解决问题时,效果也不十分理想。换言之,传统数据统计分析方法,并未探索不同数据彼此之间内在的关联,因此其分析工作只能对过去的情况加以反映,而对未来难以提供预测价值,对于要探索的目标,也无法获取相应结论。数据挖掘技术可以将获取的信息作为基础,获知潜在、未知的内容,是在原有数据基础上,发现传统统计分析无法预料的、人的感官无法察觉的,或是和实际生活相违背的信息[4]。可以说,数据挖掘技术是对传统技术的高度拓展,是统计分析和人工智能的结合,符合现代社会对数据分析要求不断提高的现实局面,正因如此,数据挖掘结果在现代社会具有极高应用价值。

(二)数据挖掘技术的特点

如今,数据挖掘技术已经从其他学科中,获取了海量经验与知识。这一技术具有如下特点:

1.信息数据量较大

借助数据挖掘技术,可提取出大量信息,其信息可用TB或GB这一容量进行描述,可见,数据挖掘技术处理的信息十分复杂,涉及范围广泛。不过在运行中,离不开统计人员对数据的精加工、深加工处理。

2.提取关键词信息

在应用数据库的过程中,若用户未能获取自身搜寻的信息,或不知自己需要搜寻哪些信息,可借助关键词来展开搜索,提升查找效率,缩短用户获取信息的时间,可促使经济统计效率大幅提升。

3.可扩展性强

计算机技术与信息技术不断发展,促使数据挖掘技术内部容量逐渐扩大,同时数据挖掘精准度也逐渐提升。数据挖掘技术具备的可扩展性,使其适应性更强。目前我国经济发展迅速,经济信息量不断增长,经济统计工作日益繁重,数据挖掘技术的这一特点,能够满足经济统计工作的发展需求。

二、数据挖掘技术在经济统计中的应用优势

借助数据挖掘技术,可从海量的原始数据中,准确挖掘出真实性、高价值性的数据,同时还可对挖掘出的数据展开处理、分析,进一步提升其价值。在挖掘技术不断创新、不断完善的背景下,这一技术对于经济统计的应用意义可逐渐提升。在经济统计工作中,应用数据挖掘技术,具有如下优势:

(一)可满足使用主体对信息的需求

在经济统计中运用数据挖掘技术,不仅能对数据展开分析,同时也可满足使用主体对于信息的需求。我国各行各业,在生产运营中均会形成海量的经济统计信息,而这些信息能够为经营者的经济管理决策提供重要支持[5]。因为不同管理部门的经营管理范围、所涉及经济领域各有不同,经济管控权限也差异较大,各部门需根据自身的具体情况,构建系统化处理机制,形成符合自身实际情况的数据解读方式。正因在这一过程中需要处理的数据信息量极大,因此不同部门的数据统计工作,对数据处理信息路径、数据统计系统均提出更高要求。在选择统计方式及处理方法时,不仅需要考虑不同管理部门具体需求,同时还需根据需求以不同方式将数据换算、呈现出来,从计算层面、信息来源层面,实现信息评估可靠性的提升,从而确保数据处理更为全面,更加高效。

(二)可对数据统计结果加以优化

运用数据挖掘技术,可以构建宏观的数据库,这可对数据统计的效果加以优化。在具体的数据统计工作中,可以借助多元化经济统计机制,为经济管理活动整体的需求提供支持,避免数据统计的重复性。并且,通过这一技术,可对不同的统计系统加以整合,让数据信息彼此融合。因此,借助数据挖掘技术构建宏观的数据库,可以为数据优化创建更广阔的平台,确保统计信息更加完整、准确。

(三)数据挖掘技术结果高度有效

因数据挖掘技术本质上属于深加工技术,其目的性十分明确,特别是在实际的应用范围之中,可对长期积累的海量数据加以统计,对数据进行解读,这样使用者可通过分析数据,来对其深层次的应用价值、象征意义有所了解[6]。现阶段,在应用数据实践中,数据挖掘技术不仅能够实现对长期积累的经济数据的高效管理,同时还可从多个角度出发,分析现有经济数据的目的性,或可基于经济数据管理的视角,实现数据分类、明确信息统计单元,以更加系统、科学的归类方式,来整合数据库中原本混乱的信息,提升这些信息中的价值含量,从而提升统计数据管理应用的便利性,提高数据使用效率。在进行经济数据处理、再加工时,对数据进行统计、分析的目标,是要对原始数据组成的内容展开重新加工,而这也需要通过数据挖掘技术来实现。原始数据的加工可以将数据背后的价值充分发挥出来,这样经济统计数据可为管理者具体的应用需求提供最大限度的服务。

三、数据挖掘技术在经济统计中的实施策略

(一)数据预处理

在经济统计过程中,运用数据挖掘技术,首先需要通过预处理方式对基础信息实现智能化分析。数据挖掘结构会被经济信息所影响,无法无中生有建立数据收集的体系,在应用这一技术的过程中,数据信息的预处理是重要的控制措施,也是一种管理机制。经济统计的数据预处理,可统筹划定数据的差距、不真实性及不正确性。数据挖掘技术中的数据清理过程,即对基础数据中的问题加以全面处理,其方法包括平滑法数据处理、均值法数据处理。

(1)平滑法数据处理:这一方法可对基础数据中空值、噪声数据统一展开计算,借助加权平均数的处理及时,对提取到的数据展开影响权重值分析,这样获得的计算结果和真实数值更为接近。在应用中,可借助下列公式来分析当前数据点的取值结果。

备注:Wj为CJ实际的权值。

(2)均值法数据处理:这一方法指的是对基础数据中的噪声数据、数据点空值来实施均值处理,确保数据可借助属性均值,填充、补足数据的空白。只有数据挖掘系统充分分析基础数据,才可确保数据的统计分析具有实效性和完整性。在当前数据点取值分析时,可用公式如下:

(二)构建决策树

在对经济数据进行预处理后,需构建相应决策树。运用数据挖掘技术实施经济统计,在构建决策树的过程中,工作人员在初步构建过程中,可借助训练集这一工具,之后再通过专门决策树算法,来简化构建的初步决策树,而这时构建的模型,就是数据输出分析的模型。之后,统计工作人员需充分利用构建的决策树,来准确分类经济数据,并对数据展开深度分析。根据决策树,从决策树的根本向决策树的各枝干进行延伸,到数据符合既定条件之后,分割即可终止。若同时展开两个分割,且这两个分割点上具有完全相同的数据,那么分割会自行终止,决策过程即可顺利完成。若数据并无分类的属性,不过可将经济数据继续实现分割,此时需将分割立即停止。在具体的经济统计过程中,还可结合该地区企业历年提供的数据报表,建立企业对应序列模式,借助数据挖掘来计算企业的预测值,并且将预测值和历年所报的经济数据展开对比,即可得知差别率。之后,工作人员可以分类分析所得差别率,根据差别率占比情况,将之划分成三大类,如20%以上者划为A类,10%-20%者划为B类,10%以内可划为C类。

(三)进一步调查

对某一地区展开经济统计分析时,应用数据挖掘技术时,工作人员可以根据本地区企业以前报告的数据,结合企业规模是否出现变化、企业内部是否出现重大的经营事件等,来判断是否需要进一步展开调查、分析[7]。若数据挖掘之后发现,企业规模的变化差异率大,不过仍在合理范围之内,则不需展开进一步的调查,即可获取可靠、准确的经济信息。若企业的规模有较大变化差异率,且超出了规定的范围,或虽然企业规模的变化差异率很小,不过在其内部出现了一些重大的经营事件,这时工作人员就需对当地企业中的经济问题进行深入了解,以便制定切实有效、针对性强的经济决策决议,在保证经济统计结构可靠、完整的基础上,协助企业提升自身的竞争力,促使其经济效益规模逐渐扩大,实现推动当地经济发展的目的。

四、应用展望

现阶段,我国市场经济活动过程中,部分管理部门在职权划分中还缺少清晰界限,经济统计管理工作也有其局限性,而经济主体管理人员不同,对数据挖掘的需求及目的也有所不同[8]。在经济统计工作中,管理部门需要改变传统数据处理的方式,充分应用数据挖掘技术,才能从根本上促进经济统计工作质量不断提升。这是因为数据挖掘技术可以规避传统数据统计分析工作中的不足,降低不完全统计、重复统计的可能性,对于我国经济统计工作而言十分适用。相信在未来的市场发展中,数据挖掘技术将有很大的发展空间。值得注意的是,在具体应用中,我们应该对这一技术的应用方式及时调整,确保数据挖掘技术保持其适用性,以满足经济统计管理工作的需求。

另外一方面,数据挖掘技术对信息深度加工处理后,可以为数据统计工作人员提供数据支持,且其数据信息可以长期保存,能够增强工作人员理解相关数据的程度,有助于构建一体化、系统化的信息结构[9]。数据挖掘技术还可促使信息数据管理更加高效、便捷,是数据统计工作有序开展的基石。数据挖掘技术在积累海量数据信息后,其应用价值可以进一步凸显。相信在未来的发展中,这一技术具备的有效性优势可以进一步发展,对数据库中数据混乱、信息重复的现象进一步优化,促使数据信息得以整合,进而提升经济统计的工作质量。

五、结语

总体来看,将数据挖掘技术用于经济统计工作中,可以推动经济数据资源的扩展,且可为经济局势、经济发展走向的判定,提供可靠、真实的数据知识。在具体应用过程中,数据统计工作人员需要把握数据挖掘技术的原理、应用方法及特征,对原始统计数据展开预处理,构建对应决策树,在实现数据分类、对调查对象予以确定的基础上,必要时结合企业经营情况,展开进一步调查,通过挖掘获取价值较高的经济数据,从而为经济管理活动提供数据支持。

猜你喜欢
决策树数据挖掘经济
“林下经济”助农增收
探讨人工智能与数据挖掘发展趋势
增加就业, 这些“经济”要关注
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
民营经济大有可为
基于并行计算的大数据挖掘在电网中的应用
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用
基于肺癌CT的决策树模型在肺癌诊断中的应用