牛静
相关领域工作者要提升对“经济统计”的重视,将其与数据挖掘技术相结合,进而为我国经济发展战略的稳步落实奠定坚实基础。基于此,本文就数据挖掘技术在经济统计中的应用展开分析,以期能够为相关研究提供积极性参考建议。
随着经济全球化的不断发展,“经济统计”这一工作也受到了社會各界的广泛关注,它能够有效地体现现阶段社会经济发展的实际情况,同时也能够在一定程度上为我国社会经济决策的制定提供基础参考保证,能够为我国社会经济的长效健康发展提供相应的积极便利条件。
基于我国社会不断进步的背景,各式各样的经济数据信息逐渐暴露在大众视野,这就意味着负责经济数据统计工作的人员面临着巨大的工作负荷,而原有的经济数据统计理念与方式已经无法满足当今时代背景下的实际需求,需要找寻新的工作技术,而数据挖掘技术的出现能够有效满足这方面的实际需要,在提升经济数据统计效率的同时,为其工作质量提供基础保证,因此相关领域工作者要积极利用数据挖掘技术,以此助力我国经济数据统计工作的长效健康发展。
一、 数据挖掘技术的含义
数据挖掘技术与其他先进技术具有一定的共性,都是时代发展与社会进步相互碰撞而成的产物,它指的就是从大规模的数据信息中,对相关信息进行“模型化”“构建化”处理,具有较为明确的目的性,就是为了找寻出最具有使用价值的数据信息。“数据挖掘技术”在一定程度上可以理解为是由先进的“人工智能技术”转变而成的,它的覆盖内容具有“多元化”特点,它能够敏感预测社会的变化,进而对自身进行自主整改。
随着近些年我国社会的不断发展,数据信息也逐渐呈现“暴涨”态势,以往的数据信息统计方式已经无法满足时代发展的实际需要,甚至在运用以往数据信息统计方式的过程中,常常还会出现“人工失误”“效率低下”等问题,这对我国数据信息统计水平的提升是十分不利的。而“数据挖掘技术”的出现就能够对以往工作过程中存在的各项问题进行有效整改,将表面化的数据信息内容进行深度挖掘,力求找寻其内涵下的有效数据信息,这样就能够有效地提升以往数据信息的实际利用价值,但是数据挖掘技术对从业人员的要求也更高,需要具备良好的专业素养与工作能力,才能够使“数据挖掘技术”的作用发挥到最大化。
“数据挖掘技术”从其运行轨迹中能够看出,它在一定程度上主要指的就是将信息数据进行“有效转换”的技术,它的运行轨迹可以用“数据准备——数据挖掘——数据分析”来概括,在实际的运行过程中,数据挖掘技术能够有效地避免“人工失误”现象的出现,同时也为数据统计工作的开展提供了大量积极便利条件,它的功能众多,包括“预测数据模型”“类聚数据信息”“分类规划数据”等等,包含一系列先进的技术手段,由此可以推断出数据挖掘技术的实际特点:
(1)能够将相应的数据进行快速整理,提升以往工作效率;
(2)能够有效地找寻具有价值意义的数据信息,提升数据利用率;
(3)能够对具有价值意义的数据信息进行深度分析,发挥作用最大化;
(4)能够快速体现出最具“功能性”特点的信息,节省工作时间。
二、 在经济统计中采用数据挖掘技术具有哪些优越性
(一)具有较强的综合能力
就近些年我国社会的发展进程能够看出,想要促进经济水平的可持续提升,相关领域工作人员就要提升对于“数据统计”工作的重视,但是由于我国不同行业的经济发展水平不同,这意味着其对于数据统计工作的实际要求也各不相同。而从我国近些年举办的一系列社会经济活动中能够看出,各个行业都存在着不同类别的管理机构,这些管理机构与管理人员在针对行业发展现状制定相关未来战略决策的过程中,需要将经济统计数据结果作为参考建议。但是,不同行业的不同管理机构运用的实际管理手段和管理理念也各不相同,这意味着不同行业会对经济数据统计工作产生多元化的需要。
由此可见,以往的经济统计数据理念与方式已经无法满足现阶段我国社会多元化的需求。而数据挖掘技术的出现就能够有效地解决这些问题,它能够有效地将不同的数据统计信息根据其实际特点转化为不同的形式,这样就能够使得相关领域工作人员针对自身实际需要对相关数据信息进行录入统计,以此发挥数据挖掘技术的作用,最大化在节省工作时间的同时提升工作质量。由此可以看出,通过数据挖掘技术的有效运用,能够有效地提升使用者的综合效益。
(二)对数据进行实际统计的效果较强
随着近些年我国社会水平的不断提升,经济数据信息也逐渐呈现暴式发展态势,而数据挖掘技术的有效运用能够对这些实时数据进行深度挖掘,力求找寻其内部蕴含的价值最大化。在实际的数据信息分析过程中,一方面,对那些杂乱无章、没有价值意义的数据信息进行科学化、合理化的规避处理,这样就能够在一定程度上有效地提升我国数据信息管理工作的时效性。另一方面,它能够对现阶段存在的相关数据进行深层次加工,为数据信息的真实性、有效性提供基础保障。由此可见,通过数据挖掘技术的有效运用,能够在数据进行实时统计的过程中,凸显其实际效果,为经济发展决策提供重要的参考依据。
(三)数据挖掘技术的适用性较强
经济数据统计工作是现阶段我国战略发展的重要基础内容,它能够为我国一系列经济实践活动提供重要的服务作用。通过数据挖掘技术进行经济数据统计工作,能够有效地规避以往数据统计过程中存在的不足,还能够有效地根据不同领域的实际需要制定相关的数据统计战略。由此可见,数据挖掘技术在一定程度上具有整合性、综合性的特点,将其有效运用于经济数据统计工作过程中,就能够对现有的数据信息进行深度融合,这也在一定程度上体现出数据挖掘技术具有适用性、个性化特点。
相关数据报告调查结果显示,我国运用数据挖掘技术的时间较短,但随着科研人员的不断努力,其运用轨迹也逐渐呈现稳定化、趋势化发展状态。随着我国社会科学技术的不断进步,各项先进技术不断逐渐出现在大众视野,为各行各业提供了相应的积极便利条件,其中最具代表性的就是数据挖掘技术,它为我国经济统计、经济发展都提供了十分重要的基础保障。在当今时代背景下,大力发展数据挖掘技术,能够为我国经济统计工作提供更具高效性和实效性的便捷服务。就现阶段我国数据挖掘技术的运用现状能够看出,它主要通过综合性、通用性、面向性的相关工具,为我国社会各界发展经济提供对应的管理,同时对我国社会中相关的普通经济结构进行信息深度挖掘。由此可见,信息挖掘技术能够有效针对各行各业提供具有针对性特点的服务。
(四)为数据挖掘的应用提供了良好的电子平台
相关数据报告调查结果显示,我国相关经济统计仍然是应用统计信息系统。这会导致相关的经济统计数据信息处于分散状态,无法有效集中,无法有效地形成对应的管理系统,这也就在一定程度上为相关领域工作人员提供了很大的工作负荷。在实际工作过程中,相关领域工作人员就会受到多维化因素的影响,导致经济统计数据结果出现偏差,一旦出现问题,就会导致严重的经济后果。而数据挖掘技术的有效应用,能够通过建立宏观经济数据库的手段对以上问题进行有效整改,这样不仅能够在一定程度上保证相关数据信息的准确性和真实性,同时也能够有效地减缓相关领域工作人员的工作压力,使其能够在实际的工作过程避免失误现象的出现,这也是我国社会经济长效健康发展的必然要求,同时也是经济决策制定的重要基础数据保障。
三、数据挖掘技术在经济统计中的应用
(一)集成化处理方法应用
集成化处理方式在一定程度上指的就是对我国社会经济发展过程中存在的相关数据进行高效性、有效性的整合,将原有杂乱无章的数据信息内容变为综合性的整体。我国社会经济水平的不断提升,意味着收集到的数据尤其是经济信息数量逐渐增长,使得原有的数据获取渠道需要有效拓展,这就为集成化处理方式的应用造成阻碍。而实际上我国社会经济活动中数据来源渠道较为多样化,不同渠道的数据会根据其实际特点呈现出不同模式,这就有可能导致经济数据信息实体识别问题的出现。例如,相关领域工作人员在实际运用数据挖掘技术的过程中,要确定数据库中的“std-id” 和另一数据库中“std-no”二者的表示对象是否相同,通过对不同数据库的“含元数据”进行深度分析对比,就能够为我国“实体数据识别”的质量提供基础性保证。
(二)预处理方法应用
就现阶段我国经济数据信息特点可以看出,其经济原始数据在一定程度上都具有不完整性的特征,也就是数据不一致,这意味着对这些经济数据信息进行“预处理”势在必行。而“数据预处理”属于我国处理相关经济数据基础信息最常用的手段,由于数据挖掘技术具有“信息限制性”特点,无法代替“数据搜集”的一系列功能,因此就必须提升对于“数据预处理”的重视,同时也要对那些存在的“不真实性”数据信息进行有效处理,它在一定程度上指的就是对整体性经济数据信息进行深度分析,找寻其中蕴含着的一系列“不完整”数据。相关领域工作人员通常在进行这项工作时,都会选用“平均法”“预判法”或“统频法”,对不同类型与价值的数据信息内容进行有效选择,这也就意味着得到的统计分析数据结果更加具有准确性特点。
(三)转换方法应用
“数据转换方式”在一定程度上指的就是运用对应的手段,将经济数据信息内容轉换为满足经济数据挖掘要求的格式,经济领域工作人员在进行这项工作的过程中可以选用“数据规范”和“数据泛化”两种形式。“数据规范”可以将其理解为是“最大规范化”“最小规范化”以及“零均值规范化”的集合体;“数据泛化”指的是使用高层次的数据信息对低层次的数据予以替代,其中包含对数据采取连续性处理,但是由于当前的手段要实现数据的连续性非常困难,因此通常选择离散化,也就是对数据实施区间划分,将某些数据直接使用标号表示,尽可能减少数据的收集量,也被称为概念分层。
(四) 决策树方法应用
数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,也可以作预测。首先,通过训练集建立决策树,并用测试集进行模型测试,进而实施精简处理,随后输出模型;其次,通过构建完善的决策树进行数据分类,这一过程又被称为“递归”,从决策树的根部开始输入,到每个分支和叶节点,直到数据映射到限定属性。停止分割的条件一般有两种,一种是某一节点上的数据完全属于相同类别,而另一种则是当前节点中的记录数低于一个最小的阈值。在完成整个决策树的构建之后,要对决策树进行修剪,主要目的在于减少由于训练集的使用对测试数据输出的过度影响,例如训练样本中的错误数据会被决策树学习,但是对于测试数据的表现就没有想象的那么好,这就是所谓的过拟合问题。在数据集中,过拟合的决策树的错误率比经过简化的决策树的错误率要高。
(五)回归分析方法应用
“回归分析方法”在一定程度上指的就是对两种及两种以上的变量进行“依赖转变”,使其能够呈现“相互依赖”的定量关系。它能够根据现阶段经济发展的实际情况,构建不同变量之间的“回归方程”,主要是通过对不同数据因素的深度分析,明确“主变量”与“次变量”蕴含的实际关系,并通过科学化、合理化的手段进行有效测试,只有在误差最小的情况之下才能够将其作为经济发展态势的“预测模型”,这样就能够为我国相关经济发展预测工作提供坚实的数据信息基础。同时,相关领域工作人员在进行“数据挖掘”的过程中,也能够在进行经济市场占有率、经济发展额的分析过程中,运用回归分析法,这样就能够将不同经济数据变量通过“函数”的形式进行表达,进而有效地解决实际问题。
结语:
综上所述,将数据挖掘技术与我国经济统计工作相结合,无论是就保证我国经济统计工作质量方面而言,或是就提升我国经济统计工作水平方面而言,还是为我国社会经济长效健康发展提供积极便利条件方面而言,都具有十分重要的价值意义。因此,相关领域工作人员要提升对于“数据挖掘技术”的重视,积极采取科学化、合理化的工作手段,对以往的工作理念与工作方式进行创新优化,这是现阶段我国社会进步的必然需要。
(作者单位:青岛酒店管理职业技术学院)