会计大数据:内涵、框架及技术实现

2022-07-13 01:38程平教授博导常吉夏会副教授
商业会计 2022年12期
关键词:财务会计管理

程平 (教授/博导) 常吉 夏会 (副教授)

(重庆理工大学会计学院 重庆理工大学云会计大数据智能研究所 重庆 400054)

一、引言

以大数据、云计算、人工智能和机器人流程自动化为代表的新一代信息技术蓬勃发展与广泛应用,对会计领域的理论和实践产生了深刻的影响。大数据作为核心技术之一,它的运用使得财务会计工作的重点由原先的编制凭证、记账、结账、编制报表等转向数据的收集、存储、加工、传递和查询上,同时对会计信息的呈现、获取、使用方式和质量产生了较大的影响,促使财务会计向业财融合方向发展。在大数据时代,财务会计与管理会计的深度融合,本质上就是体现为业财融合,而业财融合的关键是要实现企业内部的财务数据、业务数据与外部多维数据的全面融合。大数据技术助推业财融合,帮助会计信息使用者能更好地掌握和理解数据,能够实时、精准地洞察和理解市场经济现象和规律。

多年来,大数据及相关技术在会计领域的应用一直是业界关注的重点。尹建芳等(2020)在阐述人工智能背景下会计转型发展三种观点的基础上,进一步对企业会计面临的机遇与挑战进行了分析,探索了财务会计与管理会计未来的发展趋势。丁胜红(2019)采用历史文献法梳理会计核算流程的演变规律,采用演绎与归纳法构建大数据会计核算理论体系,采用嫁接法重构大数据会计核算云端化流程。陈文军(2015)在探讨大数据、云计算在数据存储和处理方面对完善管理会计的职能所发挥作用的基础上,论述了在管理会计发展领域所产生的重要影响。刘凤委(2017)分析了大数据对管理会计各项职能的影响,并从会计行业发展角度提出了未来会计从业人员所面临的严峻挑战。吴勇等(2019)在梳理大数据和管理会计相关概念的基础上,立足于数据收集、数据预处理、数据分析和数据应用四个关键阶段,重构面向大数据分析全生命周期的管理会计应用系统功能架构,进而从需求驱动、供给推动以及外部环境影响三个方面,提出基于大数据分析的管理会计应用系统的实施思路和实现路径。

现有文献对大数据技术在财务会计、管理会计领域的应用从挑战、职能影响、流程重构以及功能框架等方面进行了多维度的探索,对丰富大数据技术与会计结合的研究做出了非常积极的贡献,然而这些研究对会计大数据的内涵和具体的技术实现还缺乏清晰、深入、系统的研究。有鉴于此,本文从会计大数据的内涵、内容框架和技术实现三方面尝试为会计大数据建立比较系统的理论和方法体系提供参考。

二、会计大数据的内涵

会计大数据,目前业界还没有统一的概念界定。本文基于对会计数据和会计信息的理解,结合大数据技术的内涵和特征对会计大数据进行定义。会计大数据是建立在互联网和云计算基础之上,面向会计核算、会计管理和会计决策应用场景,对企业内外部产生的大规模、多样化的会计数据进行采集、存储、处理、计算与分析的一系列数据处理技术。简单的说,会计大数据就是大数据及相关技术在财务会计体系、管理会计体系中的应用,它是以传统会计体系为核心,并在原来的基础上增加了一个技术处理手段,并未使传统会计体系发生根本变化。

会计大数据的概念中所指的会计数据不只包含传统财务会计下的会计数据,还包括来自企业业务信息系统的结构化数据,以及外部或者互联网上的半结构化数据(如网页)和非结构化数据(如图像、文本等)。会计大数据除了能够完成财务会计的会计核算和会计监督职能,还能够通过业财数据融合和大数据挖掘技术,完成管理会计的预测、决策、规划、控制和评价职能。

三、会计大数据的内容框架

会计大数据是大数据及相关技术在财务会计体系、管理会计体系中的具体应用,可以从会计的职能层面对会计大数据的内容进行诠释,其框架如图1所示。

图1 会计大数据的内容框架

(一)财务会计大数据

财务会计是现代企业的一项重要的基础性工作,它通过一系列会计程序提供决策有用的信息,并积极参与经营管理决策,提高企业经济效益,服务于市场经济的健康有序发展。财务会计大数据是大数据及相关技术在财务会计中的应用,具体体现为大数据及相关技术在会计核算和监督职能中的具体实现。

1.核算。核算职能是对以货币计量的经济活动进行确认、计量、记录和报告。传统信息化模式下的会计核算工作,财务人员基本被定位在收集单据、定制凭证、复核、结账、报告、归档等工作的软件操作,其处理的数据主要是结构化类型的会计数据。而在财务会计大数据下,财务人员所面对的不只是会计数据和原始单据,而更多的是海量的业务数据,这些数据的类型包括结构化数据、半结构化数据和非结构化数据,并且更多的是非结构化数据。财务人员需要收集和分析会计数据和业务数据,并将有用的数据放置在合理的资源中,通过高效的核算流程输出有价值的会计信息。财务会计大数据下,大数据采集、存储、处理和计算使得会计核算更为精细。例如,企业在进行成本核算时,不管采用什么方法,重点都是要确定成本定额的大小。在财务会计大数据下,企业通过采集、存储海量数据,来分析同行业企业的成本定额标准,从而根据企业的财务状况,制定一个更加合理的成本定额标准。所以,财务会计大数据能够让企业的会计成本核算更加精细化,为企业节约成本。财务会计大数据下,大数据的传播、处理和计算的速度提升了会计核算的及时性。例如,企业在发出或者购进货物时,只需要将购进或者发出货物的单价和数量输入系统内就可以将这些数据立即传输给会计核算人员,马上进行会计处理和分析,这有利于相关管理和决策者在最佳时间点做出选择。财务会计大数据下,大数据使财务会计报告更加及时。大数据技术将推动财务报告从定期报告向实时报告转化,大数据的特点就是数据的处理速度非常快,实时报告是大数据技术与会计的完美结合,极大地促进了财务会计报告的及时性,使投资者等财务报告使用者能随时了解企业的财务状况和未来的发展趋势。

2.监督。监督职能是会计人员在进行会计核算的同时,对特定主体经济业务的真实性、合法性和合理性进行的审查。在大数据背景下,审查的对象由凭证、账簿等转变为多种类型的会计数据。在财务会计大数据下,会计监督工作迫切需要利用大数据技术对自身加以优化完善,而这主要体现在会计数据的大量化、多样化、高效化这三个方面,通过打通财务部门与采购部门、生产部门、销售部门之间的数据信息壁垒,推动会计监督数据的融合与共享,实现对会计数据的全天候、不间断的主动式监督。在财务会计大数据下,大数据技术应用于会计信息归集、处理、分析,通过对各个流程数据的汇总与对比,借助非结构化数据的提取利用,可以加强会计内部监督的职能,为不同的使用者提供高质量的会计信息。当前,基于大数据背景下的会计职能早已从反映过去向着预测未来转变,财务报告也从事后报告向着实时报告加以转型。所以,结合大数据技术与大数据思维,为会计监督工作构建一个行之有效的防范机制,对可能存在的风险问题加以防控,是加强事前、事中监督的关键。

需要注意的是,在财务会计大数据下,由于非结构化数据的比例增加,会计信息结构日益复杂,会计监督工作中传统的统一的信息判断标准开始失效,因此,需要对会计信息的质量标准提出新的观察维度,会计监督工作需要在信息的数量与精确性之间找到有效平衡。

(二)管理会计大数据

管理会计是面向企业内部的会计,是从数据到决策的一个过程。对于管理会计,大数据的理念和技术为企业管理层合理配置资源和优化决策并对当前和未来的经济活动进行预测、决策、规划、控制和考核评价提供了更多可能。从某种程度上来说,大数据是预测分析、决策分析、成本控制等管理会计职能得以良好运用的基础。此外,大数据还可以突破当前管理会计工作的限制,实现高效的信息管理与存储,深入挖掘相关数据的价值,以此提高管理会计在实际工作中的效率。管理会计大数据是大数据及相关技术在管理会计中的应用,具体体现为大数据及其相关技术,尤其是分类、聚类、关联、预测等数据挖掘算法在会计预测、决策、规划、控制、考核评价职能中的具体实现。在数据挖掘算法中,常见的分类算法有C4.5、简单贝叶斯法、SVM、KNN、AdaBoost、CART 等算法,聚类算法有 K-Means、EM等,关联算法有Aprior、FP-G、FreeSpan及prefixspan等算法,预测算法有人工神经网络、时间序列预测等算法。

1.预测。预测是管理会计的一个重要职能,它是对历史数据用一定的统计方法进行销售预测、成本预测、利润预测等,比较常用的预测方法有因果预测和回归分析。传统的预测方法都有一个共同的缺陷,就是为了节约成本要对数据进行简单处理,这使得预测结果的准确性受到影响。而在管理大数据下,通过数据挖掘技术,利用趋势分析、时间序列分析等方法,将数据进行整理、存储、分析、挖掘,将有助于更好地预测销售、成本、资金等信息,进而提高预测的准确度,比如对市场调研的数据分析可以帮助企业建立更加科学规范的销售预测体系。

2.决策。现代管理会计的主要职责之一是为决策部门提供决策支持。企业的经营决策主要包括战略目标决策、短期经营决策、长期经营决策等,这些决策的产生都需要大数据分析的支持,而这正是需要管理会计大数据的地方。在管理会计大数据下,通过积累的大量历史数据和利用统计学、机器学习、数据挖掘等技术,能够让依赖于个人经验的决策让位于理性的数据决策。例如,贷款不是靠信贷员的主观判断而是由模型预测结果来决定是否给予贷款、利率应该是多少;零售店不是靠管理人员判断采购哪些产品及采购数量,而是依赖于模型数据分析的结果给出判断依据;定价决策可能不单纯依赖成本,而是结合客户特征、偏好与以往购买行为,甚至能够针对每一个客户给出不同的定价。在管理会计大数据下,决策方式的转变使得企业更智能化,并且由于企业掌握数据的独特性,能够构建基于自身的核心竞争力,无法被其他企业简单模仿,也不用担心具有丰富经验的员工离职给企业带来严重的损失。

3.规划。规划是企业选择和制定正确战略的基础,是对未来整体性、长期性、基本性问题的思考和考量,是通过编制各种计划和预算实现的。它要求在最终决策方案的基础上,将事先确定的有关经济目标分解落实到有关预算中去,从而合理有效地组织协调企业供、产、销及人、财、物之间的关系,并为控制和责任考核创造条件。管理会计以面向未来为基点,以决策为主体,帮助企业管理者对未来进行战略规划,为决策提供最优信息,为企业的预算提供决策依据。非财务信息是企业进行战略规划的基础,宏观环境、行业竞争度、价值链等非财务信息有助于企业选择正确的战略行动,而管理会计大数据的应用将有力提升企业在规划方面的能力。在应用过程中,利用大数据技术,如网络搜寻、关键词获取等,全面掌握行业环境、价值链等各类关键信息,可以辅助企业进行战略决策;此外,大量运营的非财务数据有助于提升企业投资规划能力,如利用水质监测积累的大数据来提高污水处理企业投资收益分析能力等。

4.控制。控制职能就是将经济活动的事前控制和事中控制有机地结合起来,通过事前确定科学可行的各种标准,根据执行过程中实际与计划发生的偏差进行原因分析,并及时采取措施加以调整、改进,确保经济活动的正常进行。管理会计中的流程管理和内部控制等,将极大地加强企业对运营的控制,从而保证运营效率。控制的关键在于事先确定的标准,而明确标准的基础在于对企业研发、采购、生产、营销等各环节关键信息的掌握,尤其是非财务信息数据的积累、分析与应用,是最大限度地改进控制能力、提高企业整体运营效率的关键。大数据时代强调对企业日常经营管理活动进行全面记录与分析,这将对控制效率的提升具有决定性作用。管理会计大数据下的控制职能可以采用指标体系,将数据量化后建模达到计算指标的目的,进行偏差的查找,还可发挥监测的作用。但是偏差的前提是有一个衡量标准,大数据的数据计算能力能够满足这一前提。大数据能够完善目前管理会计工具的应用,比如用作业成本法来核算成本时,利用互联网收集基于作业层面的数据,从而使得直接费用更真实,间接费用也容易找到分配的因子,更好地实现成本控制的目标。大数据还能够系统地管理成本,传统成本控制和管理所需的信息来自于企业内部,但在管理会计大数据下,企业可以将外部信息收集起来与内部信息结合,以达到全面、系统地控制成本。

在利用非财务信息进行控制方面,成本控制的关键则取决于各项成本信息的细化与分析,从而形成控制的基本标准。没有对日常大量关键非财务信息的存储与分析,要想实现精确的控制异常艰难。以非财务信息为基础的控制将更具及时性,能够让企业更快速地采取措施、纠正错误。

5.考核评价。管理会计履行“考核评价经营业绩”的职能,是通过建立责任会计制度来实现的,即在各部门各单位及每个人均明确各自责任的前提下,逐级考核责任指标的执行情况,找出成绩和不足,从而为奖惩制度的实施和未来工作提供必要的依据。作为管理会计,其评价对象不是企业,而是组织内部的个人、分支机构或业务条线;其评价标准不一定是财务信息,而是有赖于大量非财务信息或经调整后的财务信息,以此来规避财务信息评价的缺陷。目前,大量企业管理控制与评价的标准都来自于数据管理。企业管理中经常通过数据来查看、评价员工的工作动态及绩效考核,绩效评价一直以来都是管理会计工作的一大难题,其难点之一在于实际评价时难以收集到所有与绩效有关的信息,不管用什么样的评价方法都不能完全客观、准确地评价绩效高低。一方面,为了提高员工绩效考核的科学性和合理性,管理会计有必要通过对大数据的收集、整理和分析,遵循先进且公平的考核和奖惩制度,当员工的积极性受到极大鼓舞,这种激情将快速地反馈至企业,促使企业实现强劲的发展。另一方面,在评价客户信用方面,利用管理会计大数据可以准确评价客户信用,预测企业风险。客户能否按期支付所欠货款,决定了企业需要承担坏账风险的大小。通过建立管理会计大数据平台,构建多维数据库,从不同渠道获得客户不同维度的数据,可以将事后分析转为事先引导。针对责任成本制的企业,成本中心、利润中心和投资中心都需要利用大数据仓库的数据,通过数据挖掘技术进行责任预算的编制以及实际中心数据和相关市场数据的确定,并且通过实际数据和预算数据的对比分析,对各中心的绩效做出评价与考核。在管理会计大数据下,对评价职能的彻底改变还在于以往的评价角度更强调基于效率与效益的内部评价,由于拥有大量客户评价反馈信息作为评价基准,并且是从客户价值角度出发给出的直接评价,将进一步完善与拓展现有管理会计业绩评价工具,提升管理会计工具应用水平。

四、会计大数据的技术实现

会计大数据是一套完整的“场景+需求+数据+技术”的解决方案,其本质是运用大数据采集、预处理、存储与管理、计算、分析与挖掘、可视化一系列关键技术来服务财务会计体系和管理会计体系的应用场景。

(一)大数据采集

大数据采集通过RFID射频数据、传感器数据、社交网络数据、移动互联网数据等方式获得结构化、半结构化、非结构化等多种类型的海量数据。大数据采集从数据源上可以分为四类:Web数据(包括网页、视频、音频、动画、图片等)、日志数据、数据库数据、其他数据(感知设备数据等)。互联网上会产生大量的日志、网页、音频、视频等Web数据,价值密度较低,收集难度大。数据库数据主要源自会计信息系统和业务信息系统,其中,会计信息系统包含了大量的以财务会计为主的结构化数据、价值密度高,收集难度较小,而业务信息系统包含了大量的结构化和非结构化的管理会计大数据。感知设备上的数据包括大量音频、视频和图片数据,价值密度较低,收集难度大,可以从数据服务提供商处直接获取,这些数据属于管理会计大数据范畴。

传统的数据采集来源单一,且存储、管理和分析数据量也相对较小,大多采用关系型数据库和并行数据仓库即可处理。大数据采集技术面临着诸多挑战:一方面数据源的种类多,数据的类型繁杂,数据量大,并且产生的速度快;另一方面需要保证数据采集的可靠性和高效性,同时还要避免数据重复。

和传统的数据采集技术相比,大数据采集技术有两个特点:(1)大数据采集通常采用分布式架构。大数据采集的数据流量大,数据集记录条数多,传统的单机采集方式,在性能和存储空间上都无法满足需求。(2)多种采集技术混合使用。大数据采集不像普通数据采集那样单一,往往是多种数据源同时采集,而不同的数据源对应的采集技术通常不一样,很难有一种平台或技术能够统一采集所有的数据源,因此大数据采集时,往往是多种技术混合使用,要求更高。传统企业会使用传统的关系型数据库 MySQL 和 Oracle 等来存储数据,随着大数据时代的到来,Redis、MongoDB 和HBase 等 NoSQL 数据库也常用于数据的存储。企业通过在采集端部署大量数据库,并在这些数据库之间进行负载均衡和分片,来完成大数据采集工作。此外,会计大数据采集还包括感知设备数据采集,它是指通过传感器、摄像头和其他智能终端自动采集信号、图片或录像来获取数据。大数据智能感知系统需要实现对结构化、半结构化、非结构化的海量会计大数据的智能化识别、定位、跟踪、接入、传输、信号转换、监控、初步处理和管理等,其关键技术包括针对会计大数据源的智能识别、感知、适配、传输、接入等。

(二)大数据预处理

大数据预处理是指针对财务会计大数据和管理会计大数据实施的数据清洗、数据集成、数据变换、数据规约等一系列数据操作,达到审核、筛选、排序等目的,它区别于大数据分析阶段的数据处理。当采集到的数据量较小时,只需要简单的数据处理就可以得到有效的数据,但是大数据复杂的特点意味着在获取数据时,得到的部分数据是脏数据,也就是说,源系统中的数据不在给定的范围内或对于实际的会计业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的会计业务逻辑等。由于脏数据无法进行数分析和挖掘,所以需要对大数据进行预处理。

数据清洗是保证数据质量的重要手段之一。并不是所有采集到的数据都是有价值的,有些数据可能与分析和挖掘需求无关,有些甚至是完全错误的干扰项。因此要对数据过滤、去噪,从而提取出有效的数据。数据清洗包括对缺失值、噪音数据和不一致数据的处理。对于缺失值,可用全局常量、属性均值、可能值填充或者直接忽略该数据等方法处理。对于噪音数据,即数据中存在着错误、或偏离期望值的数据,可用分箱(对原始数据进行分组,然后对每一组内的数据进行平滑处理)、聚类、计算机人工检查和回归等方法去除噪音。对于不一致的数据,可以进行手动更正。数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机的集中,从而为企业提供全面的数据共享。

在这个过程中需要重点解决模式匹配、数据冗余、数据值冲突检测与处理三个问题。数据变换是指对数据进行规范化处理,从一种表示形式变换为另一种表现形式的过程,以达到适用于大数据分析和挖掘的目的,它包括平滑、聚集、离散化、规范化、属性构造和概念分层方式。数据规约是指在尽可能保持数据原貌的前提下,最大限度地精简数据量,包括维规约、数量规约和数据压缩三个方面。

(三)大数据存储与管理

大数据存储与管理是对海量的财务会计大数据和管理会计大数据进行归档、整理和共享的过程。在大数据下,由于从不同渠道获得的数据通常缺乏一致性,数据结构混杂,且数据不断增长,更何况任何计算机都会有内存容量、硬盘容量、处理器速度等物理上的限制,因此,对于那些希望从比存储和使用成本更高的会计数据中获得价值的企业和组织来讲,有效的会计大数据存储和管理变得比以往任何时候都更加重要。比如,对单机系统来说,即使及时不断提升硬件配置也很难跟上数据规模增长的速度,也需要在硬件限制和性能之间做出取舍。大数据存储与管理技术需要重点解决会计大数据的可存储、可表示、可处理、可靠性及有效传输等关键问题,具体包括海量文件的存储与管理,海量小文件的传输、索引和管理,海量大文件的分块与存储,系统可扩展性与可靠性方面的内容。大数据存储与管理技术对整个会计大数据系统至关重要,其好坏直接影响到整个会计大数据系统的性能表现。大数据存储技术的核心是Hadoop的分布式文件系统HDFS(Hadoop Distributed File System)和分布式实时列式存储数据库管理系统 HBase(Hadoop Database)等。

大数据存储和管理并不只是被定义为接收、存储、组织和维护创建的财务会计大数据和管理会计数据,它还意味着包括更多的内容:对数据进行分类;聚合、收集和解析数据的元数据;保护数据和元数据不受自然和人为中断的影响;在内部部署和地理上移动数据,以进行共享、归档、复制、数据保护、存储系统技术更新和迁移,并访问所需的分析引擎,从而对该数据进行更深入的研究;在进行一次或多次移动后,保持用户和应用程序对数据的透明访问;提供用户可定义的策略,这些策略可自动移动、复制和删除数据;部署人工智能和机器学习以优化和自动化大多数数据管理功能;搜索数据并提供可行的信息和见解;使数据符合个人识别信息法律和法规;将数据管理扩展到数百PB甚至EB级别。

(四)大数据计算

大数据计算包括分布式离线计算框架MapReduce、分布式内存计算框架Spark、流式实时计算框架Storm等技术。在会计大数据的实际应用中,应该根据具体的业务需求选择对应的解决方案。比如对于离线、非实时、静态数据的处理,可以选用批处理方案;对于在线、实时、动态的数据处理或者低延迟的场景,则可以选用流处理方案。

MapReduce作为典型的离线计算框架,其思想来自于Google公司2004年发表的论文,用于在集群环境下处理海量的、结构复杂的数据文件。MapReduce通过对输入的数据集进行切分,形成若干独立的数据块,由Map任务对各个数据块进行处理,得到处理的中间结果;对结果进行Shuffle操作,实现对结果的排序,并在此基础上对结果进行Reduce操作,实现对数据的汇总。事实上,MapReduce是一个基于集群的高性能并行计算平台,采用“分而治之”的思想把对大规模数据集的操作,分发给一个主节点管理下的各分界点共同完成,然后通过整合各个节点的中间结果得到最终结果。

Spark是一种与Hadoop相似的开源集群环境,专为大规模数据处理而设计的快速通用的计算引擎,利用主控节点、工作节点和协调节点实现集群的状态维护和配置管理。Spark不同于MapReduce的是,其Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计、推荐系统、预警系统、金融系统(高频交易、股票)等,大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域关注的重点,而Storm更是流计算技术中的主流技术之一。Storm为用户提供了丰富的服务和编程接口,大大提高了用户管理的效率,降低了学习和开发的门槛。此外,Storm提供了可靠性保障,不仅提供对分布式的组件级的容错,而且提供不丢失数据的记录及容错保证,这为实时分析、在线学习和挖掘等提供了开放、强大的解决方案。

(五)大数据分析与挖掘

大数据分析和挖掘都是从财务会计和管理会计数据中提取一些有价值的信息,会计大数据分析更多在于利用工具和专业知识分析数据。

大数据分析是将采集到的大量财务大数据和管理会计大数据通过汇总、理解并消化,旨在发现数据的价值。最初的数据分析来源于统计学家和经济学家的一些理论,进而结合一定的实际应用场景解决问题,更多的是偏重于业务层次的。常见的大数据分析编程工具包括SAS、R、SPSS等。大数据分析常用的手段是基于数据仓库的OLAP联机分析处理。在会计大数据环境下,以特定主题为导向,数据仓库将各个业务系统中与分析有关的数据通过ETL操作整理在一起,实现对目标数据的管理和维护。在此基础上,利用OLAP分析工具对数据进行切块、切片、旋转、上钻、下取等操作,有利于从不同维度、不同粒度对数据进行观察理解,提取和总结有价值的知识。在会计大数据的实际应用环境中,数据仓库和OLAP通常采用Hive工具实现对用户的动态多维分析,包括跨维计算和建模等。这里的Hive是基于Hadoop的一个数据仓库工具,主要用来进行数据提取、转化、加载,它是一种可以存储、查询和分析存储Hadoop中的大规模数据的机制。在进行会计大数据分析之前,需要从业务和财务的角度,对数据分析的维度数据进行规划和定义。

大数据挖掘是从海量的财务会计和管理会计数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的技术。通常利用统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等技术实现。常用的大数据挖掘工具包括Rapid Miner、Orange、Weka、Knime、Apache Mahout、SSDT(SQL Server数据工具)、Sisense、IBM SPSS Modeler、Oracle数据挖掘等。其中Rapid Miner、Orange、Weka、Knime、Apache Mahout 等均是开源工具,侧重于对数据的挖掘分析和可视化操作,而Apache Mahout是基于Hadoop的一个机器学习库,主要关注分类、聚类和协同过滤问题,用于从海量数据中找到人们未知的、可能有用的、隐藏的规则。常用的会计大数据挖掘方法主要有分类、回归分析、聚类、关联规则等,它们分别从不同的角度对数据进行挖掘。

(六)大数据可视化

大数据可视化是将财务会计大数据和管理会计大数据以不同的视觉表现形式呈现出来,包括相应信息单位的各种属性和变量,通过表达、建模,以及对立体、表面、属性、动画的显示,对数据加以可视化解释,清晰有效地传达与沟通信息。大数据可视化的基本思想是将存储财务会计和管理会计大数据的数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。图表、动态图的形式可将数据更加直观地展现给用户,从而减少用户的阅读和思考时间,以便更好地做出决策。在企业的年度汇报或者分析中,销售部门、采购部门或生产部门等可以通过大数据可视化将年度内销售、采购、生产商品的数量、成本、单价等有效展示出来,通过高效的方式刻画和呈现数据反映的本质问题,丰富视觉效果,以直观、生动、易理解的方式呈现给管理层以做出战略决策与调整。

传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。随着大数据时代的来临,已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据进行抽取、归纳及简单的展现。新型的会计大数据可视化必须能够满足大数据需求,必须快速收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。会计大数据可视化工具种类繁多,其中零编程工具包括Tableau、Microsoft Power BI等。

五、结束语

大数据技术与会计结合的概念众多,内涵差异较大,学术界还缺乏统一的共识。基于此,本文针对大数据及相关技术在会计领域的应用,定义了会计大数据的概念,提出了会计大数据的内容框架,并从大数据的采集、预处理、存储和管理、计算、分析与挖掘、可视化方面对会计大数据的技术实现进行了深入阐述。本文的研究可以为会计大数据的理论和方法体系建设奠定初步基础,能够为会计大数据的相关研究和具体应用提供参考和借鉴。

猜你喜欢
财务会计管理
中级财务会计课程混合式项目化教学模式探讨
枣前期管理再好,后期管不好,前功尽弃
职业院校财务会计网络化建设
新形势下企业管理会计与财务会计的融合发展
管理漫画
财务会计理论的发展趋势研究
浅析财务会计的内部控制
采用C—NCAP 2006年版管理规则
营销管理
“这下管理创新了!等7则