路伟果 刘光军 彭韶兵
【摘要】以新时代信息技术的影响为研究背景,系统分析数据挖掘技术对会计的影响。这些影响包括:会计人员和会计部门角色发生根本变化;会计确认的要素范围扩大到数据资产和数据资本,并且更多地采用多维数据;数据解释更多地采用可视化技术,且用户将成为信息参与者;企业及会计人员将面临更大的信息安全风险。同时有针对性地提出如下策略:会计人员需要转型为数据分析师和算法工程师;会计人员必须重视数字经济蕴含的价值及其重要地位,企业也要着力培养会计人员的数字素养;会计人员要融入企业全面可视化管理;企业及会计人员应积极参与构建信息安全防护体系和标准规则体系。
【关键词】数字经济;数据挖掘;财务会计;可视化技术
【中图分类号】 F235 【文献标识码】A 【文章编号】1004-0994(2020)07-0068-7
一、引言
数据挖掘(Data Mining)一般是指通过数理分析方法和算法从大数据中搜索、挖掘出隐藏于其中的信息,建立和验证模型,以提供决策支持信息的一种过程。它是大数据技术的一种应用和发展,也是一种决策支持过程。将其应用到会计领域,有助于会计人员对大容量、多种类、实时性很强的数据进行有效的分析、处理和利用,为企业各层级的管理者或决策者提供有价值的信息。 财政部于2016年10月发布了《会计改革与发展“十三五”规划纲要》(财会[2016]19号),指出加强会计信息化建设,是“十三五”时期我国会计改革与发展的九项主要任务之一。而会计信息化建设离不开数据挖掘等相关信息技术的应用。应用数据挖掘技术,有助于推进我国会计改革,贯彻《会计法》《企业会计信息化工作规范》等法律法规。
数据挖掘技术是目前影响会计发展的十大信息技术之一。2019年6月29日,由上海国家会计学院主办的“信息技术与财务的未来”高峰论坛暨2019年度影响中国会计人员的十大信息技术评选结果揭晓。这十项信息技术和其支持比率分别是财务云(72.1%)、电子发票(69.5%)、移动支付(50.7%)、数据挖掘(46.9%)、数字签名(44.5%)、电子档案(43.1%)、在线审计(41.4%)、区块链发票(41.1%)、移动互联网(39.6%)和财务专家系统(37.7%)。该项评选结果主要是从微观视角揭示新时代对财务会计产生影响的主要信息技术,包括对财务会计、管理会计、审计等相关专业和职业的影响。在评选过程中,每年的热点均有所不同,这也说明新时代信息技术更新速度比较快,呈现出动态特点。
以上十项信息技术中,从数字经济生态体系来看,财务云和移动互联网属于生态圈里的技术支撑体系,其他则属于应用服务体系。从传统会计核算流程视角来看,电子发票、区块链发票和数字签名主要用于原始单据的取得、财务流程中的审核或内部控制;移动支付和移动互联网代表的是支付手段;电子档案属于会计档案保管范畴;在线审计和财务专家系统属于财务信息质量控制范畴;数据挖掘和财务云是财务会计参与管理的进一步发挥,有助于促进财务会计转型管理会计,并促使会计人员转型为数据分析师或算法工程师、会计部门(含财务中心,下同)转型数据分析部门。
数据挖掘技术也是当前财务职能理论研究中的热点之一。张超等[1] 研究发现,在与财务智能密切相关的关键词中,研究数据挖掘方面的中文文献有19篇,占绝对首位,远高于第二位以“财务分析”为关键词的研究数量。他们的研究结论进一步揭示了数据挖掘在信息技术中的重要地位,以及数据挖掘与财务智能之间的密切联系。
综上可知,数据挖掘技术是我国会计信息化建设的主要内容之一,也是当前影响会计发展的十大信息技术之一,更是当前财务职能研究的主要热点之一。相对于其他信息技术而言,数据挖掘技术对于会计人员仍然较为陌生,因此本文以数据挖掘为研究对象,分析其对会计产生的影响并探讨企业、会计部门和会计人员该如何迎接数据挖掘技术带来的挑战,以期为会计学术研究、会计实务、会计教学等提供一定的参考。
二、数据挖掘技术对会计的影响
(一)会计人员和会计部门的角色定位将发生根本变化
当前,会计在企业中的职能定位仍然侧重于核算,监督、参与管理、理财等职能并没有充分地体现出来。数字经济时代下,传统会计核算职能由智能机器人和自动化办公软件等替代,使得会计人员从核算职能中解放;数据挖掘技术的应用要求企业会计人员不仅需要熟练掌握会计核算,还需要精通理财、管理、数据分析、算法与设计,根据数据挖掘的结论做出有效评价,提供决策支持信息,逐渐转型为理财师、管理会计师、数据分析师和算法工程师(主要是数据挖掘算法工程师和机器学习算法工程师)等。
与此同时,会计部门也随会计人员职能和角色的变化而逐渐成为大数据处理部门;数据分析和解释数据的能力,将成为会计人员的必备技能,否则数据挖掘的结果难以支持决策。随之,会计学科向边缘学科转化的速度不断加快,与信息技术等学科交叉融合是会计学科和专业建设的必经之路,数学和数量统计成为会计专业教育的根基之一。会计工作内容,将由主要处理常规经济业务(一般信息生成),转变为主要处理复杂经济业务(特殊信息生成)、数据分析(信息利用)和算法设计。具体的,会计人员和会计部门的职能变化如表1所示。
国内外个别高校已经试点开设了会计学(大数据分析方向或商业与财务分析)专业硕士点,鼓励学生跨学科、跨专业学习,培养既精通會计专业知识,又能掌握信息技术、数据分析和算法设计等技能的综合人才;一些软件公司研发并推出了财务云或云会计等新产品。这些都是顺应会计发展和角色定位变化的现实要求,是会计转型的标志之一。
(二)确认的要素范围将扩展到数据资产和数据资本,也将更多地采用多维数据
1. 数字经济时代会计确认的要素范围将发生重大变化。工业经济时代,会计确认与计量的资产和资本,主要包括有形资产和无形资产,如存货、固定资产、长期股权投资、无形资产,以及实物资本、金融资本和产权资本(以知识产权作为资本投入)等。而在数字经济时代,随着数据资源与土地、劳动力和资本一样成为生产要素,会计确认与计量的资产和资本范围将进一步扩大。即在数字经济时代,数据的价值演变过程表现为“数据资源→数据资产→数据资本”[2] ,具体如表2所示。
数据资产和数据资本均具备资产、资本的一般特征。数据挖掘的对象包括数字产品和大数据,在数字经济时代,大数据逐渐成为数据资产。它与有形资产、无形资产一样满足资产确认的定义,也具有资产的一般特征。如网络视频公司的可视化产品,其是由过去的交易和事项形成的,是由企业拥有或控制的,预期能给企业带来经济利益的一种资源,满足资产的定义和一般特征。数据资本与实物资本、金融资本一样,能够给企业创造价值,将数据资产的使用价值或价值作为资本投入,就是通过数据流动或交易将数据资产变成数据资本的过程。
因此,学术界和实务界已经将对数字资产的相关研究提上日程,以便进一步修订《企业会计准则》,用以规范和指导会计实务;反过来,真实可靠的数据资产、数据资本的确认和计量又能促进数字经济的发展。企业掌握的数据规模、数据挖掘能力构成企业的核心竞争力和战略性资源,尤其是对于一些关键行业和以数字产品为主的电子商务企业。
2. 会计传统的单维数据模式将转向多维数据重构及多维数据分析。
(1)获取、传递、处理多维数据将逐渐成为会计的主要工作之一。传统的会计人员因数据的取得成本较低和惯性思维,易囿于单维数据陷阱。即使部分企业成功实现了财务会计转型管理会计,但会计师获取的绝大部分数据依然是单维财务数据[3] 。传统核算型主导下,会计人员记录、传递、处理、分析、存储和利用的单维数据主要是金额数据,较少涉及时间点、间隔期、地区、渠道、货物摆放位置、商品关联度、用户分类等多维文本数据。传统数据的表现方式主要是单维财务数据——金额,基本不包括文本、邮件、电话记录、聊天记录、照片或截图、音频、视频、博客、推特、微信等形式或载体,而这些非结构数据或信息,需要利用文本分析功能进行处理后形成二次分析,与直接获取财务数据的成本相比,信息处理成本相对较高。
这些多维数据都是经济资源,蕴含重要的价值、使用价值及交换价值,很可能产生溢出效应。如采取自定义数据抓取程序(网络爬虫技术),通过人工模拟搜索引擎功能来操作浏览器,利用网络空间自动获取各种数据信息,直至满足抓取程序所设定的停止要求;该抓取程序可获取的信息量大,但也可能充斥很多垃圾和噪声,准确度较低。
(2)对多维数据的分析、存储和利用,也将成为会计的工作内容。最典型的比如电商针对消费者在线评论的文本情感进行分析,研究消费者行为和消费倾向[4] ;针对消费者复购行为的数据分析,以进一步研究激发消费者复购行为的时机和购买欲;从外部截取消费者碎片式信息,了解消费者或购买商的信用状态,分析信用风险,以便设计和实施合理的赊销政策或欠款催收策略。个别高校在会计学专业人才培养方案中增设大数据分析相关课程,也是调整、适应学科建设和会计实务的需要。
(三)会计人员的数据分析及展示方式将更多采取可视化技术
对于数据挖掘,其展示或输出方式不再是单一的财务报表或文本格式,而是由平面转向可视化技术[5] 。该技术率先在科学与工程计算等领域中使用,通过将数据分析及数据解释的结果以可视化的方式展示,增强了数据解释的吸引力和便捷性,用户更易理解和接受。常见的可视化技术有标签云、信息流空间等,如标签云以典型的超链接方式为使用者提供详细的内容展示,信息流分析中则引入空间维度。一般财务数据的输出形式大多是静态信息图表,很少采用单向动态和双向动态互动模式。而设计清晰、直观、富有美感、双向动态模式的可视化产品,可以直接吸引会计信息使用者,提高财务数据解释的使用效率。但目前大多数数据挖掘应用平台还难以提供高效、清晰的可视化产品。
与此同时,会计信息使用者可以根据自身需要,直接参与数据分析过程、设计“输出产品”的表现形式,甚至可以溯源、追索数据分析的整个过程,深化和理解分析结果。最终,会计信息使用者演变为参与者、发布者(供给者)或传播者,由单向信息传递的被动接受者变成双向信息互通的主动参与者,增强了财务数据解释的互动性、灵活性。
因此,使用数据挖掘技术可以使会计人员通过自定义选项、参与构建极具特色的财务报表,会计信息使用者也可以参与设计或选择自己喜欢、便于理解的图形类型或视频产品,形成双向互动模式。
(四)企业及会计人员面临着更大的信息安全风险
数字经济时代,企业和个人的信息被挖掘成为必然。如企业在应用数据挖掘技术分析消费者行为时,获取或掌握有大量消费者的个人信息,如个人照片、截图、聊天记录、邮箱邮件、微信号、支付宝账号、电话号码及通话记录、文档、购买频率、购买商品种类和数量、微博、博客、推特、脸书等个人隐私数据,很容易导致大量的信息外露[6] 。数据泄露的渠道很多,包括内部人员泄露、系统漏洞、黑客攻击、网络爬虫、数据黑色产业链等。数据泄露的后果主要表现为电话推销、骚扰短信、电信诈骗、垃圾邮件、广告弹窗、精准营销等,给企业和个人带来财产安全隐患和直接经济损失。一旦相关信息泄漏,可能使得企业和数据分析师面临诉讼风险,需要承担相应的民事赔偿等法律责任。
针对数字经济时代数据挖掘技术对会计产生的不利影响,企业、会计人员及会计学科建设和专业教育的单位或部门,都必须实时调整应对策略,以适应新时代下会计的根本性变革。
三、会计人员应对数据挖掘技术的策略
(一)会计人员需逐步转型为数据分析师或算法工程師
会计的传统职能侧重于会计核算和日常监督,而在数字经济时代,对常规业务的处理将由智能机器人等代替,会计人员必须从传统“桎梏”中解脱出来,及时转型成为必然。
1. 会计人员需要更新思想观念,紧跟会计工作内容变革的大趋势。会计人员需从传统会计思维的固化性、局限性和程序性工作中跳出,努力提高思想观念的主动性、开放性和创新性;勇于面对、迎接数据挖掘技术工作的挑战和新问题,积极参与到新技术、新方法的学习中,而不是故步自封、墨守成规地做“账房先生”。因为在数字经济时代,核算型会计工作逐渐由智能机器人等人工智能设备替代;管理型会计工作,其部分业务处理也将由计算机系统完成;会计工作的具体内容将转向操作层面的数据分析;高层次会计工作,将由数据挖掘算法工程师和机器学习算法工程师完成。
根据上述分析,会计人员需从变化中的岗位或职业当中找到自身的角色定位,规划和实施个人岗位和职业的战术性转型:①核算型会计逐渐减少。该层面工作主要履行核算型职能,承担基础会计工作即主要处理企业常规的会计经济业务,包括财务会计和管理会计,这些会计工作已经或逐渐由计算机系统、智能机器人代替。②承担非常规业务的管理型会计将不断增加。该层面工作履行的主要是管理型职能,承担非常规会计核算及管理工作。工作内容主要包括复杂经济业务的会计处理、理财与规划、作业管理和价值管理、企业纳税筹划、风险管理与控制、全面预算管理及成本管理等。③操作层面的数据分析岗位也将增加。通过对散布各处的“碎片化”数据进行挖掘、采集、清洗、建仓存储、分析应用,数据分析、可视化产品将增加。④算法与设计将成为高层次会计人员的重要选择。该层面工作要求会计人员具有良好的数学分析、统计学、数据结构等方面的知识;熟练掌握数据挖掘算法、常用机器学习算法,如决策树、K-Means、SVM、线性回归、逻辑回归以及神经网络等;熟练使用SQL、Matlab、Python等工具。
2. 高层次会计人员需要学习、掌握跨专业知识和综合技能,以迎接数据挖掘等信息技术的严峻挑战。高层次会计人员将成为“会计师+理财师+管理会计师+数据分析师+算法工程师”,这是会计职业转型和数字经济时代的必然选择。除掌握必要的数理统计、数学分析、高等代数和会计专业知识外,还需要系统学习和掌握有关计算机类、机器学习等跨专业知识和综合技能:①以线性泛函分析、矩阵论和数值计算为内容的机器学习数学基础;②数据挖掘与机器学习;③最优化理论与信息论;④以操作系统、SQL数据库、数据仓库和Hadoop生态圈为内容的计算机与大数据基础;⑤纳入搜索引擎与爬虫的程序设计与Python应用;⑥自然语言与数据可视化;⑦以数字货币与区块链、财务共享为主要内容的大数据与财务决策[7] ;⑧模型与算法开发等知识和技能。唯有如此,高层次会计人员才能真正成为掌握会计专业知识、数据可视化处理、数理分析、计算机程序设计、大数据分析的跨专业复合型人才,适应数字经济时代下数据挖掘技术的发展。
会计人员角色转型过程如图1所示。
3. 会计部门需要逐步转型为数据分析中心,以适应数字经济时代的变革。由于会计人员从会计师转变为数据分析师和算法工程师,会计人员掌握的技能也就由专业技能转变为跨专业综合技能,因此传统的会计部门职能也必需从核算型向数据处理型转变,逐渐成为数据分析中心,为企业管理者和决策者提供决策支持。特别是在不久的将来,总会计师或财务总监、会计部门负责人等中高层领导人员,必然要转型为集综合技能于一身的复合型领导。传统的岗位分配标准也将因为新的业务内容而被打破,会计部门将由会计核算岗、理财岗、管理会计岗、数据分析岗、算法与设计岗等岗位组成。
(二)会计人员必须重视数字经济蕴含的价值及其重要地位,培育自身数字素养
1. 会计人员必须认识、重视数字经济蕴含的价值和重要地位。
(1)从经济发展态势看,“农业经济→工业经济→数字经济”是国民经济发展的必由之路。数字经济的战略地位决定了其将成为驱动新时代发展和变革的强力引擎,即数字经济是发展的新动能,也是推动供给侧结构性改革的重要支撑,能够促进就业、提高经济发展质量,也能够给国家、企业等主体带来经济价值和经济利益。在此大背景下,会计人员、会计部门不可能“独善其身、无动于衷”,必须顺应数字经济的发展、变革和需求。
(2)从会计核算视角看,数据是一种经济资源、企业资产和经营资本。数据能够通过提供服务产生价值这一现象,不仅是会计人员,也是国家、企业等需要面对的新课题。在短期内,会计核算对象还难以纳入半结构化数据和非结构化数据,但是唯有积极探索会计核算对象变化动态,才能做到有备无患。
(3)从生产要素视角看,数据已经成为当前数字经济时代重要的生产要素之一。在数字经济时代,货币不再起决定性作用,数据日渐成为核心资源,以致数据被普遍视为“已取代石油的当今世界最有价值的资源”。数据被不断地挖掘、清洗、加工、分析和运用,为消费不断升级下的经济和社会发展提供充足的信息势能和经济动能。数据资源化促使大数据发展成为大数据产业。因此,数据作为一种经济资源和生产要素,使得数字经济产业渗透和融合到供給与需求、生产与交换、公共物品与服务等全部产业环节和公共服务领域。
2. 企业应着力培育会计人员的数字素养。会计人员需积极学习数据挖掘技术,摒弃单维数据观念:根据数据挖掘目标,培育数字素养,即搜集、集成、清洗、筛选、整理、分析多维数据,为数据挖掘提供基础性资料和信息创造条件。这是因为:①数字素养是数字经济环境下对会计人员和会计部门的新要求,因为数字素养是数字经济时代员工的一项基本素质、企业的一项重要资产。②数据挖掘的数据来源绝大部分为非结构化数据和信息,不再只有低成本获取的结构化信息或单维数据如财务报表等。
(三)企业会计需融入全面可视化管理
会计输出的传统“产品”是结构化的表格数字和文本文档,单一的输出模式不仅使得会计工作本身枯燥乏味,也导致数字信息的利用效率低下。而在数字经济环境下,会计人员可以学习、掌握数据挖掘等信息技术,输出多维、多视角、简捷的可视化产品,以提高信息的使用频率和效率。
1. 会计人员需要掌握双方动态模式下的可视化技术。尽管在未来,相应的软件系统能够提供多样化、多途径的可视化产品,但会计人员只有掌握基本的数据操作技能和可视化产品的基本原理,才能进行系统的数据分析和数据解释。除此之外,会计人员还必须掌握双方动态模式下的可视化技术,以输出简捷、美观的产品。
2. 企业应将数据解释的可视化技术和可视化产品,融入企业全面可视化管理系统中。企业全面可视化管理不仅包括厂房厂区、机器设备、材料物资、工具器具、安全警示、办公部门、管理看板等静态事物的可视化,还应包括动态信息的可视化。静态事物的可视化管理在于及早曝光问题、及时处理问题,动态信息的可视化管理在于向信息使用者提供决策支持的信息,二者都提供视觉化、透明化和界限化的可视化信息或产品。
(四)企业及会计部门和会计人员应积极参与构建信息安全防护体系和标准规则体系
企业应建立以安全为核心的防护技术体系,参与构建以法律、法规、标准、伦理、安全为主要内容的标准规则体系,逐步完善数字经济生态系统。①会计部门和会计人员必须认真贯彻、落实全国信息安全标准化技术委员會于2017年12月发布的《信息安全技术个人信息安全规范》。针对数据挖掘过程中直接获取或相互交流的个人信息,必须严格保密;内部调取数据时,需及时、详细记录在线信息;对外设置防火墙,以防止病毒侵入后篡改、破坏数据库。同时,我国在信息安全方面的法律法规也需根据信息技术的发展和时代变化,适时修订和不断完善。②各行业协会应制定关于规范个人信息行为方面的行业自律公约,不同行业和经营领域在处理个人信息方面有较大的差异性,行业自律公约在规范个人信息方面有一定的优势。③企业和数据分析部门或会计部门,可以设立数据保护官,专门负责本单位或部门的数据保护工作。
四、会计人员应用数据挖掘的分析方法、算法及平台工具
(一)进行数据挖掘的分析方法及算法
数据挖掘的分析方法大体可以分为机器学习方法、统计分析方法、神经网络方法和数据库方法等。其中,统计分析方法可细分为回归分析、判别分析、聚类分析、探索性分析(主元分析法、相关分析法等)等。机器学习方法可细分为归纳学习方法(决策树、关联规则等)、基于范例学习、遗传算法等。神经网络方法可细分为前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库方法主要是多维数据分析或OLAP方法等。
数据挖掘的常用算法或技术有回归分析、聚类分析、决策树、关联规则、神经网络等。回归分析,是指利用数理统计方法建立因变量和自变量之间的回归关系模型,并根据观察数据来求解模型中的各个参数,再评价回归模型或函数表达式是否能够很好地拟合观察数据;如果能够很好地拟合,则可以根据自变量做进一步预测分析。聚类分析,是指根据“物以类聚”原理对事物进行分组,是数据挖掘中常用的一种技术。其基本原理是使得同类个体的相似性较大,而加大不同类个体的差异性,即将类间个体的同质性最大化、类与类间个体异质性最大化。通过分析事物的内在特点和规律,借助专业软件,解读结果形成相应的实操措施或策略,以提供给管理部门或决策机构。在经济学领域中,数据挖掘可用于客户细分、实验市场、市场机会研究、销售片区分析等。
除回归分析和聚类分析以外,决策树是数据挖掘中常用的一种技术工具。由于其将决策分支画成图形,很像一棵树的枝干,故称“决策树”。决策树既可以用于分析数据,也可以用于预测决策,故也是一种预测模型。在决策树中间可以有多个决策点(节点),以决策树根部的决策点(节点)为最终决策方案。关联规则是从大量数据中寻找规则或联系,挖掘出有价值的数据间的相关关系,是数据挖掘的一项重要技术,例如销售商常用它来分析消费者购物车行为等。神经网络是通过模仿动物的神经网络行为和特征,进行分布式并行信息处理的一种数据挖掘技术和数学模型。
(二)进行数据挖掘的常用平台工具
进行数据挖掘常用的平台工具主要有Office Excel、Stata、SAS、SPSS、R、EViews、Python /AMOS、Crystal、Ball、FineBI、Lingo、Maple、Mathematica、Matlab、MaxDEA、Minitab。现简要介绍常用的数据挖掘平台工具的使用及适用范围:
1. Office Excel自带模块和数据挖掘外接程序两种工具均可以使用。
(1)Excel主界面自带有数据分析模块,可以计算描述性统计、相关系数、协方差、移动平均,也可以进行回归分析、单因素方差分析、双因素方差分析、傅里叶分析,还能进行F检验和t检验等,可以满足基本的数据分析要求。
(2)Excel数据挖掘外接程序。如下载 SQL Server数据库,配置本地服务器后再安装相关插件,Excel主界面就会出现数据挖掘菜单。利用该外接程序就可以进行更专业和系统的数据分析,其适用范围及特点在于:Excel是会计人员除财务软件之外使用最频繁的管理用软件;财务软件是专业软件,Excel则是常用的Office办公软件。由于会计人员容易接受且使用成本较低,因此用Excel数据挖掘外接程序办公是财务会计人员熟练运用数据挖掘信息技术的捷径之一。
2. Stata是一款统计软件,也是数据挖掘的常用工具。①除传统的统计分析方法外,Stata汇集了近20年发展起来的数量统计新方法,包含均衡重复反复、线性混合模型、多项式普罗比模式等,具有数据分析、数据管理和绘制专业图表等强大功能。②Stata工具的统计分析能力远超SPSS,在许多方面也超过了SAS。由于Stata在数据分析时先将数据全部读入内存,在计算全部完成后再与磁盘交换数据,因此在计算速度上Stata快于SAS,SAS快于SPSS;Stata也是采用命令行方式来操作,但使用上比SAS更为简单;Stata的生存数据分析、纵向数据(重复测量数据)分析等模块的功能甚至超过了SAS软件。③Stata工具每一年半更新一次,界面设计较为简洁,可以输出Excel和Word等格式的文档,但使用过程中必须通过输入命令才能正常使用,主要适用于高层次的统计、财务人员使用。
3. 同时采用多种分析工具进行数据挖掘是必要选择。由于会计等数据分析人员的个人综合能力不同,企业所属行业的数据分析需求也不同,企业规模大小也决定了企业自身信息化水平的高低,这些促使会计人员采用不同的分析工具进行数据挖掘,从而提供相关决策支持信息。例如:安装、学习和使用Excel外接程序;升级ERP信息系统,嵌入数据挖掘模块,并不断进行升级和更新,使得相关数据实现对接和系统内共享,这也是较为理想的数据挖掘分析工具[8] 。
上述数据分析工具的使用范围及特点如表3所示。
(三)数据挖掘的应用流程
数据挖掘的应用流程主要包括以下几个步骤:①确定数据挖掘的基本目标,以便选择合适的数据挖掘工具和分析方法[9] 。②准备及整理数据。数据主要分为财务数据与非财务数据、内部数据与外部数据、抽样数据或全部数据、开放数据与非公开数据、结构化数据与非结构化数据。整理数据主要包括搜集、导入、预处理数据等。③利用数据挖掘应用工具和方法,挖掘出经过转换的数据。④针对数据挖掘的结果进行分析、评估、验证;根据数据分析师的经验积累、综合知识,查找异常,必要时查找数据是否有误、样本量是否充足,并再次进行数据挖掘。⑤将数据挖掘的分析结果提供给相关管理部门,以提供决策或其他支持。⑥得到数据挖掘的结论,评估相关的经济效益和社会效益,同时调整或确立新的数据挖掘目标以构成循环,不断提升企业的数据挖掘能力,最终实现经济及社会效益。细化应用流程视角后可知,数据挖掘过程也指具备统计学、计算机科学等知识的会计人员或数据分析师,通过机器学习和数据库分析等方法和算法,借助Excel、Stata、Python等平台工具建立和识别模型,最后验证和测试挖掘结果。具体流程如图2所示。
五、结语
数字经济时代下,数据挖掘技术对会计的影响非常深远,会计人员和会计部门的角色定位发生根本改变,将分别转变为数据分析师、算法工程师和数据分析部门;会计确认的要素范围将扩展到数据资产和数据资本,会计人员所获取的单维数据也将转为多维数据;会计人员数据解释的输出方式将更多地采用可视化技术,且信息使用者将由单向信息传递的被动接受者变成双向信息互通的主动参与者;企业及会计部门、会计人员将面临更大的信息安全风险。基于此,本文有针对性地分析了相应的应对策略,并就会计人员实施数据挖掘的分析方法及算法、常用工具和应用流程进行了较为详细的介绍和系统梳理,以期能为会计学术研究、会计实务、会计教学等提供一定的参考。
【 主 要 参 考 文 献 】
[ 1 ] 张超,肖聪等.财务智能可视化分析与文献综述[ J].财会月刊,2019(3):24 ~ 32.
[ 2 ] 上官鸣,白莎.大数据资产会计处理探析[ J].财务与会计,2018(22):46 ~ 48.
[ 3 ] 刘光军,彭韶兵,王浩.网络经济环境对会计理论的影响研究[ J].财会月刊,2016(25):3 ~ 7.
[ 4 ] 徐秋菊,刘光军.电商业务会计核算应注意的问题[ J].财会月刊,2013(7):58 ~ 59.
[ 5 ] 孙敏,王琳.大数据时代下的数据可视化方法分析[ J].软件,2019(9):182 ~ 184.
[ 6 ] 张莉.数据治理与数据安全[M].北京:人民邮电出版社,2019:1 ~ 268.
[ 7 ] 樊斌,李银.区域链与会计、审计[ J].财会月刊,2018(2):39 ~ 43.
[ 8 ] 蔣小花.ERP环境下在线审计实践探索[ J].财会月刊,2014(21):58 ~ 60.
[ 9 ] 马青.基于数据挖掘的财务诊断问题研究[ J].自动化与仪器仪表,2017(10):139 ~ 141.