侯本忠 白雪娇 刘甜甜 毕艳冰
【关键词】 经济责任审计; 大数据; 标签; 用户画像
【中图分类号】 F239;F299.23;F124 【文献标识码】 A 【文章编号】 1004-5937(2021)23-0102-05
一、引言
近年来,随着我国大型企业规模不断扩大,企业经营管理数据呈爆发式增长,数据量由GB、TB增长到PB级规模。同时,审计作业模式由传统审计向复合型业务、多数据源关联方向发展。现阶段央企内部审计信息化取得了一定的进展[ 1 ],但内部审计所需信息缺失、审计作业模式单一、高度依赖现场审计作业等问题亟待解决[ 2 ]。相比传统审计方式,大数据审计分析的数据范围更广,更方便使用外部数据,时间地点限制也少[ 3 ],针对审计大数据,利用计算机平台把数据分类、数据挖掘[ 4 ]、用户画像等先进技术应用于审计作业,能帮助快速发现审计风险和疑点。
本文主要讨论大数据视角下企业审计画像指标构建思路及应用,探索用量化的指标方式进行审计业务的画像构建,帮助审计人员做出判断。用户画像技术最早用于刑侦破案工作,目的是找到嫌疑人的犯罪特征。对企业内部审计而言,将大数据画像技术应用于审计作业,就是根据审计业务需求,从海量的数据里发现审计线索,构建出标签描述对象,进而通过标签、统计、对标、评价等分析手段进行可视化呈现,直观展示审计对象特征,发现疑点,预测风险,帮助企业提高内部审计工作效率,从而辅助提升经营管理水平。
二、画像综述
本文所指的画像,系用户画像(User Profile),是由某一特定群体或对象的多项特征构成的要素集合。计算机输出结果通常是对特征的具体描述,也可把画像理解为由多个标签组合而成的标签集合。审计画像,即在审计作业活动中,将画像技术应用于审计对象,形成对审计对象或审计业务丰富的、立体化的描述过程。
针对用户画像的研究,早期关注对象是“实体的人”或“虚拟的人”,后来扩展到“组织”或“物”等非人的对象。
当画像研究对象是“人”的时候,通过研究单一用户或群体的特征,形成描述问题的标签体系,进而实现用户行为区分、个性化搜索、行为预测的目的。黄文林[ 5 ]提出高校精准思政工作的学生画像方法。龚新刚等[ 6 ]认为,借助本体建模工具构建用户画像能详细了解每个读者的真实需求。范哲[ 7 ]以数字原住民为研究对象,通过访谈法收集用户相关数据,利用亲和图抽取用户行为过程中的阶段性特征并构建多种典型用户画像,根据不同类型用户分析行为与行为变化原因。文素华等[ 8 ]提出一种经济责任审计为领导干部精准画像的实现途径。何雪海等[ 9 ]设计的网络安全管理系统能实时地判断用户异常行为。
当画像研究对象是“组织”或“物”时,对象的特征融合了业务特征。田娟等[ 10 ]讨论了基于大数据平台企业画像标签体系模型和建模框架。赵永柱等[ 11 ]开展了基于电力资产全寿命周期的标签画像技术研究,构建多层次、多视角、立体化的资产全寿命周期画像,以实现对电力资产特征的全面刻画。王镂[ 12 ]研究了面向企业征信的画像,根据画像用途和企业数据特点,设计了一套适应征信的企业画像体系框架。孙晔等[ 13 ]将画像引入到金融监管,提供了一套风险定义、指标提炼、风险预警、风险处置的风险驱动监管闭环应用体系。
三、审计画像构建方法
(一)画像构建思路
本文研究的审计画像基本思路是构建“数据—标签—场景—画像”体系,过程如下:(1)采集企业内外部审计数据,分析数据类型、数据结构、数据年份等并选择可用的数据,编制数据调用接口。内部数据采集自人资、财务、经法、工程、营销、ERP系统等,外部审计数据包括互联网舆情、司法数据、企业征信大数据等。(2)基于数据,通过赋值、统计、数据挖掘等多种形式,形成描述审计对象特征的标签。(3)结合审计画像场景,选择可以充分刻画审计对象的多个分析维度,分别构建标签体系。通常设计为一级标签、二级标签,必要时设计三级,各级标签需定量打分时,要设计出标签对应的权重和打分方式。(4)生成审计画像,并对相关指标的风险进行预警,对重点关注指标进行预测,形成画像分析报告。
审计画像不是一成不变的,它会随审计场景、审计对象、审计年份的变化而变化。画像展现方式包括雷達图、词云、知识图谱、数据分析表等或以多种方式组合展示,如图1所示。
(二)标签体系构建原理
审计人员使用计算机大数据画像平台时,需要完成标签体系构建,主要内容如图2所示。
标签的构建过程按照层级进行[ 14 ],即标签主题+标签维度+具体标签,通过逐层刻画,以实现能描绘对象标签的全貌。标签体系构建包括标签生成、标签存储及标签管理。
(1)标签生成主要是围绕企业、组织、资产、财务、人员等主体展开,从标签的可获取、可量化、可评分、可进行推论等角度出发,结合审计业务场景,选取与之相关的标签描述形成画像指标,如描述企业整体情况,选择财务指标标签、营商环境标签等作为一级标签。当标签指标需要更加细致的描述时,要设计下一级标签,例如财务标签下细化出营业收入、营业利润、资产负债率、偿债率等二级标签。数据标签的确立以审计对象所在地区法律、法规和行业规定为基础,将数据指标从定性分析转为定量分析。(2)标签存储指针对标签类型的差异在存储时要按动态标签、静态标签做必要的区别。(3)标签管理包括对标签的增加、编辑、调用、搜索、删除等标签生命周期内的主要操作。
按照数据特点又可把标签分为统计类、规则类、挖掘类。统计类标签是指利用统计用户相关数值客观描述用户状态的标签,如年龄、年收入、年售电量、生产技改完成率等,这类标签可以用单一数量反映标签值,也可以用分组方式表示,如20~30为一类。规则类标签指对行为规则制定的标签,这类标签有主观判断,在开发前需要进行数据调研,摸清业务数据的情况,再根据目的制定标签规则,如业务强、规模大、效率高等。挖掘类标签指的是需要应用算法挖掘用户相关特征生成的标签,如预测用户行为、判断用户状态、评价用户风险、判断用户偏好、补充缺失值等。
四、经济责任审计画像的实现
经济责任审计是指审计人员依据党和国家的方针、政策,财经法令、法规、制度以及计划、预算、经济合同等,对经济责任关系主体经济责任的履行情况监督、审查、评价和证明的一种审计方式,是主要针对“人”的审计活动,在业务实现路径上由“人”及“事”,做审计画像时包括“人”和“单位”的画像。
本文以国家电网某地市供电公司为例,用经济责任审计为业务场景说明审计画像构建方法和流程。在综合考虑数据可取数、标签可判断、结论可推断的基础上,设计、构建6个与经济责任审计相关的画像场景。本文提出的画像模式也可应用于其他审计业务场景中。
(一)经济责任审计画像场景及标签设计
如图3所示,本文以某供电公司领导干部的经济责任审计画像作为业务画像场景,从经济责任审计业务中选择6个与之相关的画像场景。
1.企业整体画像
主要是用于获取企业的基本信息,对企业形成整体了解,并通过获取企业画像指标与参考值进行比较,为制定审计计划、确定审计重点提供依据。企业画像一级标签包括基本情况、市场营销、财务指标、社会责任、计划预算、劳动生产率等,在一级标签下按照标签相关内容构建二级标签。各标签的参考值及异常值要依据法律法规、国家标准、公司标准及公司制度等规范来确定。企业画像也可用于集团公司下属类似经营范围公司的横向比较。
2.领导干部基本情况画像
这是干部画像的基本内容,主要用于对领导干部基本情况的自动化和可视化的描述。领导干部基本情况画像标签包括基本信息、政治面貌、工作经历、个人惩处、职务管理风险等一级标签及相关二级标签。在分析时,审计主管部门可根据领导干部学历、职务范围等维度进行分类,辅助决定采用何种审计方式。
3.领导干部内部社会网络画像
这是领导干部画像的补充内容,主要用于对领导干部内部履历及职务关系网络的描绘,以便掌握领导人的工作背景和特征。通过对某领导标签数据分析,可以发现领导的社会关系(图4示意),从而为领导人风险判断提供辅助证据。鉴于社会网络数据较难获得,可以从有限的数据中加以描绘。领导人社会网络关系类型标签包括平级关系、上级关系、下级关系、任职单位之间关系等。在畫像时用社会网络绘制工具(如Ucinet)或使用Python绘制单位内部社会网络关系图。
4.资产画像
主要是对企业资产情况进行全面描述和综合评价,也可用于固定资产盘点。客观上不同企业的资产结构不同,通过画像技术掌握被审计对象的资产特征,分析这一任领导上任前的资产画像与上任后的资产画像,发现领导任期内资产结构变化,找出任期内做得好的地方以及生产经营忽略的风险点,例如资产残值、资产折旧情况等。资产类标签包括固定资产卡片类标签、通用资产类标签,并在一级标签下设置多组二级标签进行资产的勾画。
5.客户信用画像
主要用于对客户信用总体情况进行评价,以便帮助审计师确定电力用户抽查重点,防止出现电费损失。如长期迟交电费,或所处行业不景气,或用电量持续下降,或社会信用评价不高,都预示着该电力用户存在电费风险甚至窃电风险。客户信用画像一级标签包括负荷报装差异率、及时交费率、用电量、行业景气度、电力用户状态、社会信用评价等一级标签。把客户分为“正常用户”“关注用户”“信用不良用户”三类,利用数据绘制图表展示统计结果。
6.审计问题及整改画像
主要关注被审计单位或人员的问题整改情况,通过画像判断审计单位审计问题分布、整改完成率、是否存在审计问题反复出现。本画像包括审计问题数、审计问题类型、审计违规金额、审计整改完成数、整改完成率等一级标签。利用审计问题及整改画像,可以对各单位之间的问题差异、问题重点、整改情况进行横向比较。
(二)标签权重评估体系
标签权重评估体系如图5所示。
在审计画像构建过程中,根据场景需要对标签进行分层处理,依据场景描述的需要,采取类似逐层细化的方式进行指标设计,依据画像的复杂程度可采用一级标签、二级标签,或三级标签。不建议使用四级标签,会带来指标权重设计困难和画像过细的问题。
选定标签后,要确定标签权重。常见的专家问卷法可用于初步确定各指标权重,再根据层级分析法修订权重。
层级分析法[ 15 ],即AHP分析法,在20世纪70年代由运筹学家萨蒂教授提出,主要实现过程是通过将问题分解为若干层次和若干因素,对指标之间的重要性做比较判断,并建立判断矩阵,通过计算判断矩阵的最大特征值及对应的特征向量,进而确定画像的权重值。
实现过程包括四步,依次是“分层设计判断矩阵”“比对确定重要程度”“计算特征向量和特征值”和“一致性校验”。
第一步,分层设计判断矩阵。矩阵记为A=An×n。矩阵内所有元素均为正数,且满足Aij=1/Aji。
第二步,比对确定重要程度。即确定分析指标i和j相对彼此的重要程度。
第三步,计算特征向量和特征值。首先计算矩阵中每一行各元素的乘积开四次方,构建M向量。
其次利用M做归一化处理构造出W向量,公式为Wj1=Mj1/∑kMk1。最大特征值λmax根据式(2)确定。
第四步,一致性校验。按式(3)计算一致性指标CI。
把CI和指标数n对应的随机一致性指标RI进行比较,若CI<0.1RI,层级分析是合适的,反之则调整A矩阵。
五、研究结论与展望
用户画像技术是大数据环境下对用户、对象进行分析的一种重要手段。本文提出一种“数据—标签—场景—画像”的审计画像工作机制,即利用标签化技术,构建审计业务场景标签体系,形成场景或审计对象的描述,通过可视化方式进行画像呈现,并以某央企旗下供电企业为例,结合经济责任审计作为画像业务主题,展示了该主题下多个相关审计画像指标的设计。
审计用户画像构建和技术实现时,可从标签设计、数据采集、综合判断、逻辑推理、可视化5方面开展。在标签设计方面,开发标签描述、生成、管理技术,并适时应用数据挖掘技术,比如开发基于特征深度学习的标签自动计算生成技术。在数据采集上,开发出适应多个源端系统的ETL数据分析工具。在综合判断上,依照场景—标签对应关系,结合风险影响权重分析选出潜在高风险标签。在逻辑推理技术方面,通过关联分析、贝叶斯理论等技术进行风险判断和结果输出。在可视化技术方面,综合分析词云、指数图谱、拓扑结果、数据透视表等画像呈现技术,开发与画像业务相适应的可视化技术。
利用本文提出的审计画像机制,审计人员可进行多场景、多指标的分析,并通过直观的画像可视化展示,结合大数据分析的指标预测功能,帮助发现对象的指标异常或风险,从而及早堵上内部管理漏洞,降低企业资产损失风险,让大数据画像技术成为辅助审计决策的良好工具。
审计画像机制通过充分利用大数据分析技术,可全面提高审计工作效率,对审计署要求的“完善审计工作全覆盖”,推动审计工作从事后审计向事中审计、连续审计的工作机制转变有积极意义。
【參考文献】
[1] 宋定胜.大数据时代内部审计面临的挑战[J].环球市场,2020(1):99.
[2] 王向阳,席斌,胡璟懿,等.基于知识图谱的审计智能专家模式设计与应用:以国网湖北电力为例[J].会计之友,2021(14):140-145.
[3] 李文想.基于大数据的政府专项审计案例研究[D].厦门:暨南大学硕士学位论文,2019.
[4] 郭建龙,方院生,黄钦伟,等.基于大数据的人才画像技术应用研究[J].微型电脑应用,2021,37(6):166-170.
[5] 黄文林.基于学生画像分析的高校精准思政探索[J].东北大学学报(社会科学版),2021,23(3):104-111.
[6] 龚新刚,沈丽娟,胡之茜.以读者为中心的基础数据库建设[J].图书情报工作,2016(S1):199-202.
[7] 范哲.数字原住民采纳社会化媒体影响因素的扎根研究[J].情报资料工作,2017(1):25-33.
[8] 文素华,彭运民,彭怡.经济责任审计为领导干部精准画像的实现途径[J].中国内部审计,2020(11):49-51.
[9] 何雪海,黄明浩,宋飞.网络安全用户行为画像方案设计[J].通信技术,2017,50(4):789-794.
[10] 田娟,朱定局,杨文翰.基于大数据平台的企业画像研究综述[J].计算机科学,2018,45(11A):58-62.
[11] 赵永柱,马霁讴,张可心.基于电力资产全寿命周期的标签画像技术研究[J].电网与清洁能源,2018(1):51-58.
[12] 王镂.面向征信的企业画像研究[D].西安:西北大学硕士学位论文,2019.
[13] 孙晔,杨照东,陈德华.大数据用户画像技术在商业银行的应用[J].数字通信世界,2016(9):86-88.
[14] 王飞飞,周少军,韩迎军.基于大数据技术的电力用户画像分析[J].山西电力,2019(4):26-29.
[15] 郭金玉,张忠彬,孙庆云.层级分析法的研究与应用[J].中国安全科学学报,2008(5):148-153.