【摘 要】 政府审计结果的数据挖掘不仅有助于探查政府审计的作用效果及影响因素,探究被审计对象的共性问题,也有助于盘活政府审计的历史沉淀数据,发挥审计数据资产的价值。政府审计结果的文本分析是政府审计结果数据挖掘的基础环节,也是政府审计结果数据利用的前提。文章从政府审计结果数据挖掘视角分析了政府审计结果文本分析的内容、启示与局限。研究认为,信息抽取、分类聚类和文本情感分析是政府审计结果文本分析的主要内容,由此可以形成研究中政府审计的不同量化衡量指标。研究还认为,政府审计语调作为政府审计文本情感分析的结果,应该进一步细化为实际净语调和名义净语调,并给出了它们的不同计算公式和适用情况。
【关键词】 政府审计; 政府审计语调; 审计量化; 文本分析
【中图分类号】 F239.1 【文献标识码】 A 【文章编号】 1004-5937(2023)04-0009-06
一、引言
政府审计的监督作用既体现在审计机关通过对被审计对象实施审计形成的、对被审计对象本身的直接治理,也体现在审计机关对被审计对象的审计行为和结果经由组织人事、纪检监察、司法、其他相关主管单位、市场主体、公众等组织和人员在党内监督、监察监督、司法监督、行政监督、市场监督、舆论监督和群众监督中运用①产生的[1-2]延展作用。换句话说,要实现政府审计“对经济运行进行全方位监督检查,保障经济社会平稳健康运行”的目标②,除了审计机关对被审计对象实施审计外,全面准确评价政府审计效果也是政府审计不可忽视的内容。除了针对某些具體问题、具体研究对象可以采用案例分析法来了解审计效果、分析政府审计作用机理外,要想全面分析和掌握政府审计的作用效果,需要对政府审计进行量化处理。应该说,政府审计的量化是评价政府审计质量,进行政府审计定量研究的基础。
政府审计结果包括审计结果公告、审计报告、审计决定书、审计移送处理书、专题报告、报告解读、公告解读、新闻发布等文本类文件。利用文本分析法将政府审计结果数字化即量化,有助于更全面、深入地分析政府审计的作用效果,探究影响政府审计效应的原因,也有利于总结被审计对象的共性问题并寻找治理之策,因而会对完善政府审计监督和国家治理体系具有积极意义。
二、政府审计量化衡量的现状
梳理现有文献可以发现,目前研究中我国政府审计的衡量主要采用以下指标。
第一,政府审计具有揭示、抵御和预防的功能。多数文献利用《中国审计年鉴》中披露的审计查出违规金额、审计处理处罚金额、被审计单位实际纠正金额、审计提出的建议数、审计提交的报告数、一个地区被审计单位数量、被采纳的审计建议数、移送处理人数、处理落实的案件数、上缴财政金额、减少财政拨款或补贴的金额、调账处理金额及归还原渠道资金等省级审计数据分别量化政府审计的上述功能,通过设计单项指标或者构建多指标评价体系来衡量地方层面的政府审计[3-6]。主要量化指标如表1所示。
第二,审计投入和审计执行力度是政府审计效果的决定性因素。因此可以从审计力量、审计任务强度、审计执行力度、审计处罚力度、审计信息披露力度、审计独立性与经济发展水平等方面设计指标评价政府审计[7]。基于此,部分文献利用《中国审计年鉴》中的省级审计机关人员数,被审计的领导干部人数,被审计单位数量,审计过程中发现的违规违法、管理不规范和损失浪费金额,提交的审计报告和专题报告数量等数据构建指标来衡量政府审计[8-9]。
第三,审计结果公告是审计机关实施审计后依法将审计调查结果向社会公开披露的信息部分。公告中既披露了审计评价意见、审计发现的主要问题、审计处理处罚决定和建议,也载明了被审计单位的基本情况及审计整改情况。审计结果公告具有很强的权威性、客观性且规范化程度高。通过量化审计结果公告研究政府审计效应具有一定合理性和较强的可行性。因此,部分文献以国有企业和中央部门的审计结果公告为研究对象,通过统计公告中披露的违规违法违纪财政资金项目数量及其金额[10-11]、被审计中央部门的违规金额[12-13]、被审计企业的内部控制缺陷数量[14]、审计查出的问题数量和处理处罚金额[15],或者利用文本分析技术提取公告中的情感词构建审计语调[16-17],提取并计算公告中关键审计词数量、公告字数、涉及的地域数量和消极情感程度[18],或者统计公告中的问题篇幅、问题个数、问题金额、被审计的项目、单位和部门数量等[19]达到量化衡量政府审计的目的。
此外,绝大多数研究央企政府审计效应的文献是以央企“是否被审计”“是否公告审计结果”,或者实施或公告审计时间的前后作为政府审计量化衡量的指标,也有文献尝试从阅读数、活跃度和应用开发度等方面构建指数衡量审计署微信公众号的影响力[20]。
上述分析表明,现有涉及到政府审计量化衡量的研究中,除了采用“是否被审计”“是否公告审计结果”等二分类变量作为政府审计的替代以外,主要有三类量化衡量指标。第一类是基于政府审计的功能,分别设计反映政府审计揭示、抵御和预防作用的指标。第二类是基于影响政府审计效果的因素构建反映政府审计投入和审计执行力度的指标。还有一类文献关注到了审计结果公告在政府审计量化中的独特作用,利用文本分析技术从不同角度对审计公告进行文本处理,设计出不同的量化指标。本文以数据挖掘为视角,从更高层次对基于审计公告文本的衡量方法进行归纳,并将其所有量化方法进行统一,解决了现有指标为什么可以这么用的问题。实际上也是从方法论视角为这些指标用于政府审计的衡量提供了合理性依据。
三、政府审计结果的文本分析内容
从内容上,政府审计结果数据包括审计结果公告、审计报告、审计决定书、审计移送处理书、专题报告、会议纪要等直接记录和反映政府审计结果的数据,以及政策解读、报告解读、公告解读、新闻发布等间接反映政府审计信息的数据。从形式上,政府审计结果数据包括数据文件、文本、视频、音频等类型。除审计机关和被审计单位能够获得数据文件之外,其他主体只能够获取到后三类数据,这些数据均属非结构化数据。对于其中的视频和音频文件,由于关注的是其内容而不是图像或声音本身,因此视频和音频等数据类型一般应先转换成以语言文字为主要内容的文本后再进行分析。于是,文本是政府审计结果分析的主要数据类型。其中,政府审计结果公告是审计机关实施审计后依法将审计结果向社会公开披露的信息部分,是可以公开获取的、进行政府审计效果评价的重要依据。因此,本文主要基于审计结果公告阐述政府审计结果的文本分析。
政府审计的文本分析是抽取审计文本的特征来量化表示采用自然语言撰写的审计文本信息的过程,包括数据采集、文本内容识别、文本解析和结果表示等环节,其本质上属于政府审计数据挖掘的范畴。按照所分析文本的颗粒度进行分类,政府审计的文本分析对象可以为篇、段、句、词和属性。按照分析的内容和方法,政府审计的文本分析主要包括文本信息抽取、文本分类和聚类、文本情感分析三类。如图1所示。
(一)审计文本的信息抽取
信息抽取是从非结构化的文本数据中抽取出实体、实体的属性、实体之间的关系和事件,将其转换形成结构化数据,并进一步利用统计等方法进行的分析处理[21]。政府审计文本分析中可以利用信息抽取工具提取反映某个事件、组织、个体等实体及其属性的信息并进行分析。比如对银行的审计结果公告进行分析,抽取“贷款资金被挪用”这个事件发生的频率、金额、涉及的主体等属性,可以获得该银行贷款资金被挪用事件发生的频繁程度、被挪用资金规模大小、涉及的主体数量、主体类别等,这不仅可以用于衡量该银行此类违规经营的严重程度,还有助于进一步量化分析该项违规后果的溢出影响。现有研究中提取政府审计文本中各类违规金额、问题数量、地域数量、被审计项目数量、被审计单位和部门数量等采集政府审计指标数据的做法可以归属此类分析。
(二)审计文本分类和聚类
政府审计的文本分析中可以将被审计对象、审计实施组织及其人员等看成一个个事物。按照事物具有的共同特征进行归类,或者按照事先制定的评价指标和标准来寻找确定不同事物的类,可以实现“物以类聚”,进而通过分析各个“类”及其影响因素达到发现普遍性问题和规律的目的。比如对不同被审计对象或者一个被审计对象不同时间的审计报告或公告进行文本相似度分析,可以发现某类被审计对象存在的某些普遍性问题或者某个单位存在问题的规律性特征。因此,审计文本分类和聚类也是实现政府审计文本内容量化的一种方法。
(三)审计文本的情感分析
政府审计结果的文本包括报告公告类和解读类两种类型。审计报告公告等直接反映政府审计行为和结果的文本不仅是审计情况和结果的介绍和总结,也体现了审计监督者对被审计对象状况和行为的总体认识、评价和态度,而审计机关发布的报告解读类文本也是为了更准确全面传达这种认识和态度。因此提取上述审计文本的情感特征,对文本所含观点的情感倾向进行分析可以成为相关文本内容量化的一种途径,并作为政府审计量化的一种方法。
1.文本情感分析方法
政府審计文本情感分析可以整篇文本为对象,也可以按照文本中所含的段、句、词进行分析。从审计结果公告来看,由于政府审计立足于监督,以发现和揭示问题为导向,因此一篇审计公告的整体情感倾向总体应为负面,于是研究中可以将是否经政府审计(或者发布结果公告)作为一个二分变量。如果经过政府审计,则将此变量设为1,否则该变量设为0。从数据角度看,因为政府审计从审计介入到发布审计结果公告一般跨越两个年度,而发布结果公告是政府审计不可分割的部分,因此相比介入年度,到发布年度被审计对象受到的审计作用才更完整。于是要全面反映政府审计效用,实证研究中用二分变量时政府审计事件冲击的时点选择公告年度更为合理。
从汉语表达的语言特点看,单独的汉字无法完整传递文本情感,因此不能简单采用文本中字的个数进行文本情感量化。汉语的语句是由多个词连接组成,语句的情感由其中的情感词语决定,不取决于语句整体的长短及复杂性。也就是说句子越长只代表句子里所含的字越多,并不意味着句子的情感传达越完整越清晰。文本的一个自然段至少包括一个语句,如果直接以段作为情感分析的对象,那么人工凭借经验等可以给出一个段的情感倾向判断。但是由于很难建立清晰的段的情感倾向判断标准,采用机器学习来准确识别各个段的情感倾向就非常困难。因此数据分析的文本情感分析一般会选择以情感表达的最小单位——“词(含短语)”作为分析的对象。
政府审计文本分析以政府审计出具或发布的文本中的词(含短语)作为情感分析对象时,可以利用信息技术的分词工具,比如目前常用的Python的“jieba”,首先,将文本分解成一个个词;其次,根据事先定义的情感词词典,提取文本中包含的情感词并将它们按照一定的标准进行情感倾向归类;再次,利用专门的统计等数学方法进行处理和分析,比如分别统计审计结果公告文本中正面情感词和负面情感词的数量;最后,构建政府审计语调指标,就能够一定程度揭示出审计文本出具或发布者的态度和情感倾向强度,并达到量化政府审计文本内容的目的。
2.政府审计文本情感分析结果:政府审计语调
政府审计语调是政府审计文本情感分析的结果指标。如果用w、c1、c2、x1、x2分别表示一个审计文本对象中的全部词、全部情感词、全部非情感词、负面情感词和正面情感词的数量,用Ntone、Ptone、Netone、Retone分别表示该文本的负面情感强度、正面情感强度、实际净情感强度(实际净语调)和名义净情感强度(名义净语调),则变量之间存在如下关系:
因为文本的情感倾向取决于从文本中提取的情感词,文本中的非情感词属于影响情感分析的干扰因素,因此,可以将其看成是情感判断的一种“环境噪声”。文本净语调可以进一步细分为实际净语调(Netone)和名义净语调(Retone)。上述公式表明,文本实际净语调一定时,随着文本中非情感词比重的增加,文本的名义净语调会下降。这也意味着,当采用审计文本语调衡量政府审计时,如果强调政府审计行为的影响,由于审计行为的情感倾向体现在文本中,此时适于采用实际净语调(Netone)衡量政府审计;如果只关注政府审计结果公告(即审计文本)产生的作用,由于用户接收的是一个包含干扰的完整文本,此时更适于采用名义净语调(Retone)来量化政府审计。
由上,审计文本情感分析可以作为政府审计文本内容量化的一种可行和有效方法。其中,是否经政府审计哑变量可以看成是政府审计文本净语调的特例,即c1=x1=1,c2=x2=0时的文本净语调。
四、政府审计结果文本分析的启示与局限
(一)启示
1.按照文字是否直接表现情感倾向进行分类,可以将文本体现的态度划分为显性观点和隐含观点两类,显性观点的文本文字直接表达了文本观点持有者的情感倾向。比如“近年来某企业认真贯彻落实国家有关经济金融工作的方针政策”这句公告文字直接给出了肯定的正面评价,而“企业违规发放贷款55.14亿元”给出了显性的负面评价。隐含观点的文本文字只是陈述事实,观点持有者的态度隐含在文字背后。比如“某年某月某分行向‘四证不全、自有资金比例不足30%的某公司发放项目贷款1.5亿元”的公告文字仅仅描述了事实,文本隐含反映了对这个事实的负面态度。受立场、经验、认知等多重因素影响,不同的人对同一个文本的隐含观点可能会得出不同的判断。而数据挖掘技术可以帮助人们实现对大量数据、按照同一标准进行识别的目的,这会降低人工判断产生的偏差和歧义,更有助于找出现象背后的因素和规律。
2.就像自然人想要了解和领会一份文件的内容和精神,需要对文件进行反复阅读、思考、讨论一样,利用机器进行文本分析也要经过反复训练的过程。这个过程中需要根据文本的特点不断进行调整来纠偏。比如要根据所研究文本的专业特征不断细化补充词典,在研究的文本样本中选择足够数量的、内容最全的、最具代表性的文本进行识别训练等,从而尽量降低识别结果的误差率。
3.政府审计专业化词典是政府审计文本情感分析的关键。要提高机器自动化分词和识别的准确率,必须根据政府审计各类文本的行文特点建立相应的专业化词典。以某审计公告的文本内容为例,“从审计情况看,有关部门和单位能够认真执行党和国家政策法规,医保业务经办和基金管理总体规范,但也发现一些管理不规范问题,以及15亿元违法违规问题”这句文本从含义上判断情感倾向应该属于弱正面。如果提取情感词时不考虑公告行文特点,违法违规问题等都作为单独词汇处理,则该句话正面情感词为“能够、认真、规范”3个,负面情感词为“不规范、问题、违法、违规、问题”5个,该句话会被识别为较强的负面。如果根据审计公告行文特点细化词典,则不规范问题、违法违规问题应该分别作为一个词来处理,于是该句话提取的正面情感词仍然是3个,负面情感词为2个,整体为弱正面。事实上,本句话到底应该归属正面、负面抑或中性,不同的人可能也会给出不同的判断结果。因此对这种存在语义歧义的文本,再完善的词典也无法百分百消除识别的误差,机器自动识别也只能一定程度降低误差率。
4.当采用机器学习进行系统自动识别时,建立各種判断和识别的标准变得非常重要。比如文本分词时如何划分词、词典里要包含哪些词、什么样的词是情感词、情感词的情感倾向方向如何判断、情感词的情感倾向程度如何确定等,这些判断和识别标准是影响分析结果准确度的决定性因素。如何建立更为科学、合理、客观且操作性强的识别标准既是政府审计结果分析的关键任务,也是需要不断探索和完善的难点。
通过优化完善上述各类判断和识别标准,政府审计文本分析中各个环节的人工判断程度会随着分析技术和工具智能化程度的提高而下降,政府审计量化结果的模糊性、不可验证性才会不断优化改善,政府审计结果的处理和利用效率才会进一步提高。
5.政府审计结果公告中既有负面评价也有正面肯定,每个公告中由于被审计企业的情况不同,审计结果公告中的负向和正向词汇都有差异。而一个公告是一个整体,公告语调的作用体现在这个公告总体所反映出的净语调,任何一个审计结果文本用户都不可能在阅读文本时单独挑负面词汇或者正面词汇做出反应。因此,研究中采用实际净语调或名义净语调在内的净语调衡量更合理,而政府审计结果公告的负面情感强度或正面情感强度只能是辅助,否则可能影响研究结果的准确性。
6.政府审计结果公告意在反映审计中发现的被审计单位的问题和情况,结果公告文本的用词具有鲜明的专业性、规范性、一致性和稳定性特征。因此,在政府审计影响因素或者作用效应的研究中,可以根据研究的主题,抽取那些直接代表或者反映研究主题的词汇形成专属语调来衡量政府审计的某个特定方面。比如,审计结果公告中反映会计核算不真实的词语,如多计、少缴、调减、虚增、账实不符、重复计提等;反映经营活动不真实的词语,如编造、虚报、虚构业务、虚假材料、虚开发票、无真实交易背景等。这些词汇反映了被审计企业在会计和经营活动中可能存在违规违法等问题,因此,在进行政府审计对公司盈余管理影响的研究中,可以提取直接描述公司会计核算和经营活动中产生盈余不真实问题行为的词语形成非真性警示语调(Unretonei,t=■)[16],以此作为政府审计专属语调进行辅助研究,从而达到更全面衡量政府审计对企业盈余管理作用效应的目的。
(二)局限
1.文本语义隐蔽性产生的歧义问题。自然语言的文本语义隐含在文字背后,其情感倾向存在一定的模糊性。比如审计结果公告中“某会计师事务所对该企业2019年度合并财务报表出具了带强调事项段的无保留意见审计报告”这句话的情感倾向属正面、负面还是中性,不同的人经专业判断可能会给出不同结果。一种观点会认为既然是“带强调事项段”,就应该属负面;也有观点认为总体上既然是“无保留意见”,应该是正面;也会有人认为是中性。从目前自然语言处理技术的应用来看,采用机器学习进行自动识别并不能避免此类问题,但是与人工判断出现歧义不同的是,机器识别可以采用同一个标准给出判断结果。
2.文本分析中的“噪声”问题。“噪声”会对数据分析造成干扰,也是影响文本分析结果准确性的重要因素。信息处理中遵循着“垃圾进垃圾出”的定律,由于文本数据具有数据量大、数据的模糊性和二义性强等特点,如何提高数据质量始终是文本分析中需要解决的难题。那些存在错误或异常的噪声数据是影响数据质量的重要因素。而且噪声数据还会造成政府审计文本量化中实际净语调和名义净语调不准确、二者之间的差异增大,进而导致利用其作为衡量指标的相关研究结果不准确,甚至产生错误的研究结论。为此,需要对文本解析后获得的数据进行预处理,即通过数据清理、集成、归约和变换等一系列方法对不完整、不准确、不一致、可信性低、难以解释和离群的数据进行处理以提高数据质量,进而提高最终分析结果的准确程度,降低误差率。
五、结语
政府审计结果的挖掘分析可以盘活政府审计的大量历史沉淀数据,发挥数据这种新型资产在政府审计治理,乃至国家治理中的价值。审计机关出具的报告、发布的公告等文本格式規范且相对固定,这为政府审计结果的分析利用提供了获得高质量数据的可能,也便于采用机器自动化处理,使分析结果更准确、可靠和可信。而且研究中还可以利用各类政府审计结果文本的分析结果定义相关指标来实现政府审计的量化衡量。因此,从数据利用的角度看,文本分析是实现政府审计结果数据利用的重要基础。
【参考文献】
[1] 董大胜.论国家审计产生的基础[J].审计研究,2020(2):3-6.
[2] 董大胜.以国家治理理论为基础深化审计理论研究[J].审计研究,2015(4):3-5.
[3] 黄溶冰,王跃堂.我国省级审计机关审计质量的实证分析(2002—2006)[J].会计研究,2010(6):70-76.
[4] 党夏宁,佟一欣.国家审计促进我国医疗卫生支出效率提升研究——基于省级面板数据的测算与实证[J].会计之友,2021(23):94-101.
[5] 唐雪松,罗莎,王海燕.市场化进程与政府审计作用的发挥[J].审计研究,2012(3):25-31.
[6] 王光远,郑晓宇.政府审计移送对司法效率的影响[J].审计研究,2019(4):11-19.
[7] 蔡春,李江涛.经济权力审计监控研究——审计理论研究的一个新领域[J].审计与经济研究,2009,24(5):3-8.
[8] 李江涛,苗连琦,梁耀辉.经济责任审计运行效果实证研究[J].审计研究,2011(3):24-30.
[9] 谢柳芳,孙鹏阁.空气污染、政府审计与地方治理——基于社会调和性与经济改革度双重维度的分析[J].会计之友,2021(9):10-18.
[10] 欧阳华生.我国国家审计公告信息分析:2003—2006[J].审计研究,2007(3):8-15.
[11] 李小波,吴溪.国家审计公告的市场反应[J].审计研究,2013(4):85-92.
[12] 宋达,郑石桥.政府审计对预算违规的作用:抑制还是诱导?——基于中央部门预算执行审计数据的实证研究[J].审计与经济研究,2014,29(6):14-22.
[13] 王春飞,郭云南.中央预算执行审计与媒体关注度——基于国家治理的视角[J].中南财经政法大学学报,2015(6):3-9.
[14] 唐大鹏,从■匀.国家审计结果公告能“精准”提升内部控制质量吗?——基于央企控股上市公司的证据[J].审计与经济研究,2020,35(3):1-11.
[15] 吴秋生,郭檬楠.国家审计“监”与“督”对国有企业资产保值增值的影响[J].财经理论与实践,2018,39(5):95-101.
[16] 王海林,张丁.国家审计对企业真实盈余管理的治理效应——基于审计公告语调的分析[J].审计研究,2019(5):6-14.
[17] 王海林,张丁.国家审计对国有企业风险承担的治理效应:促进还是抑制?——基于审计公告语调的分析[J].会计研究,2021(10):152-165.
[18] 陈宋生,李睿,刘青青.中央预算执行审计效果分析[J].审计研究,2020(1):33-42.
[19] 郑小荣,何瑞铧,曹源.基于熵权法的中国政府审计结果公告信息含量研究[J].当代财经,2018(12):123-132.
[20] 郑小荣,朱泓春.审计微信传播影响力及其影响因素研究——基于审计署微信公众号推文的实证分析[J].会计之友,2020(13):130-138.
[21] 宗成庆,夏睿,张家俊.文本数据挖掘[M].北京:清华大学出版社,2019:4.