徐超 王宇涛 陈勇
【摘 要】 党的二十大报告指出,尊重自然、保护自然、顺应自然是全面建设社会主义现代化国家的内在要求,开展自然资源审计的重要性不言而喻。当下自然资源审计虽然已经取得了一定的成果,但在图像等非结构化数据的处理上仍然效率不高。水资源作为自然资源的重要组成部分,其审计工作的重要性不言而喻,而且图像等非结构化数据在水资源审计数据中占比很大。为此,文章以自然资源审计中的水资源审计为例,聚焦于水污染图像数据处理,设计了一种基于深度学习的自然资源审计数据处理算法。通过对主流YOLOv5 网络的改进,使其在水污染图像数据处理的准确率和处理速度等方面具有良好的表现,为提升自然资源审计的效率提供了有力支撑。
【关键词】 自然资源审计; 深度学习; 目标检测; 轻量化网络; YOLOv5; 水资源审计
【中图分类号】 F234.3 【文献标识码】 A 【文章编号】 1004-5937(2024)12-0010-09
一、引言
党的二十大报告指出,大自然是人类赖以生存发展的基本条件。尊重自然、顺应自然、保护自然,是全面建设社会主义现代化国家的内在要求。必须以习近平生态文明思想为指引,牢固树立和践行绿水青山就是金山银山的理念,站在人与自然和谐共生的高度谋划发展[1]。在新时代背景下,自然资源审计显得尤为重要,这也是打赢污染防治攻坚战的关键一环。
水资源作为自然资源的重要组成部分,必须高度重视水资源审计工作,从而实现对水资源的保护。我国水资源短缺情况较为严重,人均淡水量低于世界平均水平,且存在较为严重的污染问题。结合当下自然资源审计缺乏对于非结构化数据的关注[2]且存在效率低下的问题,本文以水资源审计为例,聚焦水污染治理[3],而水污染图像数据作为水资源审计数据中占比较大的数据,自然就成为审计人员必须重点分析和处理的。此外,图像数据可以很好地体现出水污染治理的情况,便于审计人员找出关键审计点,避免审计方向出现偏差。水污染图像的处理一般采用人工方式,导致大量人力物力被浪费在人工判别水污染图像的工作中。具体而言,审计人员在进行水資源审计过程中,会遇到大量水污染图像,以目前审计人员的业务水平可以很好地对少量图像进行判别。但是水污染图像的数量一旦上升,审计人员难免会因为工作量剧增,导致对部分图像的判别出现错误。长此以往,判别错误的图像累积到一定数量,必然会对审计工作产生不良影响。审计人员不得不额外分配时间对水污染图像进行校对,从而导致审计工作时间被浪费,这与水资源审计工作的初衷相违背。此外,部分水污染图像中存在一些较小的污染物,很难精确地通过肉眼辨别,需要借助其他技术手段来进行判别。
随着近年来计算机视觉技术的不断发展,深度学习算法模型开始得到广泛应用。较之传统机器学习算法,深度学习算法通过模拟神经元传递信息的方式,实现了算法的高精度。传统目标检测算法多基于手工提取特征,导致识别精度较低,而基于深度学习的目标检测算法可以很好地实现高精度的图像自动化检测,从而节省大量人力物力,便于有关部门将更多的成本投入到图像检测后的具体治理方法研究中,为打赢污染防治攻坚战提供了有力保障。
在深度学习技术与审计结合方面,相关学者从不同角度展开了研究。吴勇等[4]在明确深度学习概念的基础上,结合国际“四大”会计师事务所的实际应用探究了深度学习在审计中应用的策略和路径。蒋楠[5]分析了深度学习和人工智能技术对国家审计的影响、风险和挑战,为推进国家治理体系和治理能力现代化提供借鉴和参考。张庆龙等[6]在区分内部审计数字化、智能化概念的区别与联系基础上,聚焦于新一代内部审计智能化中大规模深度学习的特点,提出了智能化内部审计的一系列可能与挑战。邵磊落等[7]采用深度学习方法挖掘财务报表上资产、资金的状态以及资产、资金在流转中的增值性与内部控制政策的因果关系,实现结构化数据与非结构化数据的融合,最终形成一种内部控制综合评价体系。吴勇等[8]将深度学习的智能分析与审计师的经验修正有效融合,不断扩充、更新、迭代审计数据仓库,面向审计业务全流程,构建深度学习模型应用于审计业务不同阶段的集成性、整合性框架,以便更好地指导和推动深度学习模型和方法的审计应用。综上,目前深度学习与审计结合主要还是停留在理论框架上,且具体应用方面也多聚焦于结构化数据的处理。
二、研究现状
现阶段自然资源审计中,审计工作一般针对结构化数据展开,结构化数据的研究已经有了较为完善的方法体系。李妍茹等[9]通过匹配中国主要流域重点断面水质监测数据和审计试点信息,发现审计试点后水质在整体层面上得到显著改善,治理效应主要体现为感官效果较直接的溶解氧有了较为明显的改善。但是现实生活中,非结构化数据的占比很大,某种程度上远大于结构化数据。这种情况在自然资源审计中表现得尤为明显,大量数据以图像形式存储于相关数据库中。耿建新等[10]借鉴美国政府问责办公室(GAO)水资源审计经验时发现,美国GAO在编制水资源审计报告时采用多样的审计主题,且审计时关注的数据形式多样,其中就涉及到了不同类型的图片数据,这对于我国探索自然资源审计方法具有重要借鉴意义。此时,如何高效准确地处理非结构化数据就显得尤为重要。
然而,传统的深度学习算法在处理图像时准确率较低且速度较慢,同时实际应用时又局限于设备算力,无法在较小算法复杂度的情况下完成图像处理。因此,相关学者通过借鉴深度学习算法(主要是卷积神经网络算法)的思想,创造出了基于深度学习的目标检测算法。这一图像领域的分支算法能够很好地解决自然资源审计中图像数据处理的问题。
针对本文中聚焦的水污染图像处理问题,现阶段已有部分学者开展了研究工作,以期实现高效自动的水污染图像检测。宋一格等[11]提出了基于分组卷积与双注意力机制的河流水面污染图像分类算法模块(Grouped Convolution Dual Attention,GCDA),在分组卷积的基础上引入简化的双注意力机制,使用较少的参数量增强了网络对图像的特征提取能力,进一步提升图像分类效果。该模型相较于传统模型在河流污染物图像的二分类任务中有较明显的效果提升。李国进等[12]针对人工湖中的水面漂浮物检测问题,提出了一种基于改进YOLOv3的水面漂浮物目标检测算法,目标检测包括目标识别与目标定位。通过对广西大学校内镜湖与碧云湖的数据分析,发现改进的YOLOv3算法提高了识别精度且降低了定位误差。但他们还停留在使用复杂度较高的算法来完成检测,虽然检测精度不差,但是消耗的硬件资源较大,从而导致检测速度较慢。
综上所述,为了实现高效快速的水污染图像检测,本文选用YOLOv5网络模型[13]作为基础模型。同时为了实现网络轻量化的目标,本文在原有YOLOv5的基础上替换骨干网络[14]。用于替换原有骨干网络CSPDarknet的MobileViT[15]采用现下流行的Transformer思想,该思想以前多应用于自然语言处理中,可以有效实现模型轻量化,减少模型参数。同时将MobileViT中的激活函数从原有的SiLU替换为FReLU[16],在不大幅提升模型参数量的情况下加速模型收敛的速度,解决Transformer模型收敛较慢的问题。最后将YOLOv5默认的非极大值抑制模块替换为Soft-NMS[17]模块,在不需要额外训练的前提下提升检测的准确率,且不会增加算法的复杂度。
三、模型构建
(一)基于深度学习技术的自然资源审计业务流程
自然资源审计的目标是对相关自然资源资产管理和生态环境保护情况进行科学评价,以期实现经济社会的可持续发展[18]。在引入深度学习技术后,自然资源审计将会发生巨大改变。
本文针对基于深度学习的目标检测算法在自然资源审计中的应用进行研究,以期实现对于图像的自动化检测。由于需要实现更高效更准确的水污染图像检测,因此需要对现有模型进行改进。在详细阐述本文的模型改进思路之前,首先需要分析引入改进模型对于自然资源审计的影响。
常见审计业务一般分为审计准备、审计实施、审计报告和审计整改四个阶段,自然资源审计也不例外。通过应用本文的改进模型,可以很好地在这四个阶段对自然资源审计进行优化,以期达到更好的审计监督效果。下文将通过对具体步骤的分析来阐述优化的具体效果,并结合具体的审计案例进行分析。优化后的自然资源审计业务流程如图1所示,其中虚线部分为引入深度学习技术后重点变化的步骤。
在审计准备阶段,审计人员将会组建审计小组,根据相关的审计要求下达审计通知书。由于改进模型的加入,审计人员将会在编写审计通知书时更有针对性,即针对改进模型的特點要求被审计单位提供相关数据。这样可以避免被审计单位提供的数据含有大量“杂质”,影响后续审计工作的效率。接下来,审计人员将会制定适用于改进模型的数据规范,进一步去收集相关的审计数据,最终将所有数据进行整理并清洗,确保后续输入模型的数据完全符合数据规范。例如,在水污染防治绩效审计中,审计人员需要事先确定审计的目标。一旦目标确定,就需要进行数据的采集。相对于传统做法,改进模型的引入给审计人员提供了可靠的处理图像数据的方法,因此,审计人员可以把图像数据纳入审计数据库中,丰富审计数据的类型,进而拓宽审计的角度。
在审计实施阶段,审计人员将采用本文的改进模型进行审计。本文以水污染图像的审计工作切入,有别于传统水污染图像审计采用人工方式对图像等非结构化数据进行审计,本文的模型可以实现自动化图像检测。具体来说,审计人员首先在技术人员的帮助下,将改进模型部署至本地,然后将采集得到的水污染图像上传至本地电脑中,通过运行事先完成配置的改进算法来完成图像的检测工作,通常来说单张图像在几十毫秒内即可完成检测。完成检测后,图像会自动保存,便于后续审计人员进行使用。审计人员待图像全部完成检测后,即可开始对结果进行汇总,为之后撰写报告提供充足的材料。水污染图像审计作为自然资源审计中的个例,虽有其特殊性,但其普遍性不言而喻。本文的改进模型针对自然资源审计中最常出现的图像数据进行设计,自然可以推广至所有的自然资源审计场景中。在推广时,审计人员可在技术人员的帮助下针对不同场景重新制作标签并训练对应数据集,应用迁移学习的思想完成模型的适配,最终即可实现各种自然资源审计图像的自动化检测。同样的,具体到水污染防治绩效审计中,整个审计工作通常包括水污染防治政策、法律法规、资金管理、工程建设、运营管理等方面,因此数据的处理将会比较烦琐。改进模型的引入可以很好地节省数据处理的时间,尤其是图像等非结构化数据的处理时间,让审计人员将更多的时间放在对资金和项目这些关键审计点的审计上。
在审计报告阶段,审计人员将会对先前处理好的数据进行整合分析。改进模型完成检测后将会给出各类污染物的类型和数量,审计人员将对这些数据进行归类,找出污染物数量较多和类型较为丰富的图像,从而找出重点污染区域,进而开展重点污染区域的进一步审计工作。相较于传统审计,应用改进模型可以很好地节省非重点区域的审计时间安排,也有助于审计重点的突出。在完成重点污染区域的进一步审计工作后,审计人员能够编写出更有针对性的审计报告,实现高效审计。在水污染防治绩效审计中,改进模型将会极大提高审计报告的准确度,同时也可以和其他结构化数据得出的审计结论进行互补,更好地增强报告的说服力。由于水污染防治绩效审计中需要密切关注资金流转过程,图像数据得出的结论可以监控资金的使用成果,即更多的资金应该被投入到重点污染的区域,然后达到较好的防治效果。若事实与其相悖,则被审计单位必然存在一定的执行问题,需要对其进行及时问责并督促其改变原有的错误方案,使用更加高效合理的审计方案来继续完成水污染防治。
在审计整改阶段,审计人员根据先前完成的审计报告开展对于重点区域的整改监督工作。审计人员会将审计结果事先进行披露,便于社会各界人员进行监督,从而实现审计过程透明化。相较于传统方式,审计人员在更加精确的审计报告的基础上能够更有说服力,避免相关负责人员推诿责任、敷衍了事,更快督促相关负责人员开展整改工作。在整改过程中,多部门进行联动,协同工作,提高工作效率。相关负责人员可以实现污染治理的精准化、精细化,达到更好的治理效果,打好污染防治攻坚战。最终再由审计人员对于整改的结果进行验收,根据情况进行进一步的追踪审计,必要时可以再次重复之前的步骤,调用改进模型对于阶段性改进成果进行检测,发现整改时存在的一些问题,便于被审计单位针对相关问题进行整改方向上的调整,直到问题解决。任何审计终将归结于问题的解决,水污染防治绩效审计也不例外。在引入改进模型后,审计工作变得更加标准化、自动化,也就有了长期审计监督的可能。许多领导干部可能在审计结束后存在松懈的问题,很容易让已经完成治理的区域重新被污染,导致先前的防治工作前功尽弃。在大部分审计人员撤出审计工作后,改进模型就起到了其“守夜人”的作用,能够很好地代替审计人员进行持续审计。
如表1所示,本文改进的算法模型相较于二阶段目标检测的Faster RCNN有了大幅提升,模型参数量出现指数级下降,并且精度提升明显。DETR同样引入Transformer,精度很高,但是模型参数量巨大,与本文的改进模型相比呈现指数级差距且检测速度极慢,完全无法应用于本文的水污染检测场景。上述两种二阶段目标检测算法在本文水污染检测场景下均表现不佳。在一阶段目标检测算法中,SSD、YOLOv3-tiny、YOLOv4-tiny速度均快于本文的改进模型,但是检测精度均低于本文改进模型且参数量也大于本文改进模型。考虑到本文的应用场景,检测精度的重要性应该是更高的,且实际使用时对于这个量级的检测速度差距也不会有太大的感知。因此本文模型较以上三种算法速度慢的劣势并不是特别明显,可以通过精度高的优势来进行弥补。
在实际水资源审计中,同时选取水污染图像数据集中已有图像和网络上随机获取的水体污染图像,结果如图5所示,其中上半部分为数据集内图像检测结果,下半部分为数据集外图像检测结果。从结果可以明显看到,本文的改进模型可以有效检测到图像中水污染的位置并且判定污染的类别,完成了目标检测算法的分类与定位的目标,说明本文的算法模型已经可以完成一般情况下水污染图像的检测,具有较强的泛化能力,可以大范围应用于非结构化数据的识别与处理。审计人员可以通过模型检测结果图像获取到水污染图像中的污染信息,这些污染信息可以作为后续审计点挖掘的关键证据,同时还可以写入审计报告中,很好地丰富了审计报告的内容,使得审计报告更加全面且更有说服力。
综上所述,通过模型间的对比和实际检测,得出本文的改进模型可以在较高精度的情况下完成较为快速的检测。
网络结构变化会对网络性能产生影响,因此必须对三种改进策略进行不同组合,即消融实验,从而进一步证明本文改进模型的有效性,消融实验结果如表2所示。
消融实验结果中第一行是原算法的结果,√表示加入对应改进策略后的网络模型。由对比结果可以很明显地看到替换了主干网络后,参数量大幅度下降,减少了一个量级,但检测精度只下降了不到3个百分点,同时检测速度提升了10。继续引入FReLU后,检测精度有了0.5个百分点的提升,但检测速度下降了10,与原始模型持平。继续引入Soft-NMS后,检测精度稍有波动,可以理解为实验误差,但检测速度已经和只替换主干网络时非常接近。综上,本文的改进算法模型满足了改进要求,是优于原算法的。
五、改进YOLOv5模型在自然资源审计中的应用价值
通过上文对于模型实际在自然资源审计中的应用分析可以发现,本文的模型对于改进当前的自然资源审计业务流程具有重要意义。本文所建立的模型能够很好地处理海量的图像数据,为后续审计工作提供预测分析能力,从而实现必要的审计决策支持。接下来将从两个角度来分析其应用价值。
(一)非结构化信息识别功能
现阶段自然资源审计工作多关注于结构化数据,例如水资源审计多聚焦于流量、降水、地下水等水体的指标化数据,而忽略了图像数据。自然资源数据恰恰多表现为图像数据,图像中蘊含了大量对于审计工作非常重要的数据。以本文的水污染图像为例,在对某地进行水资源审计时,水资源的保护工作必然会成为审计人员的关注点。在传统方法下,审计人员多会关注于河流中传感器采集到的水污染指标化数据,例如化学需氧量、总磷和高锰酸盐指数,而水污染图像往往会被忽略。水污染图像通常可以表达出不同地区的污染程度以及污染的具体位置,这些信息对于审计人员判断当地的水污染治理效果非常关键,审计人员也可以凭借这些信息精准地对污染程度高的地区的相关负责人员进行问责,及时找出污染治理的问题点。本文的改进模型可以很好地对水污染图像中的这些信息进行识别和提取,大大节省了审计人员的时间,解决了传统审计中对于非结构化数据没有有效处理方法的弊端。
(二)决策支持功能
审计过程涉及复杂的专业判断,特别是在确定重要性水平、评估审计风险、沟通关键审计事项和确定审计意见类型时,要求审计师必须从不同的角度综合考虑大量的证据来做出最终的决定。
深度学习具有学习能力强、覆盖范围广等特性[8],这就使得深度学习方法可以很好地综合各种信息,从而得出更加全面且更有说服力的结论。本文所使用的模型也属于一种深度学习模型,且专注于图像中指定目标的分类与定位,属于特殊化的深度学习模型。本文模型擅长提取水污染图像数据中的污染物种类和数量信息,这为审计人员后续的工作提供了有力帮助。模型提取出的相关信息有助于审计人员寻找审计点,进一步地确定后续审计工作的要点。再结合传统审计中提取的结构化数据,即可实现全方位多角度的水资源审计。
在最终决策时,审计人员可以将水污染图像中的信息整合入审计报告中,形成最终的审计证据,从而给出合理的审计意见。审计人员在和有关部门交流时,可以给出相关审计意见的有力证据,提升了审计部门的公信力。有关部门后续可以据此制定相关的改进措施,对症施策,减少不必要的人力物力浪费。
六、结语
针对自然资源审计对非结构化数据处理效率低下的问题,本文以水资源审计中水污染图像处理为例,结合深度学习的思想,提出了一种改进的YOLOv5算法。首先将主干网络替换成轻量化的MobileViT,然后将MobileViT中的激活函数替换为FReLU,最后将非极大值抑制算法替换成SoftNMS。实验表明,改进模型的参数量大幅下降,小于现阶段主流的目标检测算法,且模型精度得到了很大程度的提升,检测速度也得到了一定程度的提升。实验结果表明,本文的检测算法可以很好地被应用于水污染图像检测中,具备快速、高精度的特点。
然而,本文的研究也只局限于图像数据,且改进模型只考虑了图像检测,还未涉及其他类型的自然资源审计数据,例如:音频、视频等。未来可以通过构建对应类型的深度学习模型来实现对于不同类型数据的自动化处理,进一步完善自然资源审计数据研究体系。
【參考文献】
[1] 习近平.高举中国特色社会主义伟大旗帜为全面建设社会主义现代化国家而团结奋斗:在中国共产党第二十次全国代表大会上的报告[M].北京:人民出版社,2022.
[2] 邓晓岚,余远剑,茅金焰,等.领导干部自然资源资产离任审计的大数据技术应用研究[J].审计研究,2020,
217(5):19-29.
[3] 徐志耀,袁璐,李清骋,等.政府环境绩效审计助力水污染防治的效应研究——基于“三河三湖”显性中介的分析[J].南京审计大学学报,2023,20(2):1-11.
[4] 吴勇,余洁,王尚纯,等.人工智能审计应用的国际进展[J].中国注册会计师,2021(6):121-126.
[5] 蒋楠.论人工智能时代国家审计变革与发展[J].财会月刊,2022(11):104-109.
[6] 张庆龙,邢春玉,芮柏松,等.新一代内部审计:数字化与智能化[J].审计研究,2020(5):113-121.
[7] 邵磊落,周成轩,黄琪华,等.面向电网企业内控审计的知识图谱建模研究[J].会计之友,2021(20):122-128.
[8] 吴勇,陆艺,朱卫东,等.深度学习模型应用:面向审计业务全流程的整合性框架[J].财会月刊,2023,44(1):108-116.
[9] 李妍茹,李璐,翟华云.自然资源资产离任审计与水污染防治——基于中国主要流域水质监测的经验数据[J].江西社会科学,2022,42(5):90-100.
[10] 耿建新,胡天雨.编制自然资源资产负债表 搞好自然资源资产离任审计——美国GAO水资源审计的借鉴[J].财会通讯,2020(1):3-12.
[11] 宋一格,王宁,李宏昌,等.基于分组卷积与双注意力机制的河流水面污染图像分类[J].计算机系统应用,2022,31(9):250-256.
[12] 李国进,姚冬宜,艾矫燕,等.基于改进YOLOv3算法的水面漂浮物检测方法[J].广西大学学报(自然科学版),2021,46(6):1569-1578.
[13] 杨世忠,王瑞彬,高升,等.基于YOLOv5的草莓轻量化网络检测模型[J].国外电子测量技术,2023,42(4):86-95.
[14] 张阳婷,黄德启,王东伟,等.基于深度学习的目标检测算法研究与应用综述[J].计算机工程与应用,2023,59(18):1-13.
[15] MEHTA S,RASTEGARI M.MobileViT: light-weight,general-purpose,and mobile-friendly vision transformer[Z].2021.
[16] QIU S,XU X,CAI B.FReLU:flexible rectified linear units for improving convolutional neural networks[C].2018 24th International Conference on Pattern Recognition (ICPR).IEEE,2018:1223-1228.
[17] BODLA N,SINGH B,CHELLAPPA R,et al.Soft-
NMS——improving object detection with one line of code[C].Proceedings of the IEEE International Conference on Computer Vision,2017:5561-5569.
[18] 中央审计委员会办公室,审计署.关于印发《“十四五”国家审计工作发展规划》的通知[A].2021.
[19] REDMON J,DIVVALA S,GIRSHICK R,et al.You only look once:unified,real-time object detection[C].Computer Vision & Pattern Recognition.IEEE,2016.
[20] LIU W,ANGUELOV D,ERHAN D,et al.Ssd:Single shot multibox detector[C].Computer Vision ECCV 2016:14th European Conference,Amsterdam,The Net-
herlands,October 11-14,2016,Proceedings,Part I 14.Springer International Publishing,2016:21-37.
[21] REN S,HE K,GIRSHICK R,et al.Faster r-cnn: towards real-time object detection with region proposal networks[J].Advances in Neural Information Processing systems,2015,28.
[22] REDMON J,FARHADI A.Yolov3:An incremental improvement[Z].2018.
[23] BOCHKOVSKIY A,WANG C Y,LIAO H Y M.Yolov4:optimal speed and accuracy of object detection[Z].2020.
[24] HOWARD A,SANDLER M,CHEN B,et al.Searching for MobileNetV3[C].2019 IEEE/CVF International Conference on Computer Vision(ICCV).IEEE,2020.
[25] CARION N,MASSA F,SYNNAEVE G,et al.End-to-
end object detection with transformers[C].European conference on computer vision.Cham:Springer International Publishing,2020:213-229.
[26] WEI L,DRAGOMIR A,DUMITRU E,et al.SSD:single shot multibox detector[J].Springer,Cham,2016.