基于RPA的财务机器人数据自动化分类系统设计

2024-12-06 00:00:00朱碧琴
中国新技术新产品 2024年13期
关键词:财务机器人

摘要:为提高财务数据处理的自动化水平,本文设计了一种基于RPA技术的财务机器人业务数据自动化分类系统。该系统在收集财务数据后,根据分类规则进行自动化分类,并将结果存储于数据库中。分类规则基于财务数值、文本和业务逻辑构成,并采用RPA技术进行参数设置,执行逻辑编写。数据建模使用Apriori算法挖掘数据模式,生成关联规则,并直接应用于财务机器人的数据自动化分类系统中。经测试,基于RPA技术的财务机器人数据自动化分类系统在高并发环境下的稳定性良好,能够满足大规模数据分类的需求。

关键词:RPA技术;财务机器人;数据自动化;分类系统设计

中图分类号:F273""""""""" 文献标志码:A

随着信息技术飞速发展,企业对财务数据处理的自动化和智能化需求日益增长。为提高财务数据的处理效率和准确性,本文设计了一种基于机器人流程自动化(Robotic Process Automation,RPA)技术的财务机器人数据自动化分类系统。该系统利用RPA技术,可实现财务数据的自动收集、清洗和转换,并采用Apriori算法挖掘数据模式,生成关联规则,从而实现财务数据的自动化分类。此外,除了对财务机器人数据自动化分类系统进流程、数据建模、应用与监控等方法进行设计外,还对多个用户同时向财务机器人输入数据后的情况进行了测试分析。测试结果表明,基于RPA技术的财务机器人数据自动化分类系统在高并发环境下的稳定性良好,能够满足大规模数据分类的需求。本文基于RPA的财务机器人数据自动化分类系统旨在推动企业财务管理现代化进程,提升企业的核心竞争力。

1流程设置

1.1数据处理

设计该系统时,首要任务是对财务数据进行处理。机器人会应用RPA技术自动收集、清洗和转换各种类型的财务数据,确保数据的完整性和准确性[1]。基于RPA技术的财务机器人数据自动化分类流程如图1所示。

在确保机器人有权限访问并连接财务数据源的情况下,机器人能够应用RPA技术自动从会计软件、银行对账单、发票、工资单等多个财务数据源中收集数据,并对数据进行清洗,以消除重复、不完整、不准确或无关数据。去除重复记录、填补缺失值、纠正错误和标准化数据格式后,将清洗的数据转换为适合分类的格式。采用RPA编译将数据转换为适合机器学习模型的格式。转换后,财务机器人可对数据信息进行验证,以确保其完整性和准确性。再将不同来源的数据集成到一个统一的数据集中,处理数据源间的冲突和重复问题,并将数据存储到数据库中,以支持后续的数据分析。

1.2设置分类规则

在基于RPA技术的财务机器人业务数据自动化分类系统中,处理规则是保证数据正确分类的关键[2]。RPA数据自动化分类系统处理规则流程如图2所示。

在基于RPA技术的财务机器人业务数据自动化分类系统中,明确财务数据分类的需求和目标可识别出具体的分类规则[3]。分类规则由具体财务数值、财务发票文本、财政年度以及其他业务逻辑构成。设置参数时,需要根据定义好的规则编写具体的执行逻辑,并为每个规则设置相应的参数。参数设定为固定值——金额、变量——日期以及外部源数据——市场利率。设计数据验证流程可保证输入数据符合预设格式标准。对于不符合要求的数据,需要记录异常、触发警报,并对其进行异常处理。确定规则并验证数据后,财务机器人数据自动化分类系统将设计自动化分类流程,使用循环结构遍历所有数据并应用分类规则。最后根据配置结果输出报告,生成详细财务数据信息,并根据报告结果进行反馈循环,以持续优化、调整分类规则,满足企业的财务数据分类需求。

2数据建模

2.1Apriori算法挖掘

在基于RPA的财务机器人数据自动化分类系统中,Apriori算法有助于识别数据中的模式和关联,从而辅助生成分类规则[4]。扫描数据集,并统计每个项的支持度计数,可生成频繁1-项集。基于频繁k-1项集,可连接产生候选k-项集。对候选k-项集进行剪枝,即可去除不满足最小支持度要求的候选项。计算每个候选项集在数据集中出现的支持度,可识别出频繁项集,即在数据集中经常出现的物品组合。支持度计算过程如公式(1)所示。

(1)

式中:x为一个物品或物品组合,即要计算支持度的项集;Sx为物品x的支持度,即物品x在所有交易中出现的概率;Tc为所含物品x的交易数,即数据集中所含物品x的交易数量;Tt为总交易数,即数据集中的总交易数量。

得到支持度后,根据最小支持度阈值筛选出频繁k-项集,作为下一轮迭代的基础,并重复进行连接、剪枝、计算支持度和筛选频繁项集的步骤,直到无法生成新的频繁k-项集为止。最后,基于挖掘到的频繁项集生成关联规则,并计算置信度等指标。置信度指标计算过程如公式(2)所示。

(2)

式中:(x→y)为关联规则,其中x是规则的前提部分,y是规则的结论部分,表示在购买物品x的情况下也购买物品y;S(x,y)为同时含有物品x和y的交易数,即数据集中同时含有物品x和y的交易数量;S(x)为物品x的支持度,即物品x在所有交易中出现的概率,在此处可用于计算购买物品x时也购买物品y的概率;Cd(x→y)为关联规则的置信度,即在购买物品x时也购买物品y的概率,该值可衡量关联规则的强度和可靠性。

置信度指标可评估关联规则中前提部分与结论部分间的相关性。高置信度表明在前提条件下出现结论的概率较高,规则更可靠。

2.2生成关联规则

关联规则可由频繁项集推导得出[5]。根据最小支持度和最小置信度阈值,从频繁项集中选择具有较高支持度和置信度的项集,将其作为关联规则的候选项。对于每一个频繁项集,生成所有可能的关联规则。假设频繁项集为{A,B,C},可以生成的关联规则包括A≥B,C;B≥AC;C≥A,B;A≥B;A≥C;B≥A;B≥C;C≥A;C≥B。计算生成的每个关联规则的置信度。如果置信度大于等于最小置信度阈值,则将该关联规则保存下来。对于每个保存下来的关联规则,根据规则的前置条件和结论部分进行规则命名和描述。如规则A≥B中,C可以命名为“购买A通常伴随购买B和C”,并对其进行解释和注释,以便于后续理解使用。根据增加或减少频繁项集的选择调整最小支持度和最小置信度阈值,以获得更符合实际需求的关联规则。最后将生成的关联规则应用于财务机器人的数据自动化分类系统中,辅助分类规则的生成和优化。

3应用与监控

3.1关联规则应用

在应用过程中,利用生成的关联规则帮助财务机器人更好地理解数据并进行自动化分类,从而提高分类系统的准确性、效率和智能化水平[6]。同时,计算余弦相似度可衡量2个向量间的相似程度,进而在关联规则挖掘中评估规则间的相似性,以更好地理解数据间的关系和模式。余弦相似度是指将2个向量在空间中进行投影并计算二者间夹角的余弦值来衡量其相似程度。分子表示2个向量间的内积,分母表示各自长度的乘积。对于任意2条关联规则对应的向量,余弦相似度计算过程如公式(3)所示。

(3)

式中:x和y分别为2条关联规则对应的向量;xi和yi分别为2个向量在第i个维度上的取值;Σi xi. yi为2个向量x和y中对应维度值的乘积之和,此部分计算了2个向量在每个

维度上的相似程度为2个向量各自每个维度值的平方和开根号后的乘积,此部分计算了2个向量在每个维度上的长度。

余弦相似度值范围为[-1,1],其中1为完全相同,-1为完全不同,0为无相关性。计算余弦相似度,比较不同规则间的方向关系,从而更好地理解数据间的关系和模式。

3.2性能监控

在完成财务数据的自动化分类流程和关联规则的生成后,为了确保系统的稳定性、准确性并适应可能的变化,需要对系统进行性能监控与调优。首先,应持续监控数据清洗的质量,确保数据的准确性和完整性。通过抽样检查或全量检查相结合的方式,可验证数据质量。其次,采用交叉验证测试来评估分类系统的准确率。将财务数据中的原始数据集划分为训练集和测试集,并使用训练集数据训练分类模型。将训练集数据划分为K个等份,每次保留一个份作为测试集,其余(K-1)份作为训练集,重复k次,得到k个模型评估结果。最后,统计每次交叉验证的分类结果,计算分类系统的准确率。分类系统的准确率计算过程如公式(4)所示。

×100%(4)

式中:Ac为准确率;Cs为模型正确预测的样本数量;Ts为总的测试样本数量。

将k次交叉验证的准确率取平均值,即可得到最终准确率评估结果,计算过程如公式(5)所示。

Acyi(5)

式中:Fa为最终准确率;k为交叉验证的折数,表示数据集被划分为子集进行验证的子集数量;Acyi为在第i折验证所得的准确率。

在交叉验证过程中,对每一次验证得到的准确率进行求和,并取平均值作为最终的准确率评估指标,由此可以综合考虑所有折的表现,更全面地评估分类系统的性能。

4测试评估

4.1测试准备

基于RPA技术的财务机器人业务数据自动化分类系统的集成测试以Windows Server2019为操作系统,部署Intel Core i7-10700KF处理器,以满足系统快速处理大量财务数据的基础需求。同时,采用Corsair Vengeance LPX16GB(2×8GB)、DDR43200MHz内存,以便系统能够同时处理多个任务和数据集,并便于机器人与不同的财务系统快速进行数据交换。服务器还设置有Intel X550-AT210GbE SFP+Network Interface Card网络接口。建立高速稳定的网络环境,以确保机器人可以无障碍地在不同系统间传输数据。完成测试环境搭建后,根据功能测试验证财务机器人在高并发情况下的数据收集性能。模拟多个用户同时向数据源输入数据,并运行数据收集任务,测量收集任务的响应时间和系统资源占用情况,从而验证系统在高并发情况下能否保持性能的稳定性。

4.2测试结果

为验证基于RPA技术的财务机器人数据自动化分类系统在高并发情况下的数据收集性能,模拟多个用户同时向数据源输入数据,并运行数据收集任务,系统响应时间和资源占用情况见表1。

经测试,随着用户数增加,系统响应时间基本保持在2s左右,表明系统在高并发情况下仍能保持较快的数据收集速度。TC-6(60个用户)的响应时间为2.5s,略高于其他测试用例,但仍然在可接受范围内。另外,CPU利用率随着用户数增加而逐渐上升,但利用率始终保持在60%以下,证明CPU资源没有达到满载,仍有余力处理更多的任务。同时,内存利用率同样随着用户数增加而上升,但总体保持在55%~63%,表明内存利用率的增加幅度也相对平稳,系统内存管理得当,表明基于RPA技术的财务机器人数据自动化分类系统在高并发环境下的稳定性良好,能够满足大规模数据分类需求。

5结语

基于RPA技术的财务机器人数据自动化分类系统为企业提供了一种高效、准确的财务数据处理解决方案,有助于提升企业的财务管理水平和核心竞争力。设计了基于RPA技术的财务机器人数据自动化分类系统,可实现财务数据处理的自动化和智能化,有效提高企业财务数据处理的效率和准确性。利用RPA技术,可实现财务数据的自动收集、清洗、转换和分类功能,采用Apriori算法挖掘数据模式并生成关联规则,可满足大规模数据分类的需求。经测试,在高并发环境下,系统表现稳定,响应迅速,并且资源利用率在可接受范围内。表明基于RPA技术的财务机器人数据自动化分类系统具备处理大量财务数据和快速交换数据的能力,可用于企业日常财务数据处理、分析和报告。

参考文献

[1]彭雪妍. 基于财务数字化转型背景下的国企集团司库管理体系建设路径探析[J]. 国际商务财会,2023(23):49-52.

[2]徐强艳,李璐涵. 数字化转型背景下RPA财务机器人在中小型企业财务管理中的应用探究[J]. 老字号品牌营销,2023

(23):98-100.

[3]黄月薪,陈兵,王耀东,等. 机器人流程自动化技术驱动科技期刊数字化创新发展的应用路径——出版流程转型升级视角[J]. 科技管理研究,2023,43(23):241-246.

[4]张晓玮,刘波,戈姗姗,等. 基于人工智能的财务管理创新——财务机器人在XH医院的应用[J]. 财会月刊,2022

(23):119-126.

[5]黄成庆,董文宇. 基于RPA技术的医院医疗收入核算流程优化研究——以FY医院为例[J]. 会计之友,2022(16):40-46.

[6]张媛. 基于RPA技术的财务机器人业务数据自动化分类系统[J]. 自动化与仪器仪表,2022(1):168-171.

猜你喜欢
财务机器人
浅析财务机器人对基层财会人员的影响
财税月刊(2018年3期)2018-07-04 09:12:08
财务机器人的出现对会计行业的利弊分析
智富时代(2018年2期)2018-05-02 07:56:26
财务机器人对会计行业的影响及其应对策略
会计之友(2018年7期)2018-04-26 05:37:56
刍议财务机器人对企业财务管理的影响与促进
浅谈财务机器人的出现对于基层财务人才培养模式改革的影响
商情(2018年9期)2018-03-29 09:01:38
财务机器人为财会业带来的挑战和机遇
财务机器人背景下财会人员如何应对职业危机
中国市场(2018年7期)2018-03-19 16:32:46
企业财务会计向管理会计转型方法研究
中国经贸(2018年3期)2018-03-07 09:03:44
“财务机器人”对传统会计人员影响研究
商业经济(2018年2期)2018-02-28 22:05:22
财务机器人对房地产集团公司财务共享中心建立的影响