大数据技术在核酸检测费用结算审计中的应用

2023-06-27 12:59陈希晖刘妍妍王斌
中国内部审计 2023年2期
关键词:疫情防控

陈希晖 刘妍妍 王斌

[摘要]核酸检测是新冠疫情防控工作的重要一环,切实做好核酸检测费用结算审计工作,事关防疫资源分配的公平合理性。由于全员核酸检测本身具有数据量大、情况复杂的特点,审计机关需要结合现实环境采取新的审计方法,本文结合某区(县)核酸检测费用结算审计实例,研究了大数据环境下如何应用大数据技术高效开展核酸检测费用结算审计。提出了核酸检测费用结算审计疑点数据特征,构建了大数据审计流程,并编写了详细的SQL(Structured Query Language ,结构化查询语言)语句运用到疑点数据筛查实例中。

[关键词]疫情防控   大数据审计   核酸检测   SQL语言

一、引言

核酸检测是判断新冠病毒感染的“金标准”,根据有关规定,核酸检测“应检尽检”所需费用由各地政府承担,“愿检尽检”所需费用由企事业单位或个人承担。疫情三年以来,核酸检测费用成为地方政府的一项重要支出,未来一段时间是这项支出结算的重要窗口期。审计是党和国家监督体系的重要组成部分,能够发挥“经济体检”的作用。切實做好核酸检测费用审计结算工作,事关防疫资源分配的公平合理性,同时对促进国家善治具有重要作用。

大数据审计是对数据开展深入、复杂和综合的分析,通过构建“总体分析、 发现疑点、分散核实、系统研究”的数字化审计模式,能够开展跨层级、跨地域、跨系统、跨部门和跨业务的深入挖掘与分析,提升审计发现问题、评价判断和宏观分析的能力。为响应2020年2月国家卫生健康委员会发布的《关于加强信息化支撑新型冠状病毒感染的肺炎疫情防控工作的通知》的有关要求,包括疾控中心、医院、第三方医学实验室等在内的机构积极运用互联网+、大数据等信息技术加快数字化转型并搭建数据管理平台。在此背景下,传统的审计方法难以高效、准确地发现各机构核酸检测申报数据中存在的问题,传统的审计方法已无法处理如此庞大的数据量,而大数据审计此时体现出一定优势。

二、核酸检测费用结算审计疑点数据特征

根据疫情防控工作需要,2021年7月至2021年8月,N市J区(以下简称J区)开展了大规模核酸检测,样本检测工作委托给相关第三方检测机构开展。2021年8月,J区成立核酸检测费用结算审计专班,由区卫健委牵头,协调区审计局对检测机构上报的核酸检测数量(包括采集方式、管数、人份数等)进行核查,对虚报、错报的数量进行核减,对佐证材料不全的申报进行分类梳理。通过对各核酸检测机构上报数据和省疾控中心提供的核酸检测系统数据进行数据关联比对分析,最终将疑点数据的共性特征归纳为“两个不一致”“两个重复”和“两个不合理”,形成数据分析模型和标准化审计方法体系,应用于大数据审计过程。

(一)样本接收机构与结果上传机构不一致

通常情况下,第三方核酸检测实验室首先与核酸检测点交接采集样本,并将样本信息录入系统,生成实验室流水号;接着对样本进行核酸提取、配置试剂、加样及上机检测;最终将检测结果上报区卫健委。但在疫情突发需进行全民核酸检测状态下,疫情防控指挥部(以下简称指挥部)在联系第三方检测机构时,可能存在较多交叉,且在第三方机构接收的样本超出自身检测能力时,指挥部会将样本进一步转运至其他检测机构。在此情况下,最初的样本接收机构和最终的检测结果上报机构并不完全相同,在各核酸检测机构上报的数据中,存在自身是样本接收机构而非最终检测机构的情况。在数据特征上表现为核酸检测系统中接收机构名称与上传机构名称不一致。

(二)采样方式与系统不一致

核酸检测按照采集方式可以分为单采和混采,其中混采通常分为“五合一”和“十合一”两种模式。为了大幅提升核酸检测效率,节约社会成本,在全员核酸检测时常采用混采模式。在各核酸检测机构上报的数据中,存在与系统中采集方式不一致的情况。例如:将单采变为混采或混采变为单采、混采不足10人的统一按10人上报。

(三)检测机构数据重复上报

分为同一机构数据重复上报和不同机构之间数据重复上报两种情况。在疫情突发全员核酸检测初期,任务紧急工作量大,核酸采样点的信息登记及检测机构的取样、信息录入、结果上传等环节均存在经验不足的困难,各检测机构之间存在转接交叉,数据资料存在缺失和重复的问题。因此需要关注同一机构内上报数据重复情况和不同机构之间上报数据重复的情况,一般以核酸检测系统上传机构名称为基础,结合被检测人身份证号码,并由检测机构自查。

(四)自费检测数据重复上报

主要表现为检测机构将自费用户检测数据重复上报结算费用。根据2020年5月发布的《国务院应对新型冠状病毒感染肺炎疫情联防联控机制关于做好新冠肺炎疫情常态化防控工作的指导意见》,核酸检测“应检尽检”所需费用由各地政府承担,“愿检尽检”所需费用由企事业单位或个人承担。除“应检尽检”外,企业或个人可能会出于需要在医院进行自费核酸检测,医院会将部分检测工作转交至第三方检测机构,此部分费用已由核酸检测机构与医院之间进行结算,不属于政府承担的“应检尽检”部分,而检测机构将这些自费检测的数据重复上报政府结算费用,需要筛选出此部分的数据并进行核减。

(五)上报数据核酸检测频率异常

主要表现为单人日核酸检测频次异常,且异常数据集中于某个批次。疫情发生以来,J区按照风险等级不同,检测频率主要分为“一天一检”“两天一检”“三天两检”。因疫情发生早期,传播风险具有不确定性,全员核酸检测频率会根据地区风险信息和人员感染风险进行调整。通过筛查日检测频次大于1的人群,构建异常行为的核心模型,通过模型筛查出疑点再进行甄别研判和优化,分析疑点数据的核酸采集点及核酸检测机构,审查是否出现整批次重复上报的情况。

(六)上报数据超出最大检测量

实验室在采样样本运至之前,可以根据大概的样本量预先配置相应的核酸检测试剂,配完试剂后在专门的核酸检测实验室中,将提取好的核酸加入到反应体系,并将准备好的扩增板置于PCR核酸检测仪,进行扩增检测。一般来说,这个关键过程需要90分钟。因此,在极大压缩样本信息录入等其他时间成本的情况下,一台PCR核酸检测仪器在24小时“连轴转”的情况下最多完成14轮核酸检测。将检测机构申报的日检测量与其最大检测能力比对,筛选超出最大检测能力的数据作为疑点进一步核实。

三、核酸检测费用结算大数据审计流程

核酸检测费用结算大数据审计按照“总体分析、发现疑点、分散核实、系统研究”的数字化审计模式,采集不同来源的各种类型的数据,完成整理后导入MySQL数据库,运用SQL查询语句开展跨系统的深入挖掘、比对与综合分析,获取疑点线索,最终通过现场核实锁定问题。核酸检测费用结算大数据审计流程如图1。

四、基于SQL语言的核酸检测费用结算审计数据分析步骤

(一)数据采集

核酸检测费用结算审计数据主要来源于以下部门或机构:28个核酸检测机构、5家医院、省疾病预防控制中心、区卫健委及区委组织部,详见表1。

1.检测机构及医院上报基础数据。

围绕核酸检测费用结算审计重点,审计组制定并下发了统一表格,全面获取各核酸检测单位的申报明细表、机构资质、检测样本交接台账及原始交接单、实验室检测样本登记表、检测结果、日最大检测量等资料。数据分析主要使用到核酸检测机构申报明细表,包含的字段有:[序号][上报机构][收样日期][送检单位][送样人][所属街道][采样点][采样试管号(管码)][采集方式(单采/混采)][样本人次数][检测时间][检测结果][是否为5家医院调入(并注明调入医院名称)][是否为其他检测机构调入(并注明调入检测机构名称)][检测人员分类(全员核酸检测、隔离点、医务人员、重点人群)]。

涉及自费检测并将检测工作转交给第三方机构的5家医院上报数据明细表,包含的字段有:[序号][采样医院][采样时间][采样试管号(管码)][采集方式(单采/混采)][样本人次数][转运至检测机构名称][检测时间][检测结果][是否自费]。

2.核酸检测系统数据。

省疾控中心提供的核酸检测系统数据中包含的字段有:[序号][居民姓名][证件类型][证件号][采集方式][采集点][采样时间][采样试管号(管码)][接收机构][接收时间][检测结果][上传机构][检测结果上传时间]。

3.职能部门上报的数据。

区卫健委提供隔离医学观察点隔离人员及工作组人员核酸检测数据、区委组织部派驻核酸检测点督导负责人提供的“全员核酸检测完成情况确认单”等非结构化数据。

(二)数据预处理

在数据预处理阶段,审计人员根据数据格式及时做好数据恢复、验证、清洗、整理和加工等工作,数据预处理流程如图2。

1.结构化数据清洗后导入MySQL数据库。核酸检测数据量大,涉及检测机构多,为提高数据分析效率,审计结算专班在办公地点单独准备了一台服务器用于数据集中存储及分析工作。大数据分析组将省疾控系统和东软系统检测数据完成后台一致性、完整性校验后,对属于该区数据和检测机构上报有效数据以及职能部门上报的结构化数据全部导入MySQL数据库。

2.整理、加工非结构化数据。按照一定的分类规则将核酸检测机构上报的材料及各职能部门上报的各种文档及图片归集整理到相应的文件系统便于审计分析时的查找检索。对于PDF和图片格式的文档资料可通过OCR文字識别技术转化为可以用计算机分析、处理的数据。

(三)数据分析

以检测机构上报数据及核酸检测系统数据为基础,根据核酸检测疑点数据特征形成审计思路,进行建模工作。应用SQL语句,对数据进行全面挖掘与分析,精准发现问题,确定核查重点。

1.分析样本接收机构与结果上传机构不一致的情况。

通过WHERE语句筛选核酸检测系统数据表中接收机构与上传机构不一致的数据信息,最终生成“样本接收机构与结果上传机构不一致疑点数据”。SQL语句如下:

2.分析采样方式与系统不一致的情况。

第一步:关注检测机构是否将单采变为混采或混采变为单采。通过“管码”字段关联检测机构上报数据表与核酸检测系统数据表,进一步用WHERE语句筛选采集方式不同的数据,最终生成“采样方式与系统差异疑点数据”。SQL语句如下:

第二步:关注混采是否有不足10人或5人的统一按10人或5人来上报结算的情况。通过“管码”字段使用左连接关联核酸检测系统数据表和检测机构上报数据表,以管码为分组条件,通过聚合函数COUNT()计算每管中涉及证件号的数量并命名为“每管人数”,最终筛选检测机构上报的样本人次数与核酸检测系统中统计出的每管样本数不一致的数据,生成“每管采集样本数与系统差异疑点数据”。SQL语句如下:

3.分析检测机构上报数据重复情况。

第一步:在不重复的情况下,检测机构上报数据表中每一行都可以用管码唯一标识自己的列。当存在重复数据时,同一个管码可能在同一上报机构或不同上报机构中多次出现。因此首先通过GROUP BY语句对管码进行分组,利用COUNT()函数统计每个管码出现的次数;第二步:运用子查询,将管码出现次数大于1的数据筛选出来,最终生成“检测机构重复上报疑点数据”。SQL语句如下:

4.分析自费检测重复上报情况。

第一步:将检测机构上报数据表与医院报送的检测明细数据表通过“管码”字段进行关联;第二步:通过WHERE语句对自费检测数据进行筛选,生成“自费检测重复上报疑点数据”。SQL语句如下:

5.分析核酸检测频率异常的上报数据。

第一步:通过“管码”字段使用左连接关联核酸检测系统数据表和检测机构上报数据表;第二步:通过DATE_FORMAT() 函数将检测时间以日期的格式显示;第三步:把根据身份证号码统计的每位居民每天核酸检测次数,按检测人员和检测日期分组,最后筛选次数大于1的数据,生成“核酸检测频率异常的上报数据”,进一步查看疑点数据的核酸采集点及核酸检测机构,分析是否出现整批次重复上报或上传的情况。SQL语句如下:

6.超出最大检测量的上报数据。

第一步:在检测机构上报数据表中按检测机构和日期分组,汇总得到每天各机构检测的样本人次数;第二步:通过子查询将各机构日检测上报数与检测机构提供的日最大检测量表进行比对,筛选出日检测量超出最大检测量的数据,生成“超出最大检测量的上报数据”。SQL语句如下:

(四)现场核实

依托数据分析疑点表,审计组开展现场资料核查工作,围绕核酸检测中“采、送、检、报”四个环节收集核查资料,审核检测机构上报数据的真实性、准确性、合理性。具体核查程序如下:在采集环节,疫情突发初期存在手工登记信息的情况,导致无法进行大数据审计关联对比分析,需要手工检查采样单,与上报数据比对、核实、确认。在转送环节,针对多个机构之间重复上报数据、检测机构与系统不匹配的情况,现场检查样本交接单、送检单位报送的转运记录表等信息,与上报数据比对。在检测环节,检查检测机构的实验室接收记录、上机记录、检测图谱、检测报告等资料,分析上报数量与检测机构实际最大检测能力是否匹配。随机抽取全员核酸某两轮的部分检测图谱,发现是否有不检测直接上传检测结果、蒙混过关骗取检测费用的情况。在报告环节,审计组通过检查检测结果上传记录、现场督导提供的确认书等资料,随机抽取一定比例的核酸检测图谱,核实上报数据的真实、完整性。

五、审计成效与启示

利用大数据分析,审计人员直接锁定了重点延伸审计的核酸检测机构及需要核查的疑点数据,并通过现场审计对问题数据进行了核减。审计组在审计过程中发现各区核酸检测费用结算单价不一致,且高于同期国内其他省市结算单价,以“审计要情”的方式提请市审计局关注该事项,并建议市卫健委和市财政局与全市的核酸检测机构统一协商核酸检测费用的单价,遏制了防疫费用不合理增长、维护了人民权益,促进了防疫资源分配的公平合理。

通过上述核酸检测费用结算审计实例,对应用大数据技术助力审计应对突发公共卫生事件,提出以下几点启示:

1.积极探索信息化技术在审计中的应用。在突发公共卫生事件审计过程中,资金的拨付使用和应急物资的流转等都需要信息系统的支持,通过运用结构化数据分析工具如SQL语言等,可以实现对信息系统中数据的高效分析。针对非结构化数据,如文本文件等,可运用OCR技术、自然语言分析和词频分析等技术对文件数据进行批量阅读和后期处理。实现文件的数据类型转换、关键词的提取和文档的归类,便于后续检索和分析。此外,审计信息化平台的构建,可以实现不同来源信息數据之间的关联比对分析,使以往难以发现的问题被揭示出来,提高了审计的效率和精准度,也有效应对了突发公共卫生事件中可能存在的审计力量不足和难以现场审计的问题。

2.加强复合型审计人才队伍建设。突发公共卫生事件自身具有一定的复杂性,审计人员审计思路的形成、审计技术方法的应用都需要建立在对审计对象的充分了解基础之上,因此审计人员还需要运用研究型思维充分了解学习公共卫生相关专业知识。此外,开展大数据审计需要审计人员具备信息化的能力,掌握相关技术工具。由于在突发应急状态下,难以快速临时组建专业的针对性团队,因此可以构建突发公共卫生事件人才库,整合信息技术领域、医疗卫生领域以及审计领域等的专业人才,促进各方合作,并在平时加强对审计人员相关知识的培训,建立起复合型的审计队伍。

3.总结经验,抓住关键问题,形成突发公共卫生事件审计案例库。突发公共卫生事件具有不可预见性,对审计工作而言,在前期需要花费一定的时间精力确定审计事项、制订审计实施方案。如本案例所描述,通过风险分析,抓住6个关键问题,形成审计思路。通过对各地区突发公共卫生事件审计工作的已有经验进行总结,尤其是对有关大数据技术的应用思路和方法进行归纳推广,形成突发公共卫生事件审计案例库,有利于审计人员之间互相学习交流,为应对突发公共卫生事件做好充分的经验准备。同时总结出一套用于应急审计的预案,包括具体审计流程、审计重点和难点、审计方法等,为开展公共卫生事件应急审计提供保障。

(作者单位:南京审计大学政府审计学院 南京市江宁区审计局,邮政编码:211815,电子邮箱:cxh002@126.com)

主要参考文献

[1] 陈剑芳.SQL多维分析巧审特殊人群定点药店违规刷卡问题[J].中国内部审计, 2017(7):79-84

[2] 刘卓聪,叶陈刚,王湘漪.突发公共卫生事件应急审计研究:以武汉市新冠肺炎疫情联网审计为例[J].国际商务财会, 2021(18):66-70+94

[3] 朱智鸿.突发公共卫生事件应急审计探究:以新冠肺炎疫情为例[J].财会月刊, 2020(7):92-96

猜你喜欢
疫情防控
美国科技社团应对新冠肺炎疫情的主要措施
抗击新冠肺炎疫情下疫情防控档案的收集与利用
特殊时期物业服务项目风险管理研究
新冠肺炎疫情防控中的应急信息管理问题与对策研究
疫情防控背景下“停课不停学”在线教学案例研究
政府要做好公共价值的创造者和守护者
打赢疫情防控战的制胜机理
2013~2018年乌鲁木齐市猩红热流行病学特征分析
安徽省人畜共患病细菌性传染病综述
2013~2017年东莞市大岭山医院急诊科接种狂犬疫苗情况分析