韩兆祥 罗璁 胡刚
在执法记录仪普及以后,随着物联网、云计算、大数据、5G和人工智能等新一轮信息技术的发展和运用,我们发现,在城市执法中衍生出了越来越多的智能场景应用。
我们通过分析执法记录仪和相关联的警综、案综、交综信息,实现了现场“5G+执法实时直播”“5G+警员智能定位”“AI+执法图文识别”“AI+执法语音转化”和“AI+执法语义理解”等对警员智能督察考核的场景应用。这些应用借助汇总各个系统考核数据,多维度大数据处理、分析和应用,旨在加强民警日常出警工作的考核,推动警务单位、民警和干部智能化科学绩效考核体系的形成。
与此同时,构建执法记录仪的智能化生成方式,对执法记录仪的信息进行全量的分析,推动“警务留痕”,实现各系统绩效数据与被考核主体相关联,进而建立民警考核分数和警务单位、民警、干部等数据画像,便于领导更加全面的掌握执法过程中的全量数据情况,推动执法模式从被动式督察考评向主动式、智能式督察考评转变,打造智慧督察考核新模式。
城市执法需要智能化的考核系统
为了完善考核维度,强化各考核范围的覆盖度、全面性,需要构建新型的考核系统,集约当前零散的多类系统数据,提取关键信息,形成面向民警的新一代考核体系。
城市执法考核数据日益增加与完善,推进了物联网、云计算、大数据、5G和人工智能等新一轮信息技术和城市执法业务需求深度融合。切实构建一套智能化的考核系统,打通所有考核数据的通道,汇聚考核数据并应用各种智慧化的业务算法模型,开发出一套集智能化民警绩效考核、智能化干部绩效考核、智能化单位绩效考评等能力为一体的考核服务平台是必要的。该平台需要对绩效数据进行汇聚整合、多元评估、多维测算和实时结果展示,推动“警务留痕”,实现各系统绩效数据与被考核主体相关联,推动实现5G、人工智能、大数据、云计算和物联网等新一轮信息技术在城市执法督察考核中的深度融合和智能化应用。
基于城市执法领域业务数据的基础,需要针对公安局的相关考核数据进行汇聚,通过来自警综、案综和交综等业务系统以及民警日常出警工作内容等的考核数据,重点解决执法记录仪的工作量自动生成、民警画像等一系列问题,聚焦体现单位、干部、民警的工作全貌,打造基于5G+AI技术融合在城市执法中的智能场景应用,构建全面的城市执法智能督察考核体系。
城市执法智慧督察考核体系的建设,通过技术和业务深度融合的创新理念,复用了各系统丰富的数据资源,运用执法仪视频结构化分析、执法仪语音识别、执法仪语义识别等智慧算法分析,推动城市执法智慧督察考核的应用。城市执法中针对智能督察考核建设,需要充分利用大数据、云计算、前端感知等手段,汇集接入督察数据、公安局各业务系统数据,创新督察战法和工作机制,将监督触角延伸至公安一线执法执勤、服务群众、内部管理的各个环节,及时发现异常情况,推动督察工作与信息化的高度融合,变督察“被动式”为“主动式”,打造新型“智慧督察考核”模式。
5G+AI技术融合的应用实践
在城市执法督察考核中,基于5G+AI等新一轮信息技术的智能化应用,构建了新一轮城市执法智慧督察考核体系新模式。我们针对“5G+执法实时直播”“5G+警员智能定位”“AI+执法视频图片”“AI+执法图文识别”“AI+执法语音转化”“AI+执法语义理解”“多源大数据处理和分析”等对城市执法工作的智慧督察考评场景应用,开展了深度研究探索和应用实践,推动了原有人为或被动的督察考核模式向智慧化模式的转变,大大提高了城市执法的便利性,提升了城市执法的效能,推动了城市执法决策的公正性、透明性和科学性。
5G+执法实时直播
在旁路辅助执法中,当前普通執法仪只能录音和录像,以供事后追溯。但当前指挥中心对实时事态判断和现场指导、指挥的要求越来越高。要想将执法记录仪作为一个警员执法的直播平台来使用,随时随地供调度人员进行实时监控和现场指挥,当前的4G执法记录仪由于带宽不足,因此经常有黑屏和卡顿、画面丢帧等不连续现象,效果不尽如人意。而未来的5G技术可以赋能警务多场景、多业务升级革新,可以在佩戴执法记录仪现场移动执法过程中,对音、视频进行记录,并可供事后回溯;同时,可以将执法记录仪作为一个直播软件使用,随时随地的推流直播并回传到指挥中心供调度人员进行事态判断、人证核验以及事后回溯等。
5G+警员智能定位
在警员执法过程中,需要对警员佩戴的执法仪的地理位置信息进行实时监控,警员位置需要在地图上实时显示及跟踪。该应用可在地图上实时显示每个人的位置,方便警力部署。在考核模型中,对于交通大整治的警员,他们只有在路口方圆50米的范围内连续执法30分钟以上,才会被给予考核分数。
对于不同责任区的警员,则需要考核是否跨越责任区进行执法。对于要求在责任区内巡逻的民警,则需要用到督察模型中的警员长时间在娱乐场所逗留的位置信息模型,以纠正警员的不守纪律行为。该应用可以在地图上设定区域范围或者特定位置锚点,实现基于位置的打卡签到功能,实现警员责任区区域规划及高级定位联动。此外,该应用可查询警员历史行进轨迹,可以随时调取回顾历史行进路线;支持定位信息列表按照所属部门、执法者、日期时间、起始时间、终到时间等条件进行检索,支持汇总导出纵览,让结果一目了然。
AI+执法视频分析
考虑到视频分析所用计算和存储资源的要求都非常高,所以当前在城市执法督察考核系统中的视频分析主要集中在云端。该应用实现了值班人员抽烟、值班人员玩手机、值班人员睡觉、值班人员未穿制服、单人进入枪库、在枪库玩手机、在枪库抽烟等执法视频督察分析模型。未来的视频分析,会走向边缘计算。在执法记录仪这样的智能警务终端,在边缘侧实现行为分析、人脸采集、车牌识别和车辆识别等端侧智能+端侧边缘计算,实现端侧和云端智能联动已成为必要。
AI+执法图文识别
随着城市执法中各种移动执法记录仪、智能设备的普及,越来越多的图片产生,也有越来越多的图片文字需要被识别。其中典型的应用场景有证件信息的自动识别和提取,自然场景中的文字识别,文档或者宣传资料中的文字检测识别等。同时,由于深度学习和图像检测技术的发展,上述场景中文字的检测和识别效果越来越好,机器自动识别成为可能。而机器自动识别在业务审核中给执法业务流程节省了大量的人力。在一个日常勤务工作的矛盾纠纷模型中,有如下指标项:有效时长、参与人数、民警参与度、是否验伤、是否签订调解协议书、是否网办调解。因为是矛盾纠纷调解,对是否验伤、是否签订调解协议书、是否网办调解这几项工作无法通过语音来识别。因为在调解过程中,验伤可能存在一方说是轻伤、一方说是重伤;一方说现在要验伤,一方说根本没有伤不需要验伤的情况,因此很难通过语音引擎中的关键词“验伤”来实现指标项的数据算法:满分10%,验伤过得10%,没有验伤过得0分(由民警在执法中说出关键字“验伤”,执法记录仪进行关键字抓取)。但可以通过验伤通知书、调解协议书、网办调解书来实现该考核模型。
这里用到的就是OCR的扫描技术。但因为验伤通知书是人工拍摄,因此存在偏转角度的问题。旋转需要先判断角度,这是人工智能的分类问题,人工智能需要判断好角度之后旋转回来,然后ocr。倾斜框的输出格式:opencv中旋转矩形框格式为[x_center,y_center,w,h,angle],注意夹角angle的定义为,把水平轴逆时针旋转,碰到第一条w边,水平轴和这条边的夹角即为angle,angle的取值范围为(-90,0]。通用识别输出的格式为[left,top,height,width,angle],其中left=x_center-w/2,top=y_center-h/2,height=h,width=w,angle=angle.可以通过left,top,height,width计算出(x_center, y_center),然后根据图4画出对应的文本框区域,转换代码参考。如此,多个旋转角度识别都没有问题,无论文件多歪斜,均能被正确识别。
AI+执法语音转化
同样按照上面的日常勤务工作中的矛盾纠纷模型中的指标项:有效时长、参与人数、民警参与度、是否情绪激动等,我们需要分析执法记录仪的语音,将其转变为文本。凡是在其中有文本字幕的时长为有效时长,参与人数由民警的声纹识别来实现,民警参与度则为有效时长除以音频时长的百分比,若参与人情绪激动则按照说话的语速+音量的权重来进行匹配。因此需要用到语音引擎技术。
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为城市执法中的多种实际应用场景提供支撑,适用于多个应用场景,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景。该应用使用自学习平台等工具改善了语音识别效果,而且提供了功能更丰富的管理控制台和更易用的SDK。当前,该应用主要用于在云端进行录音文件的识别,对城市执法中用户上传的录音文件进行识别。用户上传完文件之后,应用可以在几分钟内完成识别并返回识别文本,只有用户一次性上传大规模数据(半小时内上传超过500小时时长的录音)时,才会略有延迟。该应用可用于呼叫中心语音质检、庭审数据库录入、会议记录总结、医院病历录入等场景。
AI+执法语言转化可以使用自学习平台提升识别效果。自学习平台提供了训练热词和自学习模型的两种方式,帮助提升上述识别服务的识别效果。特别是在城市执法者的普通话和地方方言不是很规范的情况下,自学习平台颠覆性地提供一键式自助语音优化方案,极大地降低了进行语音智能优化所需要的门槛,让不懂技术的业务人员也可以显著提高自身业务识别的准确率。自学习平台能够在数分钟之内完成业务专属定制模型的优化、测试、上线,更能支持业务相关热词的实时优化,一改传统定制优化长达数周甚至数月的漫长交付弊端。自学习平台优化效果在很多内外部合作伙伴和项目上得到了充分验证,很多项目最终通过自学习平台不仅解决了效果可用性问题,还在项目中超过了竞争对手使用传统优化方式所取得的优化效果。
热词功能:在语音识别服务中,如果在某些业务领域有一些特有词,默认识别效果较差的情况下可以考虑使用热词功能,将这些特有词添加到词表,将改善这部分词的识别结果。
自学习模型:支持上传业务相关的文本语料训练自学习模型,上传之后便可以在该业务领域中获得更高的识别准确率,例如司法、金融等领域。
AI+执法语义理解
当通过离线文件识别,获得语音文本之后,我们需要对城市执法的规范用语进行识别。想要判断出该城市执法者在各种执法案件中的表现以及对标准执法流程的执行程度,这时候就需要用到自然语言理解了。例如在实有人口管理的执法模型中,指标项包括:入户走访有效时间、入户走访数和现场环境三个指标项。对于入户走访时间,根据4G执法记录仪测算出有效时间T(分钟),可以得T/10分,累加得分。对于入户走访数,根据系统记录,每核查1户加1分,累加得分。对于智能分析执法环境的指标项,若参与人情绪激动则减0.5分。
首先我们需要通过规范用语对城市执法人员进行执法分类。在每次执法前,执法人员需要用标准普通话,但警员的普通话水平参差不齐,有标准的,也有不标准的,因此需要根据拼音进行模糊匹配,警员说1零,11零,要要0的,应用都识别为110接处警。同时,由于词向量深度学习算法的结合,应用能准确识别其所属派出所。当城市执法人员最后总结:今日走访企业10户,市民5户,应用需要通过自然语言理解,将走访户数计算为10+5=15户,按照15户的走访户数,给该模型计算指标项的得分。
多源大数据处理和考核分析
在城市执法督察考核中,数据来源有结构化数据,也有半结构化和非结构化的数据,包括语音、图片、视频、文本,甚至执法仪的GPS经纬度信息等数据。对于这些多来源大数据,在接入上要实现实时和准实时接入模式,在数据加载上要实现批量加载和增量加载模式,对来源于上下级别,采用“市局-分局-派出所”等三级架构上,实现数据库直连、消息队列加载、短消息邮件推送等多种接入方式。在多源数据接入后,会无意将脏数据录入业务表,分析语句在访问这些脏数据、错数据时,可能会运行失败或者返回错误结果。
为避免此情况,应该对数据进行采集、归集、治理、整合、应用和开放等数据全生命周期的管理工作,同时依照需要提供数据稽核业务所需的功能。具体实施时,数据稽核会根据规则将脏数据写入指定的脏数据表(Error Table),并标明每一条脏数据为何非法,在数据导入完成后,应用将返回总共记录数,导入记录数的接口或者数据质量报告,以方便监控程序判断以及处理;也可以仅打印显示报错信息。实现上述特性都是为了使数据稽查能够在脏数据存在的情况下尽可能的保护系统或保证业务的顺畅执行。进行数据稽查时,系统将对问题数据报错并记录至Error Table上。
最后,应用将多源大数据分析结果展现为城市執法人员执法能力的多维分析,包括执法人员画像、执法能力分析和工作分析等。
对城市执法人员的考核体系,旨在加强智能化民警绩效考核,科学设定考核体系,建成智能化民警考核通用模型的同时,也将加强智能化干部绩效考核,综合运用评估模块;通过多维度客观评价和比较领导干部履职情况,加强智能化单位绩效考评,对单位绩效数据进行汇聚整合、多元评估、多维测算和实时结果展示;推动“警务留痕”,实现各系统绩效数据与被考核主体相关联。在城市执法的日常工作中,绩效考核是非常重要的一环,有利于对民警个人能力、工作能力、负荷等进行全方面地刻画。
传统考核系统,涵盖了基础的工作排班等维度,但是对于城市执法者办案数量、办案质量、出警频次、出警质量等都缺乏有效的归结及整合。基于此,为了完善考核维度,强化各考核范围的覆盖度、全面性,需要构建新型的考核系统,集约当前零散的多来源系统数据,提取关键信息,形成面向城市执法者的新一代考核体系。