胡啸峰 ,石 拓
(1. 中国人民公安大学,北京 100038;2. 北京警察学院,北京 102202)
随着公安大数据战略的稳步推进,多源异构数据不断积累,以海量数据的深度应用已逐步成为公安工作提质增效的重要支撑性条件。在公安行业中,数据驱动下的治安防控、侦查打击、合成作战等工作模式正在逐步实现更新换代,大数据在公安领域的应用已全面展开[1-3]。习近平总书记在全国公安工作会议上指出“要把大数据作为推动公安创新发展的大引擎、培育战斗力生成新的增长点,全面推动公安工作质量变革、效率变革、动力变革”[4]。可见,公安大数据的建设与应用是长远之计,是防范重大风险、保障人民生命与财产安全、不断提高人民群众安全感与满意度的重要途径。
为培养公安大数据专门人才,全国公安院校广泛开设了相关的本科生、研究生课程。公安大数据人才的专业化、系统化的培养已全面展开,公安院校结合公安工作特点和自身发展特色逐步开启了相关课程体系的设计与重构[5-7]。在数据警务技术以及其他相关专业的公安大数据课程中,应用类课程由于与公安实战结合紧密、贴合度高而成为了广受学校和学生重视的一类课程,例如公安情报、刑事科学技术[8,9]等专业中的数据应用类课程均占据较高的比例。从公安大数据人才的需求来看,专业技术能力与业务实践能力缺一不可,且上述两种能力需要相互融合、形成合力,从而有效地将大数据这一基础性战略资源转化为切实服务于公安实战的战斗力。因此,在人才培养过程中,需要着力培育学生的数据思维,通过理解数据、挖掘数据、应用数据来解决业务问题,进而提升整个公安行业在大数据时代的社会治理能力[10],这是公安大数据应用课程建设的核心任务。
本文旨在通过分析公安大数据应用课程的教学现状,剖析其存在的主要问题,进而以中国人民公安大学开设的《预测预警与智能决策》课程为例,从改革授课模式、积累数据资源、优化培养路径等方面创新性地提出公安大数据应用课程教学的措施建议。
公安大数据应用课程已逐步在全国公安院校开设,但从目前各院校的教学实践看,尚存在以下几个值得关注的问题。
当前,公安大数据应用课程中的教学内容普遍存在“重技术、轻实战”的问题,即通常以讲授数据统计、数据挖掘、机器学习等大数据处理、分析的理论、方法、算法以及计算机编程语言(Python或R语言等)为主,而以公安实战中如何运用上述技术能力解决问题的讲解不足,从而造成教学内容与公安实战应用的脱节。例如,在讲授犯罪时空预测方法的过程中,教学重点往往是长短记忆神经网络(Long Short-Term Memory networks, LSTM)、卷积神经网络(Convolutional Neural Network, CNN)、图卷积网络(Graph Convolutional Network, GCN)等深度学习模型的技术原理和算法实现,而以于犯罪时空预测方法在治安防控、情报指挥等工作中的具体作用、精度要求、限制条件等问题缺乏深度探讨。犯罪时空预测过程中,不仅用到了犯罪时空分布数据,实际上也需要经济状况、人口密度、交通条件、土地类型、气象变化等自然、社会环境数据的支撑,因此,这些数据的跨网络、跨平台获取以及多维融合等工作也是公安大数据应用过程中不得不解决的问题。此外,犯罪时空预测得到的结果必然存在一定的误差,不同时间尺度、空间尺度的误差可接受标准是由公安实战需求决定的,其能否为实战决策提供支持是评价模型性能的首要指标。可见,公安大数据应用课程内容的设计离不开全链条业务场景的支撑,教学内容与公安实战应用结合不紧密的问题亟待解决。
实验课程是公安大数据应用课程体系中的重要一环。通过实验课,可以帮助学生掌握大数据平台的使用方法,利用专业软件工具或通过计算机程序设计完成数据分析实验,从而巩固课堂教学中所学的理论知识和技术方法,培养解决实际问题的能力。然而,当前实验教学中普遍存在的一个问题是大数据资源的匮乏。众所周知,很多公安实战单位拥有海量的多源异构数据资源,但受限于数据密级、数据质量等条件,目前能够转化为公安院校实验教学资源的数据仍然非常有限。因此,在很多实验教学设计中普遍采用了互联网开源数据集作为实验数据,尽管在数据建模、模型验证等环节中,开源数据也可以起到支撑作用,但来源于世界其他国家的犯罪(如Crime Open Database[11])、恐怖袭击(如Global Terrorism Database[12])等数据集往往难以反映我国的社会安全现状,不利于学生了解真实的公安大数据应用场景和数据挖掘、分析任务,难以切实感受公安大数据实际应用过程中面临的实际困难和挑战,从而影响实验教学效果。
为满足公安实战要求,大数据应用人才需要具备持续的学习能力,掌握不断更新的科技知识,提升场景抽象、数据融合、挖掘分析、辅助决策等各个环节的创新能力。以犯罪时空预测为例,高精度犯罪时空预测方法目前仍处在不断研究和反复试验的过程中,尽管大量模型、系统已投入到了公安实战中,但其依赖的数据种类和预测算法不尽相同。事实上,数据融合手段和模型构建方法在不同的应用环境中往往难以保证其普适性,也就是说,课堂上所教授给学生的、在某一个案例中被验证可行的技术方案很有可能难以应用于其他环境,这就需要启发、培养学生“举一反三”的能力,引导其根据所学知识,以方法进行移植、迭代、升级、创新。然而,当前的公安大数据应用类课程仍以教师的课堂讲授为主,实验课程的课时有限,且实验任务多为验证型内容,而探索型实验则较为匮乏。因此,传统的教学模式难以支撑公安大数据应用人才的自主创新能力培养。
针以公安大数据应用课程存在的问题,本文从以下三个方面阐述其创新性实践改革方案,以探索公安大数据应用人才培养的新路径。整合校内外教学资源,在本科课堂引入公安实战单位资深教官提供业务指导,与校内教师共同开展互动式教学,并通过构建大数据资源池和并轨科研项目,探索“教研”一体化的公安大数据应用人才培养路径。
为解决教学内容与公安实战结合不紧密的问题,可以建立案例教学与情景互动相结合的授课模式,基本流程如图1所示。首先,由实战教官向学生介绍实战情景。中国人民公安大学目前已与相关实战单位建立了合作关系,聘请资深教官为学生提供公安业务指导。其次,根据实战情景,教师向学生提出需要解决的问题,针以该问题,由教官向学生阐述限制条件并给出能够用于解决问题的数据资源、计算资源等。再次,由教师引导学生共同研讨解决方案,并给出方案中的关键技术方法,进而向学生系统性地讲授该方法。最后,通过公安实战中的实际案例,向学生展示利用大数据分析方法为公安实战提供决策支持的全流程,并开展进一步的研讨、总结,从而以已有方案进行迭代、优化。
图1 案例教学与情景互动相结合的授课模式
以犯罪时空预测为例。实战教官可以首先向学生介绍应用场景,例如指挥部门需要利用辖区内各街道未来一周内各类犯罪案件数量的空间分布来进行警力需求测算,填写警力测算表,优化辖区内的警力部署。教师帮助学生进行情景分析,指出需要解决的关键性问题是实现以“周”为时间尺度、以“街道”为空间尺度的犯罪时空分布预测。进而,教官为学生列举出案事件统计数据、辖区地图数据等多源数据,并给出可以用于模型训练、测试的软硬件环境。通过课堂讨论,共同确定需要采用深度学习算法实现较高精度的犯罪时空预测。然后,由教师为学生讲授长短记忆神经网络、图卷积神经网络的基本原理和实现方法,并阐述在此案例中使用上述方法解决问题的具体流程。最后,介绍实际案例中的计算结果,与学生共同分析如何利用预测结果辅助指挥中心完成警力测算,同时,以预测误差开展分析,进一步优化预测方案,从而得到更为精准的结果。
通过该授课模式,可以深化“以问题为导向”的教学思路,充分借助公安院校特有的实战教官、实用数据、实际场景等教学资源,启发学生以解决问题为目标,思考可行的技术路径,进而引导学生带着问题开展互动式研讨,有针以性地教授其所需的科学知识和技术方法,并最终通过实战案例以全链条教学进行强化、提升,从而帮助学生高效地实现“学以致用”的目标。
在与公安实战单位开展全面合作的过程中,在符合规定的前提下,以部分业务数据进行收集、汇聚、脱敏处理以及再加工,并与其他渠道汇聚的社会数据(如经济数据、人口数据、城市交通数据等)进行融合,形成公安大数据应用实验课程所需的数据集,并通过数据积累和不断整合、完善,构建实验教学大数据资源池,为学生的实验课程提供符合我国公安实战特点的、鲜活的数据资源。
图2所示为“预测预警与智能决策”课程的实验教学数据资源。如图所示,针以犯罪空间热点预测、犯罪时空分布预测、犯罪风险知识图谱等不同实验任务,获取并构建了“重点巡逻点位与排查区域”“各街道经济指标”“各街道常住人口数量”“各类犯罪案件记录”“街道级地图”“各单位每日在岗警力”“社会面巡控警力”“社区警务室信息”等多个不同类型的数据集,而不同实验任务则根据需要灵活选择其中的几种数据集设计并开展实验。如前文所述,并非所有数据均来源于公安机关,例如,街道级地图即是课程组通过向第三方公司采购的方式获得。在数据处理过程中,首先需要按照公安机关的相关规定和具体标准要求,以数据进行脱敏处理。然后以部分数据按照实验任务需求进行一定程度的加工,方便学生灵活使用。例如,在犯罪案件数据集中,原本不包括天气数据,但是大量研究[13-15]指出,天气变量以犯罪时空分布具有一定影响,因此可以将天气变量作为外部特征用于犯罪时空分布预测,那么,在实验过程中为节约时间,将学生的精力集中于主要的数据处理和建模工作,于是将每日以应的天气数据提前处理好,加入犯罪案件数据集供学生使用。
图2 “预测预警与智能决策”课程的实验教学数据资源
此外,随着新的多源异构数据的不断引入,用于实验教学的大数据资源池也处于动态扩充、调整和完善过程,从而更好地服务于实验教学效果的提升。
公安大数据应用人才通常需要具备较强的应用创新能力,体现为在业务实践中抽象应用场景的能力、在应用场景中提出解决方案的能力、在解决方案中开展数据分析的能力、在数据分析中实现辅助决策的能力。因此,所谓课程教学与科研实践相结合的培养路径,即在课程教学的同时,鼓励、引导学生了解、参与科研项目,通过“第二课堂”反哺常规教学。形式上则可以采取多种形式,包括根据解决问题的思路或解决方案的特点分成研究小组,参与到教师或教研室承担的各类科研项目(如国家自然科学基金等)中,或者由研究小组牵头申请“大学生创新创业训练计划”“北京市支持中央在京高校共建项目”等学生科研项目,以授课教师或教研室其他教师为指导教师,同步开展“一体化”的教研活动,从而更为系统化地培养学生的创新能力,为“科研-实战”复合型公安大数据应用人才培养创造新路径。
上述以中国人民公安大学开设的公安大数据应用类课程为研究以象,分析了课程教学现状及其存在的与公安实战应用场景结合不紧密、实验教学数据资源汇聚不完备、学生自主创新能力培养不充分等主要问题,进而以“预测预警与智能决策”课程为例,提出了建立案例教学与情景互动相结合的授课模式、积累业务数据与社会数据相融合的数据资源、创建课程教学与科研实践相契合的培养路径等建设性意见,以期为“科研-实战”复合型公安大数据应用人才的培养提供参考。