基于大数据的人员关系分析研究及应用系统设计

2020-03-25 08:51王欣汪宁郝久月
警察技术 2020年1期
关键词:预测人员分析

王欣 汪宁 郝久月

1. 北京中盾安全技术开发公司 2. 公安部第一研究所

引言

在关系网络中,节点与节点之间通过关系即关系链接相连,组成一张巨大的网络图。然而,当前公安机关存在关系链接数据缺失、不准确等问题。因此,借助大数据分析技术提供的资源按需调度、海量数据挖掘处理能力,对人员关系链计算提出研究和设计思路,对于公安工作具有非常实际和重要的意义。

传统的关系链接预测主要基于图中的结构信息衡量节点之间的相似度开展相关研究。然而随着数据的日益增多,单纯依靠结构信息进行相似度评测,进行链接预测已不能充分利用海量数据的优势。为了更好利用多维度人员数据,本文基于人员关系理论研究,提出了关系表达模型及基于人员属性、行为的多维度信息进行关系链接预测的关系分析方法,设计了基于大数据的关系分析应用系统,充分利用人员基础属性及行为等数据进行关系分析,有效解决了关系类数据缺失、不准确给公安业务应用带来的困扰。

一、关系理论研究

(一)人际关系与交往

人际关系从社会心理学角度是指人们在社会交往过程中形成的心理关系,表现了个体间根据相互满足需要的程度而产生的心理上的亲疏远近。

人际关系通过交往表现,又通过交往实现,人际关系发展和变化是人际交往的结果。

在心理学上,交往是指人与人之间的心理接触或直接沟通,由此达到一定的认知。

交往在社会学上是指人们特意完成的交往行为,或通过交往行为而形成的特定社会联系。

在本文,人际关系是关系研究的基础,交往行为是行为研究的基础。

(二)关系分类

从社会科学角度,可以从多个维度对人际关系进行分类,主要划分维度如下表所示。

?

二、关系分析方法研究

(一)关系表达与计算模型

通过对人际关系和人际交往行为相关理论的研究,本文对关系和行为两个概念进行了划分。

通过对关系和行为的划分,进一步设计了OPRB模型,如下图所示。

其中O是对象也就是产生关系的实体,此处指人;P是对象的可参与关系表达的属性;R是对象间的关系;B是对象间交往的行为。属性和行为可以共同推导关系。同时基于行为和关系类型可以推导人与人之间的关系链接概率。

通过对OPRB模型的刻画,实现了对实体、关系及反应关系的属性、行为要素的描述。

在当前情况下,关系类数据经常缺失或不准确,此时,如下图所示,可以通过属性与行为两个维度实现对关系的表达与计算。

(二)关系分析方法

本文基于关系表达与计算模型的研究,提出基于人员属性、行为的多维度数据进行关系链接预测的方法,在人员关系链接数据质量较低的情况下实现人员关系网络的构建及关系链接预测。具体步骤如下:

基于人员属性和行为进行数据,完成节点间基于属性和行为数据的关系链接概率计算。

(1)对属性、行为等数据进行清洗、转换等预处理工作;

(2)梳理人员关系属性,如人员间已有明确关系,则不列入关系链预测范围;

(3)关系链预测

b表示由业务人员梳理的第b类行为,其中1≤b≤n,例如乘车类行为1,则b=1时,表示同乘车行为。

其中kb表示第b类行为在关系链预测中所占的权重。kb可由业务专家给出主观权重,也可通过标准离差法等方法计算客观权重。

该算法在10台服务器的大数据云平台实验环境下进行实验。针对千万级人员属性、行为数据进行离线建模分析约需8小时,人员关系预测信息实时查询响应时间<3秒。

三、基于大数据的关系分析应用系统设计

本文基于以上研究,设计了基于大数据的关系分析应用系统。利用大数据先进技术及算法,实现关系分析模型、服务,在海量数据中用“数据说话”,为公安机关提供人员关系分析等服务及应用。

(一)总体架构设计

如图,基于大数据的关系分析应用系统是建立在云计算大数据基础支撑平台之上,提出符合公安关系分析业务需要的大数据总体技术框架。具体包括基础设施层、平台支撑层、数据资源层、应用支撑层、应用层。

基础设施层:包括云计算基础硬件环境、资源池及资源服务。

平台层:包括大数据平台的离线计算、实时计算等基础构件。

数据资源层:是系统的核心部分,是一切数据分析和应用的基础,包括数据预处理、数据组织、数据治理三部分内容。数据资源层整合了从各个数据源获取的数据资源。数据预处理是为满足后续业务应用对数据的需要,预先对已接入的数据进行的必要的处理操作,主要包括数据提取、清洗、关联、比对、标识。数据组织将按照人员、地点、物品、组织、事件等专题建设主题库,进一步抽取关系分析专题库。关系分析专题库根据业务的需要对人员行为、属性数据进行梳理和存储,便于后期进行关系分析和挖掘。数据治理具体包括数据资源目录、数据分级分类、数据血缘关系、数据质量管理、数据运维管理。

应用支撑层:封装了智能分析算法和关系分析模型研究的成果,为上层应用提供大数据业务模型和算法服务,并对外提供服务接口。接口层实现该系统与其它业务系统的服务对接。算法服务包含人员关系挖掘、关系网络分析等。

应用层:利用应用支撑层提供的服务,实现关系的可视化分析,包括综合查询、关系分析、统计分析等应用。

(二)功能设计

系统按照用户设定的分析时间、频率等参数对系统中人员各类关系进行定时分析计算,并提供查询、关系分析、统计等功能。

综合查询:查询人员基础信息及相关关系人信息,并提供人员间关系链接预测。

关系分析:基于关系分析,形成人员关系网络,支持人员关系网络的可视化分析及分析结果的保存等功能。

统计分析:主要包括对热点查询进行统计分析、展示等。

四、系统应用实例

基于大数据的关系分析应用系统已初步建设完成,并部署于公安部,在青岛上合峰会期间为会议安保提供了关系分析服务。为满足业务需求,系统提供了处理亿级人员基础信息及行为数据的能力,查询响应时间<5秒,实现关系展示与分析的秒级响应。

该系统有效提升了人员关系分析研判能力,具体如下:(1)系统具有强大的底层数据处理、计算能力。基于大数据、云平台实现海量人员数据的接入、处理,完成数据的高效计算与分析。(2)该系统从人员基础行为数据中获得有业务意义的关系链预测信息,并以可视化方式推送给业务人员进行分析研判,实现亿级数据量下关系分析的秒级响应,推动了公安业务的智能化进程。

下一步,将从可解释性角度提升关系分析方法的可理解性,帮助公安机关业务专家进一步理解算法分析结果,将专家知识反馈到关系分析计算过程中。

五、结语

本文针对当前公安机关关系链接数据缺失、不准确等问题,探索了关系分析方法,提出了关系表达模型及关系分析计算方法,运用大数据等新技术手段,设计了关系分析应用系统。

基于本文提出的关系模型及计算方法,能够利用行为、属性等数据计算人与人之间的关系链接,有效解决了关系数据缺失对公安业务应用带来的困扰。

基于大数据的关系分析应用系统利用大数据先进技术,实现关系分析模型,为公安机关提供智能化人员关系分析应用及服务,并以可视化的方式展示。

随着业务数据的不断积累,算法的不断完善,关系分析应用系统将面向实战,提供更加精准、有效的大数据关系分析应用及服务,为提高人员关系分析能力提供支撑。

猜你喜欢
预测人员分析
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
隐蔽失效适航要求符合性验证分析
让刑满释放人员找到家的感觉
电力系统不平衡分析
不得与工会组织任职期内人员解除劳动合同
不必预测未来,只需把握现在
电力系统及其自动化发展趋势分析
急救人员已身心俱疲