基于基站通讯话单数据的警情分析

2018-04-10 05:57宋娟费海强
价值工程 2018年11期

宋娟 费海强

摘要:介绍了一种通过无线基站通话记录来分析重要的通讯痕迹。本系统通过析取不同数据源的数据,整合成相同格式的数据记录,通过分析、排查、碰撞和筛选的方式来对数据进行整理,通过表格化、图形化和位置化的展现方式来输出结果数据,为刑侦机构提供有效的数据线索。

Abstract: This paper introduces a method to analyze important communication traces by wireless base station call records. The system collects data from different data sources, integrates them into the same format of data records, and collates the data by means of analysis, search, collision and screening, the result data can be outputted by tabular, graphical and locational presentation, which provides an effective data clue for the criminal investigation organization.

关键词:基站通讯;话单分析;警情分析

Key words: base station communication;telephone list analysis;alarm analysis

中图分类号:TN929.5 文献标识码:A 文章编号:1006-4311(2018)11-0190-03

0 引言

基于常年的工作经验,成功的利用案发所在无线通讯基站的通话记录数据进行分析,排查和筛选出重要的数据,对破案和发现线索起了非常重要的作用。但是由于通话记录的数据庞大,数据来源不同的运营商,数据格式不一致,使得在分析通话数据时需要大量的人力和时间,效率较低。本文提出的基于基站通讯话单数据的警情分析系统采用统一数据接口,自动吸取各运营商提供的话单数据,汇总成系统规范的数据库结构,并采用自动和手动的方式对数据进行筛选,从而大大提高了工作效率和工作准确性,系统结构为C/S(客户端/服务器)结构,支持远程数据上传和查询。

1 需求分析

1.1 案件管理 对案件进行分类,支持新建、修改和删除案件档案,可以对案件信息进行维护和管理。

1.2 数据导入 统一接口导入各运营商的基站数据,按照运营商的数据格式进行导入,系统可将导入的数据进行格式化,如去除特殊字符,去除空格,字段顺序调整,冗余数据处理等。

1.3 数据分析 将不同运营商的话单数据合并,根据查询条件筛选有价值的数据,分离无效数据,保留需继续跟踪的话单数据,系统支持多表分栏比对,对不同的来源表进行分析,支持多种组合查询。通过基站(不同时间段的号码碰撞),多个基站(不同时间段的号码碰撞),通过单个号码(频率分析,时间段分析)。

1.4 数据分析模型 通过数据筛选经验建立常规经验模型,提高数据分析效率,并提供修改模型的公式。

1.5 数据导出 支持数据导出,格式支持多种数据类型,数据导出为.doc/.xls/.pdf/.txt/.xml等格式。

2 系统实现

2.1 系统架构 系统通过话单原始数据通过浏览器导入服务器端的数据库,通过数据分析模型对数据进行合并、筛选、分离和碰撞,将最终的结果数据进行数据存储和输出。

2.2 网络架构 系统为C/S架构,外网的移动终端和电脑设备进行VPN连接至内网,由防火墙对外网访问进行保护,内网终端通过LAN进行服务器访问,服务器由应用服务器和数据库服务器组成,数据库服务器和应用服务器通过内网并限制IP访问,对数据库进行安全隔离访问。

2.3 系统功能

2.3.1 案件管理 提供创建、修改和删除案件信息,提供案件描述和案件名称的信息,形成案件列表,提供后续案件筛选时进行选择。

2.3.2 数据导入模块

①各运营商数据导入。通过各个运营商提供的各基站的报表,并按照数据的类型进行分类,如同基站不同时间段数据、不同基站同时间段数据,不同时间段不同基站的数据等。系统统一将运营商提供的excel表格或是文本导入至系统的话单数据表中,自动吸取各运营商不同数据中相同的部分,如呼出号码、接受号码、呼出时间、呼叫时长等。

②数据格式化处理。用户选择导入数据,设置与标准表的映射关系,将原始数据格式化成标准格式,导入的数据提供数据格式处理,如清除字符串多余字符、清除空格和相同冗余数据等,完成处理后导入至标准表中。

2.3.3 数据分析模块 数据分析模块分数据筛选和数据碰撞两部分,数据筛选排除初步筛选出的无效数据,数据碰撞则对筛选出的数据进行数据分析和排查,通过数据筛选操作,可大大降低无效数据的干扰,提高数据查询效率和系统响应速度。

①数据合并。各运营商提供的数据将统一入库,形成一张规范的数据汇总表,系统将不同数据来源相同的字段统一合并,并以运营商和基站进行分类识别。

②数据筛选。操作员通过设定呼叫时间、通话时长、本地号码、异地号码等条件进行数据筛选,将导入的标准格式原数据进行筛选,原始数据存在海量的无效数据,数据筛选将排除初步判定无效的数据,將这些数据剥离,初步筛选后的有效数据以基站名或是时间段名存入标准库表中。

③数据分离。通过数据筛选后,操作员可以选择将筛选后不符合条件的数据进行分离,保留符合条件的数据,分离的数据依然保存在数据库中,如果需要重新筛选,操作员可以将分离的数据继续合并到现有的数据中,然后进行下一次筛选。分离数据的作用是为了将有效数据保留,降低查询复杂度和提高查询效率,使得操作员可以更直观地分析可疑数据。

④数据碰撞。数据碰撞是通过以上的数据操作,在分离后的数据中进行的数据分析,如同一个基站的呼入号码和呼出号码相同的数据,呼出时间和接受时间相同的数据。通话频率符合案发时疑犯通话频率的数据等。可根据操作员实际的工作经验结合数据筛选的功能,将符合案情的数据筛查出来。管理员也可以设置常规的数据碰撞条件,形成数据分析模型,提供今后排查时进行初步筛选有效数据。

1)单个号码分析。用户可以选择案件和案件中的基站数据,通过碰撞条件筛选出有效数据,可以再从有效数据中统计单个号码的通话频率,查看通话数据,也可以通过查询单个号码,筛选出当天的通话记录,查看基站轨迹,提供单天通话频率的柱状图显示。2)单个号码基站分析。用户可以从筛选出的有效数据查询基站的轨迹数据,数据按时间顺序排列,用户可以设置基站方位,以图形化的方式展示单个号码在一天内经过的基站。3)多基站碰撞。用户可以选择案件,从案件导入的数据表中选择多个基站数据进行分析和碰撞,碰撞条件如下:时间段选择、时长选择、主叫归属地选择、被叫归属地选择、主叫运营商选择、被叫运营商选择、主叫号码段、被叫号码段、SIM卡号、电子串码及基站复选,碰撞主叫号码与被叫号码相同的数据。多基站数据将以多个数据集的方式显示,以比对不同基站中符合条件的数据。4)单独基站碰撞。用户可以选择案件中某个基站的数据,碰撞条件如下:时间段选择、时长选择、主叫归属地选择、被叫归属地选择、主叫运营商选择、被叫运营商选择、主叫号码段、被叫号码段、SIM卡号、电子串码及基站复选,碰撞主叫号码与被叫号码相同的数据。单独基站可以设定时间段查询(多天同一时间段),按通话次数最多的顺序和通话时间最长顺序进行排序。

2.3.4 数据分析模型 数据分析模型是存储操作员在实际操作中的经验筛查条件模型,操作员可以使用数据分析模型直接对数据进行筛选,无需再逐步地进行条件筛查,特殊条件时可以自定义新的数据分析模型,供今后更方便的筛选数据,同时对新的操作员提供经验模型。

①模型建立。操作员可以对一些组合查询建立自己查询,包括筛选数据的顺序步骤和查询组合。操作员可以添加数据模型的名称、查询步骤、步骤条件等。②模型修改。操作员可以对数据模型进行修改,修改模型的名称、查询步骤和步骤条件等,能够对模型组合进行重新整理和修正,实现模型的可视化修改。

3 结论与展望

在刑侦工作中,快速地获取各种警情的分析数据对案情的取证和破解尤为重要,随着科技的迅速发展,各种维度和角度进行案件信息的分析,为警务工作人员提供了更为有力的支持。随着大数据的和云平台的发展,基于大数据分布式计算和大数据分析的刑侦手段会越来越多和越来越广泛,同时也更高效和稳定,会给刑侦工作带来更多的便利。

参考文献:

[1]张学敏.基于GIS移动通信基站信号分析系统的设计与实现[D].电子科技大学,2011.

[2]黄晨.手机话单分析系统的设计与实现[J].警察技术,2013(02).

[3]黄砻.手机话单分析技术在职务犯罪侦查中的運用[J].法制与社会,2016(24).