多源数据关联分析在走私犯罪案件侦办中的应用探讨

2019-05-10 00:21孔慧峰
法制博览 2019年2期
关键词:云计算

摘 要:本文从海关缉私办案实战角度介绍了例如电子取证数据及其他业务数据等多源数据关联分析在走私犯罪案件侦办过程中日益凸显的作用,探讨数据分析软件在案件侦办中的应用现状,分析海关缉私部门在办案过程中开展涉案数据分析所面临的问题和挑战,并结合云计算技术和大数据应用的发展提出相关建议。

关键词:走私犯罪;电子取证;数据关联分析;云计算

中图分类号:D917;F752.5文献标识码:A文章编号:2095-4379-(2019)05-0176-02

作者简介:孔慧峰(1980-),男,浙江宁波人,宁波海关缉私局,工程师,从事计算机科技应用管理与研究。

随着互联网、智能手机、电子商务、电子金融、物联网、人工智能等技术的飞速发展和使用成本降低,智能手机、平板电脑、新型汽车、智能家居、各类数码设备乃至机器人等存储和通信网络终端多样化发展,以及即时消息、电子邮件、微博、朋友圈、论坛贴吧、交通租车、购物平台、网络云盘等通信和应用服务软件大量涌现,人们的生活方式随之发生了深刻的变化,人们对互联网和智能手机的依赖程度增加,数据记录形式日趋电子化,在走私犯罪案件办理过程中,越来越多的电子数据也成为客观证实犯罪行为的重要证据,电子数据已当仁不让成为新的“证据之王”[1],大量关联涉案物证所存储的多形式数据就如同未探明的玉石矿,在其单独价值被发掘之后,仍可能通过多源数据关联分析不断挖掘产生价值。

一、多源数据关联分析应用发展的背景

在走私犯罪案件中,电子取证数据往往对案件的定性、批捕、起诉、判决起到非常关键的作用。不同类型的走私犯罪案件中电子取证数据及案件所涉的公安、海关、银行、通讯等相关多源数据,往往具备大数据的多样化、海量、快速、灵活和复杂“4V+1C”特点[2],针对多源数据关联分析能力的建设是紧跟时代发展和法治发展,适应“智慧缉私”发展需要的。

当前,走私犯罪呈现团伙化、专业化、网络化特征,每个行为主体之间的联系方式多种多样,行为轨迹分散,海量信息以片段形式存在,而这些以片段形式存储的数据和信息可能是案件重要信息、线索甚至案件突破的关键,在越来越多的走私案件中,需要对大量片段化、碎片化的涉案数据或信息进行高效搜索、挖掘和分析。

二、多源数据关联分析在走私犯罪案件侦办中的应用现状

近年来,在公安系统的信息化建设中,已系统建成多个案件数据库,公安部构建了公安数据云平台,并有数个省市的公安机关将电子数据检索分析系统接入云数据平台,以大数据为支撑,将多源数据关联分析投入实战应用并发挥了巨大的效用。

海关缉私部门历经数年电子取证实验室和电子取证装备软硬件建设,多数直属海关缉私局建立了电子取证实验室,系统地装备了电子取证、现场勘查、综合采集、数据分析等软硬件。在多数走私犯罪案件侦办过程中,可能综合获取到大量数据,如私货物流、单证记录、人员通讯、运动轨迹、资金流向、声音影像、费用记账等各类结构化和非结构化数据,在依法规范取证的前提下,这些数据因其真实、客观、有效,是认定走私犯罪的重要证据组成部分。缉私部门也已采用了一些数据分析辅助工具,以求将犯罪嫌疑人身份信息、行踪轨迹、关系网络、性格特征等情况进行分析展示,辅助为案件侦查提供方向,提升破案效率。

随着犯罪分子反侦查意识不断增强,走私犯罪团伙呈網络结构复杂化、犯罪手法隐蔽化发展,仅仅依靠对个别物证取证,将越来越难以实现全面有效的证据获取和挖掘,要高效开展海量电子数据取证及多源数据关联分析,对于后台数据支撑、战法模型构建、分析人员能力等多方面都提出了非常大的挑战。

三、多源数据关联分析的难点和解决路径探讨

(一)多源异构数据的整合

大量案件涉及电子取证数据、涉案主体信息、手机通联数据、海关业务数据、银行资金记录等多源数据,而各类数据往往以分散形式存在,办案干警需要人工对大量数据进行查询、调取、筛选、分析,从浩如烟海的数据中寻找线索,不仅效率低下,差错遗漏也很难避免。

各级政府、公安、海关、银行、电讯机构等经长年累积已形成巨大数据库,如何对分散异构数据进行整合,构建业务数据仓库,是多源数据关联分析的一大挑战。对分散异构数据库需要进行无缝链接,在逻辑上形成一个新的有机整体,这种整合方式不是简单的“数据库相加”,而是剔除多个数据库内的重复信息后形成新的虚拟性数据资源体系,让不同系统的数据和信息或整合存储、或链接运行在同一个平台上,进而通过快速检索与分析,大大提升数据分析功效。

(二)业务数据云析平台的支撑

传统的功能相对单一、支持数据格式受限的数据分析应用软件,已不能适应当前海量多源数据关联分析的业务需求。

而云计算可以为存储和分析海量数据提供高效的存储和计算平台[3],通过建设缉私电子数据存储及关联分析云平台,可以将缉私办案电子取证数据、图文音视频多媒体信息、电子邮件信息、银行资金数据、通讯联络数据、公安大数据,甚至各类物联网终端数据等加以汇聚,形成集成化、智能化的联网快速搜索和关联分析系统,通过数据清洗、数据挖掘、大数据关联、智能识别转化等相关技术对电子数据进行关联分析,运用云计算的分布式计算模式,可以将计算任务分配到不同计算节点上,根据业务需求动态形成相适应的计算和存储服务能力,高效支撑海量数据的快速查询和关联分析。

(三)契合业务特点模型的建立

现有的数据关联分析工具多基于公安行业特定警种的需求进行设计和应用建设,少有深度结合缉私业务的应用,源于不同数据库的数据结构定义不一致,文档、图片、视频等非结构化数据导入不完整,语义分析、模糊查询、模型建设[4]也尚待发展。

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的应用数据中提取隐藏在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[5]。多源数据关联分析是一个需要长期积累和衍生的过程,我们不但需要在实战工作中逐步积累数据,对业务数据进行加工整合,更需要不断的完善新的业务模型,组织数据模型,契合缉私业务特性建立多维度分析主题,不断丰富方法在多源大数据中挖掘出涉案关键小数据,辨识不同形式走私犯罪活动的共同点和差异点,将多源数据关联分析配以形象、直观的展示,并与丰富的侦查办案手段相结合,助力构建完整的证据链条。

(四)数据关联分析队伍的建设

涉案数据关联分析涉及法学、侦查学、计算机科学、统计学等多学科理论,这要求数据分析人员需要具备很高的综合素质。随着时代和技术的发展,新的走私犯罪手段、途径不断涌现,案件侦办和数据分析的难度不断加大,办案人员不仅需要丰富的取证和分析经验,还需要学习新技能、掌握新方法,不断提高运用数据关联分析工具的能力。需要加强专业建设,完善培养模式,积极引进专业人才,健全考核和激励机制,对涉及特定专业领域的走私大案要案,还可以联合相关领域甚至跨行业的专家,借助第三方专业机构运用“外脑”共同开展涉案数据的分析挖掘。

多源数据关联分析的应用在国内正进入加速发展阶段,在海关缉私业务中的应用也处于关键发展阶段。技术创新和业务应用是一个相辅相成的发展过程,我们需要积极尝试新技术、新思路,根据缉私业务实际情况,主要从数据提取转化导入、综合数据仓库建设、可视化功能模块建设、数据关联挖掘分析四大层面开展多源数据关联分析平台建设,不断改进完善,从量变到质变,探索和开创紧密契合缉私业务的数据分析有效手段,以取得良好的实战效果。

[ 参 考 文 献 ]

[1]刘品新.中国电子证据立法研究[M].北京:人民大学出版社,2005.9.

[2]中国电子科学研究院学报编辑部.大数据时代[J].北京:中国电子科学研究院学报,2013,6(1):27-31.

[3]王轶,达新宇.分布式并行数据挖掘计算框架及其算法研究[J].微电子学与计算机,2006,23(9):223-225.

[4]韩瑛.大数据在信息系统设计与推广中的思考[J].天津:中国管理信息化,2015,24(2):166-167.

[5]毛同君,段立娟,王实,等.数据挖掘原理与算法[M].北京:清华大学出版社,2005:64-205.

猜你喜欢
云计算
谈云计算与信息资源共享管理
基于MapReduce的故障诊断方法
实验云:理论教学与实验教学深度融合的助推器