章光明,黄文志
(台湾警察大学, 中国 台北)
大数据在犯罪侦查中的应用
章光明,黄文志
(台湾警察大学, 中国 台北)
自1990年以来,欧美等国家开始使用CompStat、Coplink等数据库软件,整合系统分析技术,从过去储存的各种数据库分析犯罪行为模式、犯罪热点等问题。美国的PredPol犯罪预测系统、纽约市警察局的“实时打击犯罪中心”、新加坡的RAHS(Risk Assessment and Horizon Scanning)系统等,都成为了警务大数据在犯罪预防与侦查上的先驱计划,台湾警方在路口监视系统、车牌辨识系统、关系型分析平台等方面也提供了大数据的实际操作。但警务大数据绝不仅仅是打击犯罪的工具,而只有将警察的专业判断与丰富的经验和警务大数据配合,两者相辅相成才是维护社会安全的核心。
大数据;犯罪侦查;信息分析;情报分析
1990年以来,欧美等国家开始使用CompStat、Coplink等数据库系统,整合了系统分析技术,从过去储存之各种数据库分析犯罪行为模式、犯罪热点等。但2010年以后,大数据的概念取而代之,加入民众提供影音信息、社群媒体讨论内容及警察查访所得数据等,进行结构化、半结构化及非结构化数据交叉比对,辅以大数据分析技术,方能有效找出潜在犯罪关联性,主动协助侦查人员取得有效线索与情资。
从纽约市警局的CompStat演进而来的Coplink系统是一套整合数个执法单位的系统,结合了报案系统、罪犯相片数据库、刑案信息系统等,运用数据分析、探勘、分群、分类、建立关联、特征识别等技术来分析罪犯的行为模式,并可将汇整的数据显示至地图或制作各种表格,协助警察侦查犯罪。
Coplink系统系由台湾留美博士陈炘钧(Hsin-Chun Chen)成立之人工智能实验室所开发。1996年由陈博士领导研发的“Coplink and Dark Web”计划,透过分析土桑市警察局的数据,研发出一套算法,用来分析嫌犯、犯罪者与空间的关系。后来这项技术由IBM公司以并购方式取得,并更名为IBM i2 Coplink。Coplink系统由11套程序组成,各程序功能简述如下(柯宏叡,2014):
1.A3——将各种执法单位数据库系统进行链接,以达到重要数据的共享并提供快速且同步的搜寻。
2.ACT——用来监视在特定或关键公共设施周围是否有可疑活动。
3.ACTIVE Agent——让使用者设定参数,自动产生告警数据,以保护机密调查。
4.CompStat Analyzer——一种犯罪行为的趋势统计分析和决策支持系统,帮助侦查者以地图或图表等更直观地了解犯罪活动是发生在何地、何时、何人。
5.Dashboard——提供实时犯罪监控的功能,帮助执法机关监控和管理其活动,使管理人员能快速识别并采取行动。
6.Face Match——相片辨识软件,输入嫌犯影像可从系统中找出符合或接近的影像。
7.Incident Analyzer——提供使用者选定一个特定的地理区域进一步分析,并筛选与该区域有关的情报信息,其中包括时间和空间分析。
8.Intel L.E.A.D. ——提供给情报执法机关用来输入记录及进行数据库持续搜寻的程序,一旦有新增的数据进入数据库,并符合之前设定的查询规则,就会立即通知相关单位。
9.Mobile——让使用者可透过智能型手机以串流方式存取前科记录、相片数据等。
10.Visualizer——能将人、地、物等数据的关联以图形方式呈现。
11.Analysis Search——可让使用者将Coplink数据输入Analyst’s Notebook做关联分析的功能。
IBM i2 Coplink系统可以提供策略方向,协助警察在许多看似不相关的资料中发掘调查线索;也可以图形方式分析数据,并依时间顺序排列;将多个数据库集中在一个系统内,并找出数据隐藏的价值(如图1)。警察可透过这套系统将数据与其它执法机关分享,透过加密和密码防护,不需担心数据保护问题。任何时间,只要侦查需要,警察可在办公室、车上或任何一个有行动装置的地点查询。
2015年IBM公司宣布,为了能让规模大小不一的警察局都能采纳该系统,且为了降低警察单位维护系统和服务器的费用,IBM公司将i2 Coplink的进阶提升为i2 Coplink云端(IBM i2 Coplink on Cloud)。目前,全美有6000个执法单位使用IBM i2 Coplink,数据储存在云端,除可由IBM公司提供信息安全防护外,它也可以让拥有400个警察的警察局像拥有4000个警察的警察局一样,透过IBM公司提供服务,而不需有专责的IT人员①引述自David Griffith, June 23rd, 2015. IBM Introduces Cloud Version of Coplink, Police Magazine, Retrieved on Oct. 2, 2015 from http://www.policemag.com/blog/technology/story/2015/06/ibm-introducescloud-version-of-coplink.aspx.。
图1:IBM i2 Coplink on Cloud的查询接口(数据来源:Police Magazine)
由于技术上的困难,过去国际间的警务合作往往局限在特定目的,且在个案的基础上分享情资。但某些跨领域的犯罪(例如诈欺案),往往涉及处理庞大的信息和金钱流向的数据,被害国需要将数据与他国执法机构共享,以便联合调查,此时,常因各国资料的格式不同而有困难。但近几年来,由于出现了先进的计算机及网络科技,大数据的数据分析更有效率,更可藉由关联及模式分析,有效协助侦查犯罪①引述自Abbi Hobbs, 2014. Big Data, Crime and Security, POSTnote, p.3.。以下介绍欧盟对于大数据的运用,即如何协助犯罪侦查。目前,欧盟对于大数据的应用主要是建立各国可以共享的三个数据库(杨汉鹏,2015,86-87页):
1.欧盟指纹数据库(EURODAC-European Dactyloscopy)——欧盟自2003年开始,要求所有14岁以上的难民申请者留下指纹数据,建立一个欧盟难民申请者数据库,以便他们查核同一人是否曾向另一个欧盟国家申请,根据规定,重复申请者将被遣返到最初申请的那个国家,而难民申请者提供的指纹将储存在“欧盟指纹数据库”中。
2.申根信息系统(SIS-Schengen Information System)——欧盟针对国家安全与边境管理需求所建立的系统。透过此系统,各国警方可以共享交换某些特定范畴的个人与货物数据,例如罪犯、失踪人口、不受欢迎的名单、遗失货品、赃物等。欧盟会员国可以透过国家部门(N-SIS)与中央技术系统功能(C-SIS)连接取得信息。
3.弹道比对数据(Project Odyssey)——2011年欧盟开启了奥德赛计划,建立一个欧洲执法机关得以共享的弹道数据库,该系统可让欧盟会员国能藉由不同的弹道系统转换和比对数据,在不牺牲个人数据的安全前提下有效地共享资料。
英国Accenture公司研发的犯罪预测软件,利用英国警方的数据库,包含曾经有过前科、登记在案的潜在危险分子,再加上“脸书”、“推特”与各大论坛、网站的言论做比对,透过关键词进行比对与分析,找出最有可能的犯罪动机。为了证明其准确度,英国警方针对伦敦32个行政区内的黑帮和走私贩子、潜在危险人物进行跟踪和资讯搜集,再交由资深警察以经验来判断,指出哪些人可能具有高度犯罪动机。警察所列的名单与计算机预测的名单进行交叉比对,看看双方推论的潜在犯罪分子是否一致或吻合,最后的结果证实了这套系统的犯罪预测相当准确。简单而言,此系统透过社交网络分析搭配大数据数据库,比对出哪些人可能具有高度反社会化、激进思想和暴力行为(杨汉鹏,2015,第85页)。
美国“9·11”事件后,纽约市警察局成立了“实时打击犯罪中心(RTCC- The Real Time Crime Center)”。该中心的犯罪数据库拥有5百万犯罪与保释的相关记录,3亿3千万笔公开资料及3千1百万笔全国罪犯记录等。全年无休的关键数据库可发挥实时分析功能,让纽约市警察得以快速地透过数据分析,缩短犯罪剖绘和追踪的时间。RTCC组织功能分成三部分(杨汉鹏,2015,88-90页):
1.调查支持组(Investigative Support Section)——目前有30个数据库,由整合大量的结构化与非结构化数据,快速地进行犯罪分析,提供案件相关线索、信息给予所有纽约市警察执行犯罪侦防勤务。目前该中心使用的资讯整合系统分析简称为WISE(Web Intelligent Search Engine,网络智能搜寻引擎),结合智能数据探测、GIS地图信息、GPS追踪、车牌辨识、嫌疑人警示及外部数据库结合等功能,并有案件管理、分享功能,以智能化技术分析,将各种来源之资料转化为决策智能,辅助外勤人员迅速掌握犯罪嫌疑人。值得一提的是,RTCC的车牌辨识系统(LPR- License Plate Reader)包含固定式及车载式两种,各约有1500个镜头,固定式放置在各重要路口、桥梁及隧道等,车载式则将镜头装置于巡逻车上,停放在所需位置后,摄录过往车辆并辨识车牌,并可由键入全部或部分车牌搜寻,亦可使用地理区域、车主、车辆厂牌及外观等关键搜寻,并可连接如交通违规系统、失窃车牌记录等数据库,甚至可结合地图分析车牌行进轨迹。
2.青少年犯罪支援组(Juvenile Crime Desk)——RTCC于2006年成立此单位,提供办案警察24小时全天候服务,由娴熟青少年犯罪事件处理流程之警官担任咨询人员,一般刑警接触到疑似青少年犯罪事件时,立即可以打电话向青少年犯罪支持组寻求咨询服务。而单一服务窗口即提供咨询服务,告知应注意事项、流程、其它应联络单位等,协助承办警察办理以下工作:(1)查询青少年嫌疑人的过往记录;(2)查询家长或监护人的犯罪记录;(3)给予还押或是具结担保的建议;(4)制作逮捕文书;(5)针对何时进行采验指纹及档案照片拍摄给予指导;(6)提供刑警应出庭的日期和地点。青少年犯罪支持组成立至今,已成功地提升了青少年犯罪案件的逮捕和起诉的比例,并帮助纽约市警察处理逮捕和诉讼程序,加快案件处理效率。更重要的是,由于加强了青少年犯罪案件的执法绩效,进一步预防了今天的青少年成为明天的成年罪犯。
3.脸部辨识组(FIS, Facial Identification Section)——在2011年10月正式运作,主要任务为支持各外勤单位辨识特定对象之身份,以提供侦查犯罪线索。此单位利用先进的计算机软件,以生物统计算法辨识人脸的生物特征,再比对具有大头像照片之数据库,内部数据库目前仅限前科犯影像数据库,外部数据库则是利用各种公开数据,例如证件照片及脸书Facebook、Apple、I-cloud、YouTube等社群网站。供给FIS辨识照片之质量愈高,辨识率则愈准确,照片以正面、高解析、亮度高及距离近之脸部影像最佳。脸部辨识的工作流程简述如下:(1)提交人脸辨识需求;(2)研究人员自ECMS系统(Enterprise Case Management System)中查看并分析提交的照片和影像;(3)如果有需要,利用专门的软件增强提供的原始照片和影像档案;(4)双重Morpho Trust系统和NEC系统管道进行搜寻;(5)在每次搜寻后,产生一个约200人的名单供研究人员审查;(6)研究人员提出1个符合条件人员的资料;(7)再经由其他同事审查;(8)对这1位可能符合条件的人员进行详细的背景调查。
区域警示系统(DAS-Domain Awareness System)是纽约市警察局的另一套著名的数据库系统。该系统收集并分析来自纽约市3000只公共监视镜头、超过200个车牌辨识系统、2000多个辐射传感器以及警察数据库里的信息。该系统结合了微软的专业技术与纽约市警察的实务经验与知识,能实时提供警方与嫌犯有关的人、事、时、地、物等分析,让警察以前所未见的方式去了解信息。此系统采用影像分析软件,能分析如可疑包裹等威胁。纽约市警局称此系统可以追踪与犯罪嫌疑人相关联的汽车在过去几天、几周或几个月的位置,甚至此系统还可以检查车牌号码,通过与观察名单进行分析,并给予警方与车主相关的前科资料。该系统具有以下主要特点(杨汉鹏,2015,90-91页):
1.警方能透过影像传输实时接收信息,并且立即看到嫌犯的前科资料、有关嫌犯的报案记录以及该地区曾经发生的犯罪。
2.警方能够借着标注过去犯罪发生的地理空间及时间顺序,描绘出犯罪模式。
3.警方可以追踪与犯罪嫌疑人相关联的汽车在现在、过去几天、几周或甚至几个月的位置。
4.警察指挥官可以依据犯罪数据库,配置现有的资源。
5.若发现可疑包裹,纽约市警察局可以立即调阅影像,快速查明是谁放置的。
6.如果辐射探测器发出警报并通知曼哈顿安全倡议指挥中心,此系统将有助于快速辨识放射性物质是自然发生的还是武器、医疗用的无害同位素。
新加坡于2003年建立了RAHS(Risk Assessment and Horizon Scanning)系统,用于搜集并筛选大量数据加以分析、建立模型,分析可能出现的事件,并在新加坡政府机构内分享。任何部门只要觉得信息有用就可以保存下来,以便进行监控。此系统主要有以下5个特点(杨汉鹏,2015,页87):
1.收集和组织数据——RAHS系统将所有非结构化数据组合在一起,而这些数据主要来自公开信息。
2.发展因果关系——建立各类模型以了解和描绘出情势。
3.监控和侦测——监控是此系统的关键,将搜集到的数据与过去曾经辨识过的模式或事物做比对。
4.发现和判断模式——经由语言、视觉等辨识系统处理数据并发掘新模式。
5.合作——就搜集数据、模式和监控而言,合作是此系统的重要关键因素。
至今,主管RAHS系统的官员对该系统究竟监控哪些数据还是守口如瓶,他们只承认其中一部分信息来自公开渠道,如新闻报导、“脸书”和“推特”等。但RAHS系统搜集的数据不仅如此,在新加坡,对居民和游客进行电子监控普遍存在,而且被广泛接受。新加坡所有网络都经过过滤,主要是针对色情网页和种族主义言论。此外,游客也是监控对象,游客每到一地,通常要买当地手机的SIM卡,犯罪分子喜欢可抛式的SIM卡,难以追踪。但要在新加坡买卡,任何人都要提供身份证件或护照号码,跟电话号码联系起来,这意味着电话公司及政府拥有所有人的通话记录。简而言之,新加坡的RAHS系统是由各种监视媒介(如监视器、网络等)与数据库的连接和再现,整合成了实体空间与虚拟空间的数字化监视网络。在公共空间内,几乎每栋建筑物内外都设置了隐蔽的监视录像系统,且为了达到更好的监视效果,镜头还可以调节远近以追踪目标。连接建筑物监视系统的是道路上的监视设施,依政府规定,所有车辆必须安装“读卡器”,以配合特定道路上实施的“公路电子收费制(ERPS-Electronic Road Pricing System) ”、“卫星扫描交通系统”、“高速公路监察与提示系统(俗称公路电眼)”、“卫星传呼出租车系统(Satellite Tracking System)”等多重监视设备。另外,在生活环境方面,电梯里的摄影机可录下吐痰者,尿液侦测器(Urine Doctor)可抓到撒尿者,当仪器感应为尿液后便会警铃大作,电梯门便紧闭直至执法人员赶到,若遭法庭定罪处罚则可达新台币4万元。而除了其监视硬件发达外,RAHS系统的监视软件也颇负盛名。近年来,新加坡南洋理工学院的研究人员开发了一套可实时传输画面的网络监视软件,该系统能分辨出公共空间的正常行为和可疑行动,其准确度能达到95%,监视应用科技的设计与成果显示出了新加坡对监视科技的高度需求与投入。换言之,在新加坡引以为傲的安全、有序的生活和交通背后,潜藏的是无所不在的监视系统。
Explore on the Application of Big Data on Investigating Crime
Zhang Guangming, Huang Wenzhi
(Taiwan Police University, Taibei, China)
With the coming of big data, information has played a more and more important role in criminal off ence struggle. The increase of scale and complexity of big data exceeds that of the capacity of software and hardware characterized by the law, which brings big challenge to the architecture, the processing and computing capacity of the contemporary counter-terrorism information analysis systems,meanwhile presents unprecedented opportunities on deeply mining and taking full advantage of the value of big data. At the same time, compstat is a new management mode of America policing. From the day of being using compstat was implemented, there are big progress and success on crime-fi ghting and social security. In this thesis a detail analysis of bag data mode is provided from its concept, principle, and constituent. It can also be a reference for modern police management mode.
Big Data; Investigate Crime; Information Study; Information Analysis
D631.5
A
1008-5750(2016)01-0084-(06) DOI:10.13643/j.cnki.issn1008-5750.2016.01.013
2015-12-02责任编辑:孙树峰
章光明,男,台湾警察大学行政警察学系教授兼任警政管理学院院长;黄文志,男,台湾警察大学国境警察学系助理教授。