薛亚龙,刘如意
(宁夏警官职业学院,宁夏 银川 750021)
在数据驱动创新时代,海量的数据不仅推动着相关产业的前进,而且还给各学科的研究领域提供新的研究思维和方法。同时,世界各国的警察机关亦逐步地接受和应用数据驱动创新的理论和方法为警察工作服务,尤其是数据驱动创新方法在预防和打击犯罪中的应用。数据驱动创新的侦查方法在帮助侦查人员提升侦查效能和创新侦查思维的同时,也给侦查人员带来了巨大的挑战。一方面,大量动态、复杂、不确定的海量数据,造成传统的侦查方法和侦查模式出现瓶颈;另一方面,在数据驱动创新的新时代,迫切需要发挥数据驱动创新方法在侦查工作中的引领和决定性作用。引入基于SWOT数据驱动情报侦查相关性的研究范式,不仅让侦查人员对动态性数据的相关性展开挖掘与分析,而且还能够促使侦查人员获取和掌握犯罪情势发展的基本规律,从而对犯罪情势进行及时有效的侦查预测和侦查决策。
SWOT科学理论最早属于管理学的研究范畴,学者Learned等人在1965年从战略管理的角度提出SWOT的研究方法,建议在研究企业战略管理过程中应该包含内部管理优势、弱点、外部机会、威胁等相关要素,但是这些研究要素处于相对孤立研究的状态。1972年,美国经济学家安德鲁斯在其著作《公司战略概论》中正式提出SWOT研究法,安德鲁斯指出:“SWOT研究法应该包括研究对象的内部优势和劣势、外部机会和威胁等构成要素,然后用管理学中的战略管理系统分析思维方法,从而做出企业的优化决策分析方法。”[1]20世纪80年代,美国旧金山大学的一位管理学教授提出,“所谓的SWOT分析法是指基于内外部竞争环境和竞争下的态势分析,就是将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论,而结论通常带有一定的决策性。”[2]随着国内外学者对SWOT科学理论的研究,SWOT科学理论从最初的管理学、经济学、战略学研究领域逐步应用到艺术学、规划学、教育学以及旅游学等多个学科研究领域。由于不同学科的研究对象和体系不同,造成不同学科的专家学者对SWOT学科理论的内涵和外延的理解仍然存在一定的差异性。通说认为,SWOT学科理论的构成要素主要包括优势(Strengths)、劣势(Weaknesses)、机会(Opportunities)、威胁(Threats)四个方面(简称SWOT)。
到目前为止,SWOT分析法已经被成功地移植应用于各个学科研究领域,SWOT分析法不仅能够对研究对象进行全面、客观、系统准确的分析,而且还能够在没有精确数据支持下通过对分散、模糊的动态性数据进行相关性的挖掘与分析,从而得出结论且制定出相应的发展计划和战略管理决策。
在当前云计算、“互联网+”、物联网、人工智能等数据驱动情报侦查工作改革的背景下,以数据驱动情报侦查相关性自身的动态性、开放性、关联性等显著的侦查情势特征为基础,开展基于SWOT数据驱动情报侦查相关性研究,不仅能够为基于SWOT数据驱动情报侦查的相关性构建奠定理论基础,而且还能够提高侦查人员对侦查预测的准确性和侦查决策的优化性,从而实现“主动出击、精确打击”的侦查效果。
1.数据驱动情报侦查相关性的动态性
数据驱动情报侦查的相关性既包括案件内外因素相互作用的数据情报,又包括案件中数据情报变化的方向和发展的态势。“势”即态势之意,主要是指在数据驱动情报侦查相关性研判的过程中包含人为、易变、环境以及潜在性的案件数据情报,其与“形”相对应,后者主要包含在数据驱动情报侦查相关性中能动或随机的数据情报。数据驱动情报侦查相关性最显著的特征就是它会随着侦查人员、犯罪嫌疑人以及侦查环境等具有“混沌”体系的动态情势发生变化,而且数据驱动情报侦查相关性还是侦查人员和犯罪嫌疑人在一定时空范围内对涉案数据情报构建的重要组成部分。它不仅是侦查人员通过数据驱动情报侦查方法对案件数据相关性的研判和预测,而且还是侦查人员对虚拟犯罪空间的重建。但是,数据驱动情报侦查相关性的动态性是随着其侦查情势的发展而变化,既有有利于案件侦查的侦查情势,又有不利于案件侦查的侦查情势。因此,数据驱动情报侦查的相关性研判只能通过对主观和客观、内在和外在、必然和偶然等具有“混沌”体系的侦查情势的认识而把握,侦查人员只有全面、客观地掌握了数据驱动情报侦查相关性的动态性,才能够对数据驱动情报侦查相关性进行全面的研判和精准的预测,避免陷入侦查思维的僵局。
2.数据驱动情报侦查相关性的开放性
依据数据驱动情报侦查相关性的动态性,数据驱动情报侦查的相关性是由众多具有动态性的“混沌”体系而构成。侦查人员想对案件中数据驱动情报侦查的相关性进行研判从而做出准确的侦查预测,就必然要掌握数据驱动情报侦查相关性内在和外在相互的作用形式,这样才能使侦查人员在“活力对抗”的数据驱动情报侦查相关性中对动态性数据的挖掘与分析占据主动权,达到对侦查决策的准确性和优化性。同时,根据系统学和耗散学的原理,数据驱动情报侦查中的各相关性要素主要以系统性的形式呈现和发展,这些具有相关性的数据情报之间处于互相联系、共同作用的模式。然而,数据驱动情报侦查相关性分析和预测的核心价值就是要促使侦查人员实现对侦查预测的精准性和侦查决策的优化性,数据驱动情报侦查相关性的强弱关系取决于各要素与其内核位置互相连接而形成的类似蜘蛛网络系统的“横断剖面”。各个相关性要素在数据驱动情报侦查中均呈现出具有指向性和根源性的特征情势。相关性要素处于或靠近案件核心位置,那么该要素就在数据驱动情报侦查相关性研判中处于强相关态势;反之,则处于弱相关态势。部分甚至还会脱离数据驱动情报侦查相关性这个“混沌”系统,对数据驱动情报侦查的相关性研判起不到任何作用。因此,数据驱动情报侦查的相关性研判具有典型的开放性特征,数据驱动情报侦查中的各相关性要素要时刻与侦查主体、侦查客体、侦查环境等进行数据信息的交换。只有在数据驱动情报侦查相关性研判的过程中树立开放性的侦查思维,侦查人员才能更加准确地掌握各种制约或影响数据驱动情报侦查相关性研判和预测的因素,才能在数据驱动情报侦查的相关性研判中掌握侦查情势变化发展的主导性。
3.数据驱动情报侦查相关性的关联性
数据驱动情报侦查相关性的关联性特征是数据驱动情报侦查相关性的内在本质必然的外在表现。从侦查人员对侦查情势需求的角度而言,数据驱动情报侦查相关性的关联性具有两个方面的内涵范畴:一方面,不是任何数据情报都属于数据驱动情报侦查相关性的研究范畴,只有对数据驱动情报侦查相关性研判具有侦查价值的数据情报才属于数据驱动情报侦查相关性研究的范畴。由于数据驱动情报侦查的相关性具有动态性、开放性、复杂性等内在的情势特征,必然造成各种涉及侦查主体、侦查客体、侦查环境等诸多要素进行互相联系、共同作用。如果侦查人员在数据驱动情报侦查相关性研判和预测的过程中,没有对案件涉及的要素去伪存真、去粗取精,就会投入更多的人力、物力、财力等侦查成本,案件可能出现侦查错误甚至陷入侦查僵局。另一方面,数据驱动情报侦查相关性的关联性包含案件结构的关联性和侦查结构关联性。案件结构关联性是指在数据驱动情报侦查相关性中以具体的案件事实为中心的人、事、物以及时空等要素的互相关联,而侦查结构关联性是指数据驱动情报侦查中以侦查行为为中心的侦查中主体以及侦查过程中与案件侦查有联系的主客观要素的相互关联。
从SWOT科学理论的研究范畴来看,SWOT分析法又被称为态势分析法。而将SWOT科学理论引入数据驱动情报侦查相关性研究的过程,能够促使对数据驱动情报侦查相关性研究的优势、劣势、机会和威胁等内部资源和外部环境进行综合研判。根据数据驱动情报侦查相关性具有的动态性、开放性、关联性等侦查情势特征,基于SWOT数据驱动情报侦查相关性的SWOT内容主要包含两部分:第一部分为SW部分,该部分主要用来分析数据驱动情报侦查相关性研究的内部条件;第二部分为OT部分,该部分主要用来分析数据驱动情报侦查相关性分析的外部条件。SWOT科学理论的研究范式和数据驱动情报侦查相关性的侦查情势特点决定了基于SWOT数据驱动情报侦查相关性研究的必然性。
1.数据驱动情报侦查相关性的优势(Strengths)
就传统的实体侦查方法而言,时空条件一直都是制约侦查效果和侦查效率的重要因素之一。不论是“抓住战机,及时破案”侦查工作方针的内在本质要求,还是侦查机关建立快速反应机制的外在迫切需求,都在强调时间因素对于侦查工作的至关重要性。正如法国侦查学家艾德蒙·费加尔而言:“侦查工作的头几个小时,其重要性是不可估量的,因为失掉了时间,就等于蒸发了真理。”[3]诚然,在数据驱动创新的时代,数据驱动情报侦查相关性的核心价值即侦查预测,其主要通过对涉案构成要素中的人、事、物等犯罪情报数据深入研究,深挖这些数据情报内在的相关性规律,使侦查人员实现侦查预测。随着大数据的普及和应用,犯罪嫌疑人利用大数据进行违法犯罪已成为犯罪情势发展的显著特征,造成涉案横向静态构成要素和纵向动态构成要素的数据化程度不断上升。也正是这种犯罪案件表现出来的原生态数据或衍生数据的形式存在,使得案件中的犯罪嫌疑人条件、犯罪时空、犯罪地点、犯罪手段以及犯罪方式等在一定程度上能够通过数据驱动情报侦查相关性分析被挖掘。相对传统被动的侦查模式,侦查人员能够在数据驱动情报侦查相关性分析过程中实现主动侦查或同步侦查甚至还可以采取前瞻性的侦查预防措施。侦查人员通过对犯罪嫌疑人的犯罪思维、犯罪方式以及系列性犯罪特点等相关性的数据分析,寻找涉案犯罪活动的基本规律和检测涉案犯罪情势的发展趋势,建立涉案的数据统计分析模型,从而对犯罪情势展开侦查预测。因此,数据驱动情报侦查相关性研判的优势是通过优化侦查途径和拓展侦查思维,提高侦查效率和侦查质量,采取及时准确的侦查预测和侦查决策。
2.数据驱动情报侦查相关性的劣势(Weaknesses)
首先,数据孤岛问题突出。运用数据驱动情报侦查相关性分析而展开侦查预测,其前提是需要大量的数据情报。就目前侦查人员所面临的动态性数据情报来源分析:一方面,主要还是由各个“小数据”构成,并没汇总成“大数据”情报来源;另一方面,就现存的动态性数据源来看,其主要存在于不同级别的各个国家机关、企事业单位、社会组织以及个人等所属的数据中,各个数据库之间互相独立、各自所用,没有从根本上实现数据之间的互联共享、共用,致使数据孤岛问题突出。其次,数据情报研判人才稀缺。伴随着数据驱动创新时代的发展,90%以上的社会数据呈现出半结构化或非结构化的表现形式,而且其社会数据的来源也发生了根本性的转变。面对数据驱动情报侦查的新情势、新发展,如何对原始数据或衍生数据集成转化和去粗存精、去伪存真进而通过相关性挖掘与分析达到准确的侦查预测,在数据驱动情报侦查相关性挖掘与分析过程中数据情报研判人才是最为重要的关键性要素。而数据情报研判专业人才的稀缺,最为直接的后果是造成对数据驱动情报侦查相关性进行挖掘与分析的基础薄弱和缺乏动力,导致案件中具有数理相关性的数据情报处于“休眠”状态,无法真正发挥数据驱动情报侦查相关性挖掘与分析在侦查预测和侦查决策中的侦查价值。最后,个人隐私保护问题严重。从基于SWOT数据驱动情报侦查相关性挖掘与分析对侦查预测的技术层面而言,其对涉案数据情报的发现、搜集、控制、传递以及研判到预测的整个过程,都能够发现和获取相关个人的大部分数据情报信息,并且知悉相关的隐私数据。如果侦查人员在数据驱动情报侦查相关性分析的过程中没有受制于严格的法律规制,那么会严重侵犯公民个人的隐私权,而且还会严重影响或干扰公民正常的社会生活。
3.数据驱动情报侦查相关性的机会(Opportunities)
侦查方法既是宏观的也是微观的,且要求其必须全面、客观地贯穿于对案件侦查的全过程,使之成为行之有效的侦查方法导图。从数据驱动情报侦查相关性所具有的动态性、开放性、整体性等侦查情势分析,涉案数据情报相关性分析的来源除了原生态动态性数据情报之外,还包含大量衍生的动态性数据情报信息。这不但造成犯罪情势呈现出虚拟化、网络化、数据化等新的特征,而且对破案和定案的证据体系和标准提出更加严格的条件要求,给侦查工作带来了严峻的挑战。一方面,数据驱动情报侦查的侦查情势要求侦查方法多元、发散、开放,只有这样才能够使侦查方法紧跟数据驱动创新时代的发展。目前,侦查方法不能局限于立案、破案、定案等传统的被动型思维中,应该由传统重因果关系向重相关性数理关系侦查预测的新方向转变。同时,数据驱动新时代会使传统案件中的人与物、人与人、物与物等犯罪情势发生内在的逻辑性变化,侦查人员在数据驱动情报侦查相关性分析的过程中要运用数据情报的相关性挖掘与分析案件内在具有发展规律的侦查情势,通过侦查预测对案件的侦查提出新的侦查思路。在数据驱动创新的新时代和我国侦查法治建设的大背景下,犯罪证据的虚拟性、开放性、动态性以及数据性决定了在“以审判为中心”的刑事诉讼程序改革中,破案、定案的证据体系和标准必须具有逻辑性、整体性、系统性等高标准、高规格的要求,而数据驱动情报侦查相关性研究的侦查价值正是给其前进、发展提供了必然的机遇和契机。
4.数据驱动情报侦查相关性的威胁(Threats)
在数据驱动创新时代,犯罪情势的动态性、整体性、开放性使得犯罪行为呈现出智能性、隐蔽性、非接触性等显著特点,致使侦查人员在数据驱动情报侦查相关性分析的过程中面临严重的威胁。就针对数据驱动情报侦查的相关性分析而言,其所面临的威胁主要包括两个方面:一方面,客观方面的威胁。侦查人员在对案件进行数据驱动情报侦查相关性分析的过程中,犯罪嫌疑人往往采取与之相对应的智能反侦查行为。包含个人信息泄露、网络诈骗等在内的各种网络安全问题,不但给人们的生活带来了困惑,而且还给侦查工作带来了威胁。显然,各类的数据和隐私已逐步成为数据驱动创新时代犯罪情势必然的工具,侦查人员在侦破案件过程中面临各种各样海量的“数据库”,造成侦查人员无从下手或数据持有者各自所用的“孤岛效应”等侦查僵局,致使传统侦查方法和侦查思维在面对数据驱动情报侦查相关性分析中显得力不从心。另一方面,主观方面的威胁。关于侦查工作的宣传或影视越来越多,导致各种各样的侦查工作出现在社会公众视野之中,关于犯罪现场勘查、侦查措施运用、侦查途径选择、侦查思维启发以及案情分析等侦查工作细节的报道屡见不鲜。这不仅造成各种侦查取证措施或环节的公开化,而且还致使侦查方法、侦查思维以及侦查途径的公众化,导致侦查人员在数据驱动情报侦查相关性分析的过程面对透明化的威胁。同时,各种线上和线下有关侦查学、大数据侦查、犯罪现场勘查学等侦查方面的书籍均有销售,犯罪嫌疑人可以购买并且了解、掌握关于各种侦查与反侦查方面的专业理论和技术知识,这不但使犯罪嫌疑人的犯罪行为越来越凸显智能性、隐蔽性,而且还给数据驱动情报侦查相关性的研究带来了挑战和威胁。
由于在犯罪现场中遗留有与犯罪行为和犯罪嫌疑人相关的犯罪信息,侦查人员通过全面详细地现场勘查发现、固定、提取与犯罪行为相关的痕迹物证,从而揭露和证实犯罪行为。所以,在侦查案件的过程中,侦查人员通常将犯罪现场视为侦查工作的逻辑起点,这是由犯罪现场的特殊性质和地位所决定。对犯罪现场尤其是犯罪主体现场的重视,决定了犯罪行为在其位置具有非常重要的侦查价值。然而,在数据驱动创新时代,包括犯罪行为和犯罪嫌疑人在内的犯罪情势呈现出虚拟性、隐蔽性、非接触性等新型犯罪情势特征,造成在犯罪现场遗留的可供案件侦查的痕迹物证越来越少。如果侦查人员还将主要精力集中于犯罪现场上,那么就可能会出现侦查错误甚至陷入侦查僵局。
随着犯罪现场中能够揭露和证实犯罪行为的痕迹物证越来越少,非犯罪行为的侦查价值就会越来越高。与犯罪行为相比较而言,犯罪嫌疑人在实施犯罪之前或之后的反侦查意识比较弱,不仅其视频图像等人身形象会暴露在社会公众视野之中,而且其携带或使用的相关交通工具、通信工具、网络工具等,会在非犯罪行为的过程中遗留相关的指纹、笔迹、DNA等痕迹物证。正如王大中教授所言:“犯罪现场既储存了犯罪行为,也储存有其他非犯罪行为。当犯罪行为难以被认识或为侦查提供有价值的线索时,而研究非犯罪行为则有可能对侦查有着特殊的重要作用。”[4]侦查工作的重心由犯罪行为的“何人”转向为非犯罪行为中犯罪嫌疑人实施了哪些可疑的“行为”。一方面,传统侦查工作的重点是犯罪嫌疑人实施了何种犯罪行为,而在数据驱动情报侦查相关性的分析过程中,侦查人员更加侧重于通过研判非犯罪行为挖掘和认定犯罪嫌疑人。另一方面,非犯罪行为往往还能够为侦破案件提供重要的侦查线索和侦查途径。非犯罪行为不但为侦破案件提供大量具体地点、时间、环境、内容的疑人和疑事,而且侦查人员还具有对疑人和疑事的分析、判断以及利用的权利,促使侦查人员通过非犯罪行为提高侦查效率和拓展侦查途径。诚如郝宏奎教授所言:“在侦破案件中存在两个基本规律,即案件构成要素决定着侦查方法和途径的选择,犯罪的暴露程度决定着侦查的效果。”[5]通过SWOT数据驱动情报侦查相关性对非犯罪行为的研究,不仅有利于延伸侦查工作的时空范畴,而且还有利于拓展侦查途径和提高侦查效率,其必然将会成为数据驱动创新时代侦查工作的新焦点。
在传统的案件侦查工作中,侦查人员更加注重现场痕迹物证的关联和认定,即通过现场的痕迹物证建立犯罪嫌疑人与被害人等侦查中主体①所谓“侦查中主体”即以侦查过程之外的独立的第三人之眼光看待侦查过程,案件侦查过程中有所行为的人都是这一过程的推动者,都具有主体的地位。此种认识更有利于对侦查运作过程的规律总结,客观地看待各主体对这一客观过程的影响力和作用方式,塑造“不是我在侦查,而是我在侦查中”的观念,提醒侦查人员时刻以第三者的身份冷静观察案件的发展,及时对侦查行为的效果进行评判,纠正和预防侦查错误。详见:杨宗辉、刘为军著《侦查方法论》一书,中国检察出版社2012年出版,第11页。的关联性,从而认定犯罪嫌疑人的身份。在这种传统侦查思维的引导下,证据的完整性、精确性就成为衡量痕迹物证侦查价值的标准,而众多不完整、不确定的痕迹物证则没有被引起足够的重视。随着数据驱动创新时代的发展,不论是对个案侦查还是类案侦查,侦查机关对涉及案件侦查相关专业数据库的建设均取得前所未有的成绩,尤其是大量不完整、不确定的数据情报进入侦查工作的视野之中。正如日本学者越水重臣教授所言:“从研究人体坐姿这一与数据似乎搭不上边的事物开始,通过对车辆行驶中驾驶员的身形、姿势、重量分布等数据的收集,逐步发展出了一个可供准确识别坐乘人员的汽车防盗系统一样。”[6]103涉案数据模糊性既包括不完整、不准确的侦查情报,又包括不同格式、不同标准、不同类型的侦查情报。正如学者维克托·迈尔—舍恩伯格所言:“在大数据时代,混杂性,不是竭力避免,而是标准途径。”[6]58显然,基于SWOT数据驱动情报侦查相关性研究的核心价值并不是对相关性数据侦查情报的发现、固定、提取,而是更加关注于对所获取的模糊性侦查情报数据展开挖掘与分析,从而为侦查人员提供准确及时的侦查预测和侦查决策。数据驱动情报侦查时代侦查工作不仅能够促使侦查人员转变传统重视精确性侦查情报而忽视模糊性侦查情报的侦查思维,而且还能够全面充分地挖掘与分析模糊性的侦查情报数据,进而通过模糊性的侦查情报开辟新的侦查假设,从而更加全面有效地对侦查情报进行预测。
传统的犯罪行为主要发生在受犯罪时间和犯罪空间限制的犯罪现场之中,侦查工作大部分由侦查机关和侦查人员单独在受限制的侦查时空条件内所完成。而在数据驱动创新时代,传统的物理空间转向具有开放性、动态性等特征的虚拟数据空间,犯罪行为和非犯罪行为均会在虚拟的数据空间中留下各种各样的数据痕迹,这些数据痕迹成为基于SWOT数据驱动情报侦查相关性分析的重要数据来源。但是,这些处于虚拟数据空间的数据痕迹分散、孤立且被不同机关或部门所有。如果要全面、客观、详细地搜集这些虚拟空间环境中的数据痕迹线索,单凭侦查机关力不从心,需要众多相关机关和部门之间开放数据共享的权限及互相协作、互相配合。
如果各个机关或部门仍然坚持对相关数据的权属而没有数据资源开放共享的意识,那么这些处在各个虚拟数据空间中的涉案情报数据则无法发挥其固有的侦查价值。在侦查实践中,除了侦查机关自身所建的数据库之外,往往更需要涉及诸如犯罪嫌疑人通信话单、银行账单、社保、婚姻、水电缴费、房产等个人数据情报。尤其是部分大型企事业单位持有大量涉及公民个人的原生态或衍生的业务数据链,这些分散、复杂海量数据痕迹中往往隐藏着具有重大侦查价值的情报数据。从分散孤立数据转向共享协作数据,需要具有开放性、整体性侦查协作新型侦查模式的支持和保障,而基于SWOT数据驱动情报侦查相关性研究的核心功能就是实现对各级各类虚拟空间数据的全面共享。因此,基于SWOT数据驱动情报侦查相关性研究的侦查模式,能够为虚拟空间的情报数据建立可靠有效的数据共享机制,为案件的侦查工作提供最大化的共享协作情报数据资源。
犯罪时空条件的一维性,造成先有犯罪行为后有侦查行为的这种由果溯因的传统侦查思维。侦查人员只能通过有限的证据去还原发生在过去的犯罪事实,而这样的犯罪事实也便如镜花水月一般具有模糊性。[7]即使该案件最终被侦破,也无法弥补或挽回被害人所遭受的生命、财产等损失。在数据驱动创新侦查工作新时代,侦查人员对未来犯罪的预测具有了可能性。基于SWOT数据驱动情报侦查相关性最核心的价值即是侦查预测,其对侦查预测的主要范式为:将涉案构成要素中的犯罪行为和非犯罪行为的规律转化成各个数据之间的数理关系,然后通过对这些数据之间的数理关系展开归纳和总结分析,从而对其犯罪行为和非犯罪行为的情势发展进行启发式的侦查预测。毕竟,大部分的犯罪行为不是一蹴而就的,而是经过犯罪动机、犯罪目的、犯罪预备、实施犯罪、后续犯罪等一系列循序渐进的过程。
将预测学中的预测思维、预测方法及预测操作程式引入现代侦查工作中,不仅是保障侦查效果的必然要求,也是基于SWOT数据驱动情报侦查相关性研究实现侦查预测和优化侦查决策的内在本质需求。在基于SWOT数据驱动情报侦查相关性研究的范畴中,可以将其侦查预测分为对“人”的预测和对“案”的预测。对“人”的预测是指对涉案的具有高危的犯罪嫌疑人进行预测。犯罪嫌疑人往往会在不同时间、空间、环境等中表现出异常的行为特征。基于SWOT数据驱动情报侦查相关性在其侦查预测的过程中会总结和归纳出各类犯罪嫌疑人具有典型代表性的犯罪特征数据库模型,从而使侦查人员在海量、不确定的虚拟空间数据中及时有效地发现和识别高危犯罪嫌疑人。对“案”的预测是指侦查人员预测某区域在某时期内发生某种犯罪行为的概率。研究表明:犯罪活动在空间上往往呈现出一种聚集现象即犯罪热点。在犯罪热点分析中加入时序因素,可以了解犯罪热点在时间上的变化趋势和规律,这样就可以对该区域未来犯罪活动的发生概率进行侦查预测。[8]国外一些警察机关已开始运用数据驱动情报侦查方法对犯罪行为进行侦查预测。例如,英国西米德兰兹郡警方牵头研发一种名为“国家数据分析解决方案”(NDAS)的系统进行预测犯罪行为。一旦发现被计算机系统标注为有可能实施暴力犯罪的高风险人群,NDAS系统就会自动对属地警察机关提出犯罪预防预测建议。美国洛杉矶警察局也率先使用了PredPol犯罪预测系统,在其犯罪预警中心,洛杉矶地区的电子地图不停地闪烁着,每一次闪烁都预示着那个地区有可能发生一次犯罪活动。根据地图上的实时预警,指挥中心及时派遣警力,阻止犯罪。[9]侦查人员运用基于SWOT数据驱动情报侦查相关性的侦查思维,通过对案件中各个数理关系进行归纳和总结进而分析出各种犯罪行为和非犯罪行为在时间数据、空间数据、环境数据等活动规律的演变特点,使侦查人员在犯罪嫌疑人实施犯罪行为之前就能够进行及时有效的侦查预测,从而达到“主动出击、精确打击”的侦查效果。
据IDC预测,全球数据总量预计2020年达到44个ZB,我国数据量将达到8060个EB,占全球数据总量的18%。[10]在这些网络大数据中,直接反映的往往是一个个独立的数据和分散的链接,但这些反映相互关系的链接整合起来就是一个网络。[11]这些独立、分散的数据资源具有突发性、交互性以及多源异构性等特征,不仅呈现出非结构化的数据表现形式,而且还具有较强的时效性。同时,数据自身的属性信息、此数据与彼数据的数理关系以及数据与空间的结构关系都隐藏在这虚拟的数据空间之中。基于SWOT数据驱动情报侦查相关性研究的最主要价值,不是发现和搜集巨大海量复杂的情报数据,而是通过构建其相关性分析的模型,促使侦查人员运用人工智能技术、云计算技术等数据挖掘技术去粗存精、去冗分类,最终挖掘出对侦查预测和侦查决策起着重要作用的侦查情报数据。
1.基于SWOT数据驱动情报侦查相关性分析的对象
传统挖掘的侦查情报数据,范围主要集中于机关或企业部门的相关信息管理系统的数据库和少数的用户在网络上产生的Web数据,且搜集和挖掘的范式主要以被动数据的产生为主。而基于SWOT数据驱动情报侦查相关性分析内容,其对象可以是任何类型和形式的数据源,不仅包括具有结构化类型的关系数据库资源,而且还包括具有半结构化或非结构化类型的文本数据、仓库数据、时间数据、空间数据、Web数据以及多媒体数据等数据库资源,甚至在特定的侦查环境中(如非接触型的网络诈骗、电信诈骗等)还包括分布式数据库、开放式数据库、多数数据库等异构型的数据资源。与传统被挖掘的侦查情报数据相比较,基于SWOT数据驱动情报侦查相关性分析的对象类型或形式更加复杂、来源范围更加广泛、体量更加海量,而且其分析对象的范式也从被动式转向为主动式,且对分析对象数据的处理速度也是实时快速。
2.基于SWOT数据驱动情报侦查相关性分析的特点
基于SWOT数据驱动情报侦查相关性分析具有以下几个方面的特点:首先,云服务的融合性。从基于SWOT数据驱动情报侦查相关性分析的侦查需求到侦查预测以及后续的侦查决策,都是侦查人员以人工智能技术、云计算技术等数据挖掘技术为操作程式而服务于侦破案件,具有将海量复杂数据挖掘技术与云服务相结合的融合性特征。其次,范围的扩大性。由于在对数据驱动情报侦查相关性挖掘与分析的过程中主要依靠的是人工智能技术、云计算技术、数据存储技术等云挖掘技术,对传统计算环境平台的依赖性越来越小,将该相关性分析的数据情报结果应用于侦查实践的范围也是越来越广泛。不仅能够为以侦查工作为需求导向的分布式相关性数据分析而服务,而且还能够更加详细地为侦查人员所提供虚拟空间数据关联情报分析和分布式衍生数据关联分析等个性化的侦查服务。最后,物联网的结合性。未来的虚拟空间数据应该是一个以物联网为主的云+端系统构成的复杂庞大网络,对物体的“感、知、控”均可以通过对其进行感应、探测、识别、定位以及监控等方式实现,这属于物联网的“前端系统”,而基于对各种物体进行数据驱动情报侦查相关性分析的智能控制和反馈属于物联网的“后端系统”。侦查人员依据物联网技术将虚拟空间的数据情报与互联网相连接,对海量复杂、分散的数据情报进行搜集、控制、传递、研判,为侦查工作提供具有物联网性质的云数据挖掘和分析技术,对侦查情势作出及时有效的侦查预测和侦查决策。
3.基于SWOT数据驱动情报侦查相关性分析的程度
在面对复杂、开放、动态、分散的海量数据时,基于SWOT数据驱动情报侦查相关性分析充分发挥和利用人工智能技术、数据存储技术等云数据挖掘与分析平台,对海量复杂的数据进行全方面实时的处理和立体的多维分析,对数据情报分析范围更广、更深。在基于SWOT数据驱动情报侦查相关性分析的环境中,侦查人员能够以数据驱动创新时代各种复杂、动态的海量数据为情报来源,依靠人工智能技术、数据存储技术等物联网新型的云数据挖掘与分析综合平台,将相关性分析出来的数据情报以云服务的方式及时有效地提供和反馈,对这些结构化数据、半结构化数据以及异化结构数据等数据情报源作出快速有效的实时处理和多维度的分析、利用。
侦查人员每天都会对复杂、分散的海量数据进行搜集、控制、储存、传递、分析、研判以及利用,而这些经过情报侦查工作的海量数据都具有明显的时间动态性,构成了基于SWOT数据驱动情报侦查相关性分析的动态性数据①所谓动态性数据,也称为事务性数据,是指信息通过异步变化的后续更新而形成有用的信息,是记录和反映一个组织完成的交互活动(或业务事务)且随时间变化而变化的数据。详见http://en.wikipedia.org/wiki/Dynamic_data,作者浏览日期:2020年1月10日。情报源。这些具有动态性的数据情报源为侦查人员进行侦查预测和侦查决策提供了及时有效的可行性支持,同时也增加了难度。如果这些获取的动态性数据情报源不能被侦查人员及时有效地深度挖掘其背后数理关系的相关性,那么其就很有可能成为侦查人员的负担和累赘,从而形成不利于侦查情势发展的“数据恐慌”局面。基于此,提出对基于SWOT数据驱动情报侦查相关性分析的框架模型构建,根据对动态性数据情报源相关性挖掘和分析的过程,作者认为,应该将其具体的模型框架构建为以下四个方面即动态性数据的搜集、动态性数据的处理、动态性数据的挖掘①所谓动态性数据的挖掘,是指将经过筛选的历史数据和当前数据同时结合后续新数据进行分析,动态检验后续新数据的特性,从而提取出其中有意义的、新颖的、有价值的、关键的知识与规则。详见:滕明鑫、熊忠阳、张玉芳著《动态数据挖掘研究》一文,载《计算机应用》,2008年第6期,第160-162页。与分析以及动态性数据的侦查服务。
1.动态性数据的搜集
动态性数据源主要包括公安机关自建如全国人员基本信息资源库、全国机动车/驾驶人信息资源库、全国违法犯罪人员信息资源库、全国被盗抢汽车信息资源库等内部数据库。同时,还包括其系统外部涉及通信话单、银行账单、社保、婚姻、水电缴费、房产等相关的外部数据库。动态性数据搜集的主要目的是使侦查人员能够对动态性数据全面、快速、准确地搜集,为后续动态性数据的处理奠定基础。
2.动态性数据的处理
动态性数据的处理结果直接决定了侦查人员对动态性数据相关性挖掘与分析的侦查效果,主要包含动态性数据处理的准备、动态性数据处理的转化、动态性数据处理的抽取三个具体环节。动态性数据的处理过程是对前期搜集到动态性数据中的噪声数据、冗余数据、缺失值数据等进行处理,转换结构化型、半结构化型、非结构化型以及异结构化型等动态性数据,然后将统一化的结构化型动态性数据进行无效数据的过滤,以便提取出对案件侦查具有侦查价值的相关性数据情报,再对过滤后的动态性数据进行抽取,最后将其储存到动态性数据的仓库之中,为后续动态性数据的挖掘与分析做好准备。
3.动态性数据的挖掘与分析
对动态性数据的挖掘与分析是整个基于SWOT数据驱动情报侦查相关性分析的核心内容,其主要功能是根据不同案件的侦查需求,采取不同的数据挖掘与分析的技术方法对背后具有数理相关性的动态性数据进行寻找、挖掘、分析,获取具有时间动态性的相关数据情报,充分利用已经建立的动态性数据犯罪规律规则库,将对案件侦查有价值的动态性数据全面深度地挖掘与分析出来,然后提炼出对案件侦查需求有价值的数据情报,更新到动态性数据犯罪规律规则库中,供侦查人员进行侦查预测和侦查决策。
4.动态性数据的侦查服务
动态性数据的侦查服务功能主要是侦查人员在不断更新的动态性数据犯罪规律规则库基础上,对犯罪行为和非犯罪行为分别识别与评估后进行侦查预测,然后根据侦查情势发展的不同,及时有效地提供诸如对犯罪主体的分析、犯罪对象的分析、犯罪时间的分析、犯罪空间的分析、犯罪工具的分析、犯罪痕迹的分析、犯罪遗留物的分析、犯罪携带物的分析以及犯罪其它方面的分析等侦查决策服务。最后,根据侦查人员对案件侦查所提出的具体侦查需求,结合不断更新的动态性数据犯罪规律规则库,选择合理可行的情报数据挖掘与分析技术方法,将具有数理相关性而被挖掘与分析出来的情报数据提交和展示给侦查人员。
基于SWOT数据驱动情报侦查相关性分析框架模型构建的工作原理为:侦查人员利用动态性数据情报的搜集技术和方法主要从公安系统内部和外部中搜集历史数据、当前数据、更新数据,然后利用相关的动态性数据处理技术对其进行处理,将被处理后的情报数据储存到动态性数据的仓库之中,再利用动态性数据的挖掘与技术方法对其情报数据的相关性进行挖掘与分析,并将已被挖掘与分析出来具有数理相关性的情报数据储存到动态性数据的犯罪规律规则库中,依托动态性数据相关性的挖掘技术,基于动态性数据的犯罪规律规则库而分别展开对犯罪行为的识别与评估、非犯罪行为的识别与评估,最后将基于SWOT数据驱动情报侦查相关性分析获取的结果应用于侦查人员对侦查情势所作的侦查预测和侦查决策之中。如果侦查人员的侦查预测和侦查决策经侦查实践后,发现已被应用的情报数据与侦查实际不相符合或存在差距,那么则应该及时修正或重新选择情报数据的挖掘与分析技术和方法,对已搜集的动态性数据重新进行相关性挖掘与分析,作出符合侦查实际的正确侦查预测和侦查决策(详见图1)。
图1 基于SWOT数据驱动情报侦查相关性分析的框架模型
为了便于对基于SWOT数据驱动情报侦查相关性的具体分析,作者提出基于SWOT数据驱动情报侦查相关性分析的平台设计模型(详见图2)。
基于SWOT数据驱动情报侦查相关性分析的平台设计模型主要分为三个层次的平台设计模型即支撑平台、功能平台、服务平台。
1.支撑平台
生物鲕层的加积过程可以参考藻叠层的形成[16],藻叠层也称为藻席,有富藻层和贫藻层叠积而成,富藻层由于残余有机质含量较多,镜下透明度较低,厚度起伏不定,局部呈瘤状。贫藻层中残余有机质含量较少,相对透明度较高(图4)。图2中界线之右侧的微观结构也有类似特点,不同的是有些层纹界线较平直,为鲕粒在滚动时磨平所致。
支撑平台包括两个方面的内容:一是动态性数据源的技术方法。包含:数据决策树挖掘法、数据关联规则挖掘法、数据神经网络挖掘法、数据聚类挖掘法、数据分类挖掘法、数据频繁挖掘法以及数据异常检测挖掘法等。二是动态性数据源的数据类型。包含:结构化型数据资源库、半结构化型数据资源库、非结构化型数据资源库以及异构型数据资源库。支撑平台作为基于SWOT数据驱动情报侦查相关性分析的动态性数据源和动力保障,其主要功能是将结构化型数据资源库、半结构化型数据资源库、非结构化型数据资源库等海量的动态性数据与数据决策树挖掘法、数据关联规则挖掘法、数据神经网络挖掘法等多种情报数据挖掘技术方法相结合。该平台设计不仅能使侦查人员对历史数据、当前数据、更新数据进行及时有效地数据融合,而且还能够为后续对动态性数据的处理、挖掘与分析奠定基础和提供强大的技术支撑保障。
图2 基于SWOT数据驱动情报侦查相关性分析的平台设计模型
2.功能平台
功能平台主要包括情报数据查询分析工具、情报数据搜集工具以及情报数据挖掘工具等动态性数据相关性的挖掘工具等。功能平台作为基于SWOT数据驱动情报侦查相关性分析实现侦查价值的重要途径,其主要功能是根据案件侦查工作的需求导向,侦查人员可以自行选择对动态性数据展开智能化的挖掘与分析。数据情报查询分析、动态性数据相关性挖掘依托高效的数据挖掘、数据搜集等工具,使该功能平台对动态性数据的挖掘与分析具有快速有效、实时处理的侦查优势。
3.服务平台
服务平台主要功能是通过人工智能技术、大数据技术、数据储存技术等情报数据挖掘与分析客户端与动态性数据源和侦查人员自动地进行智能化的交互认知,其对动态性数据相关性所挖掘与分析的结果通过立体多维工具、可视化工具等方式反馈给侦查人员,以便于侦查人员及时有效地作出正确的侦查预测和侦查决策。
就基于SWOT数据驱动情报侦查相关性分析的平台设计整体而言,其支撑平台、功能平台、服务平台三者在运行的过程中不仅能够互相支持、互相依靠和互相融合,而且还能够通过数据决策树挖掘法、数据神经网络挖掘法、数据聚类挖掘法等情报数据相关性分析的挖掘与分析技术方法对结构化型数据资源库、半结构化型数据资源库、非结构化型数据资源库以及异构型数据资源库等动态性数据资源进行快速有效的实时挖掘与分析,最终能够为侦查人员提供强大的数据情报支持。
挖掘与分析方法是基于SWOT数据驱动情报侦查相关性分析的核心工作,只有依靠科学有效的数据挖掘与分析的方法技术,才能够发现和寻找出动态性数据背后相关的数理关系。不同动态性数据的挖掘与分析方法技术,解决了不同案件中侦查工作的情报数据需求问题。基于SWOT数据驱动情报侦查相关性分析的侦查实践中,依据不同的动态性数据分析目标,而采取不同的对数据进行挖掘与分析的方法技术,使侦查人员能够快速有效地挖掘与分析出各个动态性数据内在本质相关的数理关系。
数据决策树挖掘法来源于一种对概念学习的系统CLS,然后被演变发展到由Quinlan提出的ID3算法。ID3算法是在信息论的基础之上以信息增益度和信息熵为其衡量标准,ID3算法的主要作用是在计算各个信息属性的相关信息增益之后,将具有最高增益的信息属性确定为该信息源所属集合的测试属性。然而,ID3算法在运行的过程中存在一个突出的问题,就是信息增益属性高的并不意味着已找到最佳的解决方法。为了解决ID3算法过程中的此问题,改进算法势在必行。ID3算法的改进版即C4.5算法的出现,不仅成功地解决了ID3算法中的突出问题,而且还实现了对不完整的数据和分散化的数据进行同时处理。尽管C4.5算法在运算的过程中具有计算速度和预测精度两个方面的优势,但是在对数据决策树挖掘时还需要对动态性数据进行多次的排序和扫描,造成C4.5算法的时效性比较低。针对C4.5算法时效性比较低的瓶颈问题,有学者提出其改进版的模型即R-C4.5算法。该数据决策树挖掘方法在挖掘与分析动态性数据的时候,能够整合分类较少的分支从而减少不必要的分支划分,有效地减少了大量不必要分支。显然,R-C4.5算法在保持模型预测准确率的同时,还有效地改进了决策树的健壮性。[12]C4.5算法需要通过对大量动态性数据潜在的信息增益进行划分,就必然会降低该分类算法的时效性。所以,学者Irani和Fayyad对C4.5算法继续进行了改进,调整了对连续值属性惩罚的基础,指定了一个阈值a,通过对阈值a与增益率的判定,决定是否继续构造节点。[13]同时,在动态性数据源中除了历史数据和当前数据之外还有更新的数据,按照C4.5数据决策树挖掘的算法,还需要对不断更新的动态数据源重新进行挖掘与分析,这会造成需要大量的计算时间成本。作者认为,在采取此数据决策树挖掘对动态性数据进行挖掘与分析时,侦查人员应该尽最大努力保留原动态性决策树中的分支与分类,缩短运用数据决策树挖掘与分析数据相关性的计算与时间,提高其实时处理的时效性。
2.数据关联规则挖掘法
在数据关联规则挖掘法的体系中,最著名的莫过于由R.Agrawal等人首次提出的Apriori算法。数据关联规则挖掘的Apriori算法原理为:首先在动态性数据源中寻找出其频繁性至少与预先设置模型中最小支持度相符合的所有集合,然后由该集合产生具有强相关的关联规则库。简而言之,由于各个动态性数据之间存在千丝万缕的互相联系,当某一动态性数据发生变化时,就可能会引起其它动态性数据的变化。而数据关联规则的挖掘方法技术就是利用各个动态性数据之间内在本质的关联或依赖关系来挖掘与分析它们之间存在的相关性,然后通过挖掘与分析各个动态性数据之间的相关规律性来进行侦查预测和侦查决策。在采用数据关联规则挖掘Apriori算法对动态性数据进行挖掘与分析的过程中:首先,对动态性的数据进行一次全面的扫描来寻找与发现与其预设最小支持度相符合的所有频繁的集合,在每一次扫描时只扫描符合该频繁集合的同一长度的项目集合,并且将扫描动态性数据所获取所有个体的集合形成一个支持度的长度为1的频繁集合;其次,在后续对动态性数据进行每一次的关联扫描中均以K-1次所形成的频繁集合为新的被扫描的频繁集合,再继续检测是否有符合预设最少支持度频繁集合的剩余动态性数据;再次,根据侦查人员对案件侦查的需求,将低于预设最少支持度的动态性数据给予删除;最后,将符合数据关联规则预设最少支持度的所有长度形成为K的动态性数据频繁集合,直到无法再继续从该动态性数据中发现新的具有关联规则的频繁集合为止。
3.数据神经网络挖掘法
虽然数据神经网络挖掘法在对动态性数据进行挖掘与分析过程中具有时间较长、结果复杂以及所提供的结果服务展示形式比较难以理解等不足之处,但是其具有的结果低错误率、良好的并行性等显著特点是其他数据挖掘与分析的方法技术无法与之媲美的。特别是数据神经网络挖掘法中的各种规则提取技术和网络剪枝技术在数据挖掘与分析的过程中被不断优化,使数据神经挖掘方法在对数据的挖掘与分析应用中具有越来越多的优势。随着数据神经网络挖掘方法被不断的自我完善,其中多层前馈式的神经网络挖掘技术和后向传播式的神经网络挖掘技术被应用得最为广泛。多层前馈式的数据神经网络挖掘技术主要作用是对动态性数据中的元组类目标进行分析和预测,而后向传播式的神经网络挖掘技术则主要作用是对动态性数据中的搜索类目标进行数据建模,使对多层前馈式神经网络挖掘中元组类目标的分析和预测与侦查情势实际之间的差距越来越小,常应用于对语音数据识别、语言类数据分析等方面动态性数据相关性的挖掘与分析。同时,针对数据神经网络挖掘法技术中存在诸如时间较长等突出问题,学者们已提出具有针对性的改进措施或建议,如引入模糊数据神经网络挖掘算法,以期通过将模糊理论和数据神经网络相结合对模糊神经网络展开建模和训练,[14]从而实现改进和优化数据神经网络挖掘法对动态性数据进行挖掘与分析的重要价值。
4.数据聚类挖掘法
所谓数据聚类挖掘法就是指在动态性数据中将物理或抽象对象的项目集合进行分组,形成由相同或相类似的对象集合,然后对该对象集合进行分类的分析过程,其主要的作用就是以相同或相类似的方式对动态性数据展开搜集数据的分类。显然,数据聚类挖掘法属于一种没有监督和前期知识的学习过程,其主要功能是从动态性数据中挖掘与分析出具有相关性的数理关系,然后将具有数理关系相同或相类似的动态性数据被分成一个未知的类。此处未知的类并不意味着被分类,因为此时还无法获知被划分为未知类的根本属性。数据聚类挖掘法在对动态性数据相关性进行挖掘与分析的过程中,不仅被应用于对交通拥挤的预测和日常生活中天气预报的预测,而且还能够对事物如动物的迁移分析、移动计算和异常点分析等方面。[15]同时,根据对动态性数据挖掘与分析其相关性隶属度取值范围的不同,可以将数据聚类挖掘法分为数据模糊聚类挖掘法和数据硬聚类挖掘法两种方法。数据模糊聚类挖掘法主要是依据对动态性数据隶属度取值范围大小差异而分类,其中的动态性数据可能属于多个类别;而数据硬聚类挖掘法主要是根据动态性数据非此即彼的属性将其划分到最近距离的一类,且只能属于一类而不能属于多类。因此,数据聚类挖掘法被广泛应用于生物学、心理学、市场营销学、统计学以及人工智能、大数据识别与分析等学科和领域之中。
5.数据分类挖掘法
数据分类挖掘法是对动态性数据相关性挖掘与分析的重要基础,主要工作的原理为:通过对已有动态性数据进行挖掘与分析其所表现出具有的数据特性,然后从这些动态性数据中获取每个类别的属性和特征来构建与其相对应的分类或分类器。显然,数据分类挖掘法是一种有监督的学习过程,主要是根据动态性数据的属性和特征而被划分类别。在基于SWOT数据驱动情报侦查相关性分析的过程中,数据分类挖掘法主要的作用是基于犯罪嫌疑人的犯罪行为或非犯罪行为对象的特殊属性特征建立数据分类模型并对其所属的行为等对象进行侦查预测。对犯罪主体、犯罪对象、犯罪时间、犯罪空间、犯罪手段、犯罪工具以及犯罪痕迹等涉及刑事案件的构成要素其中一种或多种的侦查预测是至关重要的,这使侦查人员在侦破疑难案件工作中能够及时发现和寻找到正确的侦查方向或侦查途径,避免出现侦查错误甚至侦查僵局。在基于SWOT数据驱动情报侦查中对动态性数据的相关性采取数据分类挖掘的挖掘与分析方法,一方面能够对犯罪时空轨迹的位置、案件发生的频率与密度、犯罪对象的选择性等进行侦查预测;另一方面还能够更进一步对犯罪嫌疑人未来可能落脚点的布控与搜查、犯罪思维与犯罪方法等采取移动式的查询与预测。这不仅有助于侦查人员采取数据分类挖掘方法对动态性数据的相关性进行挖掘与分析的情报数据网络资源的分配,而且还能够实现侦查预测的准确性和侦查决策的优化性。
6.数据异常检测挖掘法
在对动态性数据的相关性进行挖掘与分析的过程中,如果其中某一个数据和它在时间和空间上相邻并且在一组连续的时空内再次出现的相邻数据存在显著的差别,那么该动态性数据就被称为数据的异常对象。数据异常检测挖掘方法应用的主要目的是从已获知的动态性数据中挖掘与分析出某些显著偏离正常数据发生和发展的数据对象。其主要有三大类:一是基于统计学的数据异常检测挖掘法。该方法原理为构建一个动态性数据的概率分布模型,然后按照预设模型对动态性数据进行计算,并将低于该概率分布模型的数据视为数据异常点。二是基于数据聚类的数据异常检测挖掘法。因为大部分的数据聚类都是基于动态性数据的属性或特征而被聚类,所以如果在数据聚类的过程中发现其部分已被聚类数据的数量、特征均值等都存在比其它被聚类的数据要少得特别多等差异,那么该数据聚类在动态性数据相关性的挖掘与分析中就属于数据异常。三是专门的数据异常检测法。该类专门的数据异常检测法主要的任务就是对动态性数据展开专业性的数据异常检测挖掘,典型专门的数据异常检测挖掘法有Isolation Forest和One Class SVM等。因此,根据基于SWOT数据驱动情报侦查相关性分析对侦查预测和侦查决策的内在导向需求而言,数据异常检测挖掘法对动态性数据相关性挖掘与分析实现的侦查效果主要取决于两个方面因素即动态性数据的分辨率和动态性数据的尺度,这要求侦查人员在采取数据异常检测挖掘法的时候还要考虑动态性数据的度量数理关系和非度量的数理关系等重要因素。