侯丽波 王 冠
(辽宁警察学院公安信息系 辽宁 大连 116036)
交互式话单数据的社会关系权值分析
侯丽波 王 冠
(辽宁警察学院公安信息系 辽宁 大连 116036)
如何通过话单数据来对目标人员的社会关系进行自动合理的分析,是公安工作中面临的重要问题。为解决此问题,提出一种基于神经网络模型的社会关系分析算法。通过评价参数与调整因子来计算社会关系权值。提出双向通话频率、双向通话时长、非正常时段通话与漫游通话4个评价参数来反应不同的社会关系特征,并采用前馈神经网络思维来对输出结果进行误差修正。实验结果表明,算法可以准确地筛选出分析目标在各种社会关系下的优先联系对象。对侦查与监控工作有一定的实际意义。
话单分析 社会关系 神经网络 评价 参数权值
在公安侦查工作中,为了获取重要的线索,需要对于一个目标人员的社会关系进行分析和监控。所谓的社会关系,实际上就是一个人的关系网,即由一群具有特定关系的人连接在一起的网络。这个网络中包含了很多的常见人物关系,如家人、朋友、同事等;也包含一些特殊社会关系,如情人、犯罪关系联系人、犯罪保护伞等[1]。在社会关系网络中,人物关系通常也是错综复杂的,即相互间的身份并不唯一,如一个既是同事又是犯罪关系的联系人。因此对于目标人员社会关系的分析往往可以快速准确的得到需要的监控对象和案件侦查线索,对整个案件的侦破起到非常关键的作用。
由于电话通话遍布每个人的日常生活,电信运营商处的通话记录已经成为公安工作中重要的情报数据。因此,对于目标人员的话单进行分析已经成为对其社会关系分析的重要手段[2]。一条通话记录包含通话双方的号码、通话时间、通话时长、所在基站位置等信息,通过科学合理的数据分析,关联出目标人员的各种社会关系模式下的主要联系对象,可以对于案件侦查线索的获取和涉案人员的监控起到至关重要的作用。
然而,在现阶段公安工作中,对于监控和分析重点人员的相关话单数据,缺乏科学合理的数据模型设计和快速自动的数据分析算法。这就造成很多隐藏在话单数据中的有效线索并不能被快速准确的发现,并且过多的人工操作也使得侦查人员疲于应对。依据传统侦查思路的只采用通话频率或通话时长来过滤话单中重要关系人的方法,在现阶段越来越复杂隐蔽的社会关系环境下,并不能准确和全面的发掘一些隐藏的重要关系人。此外,当目标人员弃用原始手机号码后,如何通过其话单分析其社会关系,快速准确的对目标人员更换号码后优先联系人做出预判性监控,也是在案件侦查中需要研究的重要方向。
本文提出了一种采用前馈神经网络思想的基于话单的社会关系分析算法,首先对海量的话单数据进行清洗和筛选,然后对提取到的有效数据进行数学模型化,最后通过评价参数与不同调整因子来计算关系权值输出。算法采用改进的双向通话频率与通话时长作为关系权值的评价参数,并创新的提出非正常时段通话和漫游通话两个评价参数。对于每个评价参数均引入调整因子,在强调各参数影响的公平性同时也根据不同的社会行为规律来判断其相应的社会关系权值。算法采用前馈神经网络思维进行误差修正,通过对一定时间内目标人员话单的历史数据学习,通过修正调整因子,给出在未来时间内对于目标人员将优先联系对象的合理预测结果,便于案件的侦查与监控。
通常由运营商处获取的目标人员的话单数据所包含的基本信息有机主号码、对方号码、呼叫类型、通话时间、通话时长、通话地点、通话类型等字段。在这些通话数据中,合理快速的分析归类出目标人员的重要联系对象,可以对案件的侦查与监控起到很大的作用。
通过对话单中每个联系对象的通话次数、通话时长,非正常时段通话频率以及漫游通话频率进行分析,可以迅速关联出目标人员的重要关系人与隐秘关系人,即需要监控和侦查的重点人员。即使是非涉案的重要关系人,通常也可以通过询问得到有价值的侦查线索。对于关联出的重要联系人中,如果存在案发后其号码停用,则需要重点关注,很可能有共同涉案。当目标人员弃用原号码发生潜逃时,通过对于其主要联系人的通话记录进行分析比对,如存在共同新增或共同消失的号码,可以关联出目标人员的新号码或不在使用但曾存在重要关系的号码。当多个主要联系人都存在一个新出现的无法确定的共同联系人时,很可能就是需要锁定的目标人员。如果该号码为外地号码,往往可以确认目标人员的潜逃所在地。为了能够从海量的话单数据中快速准确的得到重要关系信息,需要引入神经网络的思想来解决这个问题。通过神经网络模型,将目标人员的重要关系人从海量数据中以自动的方式筛选出来,作为重点关注对象,可以极大减轻公安工作的负担,并发现潜在的侦查线索[3]。
神经网络是通过模拟人脑的思维方式,将复杂的筛选分类问题提供一个相对简单的解决方法。通过输入的样本,按照一定的学习算法调整各层的权值,当收敛到一定值时,即可以对于真实的数据进行分类。BP(Back Propagation)网络是一种按误差反向传播训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。其原理即为通过反向传播来不断调整权值,使误差最小。如果输出层得不到理想的结果,向前一层反馈输出误差,依据预测的误差修正隐含层的调整因子来改变权值,不断接近期望的结果。前馈神经网络模型包括输入层(Input)、隐藏层(Hide Layer)和输出层(Output Layer)[4]。图1即为参考BP神经网络思想设计的用于解决基于话单的社会关系分析的算法模型。
图1 基于话单的社会关系分析算法模型
其中在输入层负责对话单数据的各个字段进行提取和输入。机主号码即为分析主体——目标人员的号码,对方号码即为分析对象——联系人的号码,呼叫类型即为主叫或被叫,通话时间为发生通话的开始时间,通话时长为发生通话的时间长度,通话地点为发生通话的所在地点(城市),通话类型分为本地通话、国内长途、漫游通话等。隐藏层中为本文算法用于社会关系权值计算的4个评价参数。在输出层,可以给出本文算法输出的4种社会关系的分类结果,即重要关系、工作关系、私密关系和漫游关系。重要关系是指同目标人员在综合判断下有着高频率交互的联系人,工作关系是指工作时间联系比较重但私下时间联系较少的联系人,私密关系是指在非正常工作时间具有高频率交互的联系人,漫游关系为在外地漫游通话时保持高频率交互的联系人。上述4类的输出结果可以直观地分析出目标人员不同社会关系的优先联系对象。
神经网络应用于社会关系分析的研究,目前主要集中于社交网络的结构分析[5,6]以及社交网络中安全关系方面[7]。在犯罪侦查与话单分析的结合方面,主要研究集中于针对犯罪网络的分析[8],以及用户通话行为对人物关系的分析[9,10]。结合上述文献的研究现状,本文将神经网络模型引入到话单分析中,针对公安工作中对目标人员社会关系分析这一实际需求,提出一种神经网络模型的社会关系分析算法,用于对犯罪侦查目标人员的话单数据整理和分析。算法通过话单数据的清洗和整理,将社会关系抽象为数据模型,并通过评价参数的运算和调整因子的取值以得出理想的社会关系优先权值输出结果,最终将各分类结果以表单与图像两种可视化的形式输出。
数据准备阶段是整个算法的基础,需要将获取的话单数据进行提取和转换,便于接下来的参数计算和算法分析。数据准备阶段包括数据采集、数据清洗、数据集成和数据转换4个工作部分。
(1)数据采集,是对于分析的主体,即目标人员的通话清单进行采集。由于本文算法分析联系人与目标人员之间关系时采用双向影响的评价参数,所以需要在算法开始时通过单向参数的结果筛选,确定出目标人员主要联系人的通话清单,一并进行数据采集。
(2)数据清洗,是指在对于目标人员的通话清单进行过滤,清除通话清单中与分析目标明显无关的通话数据,如广告电话、垃圾电话等。这一部分需要通过算法本身建立号码筛选数据库,过滤所有已知的广告电话、垃圾电话、公共服务电话以及一些无关的干扰数据等。
(3)数据集成,是将清洗后有效的多个话单的相关数据按照统一的数据结构组合在一起。由于获取的话单数据通常存于多个不同的来源文件,通常文件的格式与数据的结构均不统一,因此需要将所有清洗后的数据进行整合,使其成为统一的按照时间顺序进行排序的话单数据。在数据集成过程中也会将每个关系人的通话数据进行分类统计,便于接下来的数据转换。
(4)数据转换,就是对话单的各项数据进行数学模式化转换,提取算法所需的各种数据以便于参数的计算和算法的调用。本文算法主要的涉及转换的数据有:①机主号码,即目标人员,在算法中虚拟为节点V0。②对方号码,每一个目标人员社会关系的分析对象,即与V0产生通信的节点Vi,其中i∈[1,p],p为所有筛选出的与V0发生交互关系的节点个数。具体的节点社会关系如图2所示。③通话时间,取每个通话发生的所在的整点小时。④通话时长,将每次通话的时间长度转换为秒数。⑤通话地点,分为本地和所有漫游通话所在的外地城市的信息,均单独记录。⑥通话类型,记为本地通话和漫游通话。
此外,在数据转换阶段,应该统计V0和每个Vi发生通话的次数,通话时间的整点,通话时长,具体以每天为单位进行计数。对于通话次数还应记录每个整点小时的次数和每个不同漫游城市的次数。对于每一个分析对象Vi,也需要记录上述数据,便于算法的双向关联。
图2 基于话单分析的社会关系图例
本文算法在评价参数上分为单向影响参数与双向影响参数两种。单向影响参数是指分析目标人员与联系人之间的通话对于目标人员自身通话的权重。双向影响参数是指在考虑目标人员自身权重的基础上,同时考虑对方联系人自身的通话权重。如一个很少与外界发生通话的联系人号码,即使与目标人员只产生很少的通话次数,但占联系人其自身通话比重很大的情况。此种认为是隐藏的重要关系人,通过双向影响参数会做出更合理的筛选。
由于通常每个目标人员获取的话单中联系人数繁多,如果对所有的联系人都进行话单的调用和分析,会造成工作量过大,实际上操作并不现实。而且,对于大多数发生极少通话的联系人,其本身对目标人员主要的社会关系分析也并不起到太大作用。因此本文算法首先通过单向影响的通话频率和通话时长以及非正常时段和漫游通话四项参数中,任意一项比例达到5%的联系人。将满足条件的这些联系人筛选出来,做进一步的双向影响评价参数分析。具体每个评价参数的数学表达方法介绍如下:
通话频率参数是话单分析中常见的评价参数,用于确定目标人员与联系人之间在一段时间内的通话次数占其所有通话次数的比例。该参数可以直观反映出两者间的通话联系频率,即社会关系的紧密度。本文算法对于通话频率评价参数采用如下数学表达:
假定获取话单数据的时间天数为n,设Ck(V0,Vi)表示在第k天时V0与Vi的通话次数,(k∈n)。则可得V0与Vi平均每天的通话次数如公式(1)所示:
设Ck(V0)为第k天V0自身的通话次数,则平均每天V0的通话次数为公式(2)所示:
由于算法需要筛选出单向影响评价参数比例大于等于5%的联系人进行双向影响评价参数分析,所以先给出单向影响通话频率参数如公式(3)所示:
由公式(3)得到权值大于或等于0.05的Vi将作为筛选出来的重要联系人,进行双向影响分析,需调用满足此条件的Vi话单数据,并由公式(4)进行计算Vi平均每天的通话次数。其中Ck(Vi)为第k天Vi自身的通话次数。
最终得出双向影响的通话频率参数公式为:
由公式(5)可以看出,对于V0与Vi之间的通话频率参数,由V0与Vi通话次数所占V0自身的比例,加上其与V0与Vi通话次数占Vi自身通话比例的乘积得到。这样可以更好的去考虑Vi自身通话的频率对于V0的影响。如果Vi与V0通话次数占V0自身比例很少,但是所占Vi自身比例很高的情况下,可以更好的放大这一参数计算权值的影响。即一个与外界联系很少的号码,即便与目标人员通话次数不多,但由于大部分通话都是同目标人员产生,则该号码更加可疑。反之,如果联系对象Vi本身是一个和很多人都产生高通话频率的情况,则通过公式(5)可以削弱其对V0社会关系权值的影响。这也保证算法得到的社会关系分析结果更加合理。
通话时长也是一个常见的用于话单分析社会关系的评价参数,通过通话时间的长短可以直观的看出双方的亲密程度,即通常发生较长时间的通话是较为亲密或重要的通话。设Tk(V0,Vi)为第k天V0与Vi的通话时长,同样(k∈n)。则可得V0和Vi平均每天的通话时长T(V0,Vi)如式(6)所示:
设Tk(V0)为V0第k天通话总时长,则由公式(7)可得V0平均每天通话时长T(V0)为:
单向影响的通话时长参数如公式(8)所示:
即V0与Vi每天通话时长占V0每天通话时长的比例,满足单向通话时长的权值大于等于0.05的Vi将作为筛选出的联系人,调取其话单进行双向分析。由公式(9)计算Vi平均每天的通话时长。其中Tk(Vi)为第k天Vi通话的总时长。
得到双向影响的通话时长的评价参数公式(10)如下:
同双向影响通话频率参数一样,双向影响的通话时长参数,是由V0与Vi通话时长所占V0自身的比例加上该比例与V0与Vi通话时长占Vi自身通话时长的比例的乘积得到的。采用公式(10)可以更好的考虑Vi自身通话时长的比例对于V0的影响。即如果Vi跟所有人的通话时间都很长,则会削弱其对V0的社会关系优先权值。反之,如Vi虽然通话时长占V0的比例不高,但对Vi自身比例很高的情况,通过公式(10)可以将Vi对权值的影响放大。
所谓的非正常时段通话,是指目标人员在每日通话频率相对很少的时间段内发生的通话。将非正常通话时段内发生通话的联系人的通话频率作为评价参数,可以更好的发现目标联系人的一些私密关系人。通常将非正常时段的默认设定都是在半夜至清晨,但本文算法将其改进为以V0实际情况为准,选择通话频率相对较小的时段,可以更好的符合V0的通话习惯,避免由于目标人员是夜晚活动频繁型这一情况造成非正常时间段的选择失误。首先给出选择非正常时段的数学方法:
设S={S1,S2,……,Sq}为对V0话单中统计出的所有的共q个非零次通话的时间段集合,每个时间段为整点1小时,可知q<=24。设Sk(V0)为获取的共计n天内的V0话单数据中,在第k个非零通话时段内V0的通话次数,其中k∈q。则,可得V0平均每个非零次通话时段内的通话次数S(V0)如公式(11):
对于每个Sk(V0)来说,若满足Sk(V0)<=1/3 *S(V0),则取该k时段为非正常通话时段,k∈q。即将通话次数不超过三分之一均值的时段认为是非正常通话时段。由上述条件可以得到V0的所有非正常通话时段的集合FS={FS1,FS2,……,FSf},其中f为非正常通话时段个数,f<q。
设CFk(V0,Vi)为第k天内V0与Vi在非正常时段通话的次数,该值由第k天FS集合的各时段V0与Vi通话次数相加得到。则可得V0与Vi平均每天的非正常时段通话次数为:
又设CFk(V0)为V0在第k天非正常时段内所有通话次数,则求得V0平均每天的非正常时段通话的次数为:
最终得到非正常时段通话评价参数,即V0与Vi在非正常时段内通话与V0的比值,如公式(14):
在非正常时段发生通话的联系人,会对其与V0社会关系权值产生额外的加成,如一个联系人没有非正常时段的通话则不需要此额外加成,即判断其同目标联系人不存在所谓的私密关系。同样的,所有满足非正常时段通话评价参数的权值大于等于0.05的Vi,将被筛选出来进行双向影响的通话频率与通话时长的评价参数运算。
漫游通话评价参数即为目标人员在外地漫游时与联系人进行通话频率比的评价参数,漫游高频率的联系人通常也是重要的关系对象,可以确定V0在异地的社会关系。便于分析当目标人员若发生在逃时的优先联系对象,以及一些隐蔽的私密联系的关系人。设Y={Y1,Y2,……,Yj}为V0所有发生漫游通话城市的集合,其中j为所有发生漫游通话的外地城市个数,又设m为V0与Vi产生漫游通话的外地城市个数,可知m<=j。
设CYk(V0,Vi)表示V0与Vi在第k个外地城市产生的漫游通话次数,k∈m。则V0与Vi发生的漫游通话总次数为:
又假设CYk(V0)表示V0在第k个外地城市共计发生的漫游通话次数,k∈j。则V0在所有外地城市的漫游通话总次数为:
由此得出V0与Vi漫游通话评价参数,如公式(17)所示:
即V0与Vi间的漫游通话所占V0所有漫游通话的比值,并乘以平衡调整参数m/j(即V0与Vi发生漫游通话的城市个数比上V0所有漫游城市个数)。由于在所有漫游城市都产生通话的对象,其重要性一定高于在单一漫游城市发生通话的联系人。因此,引入m/j这一平衡参数可以保证漫游通话评价参数的权值更合理。同样,对于满足该评价参数的权值大于等于0.05的Vi也将被筛选出来进行双向影响的通话频率与通话时长的评价参数运算。
对于分析对象V0的话单数据,首先对所有的通话对象Vi计算由公式(3)单向影响通话频率的权值,由公式(8)单向通话时长的权值,由公式(14)非正常时段通话权值以及由公式(17)漫游通话权值。然后对所有满足条件为至少一项权值大于等于0.05的Vi,根据如下公式(18)计算最终的V0与Vi之间的社会关系权值W(V0,Vi):
在上述的权值计算公式(18)中,引入调整因子的概念作为输出关系权值的修正,以便于更合理的调整输出结果。其中α为通话频率评价参数的调整因子,β为通话时长的评价参数调整因子,γ为非正常时段通话评价参数的调整因子,θ为漫游通话评价参数的调整因子。4个调整因子初始值均默认为1,可以通过前馈神经网络中误差反馈的思想来对调整因子的取值做输入调整。调整因子取值范围设定在[0,2]之间,若某项调整因子取0即为忽略该项对应的评价参数对社会关系权值的影响,亦可增大或减小调整因子的取值来放大或削弱某项评价参数的影响。
本文算法给出4种输出结果的社会关系权值的概念。重要关系为分析目标人员产生高关系权值的联系人,是一种基本的社会关系分析方式。在此模式下的输出,将四项调整因子都默认为1,即通话频率,通话时长,非正常时段通话和漫游通话4项评价参数公平的叠加到一起,来进行判断关系权值。工作关系为分析与目标人员发生通话的时间段为常规时段的通话频率较高的联系人。此输出权值的公式将减小非正常时段的调整因子γ,因为本身工作关系的联系人通常并不会在非正常时段与目标人员产生通话。削弱非正常时段通话的影响会更加明显的突出工作关系。私密关系是分析在非正常时段以及在漫游时发生较多通话的联系人。在此模式下的权值公式,应该放大非正常时段调整因子γ和漫游通话调整因子θ,使输出结果更符合私密关系的情形。漫游关系为分析目标人员在外地时发生较高联系的对象,在此模式下,权值输出公式中会放大漫游通话调整因子θ使漫游通话的影响更明显。本文算法采用开放式的调整因子输入方式,并不局限于上述4种输出模式,可以根据用户的需要来自主进行调整因子的修正,以便输出合理的社会关系权值。
对于分析目标在n天内的话单数据,若含有符合筛选条件的p个联系人,则本文算法的复杂度为O(p2,n),具体分析如下:当计算单向影响通话频率、单向影响通话时长、非正常时段通话和漫游通话这四个参数权值时,均需要对p个联系人进行n天的通话数据计算,因此复杂度为O(p,n)。针对双向影响参数通话频率与通话时长参数的计算,由于要反向考虑每个联系人自身的通话数据,因此其算法复杂度O(p2,n)。综上,整个算法的复杂度为O(p2*n +p2*n + p*n + p*n),即为O(p2,n)。
通过获取目标人员90天内的一组交互话单数据来进行算法的社会关系分析实验评估。根据改变调整因子来给出4种模式的关系权值。即输出重要关系权值、工作关系权值、私密关系权值和漫游关系权值等4组实验结果。首选通过由上文介绍的对话单数据的整理,并满足4项结果有一项大于等于0.05这一条件,共筛选出与V0产生联系的23个分析对象,将其编号为V1,V2,…V22,V23。各种社会关系下输出的具体实验结果如下:
在重要关系权值输出时,对于4个调整因子均取1,以求得最为平衡的关系权值。由23个分析对象的输出权值降序排列,由实验结果可知对于V0的重要关系人输出优先的前5位对象为:V3,V19,V11,V2,V8。
在工作关系的权值输出中,由于要忽略在非常时段通话的影响,强调通话频率与通话时长的影响,因此将α与β取值2,γ取值0.2,θ仍取1。得到工作关系权值的降序排列,由结果可知对于V0的工作关系人输出优先的前5位对象为:V3,V8,V11,V19,V15。通过结果可以推断出V8对于V0的社会关系更偏于工作关系,因为其在重要关系权值优先级中排第五位,但在工作关系优先级中排第2位。
在私密关系的权值输出中,强调非正常时段通话的影响,因此将α与β取值调为0.5,γ取值增加到2,θ仍然取1。得到私密关系权值的降序排列,由结果可以知对于V0的私密关系人输出优先的前5位对象为:V2,V3,V19,V11,V21。可以看出,V2对于V0的社会关系更具偏于私密关系,因为其在重要关系权值优先级中仅排第4位,但在私密关系排第1位。
漫游关系的权值输出主要是强调漫游通话的影响,因此将α、β与γ取值均调整为0.5,θ的取值放大为2。得到漫游关系权值的优先级降序排列,由结果可以知对于V0的重要关系人输出优先的前5位对象为:V2,V14,V19,V3,V21。可以看出,V14对于V0的社会关系更具偏于漫游关系,因为其在重要关系权值输出中只排在第7位,但在漫游关系排第2位。
从上述4组的实验结果可以看出,本文算法可以通过灵活的调整因子取值,得到各种关系下较合理的的输出结果。实验通过一组真实的话单数据进行分析后,准确的筛选出各种社会关系下目标人员优先的联系对象。
针对评价参数调整因子的取值进行进一步分析可以得出如下结论:
(1)对于通话频率评价参数调整因子α的取值越大,越可以加重通话联系频率对于关系权值的影响,反之则会削弱通话频率的影响,可以比较容易过滤掉类似于广告或骚扰电话等无意义联系人。
(2)对于通话时长评价参数调整因子β的取值越大,越可加重通话时长对于关系权值的影响。这个参数的放大,可以更好的突显出重要的联系人。也符合现实的社会关系映射,聊天时间越长的人越重要。
(3)针对非正常时段通话评价参数调整因子γ,放大该参数可以迅速抓到分析目标的私密关系,而且可以很好的屏蔽掉工作关系人。反之,削弱该参数会更好的凸显出正常工作关系的联系人。因此该参数的调整显得尤为重要。
(4)对于漫游通话评价参数的调整因子θ,主要是针对追逃分析中,对于目标在异地联系人的筛选,该参数的放大可以更好的抓到异地漫游下的重要联系对象。并且,该参数对于私密关系的影响也较大,放大该参数可以帮助进一步确定私密关系对象。这也是符合现实社会关系的映射,通常漫游状态下会更频繁联系私密对象。
综上所述,本文算法的优势主要在于对于各评价参数精准的数学设计,以及对于算法最终的关系权值输出公式中各参赛调整因子的合理修正以满足各种社会关系人的准确筛选。
本文针对话单社会关系分析这一公安应用问题,分析解决这一问题的所需方法和算法的模型设计,并且提出了双向通话频率、双向通话时长、非正常时段通话与漫游通话4个评价参数用于最终输出的社会关系权值的计算。算法根据前馈神经网络中误差反馈的思想来调整各评价参数的调整因子的取值。实验证明,算法可以得到各种关系下较合理的输出结果,准确的筛选出各种社会关系下分析目标的优先联系对象。在后续的研究工作中,将对算法进行改进,可根据多组话单数据进行机器学习。进一步深入研究神经网络模型的设计与调整因子的设定,使输出结果更为合理。也将对各社会关系评价参数的数学模型进一步的改进,使之更为合理和准确的反应社会关系的特征。
[1]王钢,刘猜.犯罪团伙网络关系模型及分析方法[J]. 中国人民公安大学学报(社会科学版),2015(3):61-71.
[2]刘为军,张绍武.移动互联网犯罪侦查对策探析[J]. 中国人民公安大学学报(自然科学版),2016(3):47-51.
[3]李建洋,倪志伟,刘慧婷.多层前馈神经网络在基于案例推理的应用[J].计算机应用,2005(11):2650-2652.
[4]SIMON HAYKIN.神经网络原理:第2版[M]. 北京:机械工业出版社,2006:217-325.
[5]窦炳琳,李澍淞,张世永.基于结构的社会网络分析[J].计算机学报,2012(4):741-753.
[6]陈克寒,韩盼盼,吴健.基于用户聚类的异构社交网络推荐算法[J].计算机学报,2013(2):349-359.
[7]李阳,王晓岩,王昆,等.基于社交网络的安全关系研究[J].计算机研究与发展,2012(S2):124-130.
[8]李海波.基于通信行为挖掘的犯罪网络分析技术研究与应用[D].上海:上海交通大学,2007:21-64.
[9]张玉超.公安重点关注对象的聚类分析研究[D]. 济南:山东大学,2015:15-28.
[10]许婷.基于话单挖掘的可视化人物关系分析系统的设计与实现[D].哈尔滨:哈尔滨工业大学,2014:16-55.
D918. 2
A
2095-7939(2017)05-0106-07
10.14060/j.issn.2095-7939.2017.05.022
2017-04-20
辽宁省教育厅科学技术研究基金(编号:L2014508)。
侯丽波(1977-),女,辽宁大连人,辽宁警察学院公安信息系副教授,主要从事互联网情报分析与信息网络安全。
(责任编辑:于 萍)