何 磊,宋名星
(中国电信股份有限公司深圳分公司 深圳 518048)
由于通信行业竞争加剧及各类新业务的频繁推出,电话网络的路由结构及业务逻辑关系日趋复杂,电话网络的复杂性给网络话务和路由的规范带来一定困难。同时,技术的进步使得电话改号软件和接入平台普及,给犯罪分子实施电话诈骗等违法行为带来可乘之机。
目前电信运营商虽然积累了一些非法呼叫筛查的经验,为打击犯罪、规范呼叫提供一些依据和帮助,但以往的筛查没有实现自动化,工作量较大。为了实现非法呼叫筛查自动化,期望利用完善的信令监测系统,研究、建立一种非法呼叫筛查模型,对电话网上所有非法呼叫进行筛查、归类和整治。
模型建立后,通过全网排查,能够主动、及时发现各类非法的、不规范的方式和手段,可有力支撑打击电话诈骗,同时为组网原则及业务实现的不断完善和修订提供依据。
电话网具有一套科学有效的组网原则对路由配置进行规范,但是由于电话网的路由规范及业务逻辑相对复杂,呼叫信息庞大(根据信令系统记录深圳本地网的呼叫信息每天约1.3亿条数据记录),现网上仍然存在非规范呼叫,如非规范路由呼叫、非规范主叫呼叫,不法分子利用非规范呼叫谋取私利,比如利用网间非法主叫套取结算、利用非法主叫实施诈骗等。电信运营商只能根据用户的投诉或者公安部门的要求事后进行人工筛查。由于筛查没有实现自动化,投入的人工工作量较大,滞后性明显。
目前网络电话和用户终端小型设备使用者越来越多,致使网内、网间传送的呼叫中出现了一些虚假主叫,而目前的技术手段难以快速查找真正的呼叫发起者,犯罪分子就会据此进行电话诈骗的活动。当前电话诈骗已成为人们关注的一个热点问题。
通过分析现网的非法呼叫,发现非法呼叫主要表现为主叫号码不规范和呼叫路由不规范。为了能够在海量的呼叫记录中筛查非法呼叫,本文在此提出非法呼叫筛查模型的总体结构。
信令监测系统里的呼叫记录为海量级,而且部分呼叫信息与非法呼叫筛查无关。如果直接使用信令监测系统的呼叫记录进行筛查,工作量巨大、繁琐,因此这样的做法不可取。本文采用信息提取、漏斗筛查、分层处理的方法,对呼叫记录进行筛查。信息提取可以只关注于呼叫筛查的信息,有效屏蔽无关信息,减少筛查的数据量;漏斗筛查、分层处理能够实现多次筛查,确保没有遗漏,而且能够有效降低下层筛查的工作量。筛查思路如图1所示。
图1 筛查思路
根据筛查思路,提出非法呼叫筛查模型总体结构,如图2所示。该模型总体结构处理流程如下。
(1)基于信令监测系统,在海量呼叫记录中进行呼叫信息提取,构成现网呼叫信息库一,该库作为第一步筛查比对的基础。
(2)现网呼叫信息库一与已有异常呼叫模型库进行第一步比对,符合异常呼叫规则的呼叫归入异常呼叫数据库,然后进行网络整改;不符合异常呼叫规则的呼叫构成现网呼叫信息库二,该库作为第二步筛查比对的基础。
(3)现网呼叫信息库二与基准呼叫模型库进行第2步比对,不符合基准呼叫规则的呼叫建立异常呼叫模型,该模型通过验证后,进行网络整改。
(4)网络整改后,对基准呼叫模型和已有异常呼叫模型库进行优化、完善。
3.3.1 现网呼叫信息库一
现网中,信令监测系统存在海量的呼叫记录,如果直接从这些呼叫记录中进行筛查,那么过程将比较复杂、繁琐,工作量巨大。为此,根据系统比对需要定义可扩展的信息提取原则,对海量记录进行信息提取,主要包括主被叫信息、路由信息、业务信息、行为信息等,构成“现网呼叫信息库一”。
3.3.2 已有异常呼叫模型库
根据目前已知的非法呼叫类型,建立“已有异常呼叫模型库”,该库涵盖主叫号码不规范、呼叫行为不规范、话务路由不规范等异常呼叫模型,作为第一步比对的基准。该库内模型可以人为直接定义,也可以由系统自动完善生成。
3.3.3 现网呼叫信息库二
现网呼叫信息库一与已有异常呼叫模型库进行第一步比对后,不符合异常呼叫规则的呼叫将归入现网呼叫信息库二,作为第2步比对的基础。该库与现网呼叫信息库一相比,数据量将进一步减少,有利于降低第2步比对的工作量。
3.3.4 基准呼叫模型库
基准呼叫模型库为非法呼叫模型研究的核心,直接定义了现网中规范话务的各种基准,包括路由规范、业务规范、行为规范等一系列基准,是筛查非法呼叫的准绳。该库内模型可以人为直接定义,也可以系统自动优化生成。该库的完备性直接影响非法呼叫筛查的精确度和效率。
3.3.5 异常呼叫数据库
筛查出来的非法呼叫归入异常呼叫数据库,作为网络整改、日常查询、统计等操作的基础。
基于总体结构,为了能够实现高效筛查比对,对筛查模型细节进行进一步研究,重点提出了呼叫信息上下文和呼叫迁移状态图的概念,并基于UML定义了呼叫上下文和呼叫迁移状态图。呼叫信息上下文和呼叫迁移状态图是非法呼叫筛查模型总体结构中各种模型库内容以及筛查比对的基础。
图2 非法呼叫筛查模型总体结构
4.1.1 呼叫信息上下文的作用
呼叫信息上下文是一个或者一类完整呼叫过程中各类信息的形式化描述。呼叫信息上下文规定了非法呼叫模型研究中所需要的各种信息,描述了路由信息、业务信息、行为信息等。
呼叫信息上下文将改变传统的基于信令消息描述呼叫的方式,提出了一种以筛查非法呼叫为目的,同时屏蔽无关信息的呼叫信息描述模型,为整个非法呼叫模型的核心部分,为高效筛查打下了良好基础。
此外,通过定义呼叫信息上下文,抽象出与话务规范相关的特征信息,有利于进行后期的网络整改,同时能够满足非法呼叫的查询、统计等操作的个性化呈现。
4.1.2 呼叫信息上下文的定义
根据呼叫信息上下文的概念,结合现网的非法呼叫类型,分析得出呼叫信息上下文应该包括路由信息上下文、业务信息上下文、行为信息上下文,如图3所示。
路由信息上下文是对一个完整呼叫所经过的局点路由信息的描述,主要包括主被叫信息和路径信息。主被叫信息用户记录呼叫的主叫号码、被叫号码、原被叫号码等信息;路径信息记录呼叫经过的局点,使用源信令点、目的信令点表示;辅助信息可以记录呼叫的通话时长、释放原因等。
业务信息上下文是对一个呼叫过程中触发的业务信息的描述,主要包括业务名称、业务ID、业务接入码。
行为信息上下文是对用户的呼叫行为进行描述。由于用户行为具有很大的可变性和不可预见性,所以行为信息上下文信息主要从实际已经发生的用户行为中提取。在此,行为信息上下文主要记录转接平台信息和回拨平台信息,以后可以根据实际情况对行为信息上下文进行扩展。
图3 呼叫信息上下文
4.2.1 呼叫迁移的概念
在电话换网中,一个完整的呼叫源于发端局,会经过汇接局或长途局等中间局点,最终到达受端局。那么一个局点可以看作一个状态,一个完整呼叫过程可以看作在不断由一个局点状态迁移到下一个局点状态,直到迁移终止,这一过程定义为呼叫迁移。
4.2.2 呼叫迁移状态图
根据呼叫迁移的定义,把呼叫经过的每一个局点看作一个局点状态,那么一个完整的呼叫流程所经过的局点状态就构成了呼叫迁移状态图。例如一个呼叫由本地发起,呼叫异地号码,该呼叫经过本地发端局、汇接局、长途局,最终到达异地受端局,其呼叫迁移状态图如图4所示。
图4 呼叫迁移状态图
4.2.3 呼叫迁移基准状态图
根据网络路由规范、业务规范、行为规范等基准约束条件,可以定义出一个呼叫在满足这些基准条件下所可能发生的所有呼叫迁移状态图的集合,就构成了呼叫迁移基准状态图。下面借鉴UML(unified modeling language,统一建模语言)的状态图概念,重点提出本地网呼叫迁移基准状态图。
当本地网局点为主叫发端局时,呼叫可能最终到达本地网局点、其他地市局点、其他运营商局点,那么呼叫迁移可能就会经过本地端局、汇接局或者长途局或者关口局等,最终到达收端局。此时的呼叫迁移基准状态图如图5所示。
图5 呼叫迁移基准状态图一(本地网局点为主叫发端局)
当本地网局点为被叫收端局时,呼叫可能是来自本地网局点、其他地市局点、其他运营商局点,那么呼叫迁移可能就会来自本地端局、汇接局或者长途局或者关口局等,最终到达收端局。此时的呼叫迁移基准状态图如图6所示。
图6 呼叫迁移基准状态图二(本地网局点为被叫收端局)
根据呼叫信息上下文的定义,呼叫信息上下文内容可以从信令系统中提取,构成现网呼叫信息库一、已有异常呼叫模型库、现网呼叫信息库二、异常呼叫数据库等库的基础内容。
根据呼叫迁移基准状态图的定义,呼叫迁移状态基准状态图是一个呼叫迁移规范路径的标准,一个呼叫在满足各种路由规范、业务规范、行为规范等约束条件下才能发生迁移。在非法呼叫筛查模型的总体结构中,重点在于第二步的筛查比对,即现网呼叫模型库二与基准呼叫模型库的比对。那么呼叫迁移基准状态图及其约束条件就可以应用于基准呼叫模型库,构成比对的基准。
一个具体呼叫的呼叫信息上文信息包括路由信息上下文、业务信息上下文、行为信息上下文,通过这些信息,可以分析出一个具体呼叫实际发生的呼叫迁移状态图。如果该呼叫迁移符合呼叫迁移基准状态图及约束条件,那么这个呼叫就是规范的;如果该呼叫迁移并不符合呼叫迁移基准状态图及约束条件,但是却实际发生了状态迁移,那么这个呼叫是非规范的。
基于非法呼叫筛查模型总体结构,应用呼叫信息上下文和呼叫迁移状态图,深圳电信初步搭建了验证平台。针对近期出现的假冒110电话进行诈骗的情况,基于验证平台,对深圳电信本地网呼叫进行筛查,发现的确存在非法假冒110电话的呼叫。下面以一个呼叫进行举例说明,从信令系统中提取出来的呼叫信息上下文如图7所示。该呼叫主叫号码为000755110,呼叫深圳号码29937809,此时的主叫号码具有很大的迷惑性和欺骗性,用户很容易上当受骗。
图7 呼叫上下文信息举例
图8 呼叫迁移状态图举例
根据路径信息可以得到该呼叫迁移状态图如图8所示。
通过该呼叫迁移状态图与呼叫迁移基准状态图及约束条件进行比对,发现主叫号码000755110为虚假主叫,从深圳通信二局送到深圳电信关口局,属于非法呼叫。
经过筛查,发现现网存在不少类似的呼叫,并非真正110发起的呼叫,均属于通过虚假主叫假冒110进行诈骗的非法呼叫。通过核查整改,完善呼叫路由原则,从网络上对此类呼叫进行封堵,有力打击了利用虚假主叫进行诈骗的行为。
通过初步验证,本文提出的非法呼叫筛查模型是可行、有效的,呼叫信息上下文和呼叫迁移状态图在筛查过程中能够得到很好的实际应用。
电话网非法呼叫筛查在实际应用中意义重大,本文提出的筛查模型总体结构能实现自动、灵活筛查。基于总体结构,提出了呼叫信息上下文和呼叫迁移状态图的概念。本文定义了呼叫信息上下文,提取了与呼叫筛查有关的特征信息,能够灵活应用,并具有扩展性。本文根据呼叫迁移状态图的概念,定义了呼叫迁移基准状态图,能够有效地在呼叫筛查中得到应用。在后续的研究和时间中,将不断改进、完善非法呼叫筛查模型的总体结构,改进、丰富呼叫信息上下文和呼叫迁移基准状态图的语义描述。
1 芮兰兰,孟洛明,邱雪松.终端业务上下文的定义方法及业务模型.电子与信息学报,2010,32(3)
2 周力,何雪飞.UML建模图解教程.北京:人民邮电出版社,2009
3 李雁,李晓峰,乔秀全.模型驱动的电信业务元模型研究.北京邮电大学学报,2006,29(2)