基于区块链的防电话骚扰欺诈模型

2019-04-12 06:10毛国君朱建明黄勇峰
应用科学学报 2019年2期
关键词:哈希诈骗区块

李 娜,陈 福,毛国君,朱建明,黄勇峰

中央财经大学信息学院,北京102206

随着通信技术的不断发展,人们通信越来越方便,但也给一些不法分子利用电话进行骚扰和欺诈提供了机会.他们购买移动用户的电话数据后进行大范围拨打,接通后立即挂机,等待这些用户回拨.用户回拨电话被转移到录音电话进行营销,给用户造成骚扰甚至诈骗.这种行为违背了用户的主观意志并严重影响移动用户的正常通信.近年来,出现了用专用的拨号软件代替手动拨号并不断更换骚扰号码的严重情况,造成一些软件难以识别骚扰电话号码.因此,保护电信用户信息、有效预防骚扰电话已成为主要的研究方向.

对于预防电话骚扰诈骗,各行各业都非常重视,公安部、电信运营商、互联网公司等都做出了不懈的努力,相继开发出了各种预防电话骚扰诈骗的APP,如百度手机卫士、腾讯手机管家、360手机卫士等.这些APP能够在终端标记骚扰诈骗号码,对电话骚扰诈骗标记库进行不断更新完善,在通话过程中或结束时对通信用户进行提示.当用户再次接到类似骚扰诈骗电话时,就会收到后台服务端发出的骚扰诈骗电话提醒.同时,还可以利用大数据平台、通话时长等进行电话号码的判断并提醒.除此之外,中国三大电信运营商也会根据用户的举报和公安部提供的不良信用的电话号码进行审核,然后放入已建立的黑名单库,并对这些号码拨出的通话进行骚扰电话提示.

但上述策略存在的问题主要包括:没有从根本上解决电话骚扰诈骗的问题,没有保护通信用户信息隐私.标记库存的数据不够全面,每个APP和电信运营商都有自己的数据库且用户数量有限,并不能全面进行电话号码防范.数据真实性存在问题,每个APP并没有对用户的信息进行审核,可能存在用户恶意操作现象.APP只能在通话进行中或结束时进行提醒,不能在来电之前进行拦截;由于利益原因,后台数据库还可能被修改.

区块链技术可以较好地帮助电信用户保护个人信息并快速识别骚扰诈骗电话[1],因此在移动电信领域的应用受到了广泛关注.2018年5月30日,印度电信管理局(Trai)宣布利用区块链技术帮助拦截并追踪垃圾短信、垃圾邮件、骚扰电话、营销电话等,而Trai或将成为首个实施此方案的组织.该方案利用区块链对电话号码进行追踪,能够发现“10位数字发送方式”的传播源[2].因此,将区块链应用于电信领域具有可行性和商业价值.

本文设计了一种基于区块链的防止电话骚扰欺诈模型,将所有通信过程放到区块链上,改变了这种标记骚扰诈骗电话号码的存储数据方式,提出了一种可以进行数据隐私保护和共享、增加数据安全性、节省时间和成本的模型.该模型具有以下特点:

1)运营商联盟服务器群(operator federate servers,OFS)和审核联盟服务器群(auditing federate servers,AFS).由于主要的电信用户资源都在运营商手中,运营商可作为节点加入OFS成为代理.对于提供APP的第三方机构可以加入AFS作为审核节点.模型采用拜占庭容错机制(practical Byzantine fault tolerance,PBFT)和股份授权证明机制(delegate proof-of-stack,DPoS)混合机制.

2)数据不可篡改.将所有数据的传播用Merkle树的树形结构来记录,这些记录互相关联,任何信息的改动都会被发现,且当一个区块链超过6个区块时,区块上的信息通常不能进行修改[3].

3)对数据进行分布式存储.每个移动用户的信息将被加密存储在分布式数据库中,由这些节点共同维护.这种存储方式不但安全性高,而且减小了存储和访问的压力[4].

1 相关工作

目前,对于区块链的研究大多集中在支付、清算系统、银行保险系统等金融体系.文献[5]将区块链技术应用于支付业务,代替了作为“信托代理人”的中间机构.文献[6]根据非洲国家的发展状况将区块链技术应用于保险行业,有效防止了骗保行为.区块链技术在医疗和慈善领域也有应用,如文献[7]运用区块链技术为慈善事业的发展提供了新思路.文献[8]提出了去中心化的电子病历管理方法,并将其存储在区块链中.在电信骚扰诈骗领域,关于区块链的研究较少.文献[9]用区块链实现电信诈骗号码标记库共享,有效预防了电信诈骗的发生.在电话骚扰诈骗方面区块链的研究刚刚起步,本文提出了将区块链应用于电话防骚扰诈骗的模型.

1.1 区块链和共识机制

区块链是比特币(bitcoin)的基础技术,比特币则是中本聪在2008年提出的去中心化数字货币[1].目前,对区块链并没有官方统一的定义.狭义的定义为一种分布式数据库技术,以区块的方式对数据进行存储并根据数据产生和存放的先后形成链状数据结构,由所有节点来共同维护[10].广义的区块链定义则是利用加密算法将链式区块加密后对数据进行验证与存储,根据共识机制生成和更新数据,利用智能合约技术对数据进行管理的一种去中心化基础架构与分布式计算范式[10].区块链主要包括电子交易、区块、链3个组件.每个组件的具体情况如图1所示.

共识机制是区块链的核心,是区块链系统安全性的重要保证,也是区块链建立信任的基础.它解决了区块链中的拜占庭问题,是对分布式节点在区块上执行权力划分提供的一种协商好的规则[11].共识机制主要包括以下2种:1)拜占庭容错机制(PBFT),主节点排序请求,从节点响应请求,多数节点响应结果为最终结果[12];2)授权股权证明机制(olelegated proof of stake,DPoS)是一种委任权益证明机制,由持币人进行投票选取超级节点,这些节点作为代表进行记账[13].其他较典型的机制还包括权益证明(proof of stake,PoS)、工作量证明(proof of work,PoW)等.表1对比了这些共识机制,可以看出一般去中心化程度越高,性能越差.

表1 共识机制多方对比Table 1 Multiparty comparison diagram of consensus mechanism

1.2 哈希算法与Merkle树

哈希算法可以将各种长度的二进制值映射为固定长度较短的二进制值.在数据完整性校验方面较常用,无论在同一个哈希函数中解析几次,只要输入内容一致,输出哈希值就一致.同时,使用哈希算法是一个单向加密且不可逆推的过程,这一特点对区块链来说特别重要.

Merkle树是数据结构中的一种树型结构,位于区块链的区块体中,叶节点存放记录信息,非叶子节点是对应的下层节点的哈希[14].Merkle树可以保证记录数据的安全性、真实性和不可篡改性.比特币区块链哈希结构如图2所示,每个数据块是由多个Item block组成的,根据每一层哈希值可以得到每一个数据块的Merkle树根.因为比特币区块链每10 min生成1个,所以模型中OFS每10 min将数据生成的Merkle树根提交到区块链,从而实现数据的透明和不可篡改[15].

图2 区块链的哈希结构Figure 2 Hash structure of blockchain

2 电话防骚扰诈骗模型

电话防骚扰诈骗模型的主要模块如图3所示.根据电信行业普通用户信息和标记号码提供能力及存放能力的不同,将用户所使用的客户端分为两种类型:1)完备级客户端,存放所有的标记号码信息和电信用户信息,一般为中国三大电信运营商和APP提供机构;2)轻量级客户端,可以根据运营商提供的接口进行查询或授权操作,一般为电信普通用户,电信普通用户分为企业电信用户和个人电信用户,个人电信用户只存放号码信息,企业电信用户在号码信息之外可以存放企业的介绍等信息.

电信行业研究发现,电话号码标记和电信用户信息大数据库基本存放于三大运营商.因为APP提供机构用户数量有限,所以数据量小且数据处理能力也有限.因此将联盟服务器群分为OFS和AFS,并使用PBFT和DPoS混合共识机制可以实现部分去中心化、集体维护、高效透明的电信数据共享.同时,由于电信用户的一些行为信息数据量比较大,这类数据将通过用户的公钥加密存放在分布式的数据库上.为了保证存储数据的安全与真实,将记录所有数据的摘要进行分层存储.在Item结构中存储数据的哈希值,然后计算Item的哈希值并存放到Item块中,减少了查询时间,提高了搜索效率[15].

根据图3可知,AFS、OFS和普通用户都可以与联盟节点进行连接,OFS可以记录电信用户信息和骚扰诈骗号码标记信息,AFS实现对OFS记录的审核,普通用户可以在区块链上查询并授权自己信息是否对其他人尤其是营销电话开放,具体的操作流程如图4所示.

图3 电话防骚扰诈骗模型结构Figure 3 Phone anti-harassment fraud model structure

2.1 电信数据存储机构Item

与比特币相似,Item中存放的电话号码信息最大为100 kB,当用户数据量较小且只有号码信息不想加密的前提下,可以将数据直接存放在数据摘要中.如果用户电话号码附加的信息数据量较大(如企业用户包含各种公司介绍的信息)并且希望对数据进行加密,则需计算数据摘要并放入Item,同时对电话号码信息进行加密并存入分布式数据库.这样既可以通过数据摘要检查数据的完整性,还可以通过提供索引来快速查找到相关数据,并获得是否具有访问权限的信息.

2.2 改进的共识机制

本文采用PBFT和DPoS混合共识机制,解决了共有链面临的去中心化和性能之间矛盾的关键问题.PBFT算法能够解决拜占庭故障问题,共识结果的一致性和正确性程度高,但算法复杂,共识达成时间较长[16].DPoS虽然可以使参与验证和记账节点的数量大幅减少,提高共识验证速度,但若某个超级节点并未产生区块,该超级节点就会被剔除,然后选出新的代替,这样会给攻击者提供机会,甚至受到分布式拒绝服务攻击(DDoS).PBFT+DPoS混合共识使联盟链保留了部分中心化,从而提高交易速度,大幅度降低交易成本.模型结合两个共识机制进行改进,选择中国三大运营商为OFS中的一员,轮流记录提交的请求到Item中,然后用私钥进行签名.AFS的指定是根据艾媒咨询在2017年公布的《2017年4月中国APP活跃用户排行榜(TOP450)》中排在前20的安全防护类APP机构,轮流校验每个被签署的区块.这20个APP机构根据排名先后给予一定的信用积分,但不能转赠.如果机构存在错误审查和作弊现象,将会扣掉一部分信用积分,当积分低于一定阈值时,将从AFS中去除,由排名次之的APP机构代替.因为三大运行商具有较强的公信力,所以直接授权为OFS,然后根据工作量证明机制对电信数据进行记录.

图4 工作流程图Figure 4 Work fl ow diagram

2.3 数据共享和访问控制

数据所有者将电话用户信息进行加密并将其存储在分布式数据库中.模型采用高级加密标准(advanced encryption standard,AES),相比于广泛使用的三重数据加密算法(triple data encryption algorithm,3DEA),AES的安全性更好、效率更高、更加灵活.该算法采用square结构,明文组为128 bit,密文长度可分别为128 bit、192 bit、256 bit,迭代轮数分别为10轮、12轮、14轮.轮结构变化包括以下4种:字节变换(SubBytes)、行位移(ShiftRows)、列混合(MixColums)和轮密钥加(AddRoundKeys)[17].由初始密钥扩展得到加解密中每轮的密钥.算法中16个字节的明文、密文和轮密钥都以1个4×4的矩阵表示.区块链中存放的是加密后的密文,若要访问数据,则需利用该算法进行解密.AES算法能较好地实现对电信骚扰诈骗数据的共享和控制,达到保护普通电信用户隐私的目的.

3评 估

本文用对照分析的方法评估电话防骚扰诈骗模型,首先与现有的研究方案进行对比,分析模型的优缺点如表2所示;然后从不同方面分析模型的优势和影响,见表3.

表2将本文模型从5方面与文献[9]模型进行对比,可以看出在整体情况下具有一定的优势.但该模型与其他领域对区块链的应用相比还存在许多需要改进的地方,例如缺少机器学习能力,不能将用户进行画像和分类.

表2 本文模型与文献[9]模型的对比Table 2 Comparisons of the model with the Reference[9]model

表3 模型面临问题以及解决方法Table 3 Problems and solutions of models

4 结语

近年来,中国电信行业电话骚扰诈骗较严重,虽然各方面采取了一定的措施,但还未从根本上解决问题.区块链技术的发展为解决电话骚扰诈骗提供了新的思路.本文提出了一种基于区块链的新的通信方式,将用户信息及通信过程部署在区块链上,可以防止用户信息泄露,定向接收广告营销,实现三大运营商、APP机构实现共享标记库,还可以实现对骚扰诈骗号码实行反查、截断,实时提醒用户等功能.因此,通过该模型可以建立良好的通信,防止骚扰诈骗的发生.

然而,区块链技术在电信行业应用中还存在许多挑战,包括区块链技术自身的局限性及两者结合之后的一些制约因素.该技术投入市场后数据量剧,会降低更新效率,而去中心化也会给监管带来困难,这些问题有待进一步研究.

猜你喜欢
哈希诈骗区块
基于特征选择的局部敏感哈希位选择算法
哈希值处理 功能全面更易用
区块链:一个改变未来的幽灵
文件哈希值处理一条龙
区块链:主要角色和衍生应用
区块链+媒体业的N种可能
读懂区块链
合同诈骗
电信诈骗
信用卡诈骗