基于BP神经网络的ICO经济类罪模型及其实证研究

2019-05-21 11:37陈兰兰左黎明
四川警察学院学报 2019年1期
关键词:权值神经网络误差

陈兰兰,左黎明,2

(1.华东交通大学 江西南昌 330013;2.江西省经济犯罪侦查与防控技术协同创新中心 江西南昌 330103)

ICO[1](Initial Coin Offering,虚拟货币首次公开发售)是指融资主体通过代币的违规发售、流通,向投资者筹集比特币、以太币等所谓“虚拟货币”。2017年9月,央行下发公告,将ICO定性为一种未经批准非法公开融资的行为,涉嫌非法发行证券、非法发售代币票券以及金融诈骗、非法集资、传销等违法犯罪活动,并责令停止各类代币发行融资活动。ICO存在诸多潜在风险,包括项目失败或跑路导致的资金损失风险、价格剧烈波动引起的金融风险、借ICO进行的诈骗、非法集资等违法犯罪风险等。万福帀是一种在美国加州洛杉矶兴起的虚拟货币,2016年3月5日,创办人刘某启动虚拟数字货币“万福币”传销项目,两个月内吸纳会员13万余人,疯狂收取传销资金近20亿元人民币[2]。2017年2月广东省中山市警方通过两个月摸底调查,抓获维卡币3名涉案人员,冻结3.1亿传销资金[3]。2017年,韩国最大比特币交易所Bithum遭入侵,用户损失数十亿韩元,预计约有100名受害者将对Bithumb提起集体诉讼[4]。ICO热度持续高涨,投资者范围不断扩大,因此基于神经网络模型研究ICO经济类罪特征,对ICO数据进行挖掘与分析,提取相关信息并进行评估,对ICO经济犯罪的防控具有重要意义。

近年来,国内外许多专家、学者对神经网络模型的建立与应用进行了研究,其中BP神经网络具有良好的通用性,并在各个领域得到广泛应用。因此,本文设计了ICO经济类罪评价指标,并创建ICO经济类罪数据集,基于BP神经网络算法建立了ICO经济类罪模型。通过训练BP神经网络,对ICO的合法性进行预测与评估。

一、ICO经济类罪模型评价指标设计

基于BP神经网络的ICO经济类罪评价指标的选取十分重要,需要从ICO的本质以及公安部已证实为涉及传销、诈骗等金融骗局的案例出发,分析与提取ICO经济类罪相关评价指标。通过查阅资料与分析,发现许多ICO项目运作方式与传统网络传销行为十分接近,利用ICO进行传销已成为网络传销新特点。由此提取出13个特征作为ICO合法性的评价指标,分别为:去中心化、开源、白皮书、发展下线、缴纳入会费、复式计酬、高收益高分成的许诺、过度炒作、成立公司、自建平台交易、官网基于HTTPS协议、有实体币、存在运行的产品。

评价指标中前3个指标去中心化、开源和白皮书为判断可靠ICO项目的重要特征。首先,一个成功的ICO是区块链社区的产物,需要区块链的底层哲学去中心化来支撑[5]。其次,一般的ICO项目都是代码开源项目,且大多都会上传到开源社区,如github社区[6]。同时,一个可靠的ICO项目一般具有一份正式的白皮书,白皮书是一个项目用非技术语言进行的概括,一般包括简介、目的、原理、特殊性、价值、如何分配融资的代币、如何使用代币、项目规则、团队背景、项目是否成熟等内容。不具备这3个特征的ICO项目的真实性有待考量,可能有传销、诈骗等犯罪嫌疑。

设计的指标中发展下线、缴纳入会费、复式计酬[7]和高收益高分成的许诺为传统涉嫌传销行为[8]的基本特征。复式计酬是指对参加者以其直接或者间接发展的下线数量,或者其直接或者间接发展的下线的销售业绩,两种方式计提报酬,形成传销的“资金链”。

余下的6个为经过ICO金融骗局案例分析后选取的评价指标。首先以典型骗局维卡币[9]为例,其具有过度炒作、成立公司、自建平台交易、官网不基于HTTPS协议等特征。在过度炒作方面,维卡币曾发布大量的不实消息,非法使用第一财经及主持人江予菲的名义及其肖像进行对外宣传,存在过度炒作嫌疑。在成立公司、自建平台交易方面,ICO项目最终是公链项目,法律主体不是公司,并且运作健康的ICO项目一般在国内外主流交易平台进行交易,而不是由ICO项目公司自建平台独自操控,故成立公司和自建平台交易可以作为两个评价指标。在官网不基于HTTPS协议方面,HTTPS协议是可进行加密传输、身份认证的网络协议,广泛用于万维网上安全敏感的通讯,而HTTP协议不提供任何方式的数据加密,不适合传输敏感信息。因此,一个可靠的ICO项目官网应该基于HTTPS协议。其次,一类典型骗局五行币是一种体积比普通硬币略大的声称由纯金打造而成的硬币,具有发行实体币的特征。另一类典型骗局万福币规定交入会费3000人民币,即送一套价值3000元人民币的美国未来城优质保健产品,具有存在运行的产品的特征。通过分析,具备这6个特征的ICO项目为金融骗局的可能性极大。

通过对上百例公安部打击的案件的研究与分析,设计了上述13个特征作为评价ICO项目合法性的指标,并以此作为BP神经网络算法选取输入变量的参考。

二、ICO经济类罪模型

(一)BP神经网络

BP(back propagation)神经网络[10]是一种多层的前馈神经网络,可分为输入层、隐含层和输出层,网络中各个神经元接受前一层的输入,并输出给下一层,即第i层的输入只与第i-1层输出相连,输入与输出节点与外界相连,而其他中间层为隐含层。BP神经网络的学习过程分为信号的向前传播和误差的反向传播两个阶段,第一阶段是从输入层经过隐含层,最后到达输出层;第二阶段是从输出层到隐含层,最后到输入层。

BP神经网络是目前应用最广泛的神经网络,具有较强的非线性映射能力、一定的容错能力以及高度自学习和自适应的能力,其算法具有计算量小、简单易行等优点。由于ICO经济类罪问题本质上是非线性的,难以直接发现其中的关联,因此本文采用BP神经网络来建立ICO经济类罪模型。

(二)模型建立

如图1所示,为BP神经网络模型结构图,它由输入层、隐含层和输出层组成。

图1 BP神经网络模型结构

1.输入层参数的选择。根据设置的ICO经济类罪模型评价指标,确定13个输入层节点,分别与14个评价指标对应,确定的输入变量为Ii(i=1,2,……,13),具体如表1所示。

表1 ICO经济类罪模型输入变量

2.输出层参数的选择。ICO经济类罪诊断结果有两种,分别是合法和非法,故输出层只需要一个节点O1作为输出值,具体输出值如表2所示。

表2 ICO经济类罪模型输出变量

3.隐含层的确定。隐含层的节点数的选择是个十分困难和重要的问题,它不仅会影响建立的模型性能,还会导致训练时出现“过度吻合”(Overfitting)问题。目前理论上还没有一种科学和标准的确定方法,但部分研究表明,隐含层节点数不仅与输入/输出层的节点数有关,更与待解决问题的复杂程度、转换函数以及样本数据特性等因素有关。如果数目太少,可能造成网络不收敛根本无法训练,如果数目太多,虽然可以减小系统误差,但同时也会延长训练时间,并且容易陷入局部极值而达不到最优值。隐含层节点数的确定还有待研究,具有很大的经验性,以下给出2种方式选择隐含层节点数目,参考公式[11]如下:

(1)n1=log2n,其中为输入节点数,为隐含层节点数。

本文所建立的模型有13个输入节点和1个输出节点,由以上参考公式可知,隐含层节点数范围为[4,13]。通过多次测试,当隐含层节点数为10时,效果最佳。因此,将隐含层节点数设置为10个。

(三)BP神经网络学习

BP神经网络的学习,实际上是调整网络的权重和阈值这两个参数,因此需要先设定目标误差或最大学习次数,采用最速下降法逼近误差函数,直至达到设置的目标误差,学习步骤[12]如图2所示,具体步骤如下:

图2 BP神经网络学习流程图

1.网络初始化。已知输入节点数为14,隐含层节点数为10,输出节点数为1,设定目标误差为ε和最大学习次数为M,定义输入变量Ii,隐含层输入hj,隐含层状态Hj,输出层输入ok,输出层状态ok,期望输出向量Ti,输入层与隐含层的连接权值,隐含层与输出层的连接权值wjk,隐含层节点阈值θj,输出层节点阈值θκ等,其中所有权值与阈值均∈(-1,1),具体变量如表3所示。

表3 BP神经网络学习变量列表

2.随机选取。随机选取第个样品数据输入网络,以及对应的期望输出。

3.隐含层计算。计算隐含层节点的输入,即为其前一层各节点的输出值的加权和:

相应的隐含层输出状态为:

式(2)中φ(·)称为激励函数或作用函数,一般采用sigmoid函数:

式(3)中θi称为阈值,λ称为温度系数。

4.输出层计算。计算输出层输入为:

输出层最终输出为:

期望输出记为{Tk}。

5.误差计算。计算期望输出与最终输出的均方误差函数E(W)为:

若E(W)<ε则学习终止,否则继续。

6.权值修正:使用最速梯度下降法来调整权值,每次的修正量为:

式(7)中η称为学习效率,为达到最佳性能,设置η为递减函数,满足:

可推导出权值修正量公式为:

故隐节点到输出节点的权值修正量为:

输入节点到隐节点的权值修正量为:

7.判断模型合理性。判断误差是否满足目标,若误差达到目标误差或学习次数大于预设的最大学习次数,则结束算法;否则返回第3步,进入下一轮学习。

三、实证研究

(一)实验数据

根据设计的ICO经济类罪评价指标,收集150组样本数据,具体样本数据集见文献[13]。样本数据主要由央视曝光的2017年最新金融骗局黑名单和加密货币分析网站CoinMarketCap加密货币数据组成,为参与评价计算,需要进行数据预处理,规范化各指标的值。经过分析,采用0-1标准化方式对数据进行处理。对处理的150组数据,将其中的130组作为学习样本,剩下的20组作为测试样本,利用Matlab编写程序建立BP神经网络模型进行实证研究。

(二)实证结果

建立BP神经网络,分别导入130组学习样本数据和20组测试样本数据,并对数据进行归一化。设定隐含层节点数为10,目标误差值为0.001,最大迭代次数为10000,开始训练神经网络。训练完成后,对测试数据进行BP神经网络实证研究,得到输出值并进行反归一化操作,再利用择近原则,将数据分类为0或1,实际输出、分类处理后的实际输出和期望输出如表4所示。实际输出和期望输出的对比图如图3所示,由对比图可见BP网络训练之后的输出可以较精确地逼近目标函数。最后,计算实际输出与期望输出的误差率为14.42%,对20组样本数据诊断准确率为95%。网络误差曲线如图4所示,由曲线图可知,网络共训练11次,5次后趋于平稳,收敛速度较快,因此该网络在训练时间、训练次数等方面具有良好的性能[14]。

表4 输出结果对比

图3 实际输出和期望输出对比图

(三)结果分析

实验样本数据主要来自央视已公布的金融骗局名单和CoinMarketCap网站数据,数据来源可靠。20组测试样本中,包括维卡币、万福币、无极币等已确认为网络传销的虚拟币。实验实际输出与期望输出结果基本一致,诊断准确率达到95%,即20组测试样本中,只有一组与期望输出不同,表明BP神经网络学习之后可以较精确地对ICO经济类罪进行诊断。通过实验输出结果可知,BP神经网络模型对ICO经济类罪的诊断准确率较高,其原因可归结为两方面关键技术[15],一方面是训练样本的可靠选择,覆盖全面的样本数据是BP神经网络具有较高诊断准确率的基础;另一方面是隐含层节点数的选择,选取合适的隐含层节点数可以提高诊断准确率。

图4 网络误差曲线

四、结语

本文研究是基于神经网络的ICO经济类罪的诊断方法,以最常见的BP神经网络建立诊断模型,实现了对ICO合法性的预测和评估。通过合适的隐含层节点数和精心选择的样本数据,诊断准确率达到95%。实证结果表明,所建立的类罪模型能有效反映各评价指标与ICO经济类罪之间的非线性关系。因此,BP神经网络在诊断ICO经济类罪方面具有较高的准确性,可用于评价ICO经济类罪的一种新思路。

猜你喜欢
权值神经网络误差
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
角接触球轴承接触角误差控制
Beidou, le système de navigation par satellite compatible et interopérable
神经网络抑制无线通信干扰探究
压力容器制造误差探究
基于神经网络的中小学生情感分析
基于MATLAB的LTE智能天线广播波束仿真与权值优化
基于权值动量的RBM加速学习算法研究
基于神经网络的拉矫机控制模型建立