BP神经网络的C2C电子商务信用评价模型的建立

2015-03-31 12:49张瑞玉刘健左敏
中国经贸导刊 2015年5期
关键词:信用评价BP神经网络

张瑞玉 刘健 左敏

摘要:从店铺信息、商品、卖家服务等方面建立C2C电商信用评价体系,在淘宝网获取了242条卖家信息,利用SPSS两步聚类法将数据进行聚类,运用MATLAB的BP神经网络工具箱,将评价指标数值作为输入,聚类结果作为输出,构建了三层BP神经网络,以230条数据为训练样本,得到具有较快收敛速度和较高准确率的BP网络。在此基础上, 以12条卖家信息作仿真实验,对卖家信用等级进行客观的预测评价,最终建立C2C信用评价模型。

关键词:C2C电子商务 信用评价 BP神经网络

当前互联网依旧成为影响我国经济社会发展、转变人们生活形态的关键行业,中国互联网络信息中心(CNNIC)在京发布第34次《中国互联网络发展状况统计报告》,《报告》显示,截至2014年6月,我国网购用户规模达到3.32亿,与2013年6月对比,增加6060万,增长率为22.37%。虽然网购规模的扩大,刺激网络经济的发展,但也引发了诚信危机。据《2014年(上)中国电子商务用户体验与投诉监测报告》显示,电商投诉大大增加,网络售假、退款问题、质量问题、虚假促销、退换货物网络诈骗、发货迟缓、订单取消、账户被盗、售后服务等尤其明显。越来越多的新问题对电商的诚信度和服务提出了更高的要求,要提高网民对电子商务的信任,首先必须让网民知道什么情况下电子商务是可信的,这就涉及电子商务信用评价问题。

传统信用评价方法主要基于线性特征建立模型,C2C电子商务的信用评价指标与信用评级之间常体现出非线性特征,神经网络则被认为更适于说明指标间的非线性特征,所以,本文建立C2C电商信用评价指标,利用MATLAB的BP神经网络工具箱建立信用评价模型,通过反复训练提高信用评价准确率,得出信用评价等级和结果。

一、BP神经网络原理

BP神经网络原理比较简单,图1为一个典型的三层BP神经网络结构图。图1中,X=(X1,X2……,Xn)T为输入向量,Y=(Y1,Y2……Ym)T为输出向量,n表示输入向量维数,m为输出向量维数。输入学习样本,使用反向传播算法对网络的权值和偏差进行反复的调整训练,使输出向量与期望向量尽可能地接近,当网络输出层的误差平方和小于指定的误差时训练完成,保存网络的权值和阀值,不断调整权值和阀值的过程,便是BP神经网络的训练进程,这个过程一直持续到输出误差减小到可接受或预先设定的学习次数为止。

二、BP神经网络C2C电子商务信用评价模型的建立

(一)C2C电子商务信用评价指标体系

根据有关电子商务的信用影响因素,结合消费者对网商的投诉内容,淘宝网现有评价规则方法和模型体系,以及前人研究的各种其他评价体系存在的问题进行全面的分析总结,本文从店铺信息、商品以及卖家服务这三个方面建立如表1所示的C2C电子商务信用评价指标体系。

(二)建立BP神经网络信用评价模型

数据选取,本文根据上文所建立的信用评价指标体系中的二级指标,从淘宝网上搜集相关数据,作为BP神经网络的训练数据集和检验仿真数据集。由于不同行业的商品性质、价格差别较大,不具有可比性,为了保证模型的准确性,本文仅选取淘宝网上以“3C数码”行业为主的店铺数据作为目标,选取了以销售手表为主的店铺,共搜集了260条数据,由于输入错误等一些原因导致部分数据缺失,经过筛选,最终产生242条有效数据,如下表2所示(由于数据较多,仅列出部分数据)。

数据预处理,由于BP神经网络学习是典型的有导师学习,其自学过程是一个反复迭代的过程,通过对足够的样本进行训练,得到一组权值,因此所建立的信用评价模型需要有学习对象。当前淘宝网店家信用等级分为4大类20等级,但是买家对这些过多的信用等级并非太敏感,本文将新信用等级分为5个等级,并且运用SPSS13.0软件,使用两步聚类法确定所有数据的聚类数,表2前三列作为参考数据,由于退款率和惩罚次数是成本性指标,其他为效益性指标,在进行数据处理时,本文将这两个指标数值由正变负,再经过软件分析得到如表3和表4的结果。

(三)基于Matlab的BP神经网络工具箱的信用评价模型建立

BP神经网络模型的确定,需考虑三方面:神经网络层次、每层神经元个数、 BP神经网络参数。进一步说,就是隐含层和输出层传递函数的选取,训练函数的选择,初始数据的归一化,以及最大训练步长和目标误差的设定等。据Kolmogorov定理,一个隐含层的BP网络能映射任意连续函数,降低训练误差,增加网络层数的方法会使网络结构变得复杂化,进而增加训练时间,因此,本文采用三层BP网络,通过增加隐含层节点数,确定最佳BP网络结构。

本文用样本数据中的230条数据作为训练数据,12条数据作为检验仿真模型数据,误差目标goal设为0.015,训练步长设为100000,其他参数为工具箱缺省值。各层神经元个数的确定,本文选取了11个二级信用评价指标作为输入,因此输入层神经元n=11;输出神经元的数量由信用评价结果的模式确定,由于将“卖家信用等级”作为目标输出,用数字分别表达对应的信用等级:1代表信用等级高;2表示信用等级较高;3表示信用等级一般;4表示等级较低,5表示等级低,因为期望输出值是单数字的形式,因此网络输出层m=1。隐含层神经元数目的选择是非常复杂的问题,常需要根据经验和多次试验来确定。本文选公式(2)和(5)选取比较宽泛的隐含层神经元数范围,可初步判断隐含层神经元数的范围为5—23,通过Matlab7.11设计了隐含层神经元数可变的BP神经网络,在nntool中默认的trainlm函数下,取隐含层节点数从5到23,由于输出的误差有正有负,本文将输出的所有数据都做绝对值ABS处理,针对不同节点的不同数据的绝对值误差求平均值,通过数百次的训练,改变权重和阀值,得到不同节点的最佳误差值,由表5右侧可知,当m=10时,平均误差是最小的,从而确定最佳隐含层神经元数为10。

BP网络常用传递函数有logsig、tansig、purelin。logsig产生[0,1]的输出,tansig产生[-1,1]的输出,purelin可以得到任意大小的输出,由于本文输入数据为连续数值,用premnmx函数进行归一化处理,所以隐含层采用tansig传递函数,目标输出数据为任意值,输出层用purelin传递函数。

选取不同的训练函数,BP网络的收敛速度有差异,对训练误差也有影响,本文分别选用trainglm、traingdx、trainda、traingdm和traingd函数等常用训练函数进行BP网络训练,训练结果如表5左侧所示,可以看出trainlm函数的收敛速度最快,收敛误差最小,因而确定网络的训练函数为trainlm函数。

综上所述,基于BP神经网络的C2C信用评价模型为11—10—1的三层BP神经网络模型,隐含层传递函数为tangsig函数,输出层传递函数为purelin函数,训练函数为trainlm函数。

最后,将检测数据集输入模型进行检测,来检测该模型的准确率。利用MATLAB的nntool进行检测仿真实验,得出如表6的结果,从表中可以看出,12个检测样本中,只有样本5和样本12未达到设定的goal=0.015,其余10个样本均达到,模型的准确率达到83.33%,说明该模型的训练精度较高,分类能力较强。

三、结论

本文使用MATLAB的BP神经网络工具箱,设计和建立了基于BP神经网络的C2C电子商务信用评价模型,此模型选用的BP神经网络算法,是一种非线性方法,没有明显的主观成分,只需将处理过的数据输入网络,通过MATLAB的nntool计算即可得评价结果,避开权数确定问题,实现评价的自动化和智能化,该过程简单易行,对卖家的信用等级有较为准确的评估,对于C2C电子商务信用的评价,可望开发一个评价系统,将训练好的的神经网络模型嵌入该系统中,输入指标值,系统会自动给出一个评价等级,同样,也可用训练好的模型来评价某些电商活动,乃至可以对国内外电子商务的信用进行对比分析,从而更好了解我国电商情况。

参考文献:

[1]PIRAMUTHUS. Financial cre-

dit-risk evaluation with neural and neurofuzzy systems[J]. European Journal of Operational Research,1999,112(2):310—321

[2]DAVIDDEMEZA,DAVID WEBB.D-

oes creditrationing imply in sufficient lending[J]. Journal of P-

ublic Economics,2000,78:215—234

[3]YUEH—MIN HUANG,CHUN—MIN

HUNG,HEWIJINCHR ISTINEJIAU. Evaluati on of neural networks and datamining methods on a credit assessment task for class imbalance problem[J]. Nonlinear Analysis:Real World Applications,2006,7

(4):720—747

[4]http://www.cnnic.net.cn/hlw-

fzyj/hlwxzbg/hlwtjbg/201407/t20140721_47437.html

[5]http://www.100ec.cn/cn/deta-

il——6192810.html

[6]吴莹辉.基于BP神经网络模型的个人信用风险评估研究[J].科技创业,2012(7):98—100

[7]卢纹岱主编.SPSS for Windows统计分析(第3版)[M].北京:电子工业出版社,2008:392—407

[8]闵惜琳,刘国华.用MATLAB神经网络工具箱开发BP网络应用[J].计算机应用,2008,21 (8):163—164

〔本文系辽宁省自然科学基金项目“面向股票价格过度波动的(x,n,1)型模拟植物生长神经网络算法研究”(项目编号:20092141)研究成果〕

(张瑞玉,1988年生,河南信阳人,大连大学管理科学与工程硕士研究生。研究方向:知识管理。刘健,1989年生,河南信阳人,中国计量学院控制工程硕士研究生。研究方向:控制工程。左敏,1989年生,山东淄博人,大连大学管理科学与工程硕士研究生。研究方向:知识管理)

猜你喜欢
信用评价BP神经网络
国内非金融企业部门债务测算及评价
就bp神经网络银行选址模型的相关研究
基于DEA—GA—BP的建设工程评标方法研究
试析电子商务环境下中小企业信用评价
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
浅析我国信用卡风险管理
BP神经网络算法在数值预报产品释用中的应用
基于AHP灰色关联分析的企业电子商务信用评价研究
基于校园一卡通的学生信用管理模型设计