刘章发(聊城大学东昌学院,山东聊城252000)
大数据背景下跨境电子商务信用评价体系构建
刘章发
(聊城大学东昌学院,山东聊城252000)
摘 要:随着“一带一路”战略部署的逐步推进,我国跨境电子商务迅速崛起,大数据发展也随之正式上升为国家战略。一直以来,信用问题都是影响我国跨境电商快速健康发展的一个重要因素,运用大数据技术构建信用评价体系成为解决这一难题的必然路径。为更好地改善贸易环境,降低贸易风险,提高贸易效率,提升我国企业跨境电子商务水平及在国际贸易中的地位,可基于大数据征信构建跨境电商信用评价指标体系,运用与大数据相匹配的指标赋权方法——模糊层次分析法为各指标赋予权重,并在此基础上构建与大数据相匹配的信用评价模型,结合先进机器学习工具进行训练和预测,从而最终可以在互联网界面准确、实时传输评价结果,构建出完整、动态的跨境电商信用评价体系。
关键词:大数据;跨境电子商务;信用评价
跨境电子商务(以下简称“跨境电商”)是把传统国际贸易加以网络化、电子化的新型国际贸易方式。随着国家“一带一路”战略的推进,跨境电商迅速崛起,有望成为“中国制造”出口的新通道。中国电子商务研究中心发布的《2015年(上)中国电子商务市场数据监测报告》显示,2015年上半年,中国电子商务交易额达到7.64万亿元,其中跨境电商交易规模为2万亿元,同比增长42.8%,占我国进出口总值的17.3%。中国产业信息网发布的《2015—2020年中国电商物流行业投资前景及发展战略研究分析报告》预计,未来几年我国跨境电商交易规模将不断提升,至2017年有望达到8万亿元,在进出口贸易总额中的渗透率将达到23.1%,占中国进出口贸易的比例将提高到20%,年增长率将超过30%,成为中国进出口贸易增长最快的领域。
然而,跨境电商的蓬勃发展也面临诸多制约因素,其中信用问题就是发展瓶颈之一。电子商务与传统交易模式相比存在信息不对称的问题,而跨境电商因买卖双方处于不同国家,买家更是很难对卖家信用做出准确判断。信用的缺失会引起交易之前的逆向选择和交易之后的道德风险,增加交易成本,降低市场效率。中国电子商务研究中心高级分析师张周平[1]表示,中国的跨境电商正在经历从量变到质变的过程,信用体系建设已经刻不容缓。
跨境电商信用体系建设主要包括两大部分,即信用评价指标体系和信用评价模型。良好的信用评价指标体系是信用体系建设的基础,它需要以多维度、多层次、多渠道的海量信息构成原始数据,然后再从巨量数据中寻找关联性并提炼出能够反映共同特征的指标,而目前备受关注的大数据技术正好能够完美地解决这些问题。
对于大数据,研究机构高德纳(Gartner)给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模(Vol⁃ume)、快速的数据流转(Velocity)、多样的数据类型(Variety)、价值密度低(Value)四大特征(也称4V特征)。大数据在生产经营、日常消费、商务活动等诸多领域源源不断地产生、积累、变化和发展,已经被越来越多的企业视为重要生产要素。大数据的应用为跨境电商的战略选择、营销决策、金融服务、趋势预测等带来了颠覆性变革,同时也给征信体系建设带来了新的思路,原来海量庞杂、看似无用的数据,经过清洗、匹配、整合、挖掘,可以转换成信用数据,且信用评估的效率和准确性也得到了一定程度的提升,使得“一切数据皆信用”成为可能。新的信用风险体系具有一个颠覆性的基本思想,即一切数据皆信用,这是需要以大数据技术作为支撑的。[2]
大数据技术的战略意义并不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。在大数据背景下研究信用评价指标应当遵循以下原则:
(一)合法性
2015年博鳌亚洲论坛关于大数据的讨论主要聚焦于大数据安全和隐私保护等方面。跨境电商的交易双方隶属于不同的国家,而每个国家关于隐私保护的法律法规不尽相同,因此需要格外注意运用大数据征信的合法性。关于保护数据隐私,许多国家都制定了严格的隐私法律。其中,欧盟1995年颁布了《欧盟数据保护指令》(DPP),美国联邦贸易委员会(FTC)从1995年开始关注数据隐私和电子商务并与欧盟签署了《安全港协定》,英国政府1998年颁布了《数据保护法案》(DPA)等,[3]而中国有关大数据隐私保护的立法几乎是空白。大数据征信要避免不必要的国际法律纠纷,对于可能牵涉到隐私的数据或指标,应当在获得授权后收集、使用。由于大数据隐私目前具有不确定因素,如果处理不当,会给用户带来不可预知的伤害,这也是跨境电商交易的风险之一。
(二)完整性
大数据征信有利于指标体系的完整构建,使之能够全方位反映信用的真实情况。然而,大数据征信面临着信用孤岛的难题,这在跨境电商上表现得更为突出。内部信用信息碎片化,外部信用信息孤立化,缺乏统一标准,融合性不强,不能互联互通,给大数据征信带来了很大的困难。要真正解决这些问题必须进行顶层设计,就目前而言,为构建更加完整的指标体系,在进行大数据征信时要对信息进行系统梳理,同时以合作交换等方式从外部挖掘信用信息。
(三)有效性
有效的指标建立在有效的大数据基础之上。目前,大数据已经成为专家学者及各界精英研究、讨论的热点,但也不免存在过度炒作的嫌疑。正确认识大数据需要树立这样一种意识:大数据不是万能的,它不等于大量的数据,大量的数据并不一定具有价值。大数据价值密度低,经典的“二八定律”同样预示着在某个数据源中或许只有10%~ 20%的数据是有用的。因此,在抓取跨境电商信用评价指标的原始数据时,挖掘的方向和对数据的清洗非常关键,盲目追求海量数据只会降低指标的有效性。大数据工作就好像在一堆稻草中寻找一根针,只有真正发现了这根“针”,所提炼的指标才具有说服力。
从某种程度上说,大数据是数据分析的前沿技术。简而言之,从各种类型的海量数据中快速获得有价值信息的能力就是大数据技术,明确这一点至关重要,而也正是这一点促使该技术具备走向众多企业的潜力。
马云是中国电子商务领域的传奇人物,2014年他曾经表示,人类正在从信息技术(IT)时代走向数据技术(DT)时代”。[4]数据技术时代,数据本身被视为资产,在“互联网+”过程中,大数据将为所有产业带来颠覆、创新和红利。将大数据技术运用到跨境电商领域的征信方面,首先需要考虑两个维度:一是数据挖掘的广度;二是数据挖掘的深度。就广度而言,大数据要多源采集和挖掘传统技术手段无法抓取和处理的数据,如社交网站上大量用户生成内容(User Generated Content,UGC)的文本、音频、视频等非结构化数据,这些数据都可能是有价值的,能够提炼出与跨境电商信用评价相关的共同因子,如境外客户满意度等。基于大数据抽取计算出的境外客户满意度将更真实、更有效。大数据挖掘的重点将是网络上的内容数据和行为轨迹数据。就深度而言,大数据要结合云计算及机器学习工具理清庞杂数据之间复杂的结构关系,对数据进行分类、聚类、降噪等处理,使原始数据标准化后成为转换数据,转换数据合并到元变量,元变量输入到不同模块,每一模块代表一种特征,由此形成有效的评价指标。
中国互联网商务金融研究院院长张云起及其团队[5]在开发信联网商务信用体系的研究中,以三个维度构建大数据征信采集结构:第三方数据、电商平台交易数据、网络轨迹数据。本文认为,这三个维度不仅覆盖面广,而且既有静态数据又有动态数据,既有传统数据又有非传统数据,符合对跨境电商信用数据采集的要求。因此,跨境电商信用评价指标体系将以三个维度为准则,并结合文献、理论以及跨境电商实际状况,对每一准则下的具体指标进行分析和提炼。
(一)第三方数据下的指标
第三方数据主要来自工商、质检、税务等政府职能部门以及银行等金融机构和跨境电商所在的网络平台,一般是静态、传统数据。第三方数据往往是公开的或者是通过合作交换得到的。从政府职能部门公开的信息可以得到跨境电商的资质认证指标。根据2012年商务部电子商务和信息化司发布的《电子商务企业资质认证标准》(征求意见稿),资质认证指标具体包括工商注册信息、纳税信息、域名注册信息等。通过第三方以及企业内部信息可以获得财务指标,这是最经典的指标,在信用评价方面具有很强的说服力。周子元[6]提出,影响企业信用的主要因素是涉及公司财务的资产规模、赢利水平、经营能力、偿债能力等,准确评估信用的前提是具备完善而精确的财务数据,因此应在信用评价体系中提高财务指标的比重。跨境电商企业在与银行或网络借贷公司进行借贷时产生的金融服务记录同样是衡量信用的重要指标,包括企业在银行的信用等级、抵押担保情况、违约记录等。
此外,跨境电商与普通电商的重要区别在于,商务活动是否涉及出关。根据跨境电商服务流程的特殊性,应当添加一些有针对性的指标,如通关记录等。杨坚争等[7]在较大规模问卷调查基础上,应用主成分分析法归纳出了五个对跨境电商发展具有重要影响的指标,其中之一就是电子通关指标,并细分为电子报关、货物查验、税费征收三个具体指标。
(二)电商平台交易数据下的指标
跨境电商交易数据多是动态传统数据,可运用大数据技术进行实时更新和监测。产品质量和服务质量是电商企业信用评价常用的指标,其中与产品质量相关的指标包括产品与描述是否相符、产品合格率、退货率等,与服务质量相关的指标包括卖家态度、物流速度、保险服务情况等。用户交易之后会在电商平台上对产品和服务质量进行评价,其评价结果对所有浏览者可视。从交易成本理论角度思考,由于境外顾客与跨境电商之间存在严重的信息不对称,为做出正确的购买决策,境外顾客需要付出昂贵的交易成本,包括搜寻成本、信息成本、决策成本、违约成本等。老顾客对已达成交易的评价积累,如好评率等,会明显降低新顾客的交易成本,新顾客对跨境电商信用的初始判断在很大程度上受此影响。
一般而言,企业的守信行为会促进交易的达成。反过来,交易规模大代表用户认可度或忠诚度高,说明企业具有良好的信用。交易规模表现在很多方面,如累积交易额、交易成功率、新顾客增长率、老顾客回头率等。此外,对跨境电商交易活动而言,因双方处于不同国家,纷杂的不确定性因素直接或间接影响交易安全,如信息安全、支付安全等,而用户信息遭到泄露、跨境支付存在安全漏洞等都会引发信用风险。
(三)网络轨迹数据下的指标
目前,社交网络已经成为用户覆盖面最广、传播影响最大、商业价值最高的web3.0业务,是一种能够实现价值均衡分配的互联网方式。社交平台数据多是动态非传统数据,涉及大量传统上无法处理的非结构化、半结构化信息。首先,社交网络往往是顾客表达自我情绪的平台,必然存在对跨境电商的情绪表达,基于大数据手段,对相关文本、图像(包括表情)、音频、视频等进行搜寻和分析,将之放入某种数据分析模型计算用户满意度,所得到的结果将更真实、更有效。其次,社交网络的灵魂是共享,信息传播速度快,甚至是病毒式传播,对跨境电商的正面信息分享实际上是顾客无意识进行的营销推广活动。因此,可将顾客主动分享作为信用评价的指标之一,正面分享越具有广度和深度,表示企业信用越高,具体指标包括转发频率、分享链接数目、建立专题群组等。其三,有学者从企业家信用与企业信用相互关系角度论证了企业家信用对企业组织整体信用的决定性作用,[8]因此应将跨境电商管理者的个人信用纳入指标体系,并运用大数据挖掘管理人员关系数据和行为数据,以此客观呈现个人信用状况。阿里巴巴旗下的芝麻信用管理有限公司推出的芝麻信用,就是运用大数据及云计算技术挖掘用户身份特质、行为偏好、人脉关系、信用历史、履约能力等信息以对个人进行征信的。其四,公众号影响力也是判断跨境电商信用的一个指标。当前,在社交平台上建立企业公众号成为营销的新常态,公众号的影响力体现在两个方面:一是粉丝数目或关注人数多,说明影响面广,其中尤其是境外人员的关注;二是粉丝在线参与度高,说明影响程度深。
综合以上分析,基于大数据构建跨境电商信用评价指标体系,如图1、表1所示。
图1 大数据下跨境电商信用评价指标体系框架
表1 大数据下跨境电商信用评价的具体指标
在计算指标权重的方法中,层次分析法(Ana⁃lytic Hierarchy Process,AHP)使用最为广泛,是一种定性与定量相结合的决策分析方法。层次分析法最初于20世纪70年代由美国著名运筹学家萨蒂(SAATY A L)提出,它既是一种分析多目标、多准则复杂大系统的有力工具,也是一个将决策者对复杂系统的决策思维过程模型化、数量化的过程。层次分析法将定性指标与定量指标相结合,综合了德尔菲法的适用性和数理统计方法的科学性,具有思路清晰、方法简单、适用面广、系统性强等特点,[9]其主要步骤包括构建递阶层次结构模型、构造两两比较判断矩阵、一致性检验等。
其实,在大数据背景下,传统的层次分析法并不十分适用,这主要表现为以下两点:一是构建判断矩阵时,传统层次分析法要求专家以一个精确值来比较两个指标之间的重要性,而大数据征信所提取的指标不仅量大,而且复杂,专家很难提供精确的比较值,此时用“大约”“左右”等模糊概念表示更合理、更自然;二是传统层次分析法在构建一致判断矩阵时工作量大,判断矩阵不能通过一致性检验时,需要一次次地进行调整—检验—再调整—再检验,直至满足要求。大数据下的指标无疑将使该检验过程变得更加纷繁复杂、循环往复。因此,传统的层次分析法并不适合用来确定大数据条件下的指标权重,需要在算法上做出改进。模糊层次分 析 法(Fuzzy Analytic Hierarchy Pro⁃cess,FAHP)将模糊数学的概念引入层次分析法,改进了传统层次分析法存在的问题,提高了结果的可靠性。模糊层次分析法主要可分为两种,其中一种基于模糊数,即不要求专家提供判断矩阵中的精确值,而是给出模糊量,可以解决专家思维判断的模糊性问题与客观决策对象的复杂性问题,最常使用的是三角模糊层次分析法;另一种基于模糊一致矩阵,可利用模糊一致矩阵的性质简化一致性检验问题。两种模糊层次分析法对结构层次多、评价因素多的对象系统都很适宜。因此,大数据背景下跨境电商信用评价指标权重的确定应使用模糊层次分析法。表2对传统的层次分析法与基于三角模糊数的层次分析法进行了对比。
构建跨境电商信用评价指标体系并确定各指标权重之后,接下来就要分析应当运用哪种信用评价模型(方法)来进行评价和预测。信用评价模型很多,一些基本的传统评价模型因有悖于大数据的背景及其自身方法的科学局限性,这里不予考虑,只分析几种目前正处在研究前沿位置的模型。这些模型一般都能够与模糊层次分析法结合使用,且满足以下两个条件:
第一,评价模型要与大数据特征相匹配。前面提到,大数据具有4V特征,简单来讲就是大容量、多样性、高速性、价值性。大数据的大容量特征要求评价模型具有良好的可伸缩性,即面对数据拓展能够有效构建模型的能力;大数据的多样性特征表明,其异质性程度高,要求评价模型能够处理多种类型的数据,特别是非结构化数据;大数据的高速性特征要求评价模型计算速度(收敛速度)快,灵活性高;大数据的价值性不仅指其价值高,而且指其价值密度低,即存在大量的噪声数据或有空缺值的数据,这就要求评价模型具有较好的鲁棒性,即在数据不准确、不完整情况下有正确评价和预测的能力。
表2 传统的层次分析法与基于三角模糊数的层次分析法的比较
第二,评价模型要与跨境电商的实际情况相符。跨境电商由于涉及到不同的国家,交易流程多,交易时间长,海外顾客购买心理和行为不确定性高,既增加了与信用有关的数据的容量和异质性,也提高了数据收集的难度,使我们的指标数据具有大容量、含噪音、异质程度高等特点,评价模型只有更好地匹配这些数据特征才能更有效。
目前,信用评价方面比较前沿的方法包括模糊综合评价法、盲数评价法、支持向量机、神经网络等,其中后面两种是机器学习工具。这里结合前面的分析,对上述四种方法进行简单比较,比较结果如表3所示。
结合评价模型需要满足的两个条件以及表3中各模型的特征可知,以上四种模型与所要求的条件都不能实现完全匹配。大数据的复杂性无疑对评价模型提出了非常严苛的要求。比如,神经网络能够较好地处理指标模糊不全的问题,在训练样本足够大时能够达到极高的精度,而大数据恰好能够提供充分的训练样本,然而神经网络学习时间过长,收敛速度较慢,甚至可能达不到学习的目的,而这显然又有悖于大数据的初衷。
幸运的是,学者们针对上述模型的不足之处提出了改进方法,或者通过模型之间的组合运用达到更好的评价效果。优化与组合后的模型将更适用于大数据。比如,支持向量机在处理大规模数据集时往往需要较长的训练时间,针对该问题,张珍珍等[11]提出了基于密度聚类的支持向量机两步分类算法,有效提高了大规模数据下的分类速度。另外,各模型之间相互融合、取长补短是处理大数据的必然趋势,已有研究包括基于神经网络的模糊综合评价、基于三角模糊数的盲数评价等。
在以上四种模型中,最值得关注的是盲数评价法在大数据背景下进行信用评价的应用前景。目前,盲数评价法主要应用于建筑、矿业、电力等行业,其在信用评价领域的应用尚处于探索阶段。由于事实上的信用信息往往并不是单一的,而是具有多种不确定性,如任何有行为因素参与的含状态因素的系统至少含有两种或两种以上的不确定性,[12]而盲数在解决这种问题上的优越性是其他方法无法比拟的。另外,学者们在盲数算法改进方面也取得了不少成果,如为克服盲数运算计算量增加过快的缺点,王磊等[13]提出了先合并相交区间,再合并小可信度区间的降阶方法。
表3 各种信用评价模型的比较
2014年6月14日,我国首部国家级社会信用体系建设专项规划——《社会信用体系建设规划纲要(2014—2020年)》出台,成为我国经济体制改革过程中“从市场体系向信用体系发展”具有里程碑意义的转折点。2015年8月5日,国务院发布《促进大数据发展行动纲要》,标志着大数据发展正式成为国家战略。当前,跨境电商作为一种贸易方式发展迅速,从规模到质量都有了很大幅度的提高,但贸易双方信用的不确定性以及信用评价体系的匮乏加剧了跨境电商的交易风险,并成为影响其快速健康发展的重要因素之一。综观国内外相关文献,将电子商务信用评价模型或信用评价体系构建研究扩展到跨境领域的少之又少。鉴于此,运用与大数据相匹配的指标赋权方法,建立与大数据相匹配的信用评价模型,结合先进的机器学习工具进行训练和预测,最终在互联网界面准确、实时传输评价结果,进而构建出完整、动态的跨境电商信用评价体系,对于改善贸易环境、降低贸易风险、提高贸易效率等具有非常重要的现实意义。信用体系建设意在构建诚信中国,而大数据背景下跨境电商信用评价体系的构建,必将在对我国社会信用体系建设产生正面、积极影响的同时,全面提升我国企业跨境电子商务水平,全面提高我国企业在国际贸易中的地位,为我国经济发展做出更大的贡献。
参考文献:
[1]张周平.信用体系建设刻不容缓[N].国际商报,2014-04-11(A02).
[2]刘新海,丁伟.大数据征信应用与启示——以美国互联网金融公司Zest Finance为例[J].清华金融评论,2014(10):93-98.
[3]孙美丽.美国和欧盟的数据隐私保护策略[J].情报科学,2004(10):1266-1267.
[4]张滨,刘小军,陶章.我国跨境电子商务物流现状及运作模式[J].中国流通经济,2015(1):51-56.
[5]张云起,孙军峰,王毅,等.信联网商务信用体系建设[J].中央财经大学学报,2015(4):90-99.
[6]周子元.信用风险量化研究综述[J].金融教学与研究,2009 (4):35-37.
[7]杨坚争,郑碧霞,杨立钒.基于因子分析的跨境电子商务评价指标体系研究[J].财贸经济,2014(9):94-102.
[8]雷晓敏,宋家顺.衡量企业家信用的财务指标分析[J].中央财经大学学报,2007(11):82-85.
[9]偰娜.我国跨境电子商务贸易平台模式探讨[J].中国流通经济,2015(8):70-74.
[10]刘开第,庞彦军,金斓.浅析模糊AHP中一致性检验的不必要性[J].数学的实践和认识,2015,45(14):285-293.
[11]张珍珍,董才林,陈增照,等.改进的结合密度聚类的SVM快速分类方法[J].计算机工程与应用,2011,47(2):136-138.
[12]刘开第,吴和琴,庞彦军,等.盲数的概念、运算与性质[J].运筹与管理,1998,7(3):14-17.
[13]王磊,张明文,王秋莎.基于盲数理论的输电系统可靠性评估[J].电力科学与工程,2010,26(8):8-13.
责任编辑:陈诗静
中图分类号:F713.36
文献标识码:A
文章编号:1007-8266(2016)06-0058-07
收稿日期:2016-04-30
作者简介:刘章发(1983-),男,山东省莘县人,聊城大学东昌学院教师,河北大学经济学院博士生,主要研究方向为宏观经济理论与政策。
Analysis on the Construction of Cross-border E-commerce Credit Evaluation System under the Background of Big Data
LIU Zhang-fa
(Liaocheng University,LiaoCheng,Shandong252000,China)
Abstract:With the implementation of the Belt and Road Initiative,cross-border e-commerce is rapidly rising in China;and the development of big data has become the national strategy.Credit problem is always the important factor having impact on the rapid and healthy development of China’s cross-border e-commerce;and the application of big data in formulating credit evaluation system is the evitable choice for us to solve this problem.To better improve trade environment,reduce trade risk,increase trade efficiency,improve the level of cross-border e-commerce,and increase the position of Chinese enterprises in international trade,we should formulate the cross-border e-commerce credit evaluation system with the help of big data credit investigation,use fuzzy AHP to assign different weights to different indicators,establish the credit evaluation model which is suitable to big data,combine with the advanced learning tools to realize the accurate and real time transfer of evaluation results,and formulate the comprehensive,ecological,and dynamic credit evaluation system for cross-border e-commerce.
Key words:Big Data;cross-border e-commerce;credit evaluation