□ 王和勇,卢淑霞
(华南理工大学 经济与贸易学院,广东 广州 510006)
由于跨境电商平台的迅猛发展以及政府对跨境电商的宣传与重视,许多制造业企业除了使用线下宣传、代理商介绍等营销方式外,还利用第三方B2B跨境平台进行跨境交易。利用第三方B2B跨境平台使得制造业企业与国外交易商直接连接和双向互动,大幅减少交易和协作成本,提高了交易的效率。与此同时,由于跨境交易的交易双方在语言、文化以及交易方式存在较大的差异,加之跨境交易中存在信息不对称,使得在进行初次跨境交易中无法对双方的信用做出准确的判断,形成较大的交易障碍。同时,制造业企业在交易过程中存在交易金额与规模较大、资金回转周期长的特点,使得制造业企业一旦发生问题,其损失较为严重甚至导致企业因此而倒闭。针对制造业企业进行跨境交易的现状以及困境,通过对企业建立信用评估,从多方面去展示企业的信用情况,对于利用第三方B2B跨境平台的制造业企业进行信用评估具有重要意义。
信用评估体系的建立包括评估指标以及评估模型的选择,因此,本文将从评估指标和评估模型两方面对相关文献进行整理与分析。
冷沙沙等[1](2010)等将企业注册信息、企业证书荣誉、运输情况、支付情况、历史交易情况纳入指标体系当中,通过实证研究发现支付情况以及产品的权重最高,而企业注册信息,历史交易情况影响较小。沈琳等[2](2010)、赵冬梅等[3](2015)在构建指标体系时考虑了财务指标,并且细分为盈利、偿债、资产营运、成长这四个方面。刘晋飞[4](2018)在构建制造业跨境电商企业竞争力的指标体系时考虑了通关支付能力这一指标,得出通关支付指标在评估企业竞争力里中排名第五。刘章发[5](2016)将财务情况、产品纳入指标体系当中。黄兴等[6](2016)构建信用评估时考虑了企业素质、历史交易情况、服务情况这三个一级指标,二级指标则选择了成立时间、员工人数、货品满意评分、到货速度评分、产品数量这几个指标。王小会[7](2017)在分析中小企业信用评价时考虑了财务指标,企业未来发展潜力这两个一级指标,其中,他将财务指标划分为盈利、偿债、资产营运、成长这四个方面的指标,企业未来发展潜力则由研发人员比重这一指标所体现。荣飞琼等[8](2018)的信用评估体系包含了产品质量这一指标。王珊珊[9](2018)则从产品、服务情况两个方面去构建信用评估体系。整理结果如表1所示:
表1 指标对应提及的文献
国内学者在模型的选择上主要是层次分析法和因子分析法,或者是在这两种模型的基础上进行改进的模型如拉开档次法,或者是与其他模型结合来使用的模型,如层次分析法和灰色关联相结合、因子分析法与聚类分析相结合。而近两年才逐渐有学者使用机器学习的模型进行研究,如BP神经网络和XGBoost模型。
冷沙沙等(2010)、刘章发(2016)在进行信用评估时使用了层次分析法作为评估模型。刘晋飞(2018)、王小会(2017)黄兴等选择的模型为因子分析法。沈琳等(2010)改变了传统的AHP指标权重的确定方法,采用拉开档次法来确定定量指标权重。黄兴等(2016)利用AHP和灰色关联相结合的方法,对利用电商平台进行交易的传统企业继续信用评估。赵冬梅等(2015)使用因子分析与聚类分析相结合的模型对评估体系进行验证。荣飞琼等(2018)使用BP神经网络作为评估模型,其预测结果和真实评估结果的吻合率达到了90%。王珊珊等(2018)使用XGBoost模型,其评估的准确率达到80%。
由于层次分析法评价方法较为主观,定量数据较少,定性成分多,不易令人信服;而因子分析法则是将原始变量浓缩为几个因子变量,无法对线性不相关的变量进行重要程度的排序,从而找出最要主要的影响因素;BP神经网络其拟合效果较好但是解读性较低。基于上述分析,本文使用的是决策树这一机器学习的模型,减少了主观判断,更聚焦于数据本身,同时解读性强,学习速度快。
本文选取的第三方跨境B2B平台是阿里巴巴国际站,研究对象选取了家具、衣服、运动这三个大类中的制造业企业。本次实验一共选取了597个样本。其中,家具行业为197个(33%),衣服行业为177个(30%),运动行业为223个(37%)。
本文从第三方数据以及第三方B2B跨境平台数据两方面建立信用评估体系。其中,第三方数据包括企业注册信息、企业素质、财务情况、企业证书荣誉、企业未来发展潜力这五个一级指标。而第三方B2B跨境平台数据下则包括运输情况、支付情况、服务情况以及历史交易情况及产品这五个一级指标。如下表2所示:
表2 利用第三方B2B跨境平台的制造业企业信用评估体系
2.2.1 企业注册信息及企业素质
①公司成立年限:企业经政府工商部门的批准颁发营业资格证的时间;
②生产设备和设施:企业用于生产商品的生产设备和设施;
③生产能力:反映在一段时间内企业的生产可能性;
④员工总数:企业所有员工的数量;
⑤生产线数量:生产线是用于生产特定种类的产品所需要的机器、人员的一个组合的数量;
⑥厂房面积:用于生产或为生产配套的各种房屋的面积;
⑦贸易部门人数:专门负责对外贸易的部门的人数。
2.2.2 财务情况
①年平均交易额:指自开业以来,每年的营业额之和除以年数的数值,衡量一个企业从开业到现今的平均交易水平;
②年度总收入:指最近一年整年的收入总和;
③年产值:一年所有产品的总值。
2.2.3 企业证书荣誉
①证书总数:指的是从过去到现在所拥有的证书、产品资格证、商标与专利的总和;
②已验证证书总数:指的是官方认证的证书、产品资格证、商标与专利的总和;
③会员年数:指的是企业加入平台的会员的年数。
2.2.4 企业未来发展潜力
研发人员数:是指企业内工作职责为不断研发新产品与维护旧产品的人员。
2.2.5 运输情况
①按时装运评分:指的是所有已购买该店铺产品的卖家对按时转运评价的平均值;
②接受的交货条件:交货条件是进行国际贸易时,用来表明进出口商品的价格构成、买卖双方各自应负担的责任、承担的费用和风险及货物所有权转移的术语;
③平均提前期:指从开始订单到完成订单的平均花费时间。
2.2.6 支付情况
①接受的付款货币:指在付款时能使用的付款货币种类;
②接受的付款方式:指在付款时能使用的付款方式。
2.2.7 服务情况
①报价次数(过去30天):指的是当前时间点过去30天内店家向卖家报价协商交易的次数;
②回复率(过去30天):指的是过去30天内店铺回复买家问题占买家所有问题的比例;
③平均响应时间(7天):指的是在过去一个星期内,所有买家提出问题到店铺回答问题的平均时间;
④供应商服务评分:指的是所有买家在购买产品后对供应商服务进行评分的平均值;
⑤总得分:指的是所有买家对供应商服务、按时转运、商品质量打分的一个平均值,从总体衡量了用户对店铺的一个整体态度。
2.2.8 历史交易情况
①交易数:指的是过去一年内所有的交易数;
②总评论数:指的是从开业到现今统计时间内的所有评论数。
2.2.9 产品
①主要产品种类数:指的是用户在该店铺主要购买的产品种类;
②所有产品种类数:指的是阿里巴巴国际站上显示的,店铺上架的所有产品的种类数;
③产品质量打分:指的是所有买家在购买产品后对产品质量进行评分的平均值。
决策树具有结果解释性强、学习速度快等特点,比较常用的决策树算法有ID3、C4.5、CHAID和SLIQ算法。而算法的选择与因变量与自变量的数据类型有关,根据本文的数据特点,本文的决策树算法选择了CHAID。
CHAID决策树的运行机制主要包括解释变量划分的临界点的寻找以及确定哪个解释变量作为分裂节点两部分,具体如图1所示。其具体步骤为:
临床有研究显示:糖尿病患者自身抗感染能力以及机体组织愈合能力较差,极易发生骨折以及骨质疏松,骨科糖尿病患者一般以手术治疗为主,术后并发症发生率极高,切口极易出现感染、不愈合等情况,一定程度上延长了患者住院时间,增加了住院费用,加重了患者以及家属的心理负担和经济压力,由此可知围术期的护理质量对于患者切口愈合、机体恢复极为重要[4-5]。临床常规护理过于单一、固定,具有机械性、被动行特点,缺乏主动性,护理期间患者会感受到厌烦或者不适,稍有不慎,极易引发护患纠纷,护理效果一般,具有一定的局限性。
①若解释变量X只有一类,则其调整为1;
②若解释变量X有两类,则使用Bonferroni方法计算合并好的分类的调整值;
③若解释变量X的分类超过两类则需要根据不同类型的目标变量Y选择不同的检验方法,找出每个解释变量X关于目标变量Y的分布差异最小的两个类别,即值最大的两个类别;
若目标变量Y为连续变量,则选择F检验;若目标变量Y为定类变量,则使用卡方检验或似然估计统计量:若目标变量Y为定序或离散变量就使用似然估计统计量。其中,F检验的公式为(1)(2):
(1)
(2)
卡方检验χ2公式为(3),似然估计量L2公式为(4)。
(3)
(4)
⑤使用Bonferroni方法计算合并好的分类的调整P值;
⑥选择具有最小调整P值的解释变量;
⑦如果该调整值≤(用户设定的显著水平),则使用该解释变量分裂节点。否则,不分裂并且考虑作为叶子节点;
⑧继续决策树的生长直到遇到停止规则。
图1 CHAID决策树运行机制图
本文以阿里巴巴国际站中597个制造业企业作为样本,提出了有关第三方B2B跨境平台的制造业企业信用评估体系,分别将公司成立年限、生产设备和设施、生产能力、员工总数、生产线数量、厂房面积、贸易部门人数、年平均交易额、年度总收入、年产值、已验证证书总数、证书总数、会员年数、研发人员数、按时装运评分、接受的交货条件、平均提前期、接受的付款货币、接受的付款方式、报价次数(过去30天)、回复率(过去30天)、平均响应时间(7天)、供应商服务评分、总得分、交易数、总评论数、主要产品种类数、所有产品种类数、产品质量评分这29个输入指标纳入评估体系中,在构建评估体系时本着全面性的原则尽可能多的纳入更多的指标,并使用决策树进行重要因素的筛选。
样本原始数据如表3所示,由于输入指标数据类型既有分类数据又有连续性数据,而输出数据是共有十个分类的分类数据。
因此,根据数据的特征,本文选择的决策树算法是CHAID算法,使用的软件为Modeler中的CHAID决策树模型。
表3 原始数据
图2 CHAID决策树预测变量重要性图
由图2所示,CHAID决策树模型所预测前10个最重要的变量按重要性从大到小为年平均交易额、总评论数、接受的交货条件、接受的付款货币数、生产线数量、所有产品种类数、供应商服务评分、会员年数、接受的付款方式、贸易部门人数。
基于以上研究结果,针对利用第三方B2B跨境平台的制造业企业在进行跨境交易中遇到的障碍,本文将对企业、平台以及监管部门提出不同的建议。
对于在第三方B2B跨境平台进行交易的制造业企业来说,可通过增加年平均交易额,鼓励买家发表评论、增加可接受的交货条件与付款货币数这几种方式来提升企业的信用评估级别。根据决策树的模型结果发现年平均交易额、总评论数、接受的交货条件、接受的付款货币数这几个属性对信用评估具有显著的影响,企业可针对每一个属性来对采取相应的措施从而增加企业的信用评估级别,从而增大店铺的曝光率从而提高其信用等级。值得注意的是,企业需要通过正规的途径来提高信用等级,而不是通过虚假与恶劣行为来增加企业信用评估级别。
对于第三方B2B跨境平台来说,要规避企业为提高信用评估等级进行恶意刷好评、提供虚假信息等恶意扰乱市场的行为。要确保信用评估体系的可使用性,第一步是确保数据的真实性,虚假的数据就会产生虚假的结果,这样不仅影响进行跨境交易的主体的利益,也不利于第三方B2B跨境平台的健康发展。
针对企业提供的第三方数据,平台可要求企业提供相关部门的证明或者凭证来确保信息的准确性。而对于第三方B2B跨境平台数据,因为这些数据是在交易过程中产生的,而交易双方的数据都在在平台上,平台不仅可以通过企业本身来判断信息的准确性,也可以结合交易方的信息来判断交易的合理性。通过加大平台对失信企业的惩罚力度或者设置警报阈值发现异常交易行为都可以在一定程度上确保信息的准确性。
对于监管部门来说,通过平台提供或者自身建立的信用档案,可对整个行业的信用情况有一个较为清晰的了解与认识。对监管部门出台相应的政策进行宏观调控具有指导性作用,通过信用评估来对企业进行划分,找出行业中的优质企业以及失信企业。一方面可针对优质企业提供便利化措施,例如,针对这类企业开通绿色通道,享受通关便利等;另一方面,监管部门应针对失信企业进行监管,防止出现劣币驱逐良币的现象,使行业更加健康的发展。