花锦彤,孟庆良,徐信辉
(1.江苏科技大学 服务制造模式与信息化研究中心,江苏 镇江 212100;2.江苏科技大学 经济管理学院,江苏 镇江 212100)
众包创新作为一种新型创新模式,是指公司或机构将过去由员工解决的内部创新问题转交给外部网络大众来完成的商业模式[1]。企业通过采用众包创新模式获取和整合外部网络知识,将创意、智慧、技能转化成商业价值和社会价值[2]。InnoCentive众包平台自2001年成立以来,汇聚了来自全世界125个国家近十余万的科研人才,破解了2 000多项技术难题;Dell公司的自建众包社区IdeaStorm,截止目前已有550条想法创意得到实现;猪八戒网(zbj.com)平台注册人数近1 900万,已帮助6 157 952位雇主解决企业相关难题。众包创新突破了传统组织界限,扩展了企业原有的创新模式,越来越多的国内企业建设了自己的众包创新平台,如海尔HOPE、美的美创等,都取得了不错的成绩。但作为一种新型商业模式,其相关研究还处于探索阶段,成果呈碎片化状态、用户持续参与不足[3]、创新质量亟待提升[4]等问题也日益凸显。
众包创新模式具有组织形式松散、参与者自由自愿和信息不对称等典型特征。根据国内用户数较多且活跃度较高的众包平台——猪八戒网的相关数据显示:用户参与众包过程出现诱导发包方好评(36.03%)、方案欺诈(29.96%)、恶意评价(14.61%)等诸多机会主义行为,严重影响最终解决方案质量和平台声誉。为有效降低众包创新风险,需要科学识别用户的机会主义行为并采取针对性的治理策略,保障创新过程在诚信环境下进行,提升众包创新绩效。
针对众包创新中用户的机会主义行为,学者主要从两个维度展开研究。首先,针对机会主义行为的影响因素,LE等提出通过提高预定的黄金标准,可有效规避任务解答方违规、不诚信的问题[5]。KAZAI等指出奖金额度发生变化将会影响用户的欺诈行为[6]。EICKHOFF等在众包平台CrowdFlower开展实证研究,结果表明,需要抽象性思维和较强创新能力解决的任务中,作弊者更少,并且指出仅仅用历史中标率不足以衡量用户的可靠性[7]。其次,在机会主义行为的规避方面,HIRTH提出设置多数人决策及控制组复测相结合的监测制度,可以有效监测接包方的欺诈行为[8]。张志强等通过精进质量评估算法,实施动态质量检测来有效识别创新过程中的欺诈用户,以有效控制任务完成质量[9]。费友丽等通过分析众包创新中任务发布者与解答者产生欺诈行为的原因,提出了完善信用评价制度、健全相关法律体系等应对策略[10]。YE通过总结欺诈型用户的三种威胁模式,提出基于信任向量的威胁防御模型以规避用户的欺诈行为[11]。刘猛运用演化博弈模型,提出增大投机成本的同时提高奖金额度可有效规避机会主义用户[12]。乐承毅运用微分博弈对有无众包平台监管时用户采取的行为策略进行分析,提出设立诚信交易机制、保证金机制可有效应对用户欺诈行为[13]。
上述研究对识别和规制用户的机会主义行为具有重要指导意义。但上述研究多聚焦于机会主义行为的产生原因和影响,较少涉及对机会主义行为的识别问题。此外,众包创新作为一种新型商业模式,创新任务复杂多样,参与大众来源广泛,众包组织信息不对称,因此需要结合这些典型特征深入开展用户机会主义行为识别研究,以完善众包创新相关理论,降低众包创新风险,确保众包平台的良好发展。
在众包创新实践中,用户机会主义行为屡见不鲜,以猪八戒网为例,其诚信交易中心显示2 945名用户受到惩罚。其中,317名用户被清除,324名用户被封号。在众包创新过程中用户主要存在以下几种机会主义行为:
1.方案欺诈
利用企业和用户信息不对称,用户在参与众包创新过程中为实现自身利益最大化而实施欺诈,主要表现为:用户直接抄袭或模仿其他平台类似的解决方案;采用不正当方式窃取其他用户未公开的解决方案;利用任务相似性,提交同一解决方案给多个发包方,以骗取多份奖励。
2.诱导或要挟发包方评价
任务截止时间临近,发包方提出整改意见,用户以虚假态度诱导发包方先对其进行好评,待评价结束后以诸多理由搪塞发包方,延时修改时间或拒绝修改作品。发包方在此过程中不仅蒙受了经济损失,降低了参与热情。同时,该行为对众包平台的声誉也造成恶劣影响。
3.言过其实,诱导选标
用户在任务竞标过程中,针对发包方提出的任务要求,故意扭曲或隐瞒信息迷惑发包方选标,但实则无力完成任务要求,最终导致任务不能按时完成,并造成发包方时间和经济上的损失。
4.恶意评价
用户对其他用户提交的创意或方案进行恶意评价,捏造、散布不实言论,恶意中伤其他接包用户,造成发包方和其他用户产生误解,导致发包方的创新风险和方案评估成本提升,同时也会降低发包方的参与热情,损害众包平台的声誉。
根据上述用户机会主义行为的主要表现,结合众包平台猪八戒网的具体实践,分析总结了四个维度共12项指标来构建众包创新过程中的用户机会主义行为识别指标体系,具体如表1所示。
表1 众包创新过程中的用户机会主义行为识别体系
考虑到构建的识别体系包含多个维度指标,各指标变量之间可能存在一定相关性,且输入层过多易造成神经网络学习效率低、收敛速度慢等问题。因此,采用主成分分析法(Principal Components Analysis, PCA)对指标数据进行处理,降低输入数据维数,同时又保留原数据的大部分信息,进而简化神经网络结构,提高收敛速度。
第二步,确定主成分个数。对标准化处理后的数据进行共线性检验和主成分分析。根据旋转成份矩阵提取主成分,所得主成分特征值大于1,且累计方差贡献率达到85%以上[14],即可涵盖原数据的大部分信息。
第三步,计算主成分得分。根据成分得分系数矩阵得到各个主成分的权重,运用式(3)计算各个主成分的得分,基于此便得到了经主成分分析处理后的输入变量。
式中:Zxi为标准化处理后的指标变量;aij为各主成分中的指标权重;F1,F2,F3,…,Fn分别为第一、二……,第n主成分。
第四步,建立PCA-BP神经网络。BP(Back Propagation)神经网络是一种误差反向传播算法训练的多层前馈网络。根据Kolrnogorov定理,BP神经网络具有优良的多维函数映射能力,一个三层的BP神经网络即可实现对任意非线性函数的逼近[15]。信号的前向传播过程为:
(4)
(5)
式中:xj表示输入层第j个节点的输入,j=1,…,M;wij表示隐含层第i个节点到输出层第j个节点之间的权值;θi表示隐含层第i个节点的阈值;φ表示隐含层的激励函数;wki表示输出层第k个节点到隐含层第i个节点之间的权值,i=1,…,q;ak表示输出层第k个节点的阈值,k=1,…,L;ψ表示输出层的激励函数。信号的反向传播过程为:
(6)
(7)
式中,η为学习速率,Δwij为隐含层权值修正量,Δθi为隐含层阈值修正量。
从简化神经网络结构入手,将主成分分析法与BP神经网络相结合,构建基于PCA-BP神经网络的用户机会主义行为识别模型。首先,利用PCA对输入指标进行降维。其次,计算各指标得分,并按10∶2的比例将样本划分为训练集和测试集,用于BP神经网络的训练和测试。最后,将综合指标的训练集输入BP神经网络进行训练,待训练完毕后,将测试集输入模型中进行测试,以验证模型的识别准确性。
基于2018年6月到2019年8月猪八戒网中“曝光台”模块的相关数据搜集到256个样本数据,其中存在机会主义行为的用户38个,正常用户218个。从用户机会主义行为主要表现来看,用户诱导评价、无能力完成任务、稿件抄袭、不履行约定占主要部分(82.08%)。在256个用户样本数据中取216个为训练集,40个为测试集展开实证研究。
采用Mann-Whitney U检测法对样本数据进行显著性检验,如表2所示。
表2 两独立样本U检验统计量
由表2可知,12个指标变量中除“近三月收入”的渐进显著性检测值为0.62以外,其余指标的渐进显著性检测值均小于或等于0.05,因此去除“近三月收入”这一变量,其余11个变量可构成识别众包创新过程中机会主义用户的指标体系。
共线性检验是为了判断变量之间是否存在很强的相关关系,进而会导致信息出现重叠,如表3所示。
表3 共线性检验
VIF(方差膨胀因子)是检测变量之间是否存在共线性的关键指标,一般认为VIF大于10时,表明模型存在共线性问题。由表3可知,综合评分、完成质量、工作速度、服务态度四个变量的VIF值远大于10,说明构建的基于PCA-BP神经网络的用户机会主义行为识别模型的各指标之间存在着严重的共线性问题。
KMO(Kaiser-Meyer-dkin)统计量是比较变量之间相关性大小的度量指标,KMO统计量取值0~1,经统计分析后发现,构建模型的KMO值为0.812,表明原始变量存在高度的相关性,样本数据适合进行主成分分析。
运用SPSS分析软件进行主成分分析,根据初始特征值及相应的累计方差贡献率提取主成分并计算主成分得分,如表4所示。前4个主成分特征值均大于1且累计方差贡献率达88.970%,因此,提取前4个主成分,就可反映出原数据的大部分信息。
表4 主成分特征、方法百分比以及贡献率 %
如表5所示,在主成分1中,综合评分、完成质量、工作速度、服务态度及好评率的负荷量较大,可反映出用户在完成创新任务过程中所具备的综合工作能力;在主成分2中,纠纷率、受处罚数的负荷量较大,可反映出用户是否如实履行发包方的任务要求,不能履行任务要求的用户具有较高的机会主义倾向;在主成分3中,缴纳保证金、用户等级的负荷量较大,一般来看,等级越高的用户缴纳保证金越多,可反映出用户在众包创新平台等级地位;在主成分4中,近三月退款率与项目完成率负荷量较大,反映出用户是否具有解决创新问题的能力。
表5 旋转成份矩阵
根据式(3)和表6,可以得到主成分得分计算表达式(8)。其中Zxi为标准化的变量。利用式(8)计算得到4个主成分得分,作为BP神经网络的输入变量。
表6 成份得分系数矩阵
(8)
结合前文运算得到的主成分输入变量,确认BP神经网络各层级节点数,依据数据特性确定传递函数和训练函数,进而构建BP神经网络模型。
1.各层网络节点数的选取
2.传递函数与训练函数的确定
由于本文输出结果是在(0,1)之间,logsig传递函数为S型对数函数,此函数特点可将最终输出数据映射到区间(0,1)上,因此设定输出层的传递函数为logsig函数;此外,采用traingdx训练函数作为神经网络的训练函数,该函数是带动量的梯度下降自适应学习率反向传播算法,可通过调整局部的权值和阈值达到训练效果。
将原始指标变量提炼成4个综合性指标作为BP神经网络的输入,将256个样本数据按照大约10∶2的比例分为训练集和测试集。其中,训练集有216个样本数据,包括188个正常用户和28个机会主义行为用户;测试集有40个样本数据,包括30个正常用户和10个机会主义行为用户。
将训练集代入BP神经网络进行训练,设定网络最大训练步数为5 000步,最小误差值为0.01,利用traingdx训练函数不断调整局部的权值和阈值,直到训练结果达到最小误差值时训练结束。如图2所示,BP神经网络模型在第2 712步时达到设定的误差最小值。
图2 训练误差曲线
将40个测试数据输入已训练好的模型进行测试,测试结果越趋近于1,表明用户的机会主义倾向越高,界定为机会主义行为用户;结果越趋近于0,表明用户的机会主义倾向越低,界定为正常用户。结合logsig函数可将输出数据映射到区间(0,1)上,对最终的测试结果与期望值进行比较可以验证模型的识别准确性。将原始BP神经网络的识别结果与基于PCA-BP神经网络的识别结果进行对比,如表7所示。
表7 BP神经网络模型和PCA-BP神经网络模型检测结果
由表7可知,利用PCA-BP神经网络模型进行测试,识别正确37个,错误3个,识别准确率为92.5%;传统BP神经网络识别正确33个,错误7个,识别准确率为82.5%。可见,PCA-BP神经网络的识别精度高于原始BP神经网络。
众包创新作为一种新型商业模式,具有组织形式松散、参与用户自由自愿、创新目的性强和信息不对称等特征。因此,在众包创新过程中易发生机会主义行为。因此,科学识别用户的机会主义行为并采取针对性策略,对保证众包创新模式的持续、健康发展具有重要意义。根据上述理论分析与实证研究结果,提出从以下三个方面规避用户机会主义行为的策略:
第一,设置用户机会主义行为识别机制。目前,众包平台一般使用后验法来识别众包创新过程中的用户机会主义行为,即对方案完成质量进行评估或对被举报的用户进行鉴定等。此方法效率较低,待行为发生后才采取应对措施,导致任务时间延长使发包方蒙受经济损失。因此,应设置科学合理的识别机制,将事后控制转化成过程识别。众包平台可利用能够及时获取用户信息的优势,建立用户数据库;通过不断洞悉识别指标的状态变化,并根据PCA-BP神经网络模型对数据进行动态评估,对机会主义倾向较高的用户进行动态预警;同时,不断加强风险监控,对发生过机会主义行为的用户进行重点防范。
第二,完善用户机会主义行为惩罚机制。众包平台一般是根据发包方发起争议维权或其他用户的举报,经过核实后对相应用户进行惩罚,惩罚方式多为扣减诚信度得分或给予差评,但力度尚轻,不足以起到警示作用。因此,应采取累积惩罚制,规定时间节点,首次受处罚用户扣减一定诚信得分,如用户在时间节点内再次受罚,则会成倍扣减诚信得分,并受到降级处理;引入第三方争议处理机制,给发包方及平台造成损失的用户,按事件严重性暂扣或扣减其缴纳的保证金。通过加大惩罚,提高违规成本来防范机会主义行为。
第三,营造诚信的众包创新平台环境。平台从多层面、多维度设置科学的信誉机制和诚信保障机制。该机制应当不仅包括人际信任、组织信任,还需要考虑团队信任,尤其对于需要很多用户协作完成的创新任务来说,不仅仅是简单二元关系下的信任,还需要考虑发包方、众包平台、参与用户以及用户之间的多元信任关系。在具体操作中,可在发包方宣传动员和品牌拓展阶段构建参与用户的初始信任,通过设计有效的多方互动策略构建过程信任机制,最大程度提升众包创新绩效以增强用户的持续信任度。