众筹项目筹资绩效的信息影响机制研究：基于Indiegogo 平台证据

2023-11-16 08:52赵洪科周启璇尹德虎任丽雪刘春丽

管理工程学报 2023年6期

赵洪科, 周启璇, 尹德虎, 张兮*, 任丽雪, 刘春丽

(1.天津大学管理与经济学部, 天津 300072： 2.合肥工业大学管理学院, 安徽合肥 230009)

0 引言

众筹打破了传统融资方式偏好资本雄厚或信用良好的企业的局限[1],为中小微企业的自由、灵活融资提供了便利[2]。众筹的本质是借助网络吸引众多小额投资,以获得项目所需资金[3]。与传统融资中投资者可通过网络、约谈等方式获得项目信息不同,众筹项目投资者仅能通过筹资者披露的有限信息了解项目。众筹项目披露的信息是参与方之间交流沟通最主要最直观的渠道,已有相关研究[4]表明,项目及项目发起人披露信息能增加投资者数量和融资成功几率。

针对众筹项目披露信息对筹资绩效的影响,现有研究主要集中于两个方面的信息,一是项目本身信息,二是发起者社交特征。 Mollick[5]对众筹的研究发现相较于公益类众筹项目,投资者更偏向于科技类项目,同时项目信息中披露的个人网络和潜在质量信息对项目筹资结果发挥着重要作用。Evers 等[6]通过实验表明项目披露的筹资者团队规模对筹资绩效具有显著影响。 Lin 等[7]也认为项目披露的筹资者社交网络规模、筹资者地理位置及其他投资人的决策都将有助于众筹项目的成功。目前,关于众筹项目信息的研究大多集中于披露信息传达出的项目属性,而忽略了披露信息本身的质量对筹资绩效影响。关于创始人社交特征信息的研究主要集中于第三方社交平台,有关众筹平台本身社交关系的研究较少,而Fisk 等[3]研究表明,众筹平台的亲社会特征显著,互助精神则是亲社会特征的重要表现,平台本身的社交关系也是影响众筹绩效的关键。此外,总体来看,已有研究多关注在不同行业下[8],某一个或者某几个因素对不同类别项目筹资绩效的影响作用,缺少对项目的营利属性与相关因素间的内部作用关系系统的考虑,而项目营利属性与投资者动机直接相关,影响了投资者对项目整体的期望回报[5],具有较大的调节作用。据此,本文弥补现有研究的不足,基于投资动机的划分,综合考虑了项目披露信息和创始人社交特征对众筹项目筹资绩效的影响,并引入项目营利属性作为调节变量,对筹资项目绩效影响因素进行了全面探究。

根据上述问题,本研究将借助详尽可能性模型(elaboration likelihood model, ELM)[9]进行全面地实证分析研究,考虑用户对待不同类型项目信息的关注重点不同,根据信息是否直接与项目有关将众筹项目披露信息分为中心路径信息与边缘路径信息。本文实证研究结果发现项目中心路径和边缘路径信息都对筹资绩效有显著影响,且营利类项目绩效更易受中心路径信息影响,而非营利项目受边缘路径信息影响更大。进一步,本文对项目筹资绩效进行了预测。不同于一般直接基于整体进行预测,本文基于实证研究,探讨项目披露信息对营利属性不同项目的影响机制,设计多任务学习模型预测众筹项目融资绩效。结果表明本文所设计的多任务学习预测效果优于单任务模型和随机数据模型,并验证不同项目类型信息能指导和优化多任务学习模型的预测效果。

本研究探究了在筹资项目营利属性的调节作用下,不同因素对项目筹资绩效的影响机制,并用实证分析结果为选择机器学习方法进行绩效预测提供指导。本研究具有以下几点贡献：首先,本文基于投资的不同动机,利用详尽可能性模型系统考虑了不同营利属性下项目筹资绩效的敏感因素,使研究结果更精确,更具有针对性,完善并细化了相关理论基础,并提供了实证依据;此外,本文以实证分析结果为思路设计多任务学习模型,对筹资项目结果进行预测,提高预测结果的准确性,以便项目发起人根据预测及时进行披露信息的调整;最后,研究结论可以帮助理解项目信息对不同众筹项目融资的影响机制,改善创始人对项目信息的管理,提高项目的筹资效率。

1 文献综述

本节将从众筹投资动机以及筹资绩效的影响因素两方面进行文献回顾。

1.1 众筹营利属性与投资动机

Mollick[5]将众筹定义为在传统金融中介之外,企业家个人和组织利用文化、社交和回报吸引网络上较多的小型网络用户为项目筹资的方式。而Van[10]从用户的视角定义众筹为“消费者-投资者”的“群众”捐赠、投资或承诺。 Valenzuela[11]还指出众筹企业家善于创新地寻找可替代、定制的融资方法。因此众筹还可以为初创公司或商业想法定制筹资方案,为新产品提供推广平台。

众筹的传统投资动机研究基于自我决定理论,该理论将动机概念化为利己和利他。利他主义的众筹受风险投资价值观和方法的影响,逐渐演变为互惠捐赠行为。在现实场景中,互惠捐赠以非营利性项目形式广泛存在于奖励类众筹平台中。利己主义者则会着重关注自我利益,为综合、深层次地考虑项目信息花费较多精力[12]。部分投资者出于社会责任感及同理心更关注非营利性项目,所要求的财务回报率也相应降低[5]。已有相关研究表明非营利性比营利性项目更容易获得资金,也拥有更高的筹资成功率[13]。因此,项目营利属性能够影响不同动机的投资者选择,对项目投资绩效有重要影响。

1.2 众筹项目筹资绩效的影响因素

众筹项目的主要目标是筹得所需资金,关注的重点是项目筹资绩效[14]。现有研究发现,项目的信息披露管理对于项目是否取得成功起着至关重要的影响。

已有相关研究结论表明,项目的质量信息和社交关系信息能够对筹资绩效产生重要的影响。 Mollick[5]认为个人网络和潜在项目质量信息对众筹的筹资绩效有重要作用,企业家要积极在虚拟环境向用户传递利好信息。进一步,Bi 等人[2]用项目提供的文字和视频数量作为衡量项目质量的指标,对项目详尽的描述和制作精良的动态资料都有助于提高项目成功的可能性。同时,Zheng 等[15]搜集了中美两国的数据,发现企业家的社交网络联系、资助其他企业家的行为以及与投资者的互动都会影响项目的筹资;同时,李清香等[16]也通过实证表明发起者回复评论的长度对筹资起到积极作用。 Clauss[17]也关注于项目的社交网络信息,认为项目的社交媒体账户数量、发起人的社交媒体账户数量、分享内容数量都能够增加投资者数量和融资百分比。

除了项目质量和社交网络静态信息,项目筹资绩效影响因素还包括项目客观信息和筹资动态过程信息。 Agrawal[18]认为互联网消除了地理距离带来的经济摩擦和部分成本,降低了项目地理位置的影响。关于筹资动态变化过程影响筹资绩效的机制,Li 等[19]关注时间和项目累计资金对投资者决策的影响,发现投资者更愿意支持筹资完成度较高的项目,但是支持倾向会随着时间的推移而下降,表明了前期资金筹集情况与时间对项目成功的影响。与此同时,Wu 等人[20]也关注到项目早期筹资绩效的特殊性,并利用通用模型环境(generic modeling environment, GME)对筹资效果进行有效的预测。更有研究借助用户行为数据,设计动静态协同预测模型,对投融资方之间的交互行为进行深度挖掘分析[21]。

2 研究模型以及假设

众筹项目的进行离不开平台、发起者和潜在投资者三方的参与[22]。根据前文所述,自我决定理论将投资者动机分为利己和利他,其对各驱动因素的敏感程度不同,前者更偏向于为评估项目综合能力花费更多精力,而后者则更多考虑社会责任与同理情感。据此,平台提供的信息可以改变潜在投资者对项目的态度和决策行为,因此,对信息进行梳理分类,促使其在三者之间形成良性循环,才能促使项目获得更好的筹资。

ELM 是为了能够帮助理解说服性沟通的有效性提出的社会心理学框架[23],它通过模拟消费者接触产品相关信息,探究消息特征如何影响其态度形成及决策行为[24]。该理论将信息分为中心路径和边缘路径,中心路径信息与项目直接相关,需要接收者对其进行批判性地思考分析、考虑相对优势,并基于此思考对目标进行理智判断。边缘路径信息则更多依赖于关于目标行为的线索[12],与项目间接相关,例如用户社交好友量、信息来源可靠性等[25]。 ELM 模型运用广泛,例如探究外部影响过程如何影响潜在用户对信息技术的接受程度,以及该过程在不同群体和时间中的变化[26]。具体来说,Luo 等[27]搭建ELM 框架,对个人-集体主义倾向调节读者对信息信任程度的改变进行预测。因此,ELM 理论的信息分类路径与不同动机下投资者敏感因素分类相符。

综上,将众筹项目信息根据ELM 理论进行分类有助于对项目绩效的改善提供新思路,故本文借助ELM 理论对影响众筹绩效相关因素进行归类,梳理项目质量信息和社交网络信息,探究其影响众筹项目筹资绩效的影响机制。

2.1 中心路径信息-项目质量信息

中心路径信息直接传递项目信息,如提供产品参数、描述产品质量等。近年来,ELM 理论被很多学者应用于消费者领域,研究消费者购买决策行为中的影响因素[22],而在消费领域的研究中,通常把产品质量视为中心路径信息[28-31],众筹领域与消费领域的相似处在于,非专业化参与者以对项目或产品的描述为标尺,对供给方的产品或服务做出判断。此外,Allison 等人[32]指出,在运用ELM 理论研究影响创业因素时,创业者或产品质量也往往被用作中心路径信息,而众筹中创始人发布新产品或新项目,与创业者创业的过程相似。此外,Liang 等[33]也直接将项目信息质量作为中心路径信息进行研究。综上,本文选择项目质量信息作为中心路径信息。 Forman 等人[34]集中探究网络评价对消费者决策的作用,认为项目信息质量直接影响在线产品销量,有助于信息在投融资者之间良好的循环交流。据此,提出研究假设如下：

图1 实证研究模型Figure 1 The model of empirical study

H1众筹项目的正向质量信息对筹资绩效有积极影响。

Mollick[5]指出项目信息能反映创始人的态度以及准备是否充分,是项目质量评价的一个重要方面。 Bi 等[2]的研究利用项目描述字数统计性指标和发布的动态视频数量作为项目质量的衡量变量。研究证实信息管理者可以通过调整项目相关信息的数量和长度、管理互动过程频率向潜在投资者传递项目利好信息,能够吸引投资者参与项目[35]。据此,选择项目信息质量作为项目质量的衡量,并提出研究假设如下：

H1a众筹项目信息质量高对筹资绩效有积极影响。

此外,在众筹市场中,几乎任何个人或组织都能在通过平台筛选后发起项目,低准入门槛加大了投资者辨别项目质量的难度,导致严重的信息不对称,而创始人与投资者之间的互动评论能反映发起者的信息共享意愿,通过互动能够有效减少这种不对称,继而提高信息的质量及传递效率,表现出较高的项目质量。 Xiao 等人[28]则从信号理论和选择载荷理论出发,实证证明了较高的信息共享是显著的项目质量信号。 Wang 等人[36]也通过研究证实了创始人与投资者之间信息共享程度与融资绩效正相关。据此,选择作众筹创始人为项目质量的衡量,并提出研究假设如下：

H1b众筹创始人积极的信息共享意愿对筹资绩效有积极影响。

2.2 边缘路径信息-社交网络信息

边缘路径信息通过简单的认知、情感或行为决策标准和线索发挥作用[37],此类信息与传达者想表达的立场有关,使接收者能够做出相对简单的推断,具体表现为名人效应、社交影响力和信息来源等[38]。众筹项目的社交信息主要有两个来源,一是平台形成的社交信息,另一种则是除平台外的第三方社交媒体。 Bodily 等人[39]指出,社会关系网络可以降低借款违约率,因为社交媒体能借助名人效益,在一定程度上反映出创始人的社交影响力和信誉质量。 Zhang 等[40]的研究也表明了社会资本对众筹项目绩效具有重要影响。此外,研究也表明,社交媒体信息对拥有商业计划并需要财务支持的企业家是非常重要的[15]。因此,本文选择社交网络信息作为边缘路径信息,并提出以下假设：

H2众筹社交网络信息对项目筹资绩效有着积极的影响。

众筹的社交网络包括平台社交和第三方社交两个方面。针对众筹平台的社交信息,Buf 等[41]指出对于亲社会投资者而言,创始人对其他项目的支持等内在因素对筹资绩效具有较大影响;王念新等[42]也指出了发起人经验对项目筹资绩效的重要作用。此外,Huntley[43]研究发现,项目评论包括情感层面和社交层面的互动,这会对潜在投资者产生人际关系影响,进而影响投资者的出资决策或出资意愿。 Kraus[44]研究也表明,在不考虑其他因素时,项目评论数正向影响项目筹资额。据此,本文提出以下假设：

H2a众筹平台社交网络信息对项目筹资绩效有着积极的影响。

针对第三方社交平台,Lehner[45]证实企业家个人网络信息有助于众筹的筹资效果预测。 Vismara 等人[46]根据数据挖掘和网络分析理论指出,节点的影响力与该节点的链接数量成正比,众筹项目的影响力与其链接的平台数量成正比;近年来,企业家广泛借助互联网进行内容发布、交互式沟通(博客、Facebook 等)的趋势也日益明显。故有理由相信社交网络平台的宣传以及好友数量与项目筹资能力之间有着紧密关系。据此,提出如下的假设：

H2b第三方社交平台网络信息对项目筹资绩效有积极的影响。

2.3 调节变量-项目类型

潜在投资者面对营利性项目时,往往会根据相关信息进行理智和客观的分析评价,进而评估投资所能带来的财务回报。而用户投资非营利性项目时,出自互惠奉献精神,更多关注于项目的动机、项目推广程度等线索。由此不难看出,投资者面对不同类型项目时,在项目动机方面存在较大差异,故筹资绩效受到相关因素影响程度不同。因此,本文将项目的营利性动机作为调节变量[35],提出了如下假设：

H3相对于非营利性项目,营利性项目的筹资绩效更容易受到项目质量信息的影响。

H4相对于营利性项目,非营利性项目的筹资绩效更容易受到社交网络信息的影响。

3 研究设计

3.1 样本说明

2008 年成立的美国众筹平台(Indiegogo)发展迅速,已吸引近千万用户,累计帮助完成融资项目80 余万个,成为全世界范围内最受欢迎的奖励型众筹平台之一。在Indiegogo 众筹平台上,融资项目根据其所属行业进行分类,创始人通过平台发布与其项目有关的详细信息,包括文字、图片或视频等对融资对象进行细节展示,包括项目创新点与未来规划、创始人团队基本信息与愿望、融资目标、支持方式等,创始人也可以通过对项目进行评论的方式追加项目的补充信息。平台其他用户即为潜在投资者,他们通过浏览项目信息决定是否进行投资以及投资数额。此外,用户可通过对项目留言发表其看法,或是询问创始人项目相关疑问,帮助其进行决策。

本研究利用Indiegogo 平台自2011 年7 月至2016 年5 月共14137 个项目的相关信息,其中非营利性项目数量为1887。整个项目数据集的成功率约39.15%,其中非营利性项目的成功率为42.13%。

3.2 变量测量

3.2.1 自变量

Bi 等[2]的研究利用项目描述字数统计性指标和发布的动态视频数量作为项目质量的衡量变量。研究证实信息管理者可以通过调整项目相关信息的数量和长度、管理互动过程频率向潜在投资者传递项目利好信息,项目详细介绍信息是与潜在投资者交流的重要方式,能够吸引投资者参与项目[45]。同时,投资者可以通过分析创始人发布的信息和互动反馈进行分析和抉择。 Xiao 等人[28]的研究也表明,是否有视频、文本长度、动态更新次数是显著的质量信号。

据此,本文用项目介绍文本长度、有无视频介绍衡量项目信息披露程度,文本长度为项目基本情况介绍部分的文字长度,有无视频介绍反应是否有视频对项目的基本产品、服务进行介绍,为虚拟变量,有视频值为1,反之为0。信息共享意愿的量化则参照Wang 等[36]的做法,项目更新次数指项目创始人在平台上更新项目信息的次数,创始人回复评论比例指项目创始人发起的所有项目中,得到该发起者回复的评论占所有评论比例,创始人回复评论的平均长度则是指创始人所发起的所有项目中,项目创始人回复的平均长度。具体指标信息如表1 所示。

表1 变量名称、介绍及收敛效度检验Table 1 The names, introductions and convergent validity test of variables

社交网络信息尤其对新项目融资效果产生积极的影响作用。其中网络平台内的互动信息是企业联系客户、维系客户的一个重要途径[47]。此外,Zheng 等[15]的研究中表明,创始人为其他项目提供资金帮助的义务也被认为是其项目筹资成功的重要预测因素。本文涉及的社交网络信息归纳在表1。创始人支持数量用项目创始人在平台上赞助其他项目的数量表示,创始人发起数量则是指创始人在平台发起的项目数量总和,评论项目数量指该项目获得的所有用户评论数量,Facebook 好友数指创始人Facebook 平台的好友数量,社交网络推广量则是指项目在社交平台Facebook、Twitter、Youtube、Imbd、Website 上推广次数。

3.2.2 调节变量

营利属性不同的项目,在筹资绩效方面有着不同的表现。 Indiegogo 平台中科技创新和创意艺术都以财务和回报为目的的营利性项目,变量用0 表示;而平台社区项目纳为非营利性项目,变量用1 表示。

3.2.3 控制变量

为保证实验结果的稳定可靠,本文设置了六个控制变量,分别为项目目标金额、项目存续时间、发起地、货币、项目所属行业、创始人规模(见表1)。在Indiegogo 平台的数据中有过半的项目创始人位于美国,是否以美国为发起地也成为影响项目成功与否的重要因素,投资者也深受项目存续事件、融资目标、汇报形式的影响[48]。同时,研究表明目标融资金额的高低是影响获取资金支持的因素[47],创始人团队规模也与筹资成功率呈正相关[49]。此外,作为重要经济支柱的行业更易受到青睐[8]。

4 数据分析与实证结果

4.1 效度检验和相关性分析

在效度检验方面,本文首先对各变量进行KMO 检验,得出总体KMO 值为0.7456,且各因子KMO 值均大于0.5,适合进行因子分析。基于此,本文计算了各维度层次变量的因子载荷如表1 所示。在表1 中,项目质量维度、社交网络维度测量变量的因子载荷均大于0.5,因此,上述变量均能通过收敛效度检验。

变量的相关性分析结果及描述性统计如表2 所示。结果表明,各变量间相关系数的绝对值总体不高,且最大值0.606 低于问题阈值0.9,也进一步证实了回归模型面临多重共线性的可能性较低。

表2 相关性分析结果及描述性统计Table 2 Correlation analysis results and descriptive statistics

4.2 实证分析

在实证分析前,对所有解释变量和控制变量诊断[50],排除多重共线性问题结果如表3 所示,Mean VIF 约为1.370,故可以排除多重共线性问题。实证部分先分析项目的信息对筹资绩效的影响,其次分析信息与筹资机制关系的调节机制,即不同类型项目对两者关系的调节效应。实证部分将项目最终是否成功筹集目标资金作为衡量项目筹资绩效指标,成功筹集为1,否则为0。

表3 多重共线性结果Table3 Multicollinearityresults

根据模型是否加入调节变量将实证分为两部分,未加入调节变量部分共设计了4 个回归模型,其结果如表4 所示。模型1 引入控制变量,均显著影响筹资绩效,证明了控制变量的有效性。模型2、3 分别在模型1 基础上引入质量信息和社交网络信息做解释变量。模型2 中,项目信息质量、动态更新次数和信息共享信息与筹资比例呈正相关;模型3中,创始人发起数量越多,则表明其分配给该项目的资源与精力相对减少,信息质量也就相对降低,因此其对筹资起到相反作用,故H1a、H1b、H1c 得以验证,模型2 结果能够证明筹资项目信息质量越高,筹资取得成功的概率越大。由此可知,通过传达体现项目披露信息的高质量的信号,增强了投资者对该项目的信心,从中心路径信息角度,提高筹资绩效。

表4 未加入调节变量实证结果Table 4 The empirical results without judgement variables

模型3 中众筹创始人支持项目数与筹资比例呈正相关,创始人支持其他众筹项目是其良好的众筹平台社交关系的体现,有利于自身项目筹资,H2a 通过验证。在第三方社交信息中,创始人Facebook 好友数、社交网络推广量均显著正向影响项目资金的筹集,因此H2b 通过验证,边缘路径信息对项目筹资绩效影响显著。模型4 则在模型1 的基础上引入中心路径信息和边缘路径信息,除创始人回复评论比例与创始人发起数量产生了相反影响作用、创始人回复评论平均长度的影响不再显著外,其余变量的影响效果均保持不变,表明在综合考虑项目披露的信息时,投资者往往对相对较为直接的信息更加关注。

加入项目类型的调节变量后,设计3 个模型,结果如表5所示。在模型2 和3 基础上分别加入项目质量信息和社交网络信息与项目类型的交互项得到模型5 和6,模型7 则加入所有变量及其与项目类型的交互项。在模型5 中,结果显示除“项目有无视频×类型”和“创始人回复平均长度×类型”,其余交互项均与因变量呈现正向相关,也就是营利性项目对质量信息与筹资绩效之间关系具有正向调节作用,潜在用户面对营利性项目时更乐意付出更多的认知努力,进行理性思考决策。因此,假设3 通过验证。在模型6 中,创始人发起项目数和评论项目数量与项目类型的交互项与绩效呈显著正向相关,而其他交互项的影响并不显著,说明非营利性项目对社交网络信息与筹资绩效之间关系具有正向调节作用,由此H4 得到验证。综上,总的来说,用户对非营利性项目投入较少的认知努力,较多依赖于边缘路径信息,且项目营利属性往往对项目较为直接的信息披露的调节作用更为显著。

表5 加入调节变量实证结果Table 5 The empirical results with judgement variables

4.3 稳健型检验

上述实证以项目是否成功筹资为因变量进行分析,仅考虑了项目筹集资金的能力,而在实际筹资过程中,项目所吸引的支持者数量也是衡量其绩效好坏的重要指标。因此,本节对因变量进行多方面的衡量以验证研究结果的稳健性,用项目最终支持者的数量同样验证实证结论有助于说明试验结果的一般性和稳定性,可得出与原实验相似结论。其中,模型4 表明,在中心路径信息中,“创始人回复平均长度×类型”显示非营利性活动变动对这个因素变动的敏感性增加;模型5 表明,在边缘路径信息中“创始人支持数量×类型”和“社交网络推广量×类型”的系数显示项目类型的调节作用较原来更加显著,结果见表6。综上,本文实验的稳定性得已验证。

表6 改变因变量实证结果Table 6 The experimental results with the change of dependent variable

5 众筹项目筹资绩效的预测

在互联网金融领域,对目标行为的预测研究同样受到学界和业界的重视。例如,用联合深度生存模型对慈善捐赠者复捐和保留的预测[51],基于多面先验方法预测投资者分布和项目成功时间[52],基于神经网络结构预测互联网金融市场动态过程[53],以及基于马尔科夫决策过程描述筹资动态过程的强化学习预测方法[54],基于图形市场环境模型预测未公布项目的筹资绩效等。根据研究问题的独特性,不同的研究在预测方法的选择方面存在较大的区别,但大部分预测方法的选择依据已有经验。但是,目前对众筹绩效的预测问题缺乏对项目营利属性差异的考虑。而根据本文实证研究分析,项目的营利属性对信息的影响机制有显著调节作用。因此,有理由认为,在预测中考虑项目的营利属性能显著提高预测结果。

在本研究中,基于实证分析结论,考虑项目营利属性的调节作用,两类项目信息对其筹资绩效的影响机制具有一定的区别与联系。据此,简单运用所有筹资项目对筹资绩效进行预测会忽略项目类型之间有价值的关联信息。因此,本文充分利用不同营利属性项目间的区别与联系,采用考虑项目营利属性的多任务模型,基于ELM 理论中的信息分类对筹资绩效进行多任务学习预测;并将预测结果分别与单任务预测结果、随机分类的多任务模型进行比较,验证项目营利属性对预测效果的提升作用,增加预测的准确性。

5.1 预测方法选择

多任务学习方法对不同层次数据之间的联系与区别进行抽取,利用共享信息,同时学习相关任务,更好地泛化原始任务,能提高学习效率和预测精度,目前已应用于方案推荐、自然语言处理、智能识别等各领域。在众筹领域中,Zhang等[55]运用多目标优化思维进行个体用户项目推荐系统的建模,为潜在用户提供了更精准、个性和多样化的投资组合推荐;此外,通过根据不同的奖励设置多任务学习实验,Liu等[56]为投资者预测推荐最佳产品选择,Wang 等[57]则为筹资项目设计最佳奖励设置。可见多任务学习的运用能够有效提高预测精确度。

在本节多任务学习模型建立中,t为项目类型,输入层Xt是n*d的单元格数组矩阵(t ＞1),n是Xt的样本数量,d是特征维度。输出层Yt为单元格数组是ni*1 的矩阵。通过使用不同正则化项优化d*t的特征权重矩阵W,其中每一列是对应任务的d维参数向量。计算任务t的预测值y为：Yt =Xt*W(：,i)。本实验设定输入层和输出层为二维单元格数组,即营利性项目和非营利性项目,所用特征是实证部分验证对项目筹资绩效有影响的所有变量,具体如图2 所示。X非营利项目、X营利项目分别代表营利性和非营利性项目相关变量,Y非营利项目、Y营利项目是分别与之对应的预测变量。

图2 输入层与输出层主要变量Figure 2 Main variables in the input layer and output layer

正则化能够帮助建立性能较优的预测因子,并确定相对重要的变量[58],因此正则化编码项目相关性在多任务回归学习方面受到了较多研究。在众多正则化方法中,Lasso 正则化法可以构建稀疏模型并用于特征选择,因此被广泛运用于降低多任务学习模型的复杂度并提高预测绩效[59];而Trace-norm 正则化方法则能够有效获取不同任务间的关系并将其约束在低维子空间内,也已被广泛运用于多任务学习中并取得了较好效果[60]。本文使用Least-trace、Logistic-Lasso 和Logistic-trace 三种带有正则化项的多任务学习模型。三种模型具体算式如下：

Least-trace：利用Trace-norm 正则化的多任务最小二乘回归。其损失函数为

Logistic-trace：利用Trace-norm 正则化的多任务逻辑回归问题,其损失函数为

Logistic-Lasso：利用ℓ1-norm(以及ℓ2-norm 平方)正则化的多任务逻辑回归,其损失函数为

其中i∈(1,t),Xi,j是第i个任务的样本j,Yi,j是其对应的标签,Wi和ci是任务i的模型,W的秩由正则化参数ρ1决定,正则化参数ρL2则决定了ℓ2规范的惩罚大小。

5.2 多任务模型与单任务模型

为了验证本文构建的多任务学习模型的预测性能,本文将多任务模型与单任务学习的预测结果进行比较。单任务模型选择了三种较为常用的线性回归方法,分别为Regress、Lasso 和Ridge。此外,在评估指标方面,本文使用在预测领域中广泛采用的均方根误差(root mean squared error, RMSE)作为预测精度评价标准,其基本原理为计算预测值与实际值之间的差异大小,RMSE 值越小代表预测精度越高。

本文分别以项目是否筹资成功、项目支持者人数为预测目标进行预测,图3、图4 分别给出了在上述Least-trace、Logistic-Lasso 和Logistic-trace 三种多任务学习,及Regress、Lasso 和Ridge 三种单任务学习下,对预测目标结果的RMSE值。为验证结论的普遍性,根据数据集总量,分别提取80%、75%、70%用于训练,剩余数据集组成测试集,得出按照不同比例划分训练集与测试集后模型的预测结果。从图中可以清晰地观察到,在训练测试集划分的不同比例下,对于筹资是否成功和支持者人数两者而言,本文设计的三种多任务学习模型预测的结果均优于单任务预测模型。在两个目标的预测任务中,多任务学习相较于单任务学习分别取得了约19.70%、26.68%的提升,表明多任务预测模型获得更准确的预测效果。

图3 对是否成功筹资预测结果Figure 3 The RMSE results of predicting whether the project is successful or not

图4 对支持者数量预测结果Figure 4 The RMSE results of predicting the number of investors

实证结论能够帮助机器学习方法的选择和理解。多任务预测模型利用了营利项目与非营利项目之间受信息影响机制的相似与不同,能够弥补单任务对数据进行整体预测时对数据利用程度较低的不足,得出考虑项目营利属性的多任务方法对预测效果具有提升作用。

5.3 任务划分：ELM 理论与随机划分

本节证明上述多任务学习模型的优异性得益于基于ELM 理论的信息划分对筹资绩效预测的调节作用,而不是模型本身能够更好地利用信息的优势所致。根据原始数据集中营利与非营利项目比例,本节将实证数据随机分为两组,重复上述实验,对项目是否成功筹资及项目支持者数量进行预测。同样提取总数据集的70%、75%、80%用于训练,得出结果如图5、图6 所示。从图中可以看出,将项目根据营利性划分作为输入变量带入多任务学习模型进行预测的结果,均优于输入集为随机划分的两组项目集的预测结果。由此证明,考虑筹资项目的营利属性能进一步提升多任务学习的预测结果,以及本文提出的基于ELM 理论的多任务模型在提升项目筹资绩效的预测结果方面的有效性。

图5 对是否成功筹资预测结果Figure 5 The RMSE results of predicting whether the project is successful or not

图6 对支持者数量预测结果Figure 6 The RMSE results of predicting the number of investors

6 结束语

实证研究表明运用ELM 理论梳理的两种路径信息对众筹筹资绩效都有显著影响。基于奖励类众筹中存在的项目动机不同的问题,本文将是否为营利项目作为调节变量,探究两种路径信息对项目的不同影响机制,得到结论为：非营利性项目投资者更容易受到边缘路径信息的影响,倾向付出更少的思维分析过程;而投资者面对营利性项目信息的态度则恰恰相反,更倾向于思考这类项目信息深层的含义,投入更多的精力进行分析。结论可以丰富众筹绩效理论依据,为众筹项目信息管理提供侧重点,以期使众筹项目绩效提高,使众筹平台发挥更大效益。

实证分析表明项目的营利属性对项目信息与筹资绩效的影响关系有调节作用,单纯利用单任务机器学习模型预测项目筹资绩效存在局限性,因此本文设计了基于ELM 理论的多任务学习预测模型。结果证实,区别项目是否为营利性项目,利用两者之间不同信息的多任务预测效果更优,也进一步表明了项目营利属性对投资者决策影响的调节作用。基于此,用实证分析的相关结论帮助指导机器学习算法选择和利用,实现实证研究和机器学习之间互补,提升了预测模型的有效性与准确性,有利于更好的理解研究问题。本研究也存在一定的局限性,包括但不限于只选取文本信息的静态数据特征,忽略了文本内容可能包括的情绪、态度、时间等信息。未来的研究中可以综合加入包含情绪、态度的项目信息及时间因素,考虑运用更多种多任务预测方法,获取更优的实验结果。