基于信号理论的开放式创新平台创意认可度研究

2022-03-08 11:10王玉洁戚桂杰王凯平徐宏祯
信息资源管理学报 2022年1期
关键词:发布者认可度文档

王玉洁 戚桂杰 王凯平 徐宏祯

(山东大学管理学院,济南,250100)

开放式创新平台(Open Innovation Plat-form,OIP)是企业用来收集用户对产品、服务或制作流程创新想法的虚拟线上平台,其主要目标是利用产品用户的技能、使用经验和创新观点,为企业创新作出贡献。OIP不仅为产品和用户之间提供了交流、学习的机会,也为企业更好地了解产品用户的创新需求提供了条件。用户创意源于市场需求[1],也是企业创新的重要来源[2]。随着社区的持续运营,用户发布的创意呈指数型增加,大量创意存在质量不高、表述模糊的问题[3]。如何快速识别和筛选质量高的创意,成为企业和学术界关注的重点问题[4]。

现有关于OIP创意质量的研究主要聚焦于创意采纳[5-6],也有学者研究了创意认可度的问题[7-8]。创意采纳从企业角度入手,是企业对用户创意的肯定,代表创意是否被企业接受并投入实际生产使用[9];认可度从同行用户角度出发,表示其他用户对该创意的关注和认可,代表着产品或服务实际使用者的需求。初期研究多使用创意采纳作为创意质量衡量指标,因为采纳直接反映了企业的态度。然而,根据创新价值链理论,创意在被企业采纳之后,还有创意转化和创意扩散阶段,在OIP上产生的创意需要商业化为新产品或新服务,所以更契合市场需求的创意才能为企业带来更高绩效[10]。创意认可度衡量了创意被产品用户接受且认可的程度,因此创意认可度也受到了越来越广泛的关注[7,11]。

现有关于创意认可度影响因素的研究主要从创意发布者特征和创意表现特征进行,仍然存在一些局限性。首先,OIP创意是以文本的形式传达的,目前研究多采用结构性指标(如用户粉丝数、创意评论数等)衡量,忽略了文本中信息和情感的表达;其次,少数对创意文本进行的研究中,变量多采用人工编码的方式获取[12-13],大数据背景下,人工编码难以满足企业需求;最后,现有研究只探索了某一方特征对创意认可度的影响,未充分考虑创意发布者和创意阅读者之间的信息传递,创意发布者表达的信息可能与阅读者理解的信息不同,存在信息不对称的问题。因此,需要新的方法和新的视角分析创意认可度的影响因素。

信号理论解释了发布者和阅读者之间的信息不对称[14]。该理论认为发布者需要以一种有效和高效的方式向阅读者发送信息和情感,才能提高信息传达效率[15]。OIP创意本质上也是一种信息,创意发布者在其发布的创意中使用语言信号来激发其他用户的反应,这些反应就是其他用户对这些信息的认可。快速有效地挖掘用户之间的信号传递十分重要,随着信息技术的快速发展,企业可以通过文本挖掘技术,尤其是自然语言处理技术,快速准确地识别出创意传达的信号,提高平台效率[16]。

基于此,本研究以信号理论为基础理论框架,通过文本分析的方式,构建了影响OIP创意认可度的信号模型。从理论层面来说,本文分析了用户发布者和阅读者之间的信号交流,弥补了先前的研究视角,也拓宽了信号理论的应用领域;从实践层面来说,本文利用自然语言文本挖掘技术,能在一定程度上缓解企业人工审核的认知负荷,为企业发掘有价值的创意提供建议。

1 文献综述与研究理论

1.1 开放式创新平台创意认可度

OIP每天涌现海量创意,人工判断创意质量的难度不言而喻,这意味着很多有意义的创意得不到挖掘。创意认可度是衡量创意质量的重要指标,创意认可度越高,表示用户对获得这种新产品或新功能的期望越大。创意即使本身不可行,也可以经由企业研发部门改进变得更实用[6]。对发布创意的用户而言,发布创意得到的认可度越高,创新自我效能感越强,之后发布创意的意愿越强[6,17]。虽然平台上的创意得票数或点赞数能较为直观地反映其他用户的认可情况,但是随着创意数量大规模增加,新的创意层出不穷,即使创意本身有价值,也可能因为没有及时被发掘,泯没于海量创意之中。因此,如何准确判断创意的认可度,选择企业需要的创意,是学术界关注的重点方向[18]。

创意可行性的影响因素多从两个角度研究,分别是创意发布者特征和创意表现特征。创意发布者特征方面,主要从创意者自身特征和交互行为两个角度研究,如Elina[7]从创意发布者专业知识水平角度认为,多面手(知识范围比较广的用户)会创造出更受到他人认可的创意;Özaygen等[11]从社会网络角度认为,当一个用户先前给予他人的认可更多、收到他人认可更多,即认可网络出度、入度更高的用户,发布的创意会受到更多的认可;刘倩等[6]对社区用户交互对创意质量的影响进行了详尽的研究,探究了社区中不同类型的用户交互对创意质量的影响,证实了专业性成功经验的调节作用。创意表现特征方面,主要从创意的表现形式及表现评价角度研究,如Ma等[8]研究了创意长度、图像及视频的数量对创意认可度的影响;Zheng等[19]采用taskcn.com数据,探究了先前发布的创意数量和创意多样性对创意质量的积极影响;王婷婷[18]将影响因素分为信息型因素和规范型因素,研究了创意长度、情感等信息型因素和创意得分数、评论数等规范型因素对创意可行性的影响。

现有文献多从创意发布者特征和创意表现特征的结构性指标角度进行研究,文本特征等非结构性特征的研究仍处于起步阶段。相对于传统结构性指标,OIP用户分享创意的方式主要为文本,通过对创意文本的分析,能最大程度了解用户创意传达的信息和情感。随着机器学习算法等计算机技术的发展,文本特征挖掘技术更加成熟,得到的创意文本信息也更加多样和完善。

1.2 信号理论

在经济和社会环境中,当一方拥有信息而另一方缺乏这些信息,二者之间出现信息不对称时,前者需要通过各种信号将信息传递给后者,来获得理想的结果[20]。乔治·阿克洛夫[21]于20世纪70年代提出了信号理论,以解决信息不对称的问题。自诞生以来,信号理论被应用于经济管理和信息系统的多个方面,如共享经济[22]、电子商务[20]、企业创新[23]、酒店管理[24]及健康社区[15]等。

在OIP,创意发布者发表有关企业产品或服务的新想法形成创意,创意阅读者查看这些创意。当阅读者与发布者之间看法相同,或认为这些创意有价值,就会支持这些创意,并采取投票、打高分等操作。但是,由于创意发布者和阅读者对企业产品和服务的使用体验不完全相同,专业知识水平也有所差距,创意发布者在发布创意时,会存在与阅读者之间的信息不对称现象[26]。信号理论很好地解释了创意发布者及创意阅读者之间的信息不对称[26]。

信号理论中的关键概念包括信号发出者、接收者和信号[14]。在OIP中,创意发布者是创新想法的信号发出者,目的是向社区提供这些信息;信号接收者是查看这些创新想法的创意阅读者,希望获取自己认可的观点;信号则是信号发出者和接收者之间交流的语言[25]。创意发布者需要以更有效和更高效的方式向信息不足的潜在阅读者发送有意义的信号,才能获得更多支持。相对于传统线下创新环境,用户与企业可以通过面对面交流、肢体语言等多种表达方式进行沟通,OIP是一种虚拟在线平台,用户与企业之间或者用户之间的交流主要通过文本传达[4],文本语言是二者之间的主要沟通信号。

不同的文本语言特征可以传递不同种类的信息和情感,并导致不同的结果。信息性信号和情感性信号是虚拟社交媒体中两种主要属性[15],信息性信号表达高度准确的信息,情感性信号表示情感或感觉,这两种信号都能减少交流双方的信息不对称[27],先前文献对这两类信号的正向影响进行了深入研究[15]。信息性信号能够增强信息的可观测性,降低信号接收方的信息获取成本,情感性信号可以引发或增强信号接收者的情感强度或情感相似度。在OIP中,创意文本在发布者和阅读者之间传递了信息和情感,本文研究信息性信号和情感性信号对创意认可度的影响。

2 研究模型与假设提出

本研究根据信号理论,理解文本的语言信号如何影响创意认可度,如图1所示。创意发布者和阅读者之间的信号有信息性和情感性两种表现形式,信息性信号表示了创意文本自身传达的语言特征,由信息独特性、主题多样性和文本复杂性表示。情感性信号是创意发布者在发布创意时表达的情感,包括情感效价和情感主观性两个方面。控制变量从创意自身特征和创意发布者特征两个方向选择。

图1 研究框架

2.1 信息性信号与创意认可度

2.1.1 信息独特性

信息独特性表示文本与其他文本的相似程度,文本越独特,内容与其他文本差距越大[28]。企业构建OIP的根本目的是鼓励产品用户参与企业创新[29],由于创新通常通过对现有知识的重组、修改和整合而产生,因此创意的独特性会产生更好的创新绩效[30]。相对于陈旧的信息,当信息中揭示了一些新内容(即先前没有发表过)时,它的价值就更高[31],这样的创意出乎之前的预料,会受到更多关注。如果某个创意没有提供新的信息,而是简单重复了以前的文本,那么该创意文本的相似度较高,吸引力就会降低。

本研究通过文本相似度来度量对创意的信息独特性。文本相似度指两个或多个实体(词语、短文本、文档等)通过一定的文本比较方法得到的具体量化数值[32],是信息独特性的一种测量[28]。创意中包含的信息与之前的信息越重复,文本相似度越高,独特性越差;反之,文本相似度越低,其措辞越独特[28]。OIP是展示用户创新想法的平台,新颖的创意可以得到更多用户的关注[7]。如果读者阅读了很多类似描述的创意,或者说与之前创意的词句表达较为相同,那么读者就不想再次看到类似的文本。同样,如果创意描述中与之前相差较大,它就可以传达更新颖的信息,可能受到更多读者认可。综上,本文假设:

H1:信息独特性正向影响创意认可度,创意文本信息越独特,认可度越高。

2.1.2 主题多样性

主题多样性表达了创意内容的广泛程度[30]。在OIP中,用户展示的创意包含不同的主题信息,有的创意更侧重于对产品性能的改进,有的热衷于对产品外观的描述,有的只注重对情感的宣泄。根据Sweller[33]提出的认知负荷理论,认知是个体对信息处理的过程和能力,用户处理信息、学习知识需要进行认知加工,这个过程是一种对认知资源的消耗过程。当所需资源总量超过已有资源时,个体就无法正常处理信息,这种情况被称为认知超载(cognitive overload)[34]。OIP中的创意多针对某个问题进行反馈,或对某个产品进行改造,并不会结合大量主题进行综合性概述。当读者阅读创意时,如果得到的信息主题过多,信息量过大,可能会产生认知超载现象,创意的吸引力就变小。从另一个角度来看,如果一个创意主题数较多,说明该创意所涉及的面较广,论证重点可能不够清晰,收到的认可更少。

对于文本主题数的解释,本文引入LDA主题建模的方式来计算文本主题。LDA是一种无监督的机器学习技术,可用于识别大规模文档集合或语料库中的隐藏主题信息,因此,我们利用LDA从创意中提取主题,并获得每个创意中各主题的分布频率。本研究认为,对于一个创意文本而言,主题数量越多,越容易造成认知超载,认可度越低。综上,本文假设:

H2:主题多样性负向影响创意认可度,创意中主题数越多,认可度越低。

2.1.3 文本可读性

文本可读性指文本易于阅读和理解的程度或性质[35]。OIP是一种线上的虚拟社交平台,创意都以文本的形式表现,信息的载体是文本,其他用户对创意的理解也是通过阅读文本的形式获得的。与企业创新部门不同,OIP具有自主性的特征,用户创新是自愿发生的,没有组织的联系[36]。因此,相对于可以进行多种形式交流和沟通的传统企业创新环境,OIP中创意信号几乎完全通过文本(或少量图片)传递给阅读者,是否能理解对方的文本表述更加重要。

本研究通过已有的可读性指标(句子中复杂单词的数量)来衡量文本可读性。由于OIP的开放性特征[1],各种类型的用户都可以参加企业创新,创意发布者和创意阅读者的知识背景、产品使用经验可能不同。当发布者采用一些专业晦涩的词语来表示创意时,阅读者可能无法恰当地理解发布者表达的含义;相反,如果创意描述方式比较通俗易懂,读者就能更深刻地理解创意内涵,创意就更容易被认可。因此,本文假设:

H3:文本可读性正向影响创意认可度,创意文本可读性越高,认可度越高。

2.2 情感性信号与创意认可度

2.2.1 情感倾向

用户发布在OIP中的创意是其创新想法的文本阐述,理应是理性和客观的,但是用户在描述创意时会掺入自己的情感[37]。当用户对发布的创意比较自信,认为较有可能实现时,其创意表达可能是正向和积极的;当对自己的创意信心较小时,其情感表达更为沮丧和消极[31]。从另一个角度看,当用户对企业产品或服务比较感兴趣,对其表现比较满意时,提出的创意可能更为正向;而当对产品或服务不满意时,会带有愤怒不满的情绪提出自己的改进措施及意见,表达较为负向。

当创意阅读者在阅读创意内容时,可以体会到创意发布者的情感表达,更积极的创意表达能让读者体会到发布者的信心和对产品的好感,而消极创意则让读者感到发布者的偏见或愤怒。读者更愿意接受积极情感表达的创意,并为之投票[31]。阅读积极情感的创意会感到更轻松,获得更多的乐趣,好心情让读者更愿意接受创意,这种情况下创意会得到更多关注。综上,本文假设:

H4:积极情感正向影响创意认可度,创意中情感表达越积极,认可度越高。

2.2.2 情感主观性

本文还进一步研究了情感主观性对创意认可度的影响。创意的情感主观性就是用户在创意文本描述中情感表达的自我、主观程度[38]。创意是产品用户对于产品或服务的创新想法或意见,需要客观实际地表达自己的观点[18]。主观想象的描述多用于表现个人的观点、情感等非事实内容,有较强的强调自我成分[39]。

文献表明[40],过度自我的情绪表达会使阅读者产生心里抗拒,从而减少对文本表达的认可。Hu等[38]和Schindler等[41]对评论有用性的研究发现,表述温和的评论具有最大的价值。当用户的创意描述偏向于自己的主观意愿时,其创意情感主观性较强,其他用户可能在阅读的时候认为该创意掺杂了过多个人情绪,而认为其价值较低;相反,当创意描述比较客观时,其他用户会认为该创意是理智和冷静的,更容易接受,也更容易给予更多关注。因此,本文假设:

H5:情感主观性负向影响创意认可度,创意中情感主观性表达越强,认可度越低。

3 研究方法

3.1 数据收集

本文选择Salesforce公司经营的OIP——TrailBlazer Community作为研究对象。Sales-force是一家强大的客户关系管理(Customer Relationship Management,CRM)软件公司,是CRM行业最受欢迎的公司。TrailBlazer Community是由Salesforce创建的,用来提供用户创意交流的OIP,IdeaExchange板块用来收集用户有关新产品开发的建议和创意(如图2所示)。用户可以根据分类发表不同的创意,也可以进行评论、点赞、打分等交互活动。

图2 TrailBlazer Community的IdeaExchange板块

通过Python爬虫程序,本研究爬取了Idea-Exchange板块的创意信息,包括每条创意的内容、发表者、发表时长、得票数等(如图3 所示)。由于网页设置问题,每个分类只能显示前500页信息。因此,本研究爬取了截至2020年6月平台上可用的全部创意信息,共22216条。通过数据清洗,去掉非英文及非完整信息的创意,保留了18777条创意。因为 TrailBlazer Community允许用户设置隐藏主页信息,所以我们无法获取主页不可见的用户个人信息,为减少创意发布者特性对创意认可度的影响,进一步去除了无法获取发布者主页信息的创意,最终保留10818条创意数据。

图3 创意信息

3.2 变量设计与测量

3.2.1 因变量设计

在OIP上,用户可以通过投票来表示对一个创意的喜爱和关注程度,投票数越多,表示该创意受到更多产品用户的关注,越容易被其他用户认可,也就越有价值。本文采用网站客观的变量测量创意认可度,即通过其他产品用户对创意的投票数来测量,用Votes来表示。

3.2.2 自变量设计

(1)信息独特性

本研究主要使用TF-IDF算法和余弦相似性计算文本相似度指标Similarity,来衡量信息独特性。TF-IDF是一种统计词语重要性的方法,其中心思想是,如果某个词在一篇文档中出现频率高且在其他文档中很少出现,则该词语具有较强区分能力[42],可以将定性的文本量化为向量。余弦相似性指通过计算两个向量的夹角余弦值来评估它们的相似度。TF-IDF和余弦相似性相结合被广泛应用于文本相似度计算中[43],本研究使用该方法计算创意的文本相似度,具体计算过程如下:

①文本预处理:将每个创意文本作为一个文档,对于每个文档,首先要消除非英语字符和单词、标点和停用词(例如a,an,the);然后将所有大写字母转换为小写字母;最后使用词干提取算法将创意中的所有单词都转换为词干(例如,“happy”和“happier”都转换为“happy”)。

②制作语料库:首先用dictionary方法获取词袋(bag-of-words),然后使用doc2bow制作语料库,生产的语料库是一组向量,向量中的元素是一个二元组(编号、频次数),对应分词后的文档中的每一个词。

③建立TF-IDF模型:TF(Term Frequency)指词频,即一个词在文档中出现的频率;IDF(Inverse Document Frequency)指逆文档频率,表示某个词在语料库中出现的次数越多区分能力越差[44]。TF-IDF是词频与逆文档频率的乘积,每个词项wi的计算如公式(1)所示,其中,tfj(wi)表示词项wi在文档j中出现的频率,df(wi)表示全部文档中词项wi出现的频率,N表示全部文档数量[45]。

(1)

在计算每个词项在每个文档中的TF-IDF值后,就可以将每个文本文档量化为向量模型。

④计算文本相似度:计算每个文档与语料库的余弦相似性,可得到该文档的文本相似度。余弦相似度的计算如公式(2)所示[46],其中,A表示焦点文档的向量表示,B表示语料库的向量表示。

(2)

⑤由于文本相似性测量的是文本之间的相似程度,数值越大表示文本的信息独特性越差,为逆向指标。为保证结果可视性,本研究对文本相似度值使用极差变换法进行归一化处理,将逆向指标正向化[47],如公式(3)所示。其中,xi表示焦点文档的文本相似度原始值,MaxX表示全部文档文本相似度最大值,MinX表示全部文档文本相似度最小值。

(3)

(2)主题多样性

本文用TopicNum表示创意文本的主要主题个数。过程主要包含三个步骤:①文本预处理;②LDA主题建模;③检查每个创意中主要主题的数量。过程如下:

①文本预处理:预处理过程与文本相似度预处理相同,此处不再赘述。

②LDA主题建模:LDA是一种生成统计模型,可用于从大量文本中提取主题。 在LDA中,每个创意都可以视为各种主题的混合,其中每个主题都是代表某些“含义”的一组单词(例如产品/服务的属性)。对于给定的一组创意文本,可以通过LDA的生成过程获得每个评论中的主题分布和每个主题中的单词分布,进而推断出在线评论的主要主题。最优主题数计算通常有三种方式,分别是通过经验获得、极大似然比最大值和困惑度最小值来判断,本研究通过极大似然值获得最优主题数为40。每个主题都是通过一组代表某些含义的单词表示,需要人工通过这些单词,给予该主题某个标签作为标记。最后,LDA结果得到每个文档在每个主题的分布概率。在一篇文档中,所有主题分布概率之和为1。

③检查每个创意中主要主题的数量:通过上一步,已得到每篇创意文档在40个主题下的分布,本研究将主题分布超过0.025(总分布概率为1,一共40个主题,如果主题平均分布的话,每个主题分布概率为0.025)的主题记为主要主题。

(3)文本可读性

本研究认为,得赞数多的创意文本更加可读,为此引入了指标Readability来衡量文本的可读性。可读性指标本质上是对文本单词数量、句子数量所占比例的解释,因此可以有效计算出文本的复杂情况[48]。计算文本可读性的指标很多,包括Flesch-Kincaid、Smog、Linsear Write Formula(LWF)等,本研究采用LWF作为可读性的测量指标。LWF最初由美国空军开发,用来帮助计算其技术手册的可读程度,现已被广泛应用于文本可读性测量,用于评价文本可读程度。LWF指标根据句子的长度和具有三个或更多音节的单词数来计算文本可读性等级,计算过程如下:

①从文本中找到100个单词的示例;

②计算简单单词(easy words,定义为两个或以下的音节)记为e,包括a,an,the和其他简单单词;

③计算困难单词(hard words,定义为三个或三个以上的音节),记为h;

④将简单单词的数量乘以“ 1”,将困难单词的数量乘以“ 3”;

⑤将前面两个数字加在一起(e+3h);

(4)情感倾向

对文本情感值的计算主要有两种方式,分别是人工编码和计算机文本挖掘技术。本研究所用数据较多,采用人工编码的方式工作量过大,故采用自然语言处理方法。我们使用Python编程的textblob包计算文本情感,用Sentiment表示结果,计算过程如下:

①文本预处理:预处理过程与文本相似度预处理相同;

②识别词项情感值:利用成熟词库(斯坦福大学的CoreNLP)识别出每个词项的情感得分;

③计算文档情感倾向值:在每个创意文档中,计算每个词项情感得分的均值,得到该创意文档的情感倾向值。其中,具有正向情感的记为正值,情感越激烈值越大,最大值为1;具有负向情感的记为负值,情感越激烈值越小,最小值为-1;没有情感偏向的记为0。

(5)情感主观性

情感主观性是文本表达的主观程度,本研究采用自然语言处理的方法获取文本的情感主观性。情感主观性计算与情感倾向值计算类似,本文同样利用Python的textblob包计算文本情感主观性水平,用SentiSub表示,过程如下:

①文本预处理:预处理过程与文本相似度预处理相同;

②识别各词项主观值:利用成熟词库(斯坦福大学的CoreNLP)识别出每个词项的主观性得分;

③计算文档情感主观值:在每个创意文档中,计算每个词项主观得分的均值,得到该创意文档的情感主观性得分。其中,情感主观值最小值为0,表示该创意文本没有主观性的情感表达;最大值为1,表明该创意文本主观性表达极强。

3.2.3 控制变量设计

根据研究文献和平台现状,本研究从创意自身特征和创意发布者特征两个角度选取控制变量。这些变量可能会对认可度产生影响,但它们并不是本研究的重点。

(1)创意自身特征

创意自身特征包括创意类型、创意图片数、创意长度及发表时长。创意类别指用户发布创意时选择的种类,在TrailBlazer Community,创意一共有16个大类(如analytics、commerce、communications等)及其包括的100个小类(如analytics包含operational dash-boards、operational reporting和Tableau CRM三个小类别)。本研究选取大类作为控制变量,控制每个创意所属的大类,用Category表示。创意图片数表示用户在发布创意时为搭配创意文本添加的图片数量,在TrailBlazer Community,用户主要采用文字表达自己的创新想法,但也有少部分用户添加了图片作为辅助。本研究使用图片数作为控制变量,用Images表示。创意长度指创意文本中单词的数量,已有相关研究(如Liu等[34])探究了OIP中创意长度与创意可行性的关系,本研究使用创意中单词字数表示创意长度,用Words表示。创意发表时长指创意从发表到数据收集之间的时间,在TrailBlazer Community,创意发表的时间并不显示发表的确切时间(年月日的表达),而是以“几个月前”“几年前”的形式存在(如图3所示),本研究控制创意发布时长time,以月为单位,用月数表示创意发表至创意收集之间的时间,少数创意发布时间不到一个月,曝光时间较短,以0.5表示。

(2)创意发布者特征

创意发布者特征包括发布者国家、发布者性别、发布者获得勋章的数量和发布者创意数量,发布者特征可在用户个人档案页面获取(如图4和图5所示)。发布者国家表示发布者在用户主页填写的国家信息,用Country表示,在我们的数据集中,共6924个用户填写了54个国家和地区,未填写国家信息的用“0”代替。Sex为发布者性别,使用Pronoun判断,“he/him/his”表示男性(用“1”表示),“she/her/hers”表示女性(用“2”表示),另外使用“0”代替“other/ask me”及未填写性别信息的用户。发布者获得勋章的数量表示用户获得的奖励,用Badges表示。另外,我们控制了用户活跃性水平,即用户发表的创意总数,用Ideas表示。

图4 用户个人主页(部分1)

图5 用户个人主页(部分2)

表1为各变量及其测量指标列表。因变量为创意认可度,用投票数表示;自变量从信息性信号和情感性信号角度区分。除此以外,表中还展示了一系列控制变量。

表1 研究变量及测量指标

相关数据的描述性统计结果如表2所示。

表2 数据描述性统计结果

3.3 模型设计

因变量Votes的频数分布情况如表3所示。

表3 因变量Votes频数分布

由表3可见,因变量分布不服从正态分布,因此不适于使用OLS线性模型。因为因变量为计数变量,所以考虑计数回归模型,本研究选择使用负二项回归来研究影响用户创意贡献行为的因素,该回归模型引入随机干扰项εi放宽了均值和方差相等的约束。本研究的回归模型如方程(4)所示:

Votes=α0+α1Similarity+α2TopicNum+α3Readability+α4Sentiment+
α5SentiSub+α6Category+α7Images+α8Words+α9Time+α10Country+
α11Sex+α12Badges+α13Ideas+εi

(4)

如公式(4)所示,研究考察创意语言信号对创意认可度的影响,因变量是创意认可度,用投票数(Votes)表示。自变量有信息性信号,分别用文本相似性(Similarity)、主题数(TopicNum)、可读性(Readability)表示,自变量还有情感性信号,分别用情感强度(Sentiment)和情感倾向(SentiSub)表示。控制变量包含对创意自身特征的控制和创意发布者特征的控制,创意自身特征包括创意类别(Category)、创意包含的图片数(Images)、创意长度(Words)和创意发表时长(Time);创意发布者特征包括发布者所属国家(Country)、性别(Sex)、获得的勋章数量(Badges)及发布过的创意数量(Ideas)。此外,εi为误差项。

4 实证结果分析

4.1 假设检验

本文使用 Stata软件进行数据分析和假设检验,得到负二项回归模型的结果如表4所示。其中,模型1中只包含控制变量,模型2在模型1的基础上加入所有信息性信号类型自变量,模型3在模型1的基础上增加了情感性信号类型自变量,模型4是全部自变量和控制变量的回归。

由表4可以看出,加入所有自变量和控制变量的模型4拟合度更优。

表4 负二项回归模型结果

信息性信号对创意认可度的影响方面,信息独特性指标(Similarity)正向影响创意投票数(模型2,β=0.259,p<0.1; 模型4,β=0.250,p<0.1),即创意越独特,新颖性越高,越容易受到其他用户的欢迎,假设H1成立;主题多样性指标(TopicNum)负向影响创意投票数(模型2,β=-0.014,p<0.05; 模型4,β=-0.0145,p<0.05),表示在一个创意中,主题个数越多,越不受到其他用户欢迎,假设H2成立;文本可读性(Readability)正向影响创意投票数(模型2,β=0.005,p<0.01; 模型4,β=0.005,p<0.01),即创意越容易阅读,文本表示越不复杂,越容易得到用户认可,假设H3成立。

情感性信号对创意认可度的影响方面,情感倾向值(Sentiment)对创意投票数有正向影响(模型3,β=0.180,p<0.05; 模型4,β=0.186,p<0.05),表示创意描述越积极,该创意得到的投票越多,假设H4成立;情感主观性指标(SentiSub)负向影响创意投票数(模型3,β=-0.267,p<0.01; 模型4,β=-0.266, p<0.01),即创意描述越主观,越不容易得到其他用户的认可,假设H5成立。

通过回归结果,可以得知,对信息性信号而言,创意信息越独特,与先前创意越不相同,越容易得到其他用户的认可;创意所含的主题数量越少,主题越单一,越容易得到其他用户的支持;创意文本越容易阅读,越简单,其他用户的认可度越高。对文本情感性信号而言,创意所表达的情感越积极,越容易得到他人认可;创意主观性越强,越不容易得到他人认可。

4.2 稳健性检验

4.2.1 数据方面:重新爬取近一年数据

为保证数据的稳健性,我们于2021年6月重新爬取2020年6月1日—2021年5月31日创意数据进行分析,经过数据处理和清洗后最终获得5666条创意。重新经过上述方法处理和回归后,结果如表5中模型5所示。可以看出,在重新选择数据后,所得研究结论与前文基本一致,结果稳健。

表5 稳健性检验结果

4.2.2 变量方面:变更创意认可度衡量方式

本文采用创意投票数votes衡量创意认可度,除投票数外,TrailBlazer Community中也用得点数points表示创意认可程度。Votes主要是其他用户给予的支持性评分,Points是平台对创意的打分,通过其他用户对该创意的支持和反对投票给予的综合性得分。回归结果如表5中模型6所示,所得结论与前文基本一致。

4.2.3 计量方面:使用泊松回归

泊松回归同样适用于计数变量回归,本研究使用泊松回归进一步对数据进行回归[49],结果如表5中模型7所示。可以看出,信息性信号和情感性信号对创意认可度的影响与前文基本一致,结果稳健。

5 结语

5.1 研究结论与贡献

本研究借鉴信号理论,建立了一个创意认可度的语言信号模型,通过对Salesforce TrailBlazer Community的10818条创意进行测试,研究了创意不同类型的语言信号对创意认可度的影响,得到以下结论。

(1)本研究引入信号理论,从两种信号类型角度提出五种文本特征,构建了影响创意认可度的文本特征理论框架。与企业创新的传统线下环境不同,文本是OIP创意的主要载体,是创意发布者和创意阅读者之间初次沟通的主要渠道。以往研究多聚焦于创意发布者特征和创意表现特征的结构性指标角度, 采用统计量表、 结构性指标或小样本人工标注等方法分析文本特征对创意认可度的影响,尚未在理论层面对文本特征的语言风格进行全面阐释。本文基于信号理论,整合量化文本特征,探索了创意文本特征中包含的语言信号。本研究认为,创意发布者和创意阅读者之间的信息不对称可以通过信息性信号和情感性信号得到有效缓解,具体来说,信息独特性、主题多样性和文本可读性传递信息性信号,情感效价和情感主观性传递情感性信号。

(2)本研究揭示了信息性信号与情感性信号对创意认可度正负向影响的内在逻辑。与已有文献中文本信号一致的正向影响不同[15],本文结果表明,在OIP领域,文本传达的信号对创意认可度的影响方向并不相同,研究显示,信息独特性、文本可读性和情感效价信号正向影响创意认可度,即观点更特殊、可读性更强、表达更积极的创意更容易受到其他用户的认可;主题多样性及情感主观性对创意认可度产生负向影响,即多主题和更主观的创意不太会受到其他用户欢迎。本文厘清了创意文本描述影响认可度的潜在规律,丰富了开放式创新平台的文献。

本研究也为企业或平台管理者提供了一定的管理建议:

(1)本研究结果有利于协助开放式创新平台重新定位用户创意文本特征的作用,为企业筛选高质量创意提供了新的思路。创意在平台上发布是一个信号传递的过程,鉴于此,管理者可以通过创意所表达的信息性信号和情感性信号确定更有可能受到欢迎的创意,增加这些创意的曝光度,筛选出更具有潜在价值的创意。

(2)平台可以根据本研究结论推出创意描述规则,以指导用户以适当的方式描述创意。我们为企业刺激平台用户创造更容易受到认可的创意提供了新的想法,比如在信息传达上,激励用户发表更特殊、更容易理解的创意;在情感表达上,激励用户发布更友好、更具积极情感倾向的创意。

5.2 研究局限与未来研究方向

本研究力求采用客观严谨的科学方法验证模型和假设,但仍存在一些局限,一是平台样本的选择问题,仅选择了CRM软件的OIP作为研究对象,未能广泛使用其他类型的平台;二是样本语言的选择问题,仅使用了英文文本创意,没有考虑其他语言的影响;三是观测因素的选择问题,未考虑某些无法观测的因素对用户创意认可度的影响,如用户内在需求等;四是测度的选择问题,本文的变量测度存在一定主观性,尚未对其他测度进行讨论,将来需要进一步改进和完善。

因此,本文有以下未来研究的建议:第一,选择不同类型的OIP,研究不同行业、种类的OIP,探索其创意语言信号特征对创意认可度的影响;第二,在文本分析的基础上,深入挖掘以图片、视频等形式存在的创意信息的信号特征,探讨不同信息内容对OIP创意认可度的影响;第三,采用定性定量相结合的方法,探究用户内在动机与创意质量之间的机理。

猜你喜欢
发布者认可度文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
新加坡新法规引争议
带隐私保护的群智感知任务分配机制
软件众包任务发布优先级计算方法
关于家长对幼儿园体育活动的认可度和支持度的调查研究
提升职业院校毕业生对母校的推荐度
Word文档 高效分合有高招
护理学基础教学中高仿真模拟人技能训练系统的有效运用分析
翻转课堂教学模式的变式实践与启示