赵晓煜,孙福权
(1.东北大学 工商管理学院,辽宁 沈阳110819;2.东北大学 秦皇岛分校,河北 秦皇岛066004)
创新是企业培育和提升核心竞争能力的关键因素,对企业的生存和发展具有重要意义。随着竞争环境和顾客需求的日益变化,企业改变了以往单纯依靠自身研发力量进行创新的传统模式,开始联合利益相关者(如顾客、供应商等)进行合作创新,其创新活动逐渐从封闭走向开放[1]。
顾客作为企业重要的外部创新源,在许多领域都开始发挥重要作用。互联网技术的飞速发展为顾客参与创新提供了强大的技术支持,使顾客与企业间的关系发生了根本性的转变。很多知名生产和服务企业(如宝洁、戴尔、星巴克、耐克等)都建立了自己的协同创新社区,将顾客、供应商等外部资源纳入到企业的创新体系中[2-3]。
协同创新社区是指由企业、顾客或第三方机构建立的,用于支持顾客和其他外部创新源参与企业创新活动的网络社区平台。它的出现拓展了企业与顾客之间的交互方式,为创新导向的企业提供了一种网罗创意、创新产品的有效途径[4-5]。
顾客在创新意愿和创新能力方面存在着显著差异。HIPPEL 最先提出了领先用户的概念,用来指那些比普通用户具有更为敏锐、超前的需求洞察能力,且拥有强烈创新热情和出众创新能力的顾客群体[6]。领先用户是产品开发中最有价值的客户群,因此,如何利用协同创新社区这种新型的创新环境来识别领先用户,并充分挖掘他们的创新潜力,是企业创新管理中的全新课题,对于提升企业的创新绩效具有重要意义。
笔者提出了一种用于识别协同创新社区中领先用户的方法,利用用户留存在创新社区中的内容信息和互动信息对用户的“领先性”进行评价,甄选出社区中的领先用户,进而通过对其进行有效的组织和管理来提高新产品开发的效率。
准确地识别领先用户是对其进行有效管理的前提和基础。目前,领先用户的识别方法主要包括筛选法和网络法,这两种方法虽然在原理和程序上有所差异,但都是通过一定的调查或访谈程序,由创新社区中的现有用户来推荐并确定领先用户的[7]。
上述方法虽然被广泛应用,但其存在以下的局限性:①带有一定的主观性。在社区内部经常会形成一些具有较为密切联系的小群体,群体成员之间的个人关系会使其在推选领先用户的过程中掺杂一定的感情因素,影响领先用户识别的客观性和准确性;②可能会遗漏掉一些重要的领先用户。创新社区中的领先用户不同于普通社区中的“意见领袖”,有些领先用户虽然具有较高的创新性和专业性,但在社区中不一定具有较强的人际影响力。因此,采用人工推举的方法可能导致这部分领先用户被遗漏。
随着互联网应用的日益普及,越来越多的顾客开始以协同创新社区为媒介参与到产品和服务的开发过程中。高速成长、易于访问、信息丰富的协同创新社区为识别领先用户提供了良好的条件。大量研究表明:领先用户在创新社区中通常表现出极高的参与热情,他们在社区中留存的信息为研究人员提供了丰富的研究素材。
笔者基于领先用户和数据挖掘的相关理论,提出了一种协同创新社区中领先用户的自动识别方法,该方法利用用户留存在创新社区中的内容信息和互动信息对用户的“领先性”进行客观的评价,提高了领先用户识别的效率和准确性。该方法包括以下3 个阶段:
(1)基于领先用户的相关理论,结合协同创新社区中可利用的内容和信息,建立了领先用户的评价指标,从创新性、专业性、互动性和影响力等4 个方面对用户的“领先性”进行评价;
(2)采用文本分类等数据挖掘方法,对用户留存在创新社区中的内容信息和互动信息进行分析,获取用户在各项评价指标上的具体得分;
(3)对各项评价指标得分进行综合,得到创新社区中每位用户的“领先值”,并据此判断用户的领先性,确定社区中的领先用户群体。
领先用户在用户群体中所占的比例较低,位于“用户金字塔”的顶端。分析领先用户所具有的特征并建立相应的评价指标,是准确识别领先用户并对其进行有效管理的前提和基础。
领先用户概念的提出者HIPPEL 指出,领先用户至少存在两个明显的特征。①领先用户比普通用户具有更为超前的需求;②领先用户具有更为积极的创新参与意愿,并期望通过参与创新活动来获得更大的收益。
MORRISON 采用领先优势状态(leading edge status,LES)来测量领先用户的特征,在领先用户两个基本特征(较早意识到需求和较高的期望收益)基础上又增加了两个变量,即用户本人和他人感知的LES 以及应用创新性[8]。LUTHJE 对领先用户的特征进行了全面的归纳,进一步提出了用以识别领先用户的6 个指标,即超前的消费需求、精深的产品知识、丰富的使用经验、不满足于现有产品、深入的参与程度和较强的社区影响力[9]。
笔者基于前人的研究成果,综合考虑协同创新社区中可利用的数据和信息,建立了包括创新性、专业性、互动性和影响力共4 类指标的协同创新社区领先用户评价指标体系。各类指标的具体含义和计算依据如表1 所示。
表1 协同创新社区中领先用户的评价指标
在一个成熟的创新社区中,留存了用户生成的大量内容和信息,通过对这些数据进行深入分析可以洞察用户的心理和行为[10]。笔者考虑利用上述信息对提出的4 类领先用户评价指标进行计算。其中,创新性、专业性和互动性的评价指标值可以通过对用户所发帖子的内容进行分析和归类,再对其进行综合后获得。影响力指标则可以通过对用户的好友数、粉丝数、社区积分等变量进行综合后获得。
文本分类是指按照预先定义的主题类别,确定文档集合中每篇文档所属类别的过程。对于所研究的问题,考虑根据内容将用户的帖子划分为创新帖、专业帖、互动帖和普通帖。前3 类帖子分别反映了用户具有创新性、专业性和互动性。这3 类帖子以外的其他帖子均划归为普通帖,主要指用户发布的记事、感想等其他内容的帖子。
每类帖子都会有一些反映自身语义的特征词。例如,在体现用户具有超前需求和创新意识的创新帖中,通常会包括自己、设计、制作、新产品、DIY 等特定的词汇。因此,可以根据每个帖子的特征词对其进行分类。
笔者采用朴素贝叶斯分类方法对每位用户所发主帖的内容进行分析,具体步骤如下:
(1)在协同创新社区中选择一些典型的帖子,由专业人员对其内容进行分析,并将其划分为创新帖、专业帖或互动帖,即为帖子加上类标号。将这些已经被提前赋予了类标号的帖子作为训练集,作为后续对其他帖子进行自动分类的依据。
(2)对于某篇待分类的帖子,先采用中文自动分词技术对帖子进行分词处理,之后采用词频统计技术获得体现帖子内容特征的高频词表,再从高频词表中去除不能明确反映帖子内容的停用词,如一些副词、介词、连词等,进而获得该帖子的特征词向量,可表示为W=(w1,w2,…,wn)。
(3)对于每个用特征词向量表示的帖子,采用朴素贝叶斯分类方法预测该帖子属于某类帖子的概率,并最终将其归入所属概率值最大的帖子类别。根据贝叶斯定理,某帖子属于Ci类帖子的概率为:
因为对于所有的帖子类别P(W)是常数,所以,只要计算P(W|Ci)P(Ci)最大即可。其中,各类帖子的先验概率用P(Ci)=si/s计算。这里,si是训练帖子集中属于Ci类帖子的训练样本数,而s是训练样本总数。
(4)直接计算P(W|Ci)的难度通常较大,为了简化计算过程,可以做类条件独立假设,即对于给定的帖子类别,假定各特征词之间条件独立,即在特征词间不存在依赖关系,于是有:
概率p(wj|Ci)可以由训练样本估值,计算公式为p(wj|Ci)=sij/si,其中sij是Ci类帖子中包含特征词wj的样本数。
经过上述的帖子分类过程,能够对用户发布的所有主帖进行归类,进而通过统计每位用户所发各类帖子的数量来间接地获得该用户在创新性、专业性、互动性等领先指标上的得分。
为了衡量创新社区中每位用户所具有的创新性、专业性和互动性,先采用上述方法对每位用户所发的主帖进行分类,分别获得每位用户所发创新帖、专业帖和互动帖的数量。但由于每个帖子在创新社区中受到关注和认同的程度有所不同,因此,考虑根据帖子的点击数和回复数对其分值进行调整,具体方法为:分别依据点击数和回复数,采用聚类分析的方法对帖子进行归类,据此将帖子划分为5 类,按照点击数和回复数的高低分别对帖子赋予附加值1,0.8,0.6,0.4 和0.2。每个帖子的最终分值=1 +点击数附加值+回复数附加值。例如,对于一条点击数排名处于最高类别(获得1 分的附加值),回复数排名处于第2 类别(获得0.8 分的附加值)的创新帖,可以为发布该帖子的用户增加2.8 分的创新性得分。
在对每篇主帖进行分值调整后,将每位用户在各类贴子上的得分进行分类汇总,即可分别得到该名用户的创新性、专业性和互动性得分。
以计算创新性得分为例,假设在进行帖子分类后,第k个用户共有I个创新类帖子,则该用户的创新性得分为:
其中,CLICKi和REPLYi分别为第i个帖子的点击数附加值和回复数附加值。
同理,按照好友数、粉丝数、积分值等能反映用户在社区中声望、资历的数据对用户进行排序并加以综合后即可获得用户的影响力指标得分。
按照上述方法计算出的各项评价指标分值可能存在较大差异,不宜直接对它们进行汇总,因此,先对每位用户的各项指标得分进行归一化处理。以创新性为例,第k位用户经过标准化之后的创新指标得分为:
其中,INNOmin和INNOmax分别表示创新性得分中的最小值和最大值。
最后,按照式(5)对每位用户的各项指标进行综合,即可得到第k位用户的领先值得分。
式中,ω1,ω2,ω3,ω4分别为创新性()、专业性()、互动性()和影响力()4 类指标的权系数。在具体评价过程中,可以采用层次分析法(AHP)等综合评价方法加以确定。
采用MyEclipse 作为编程软件实现了笔者所述的方法。为了验证其有效性,选择了由德国某知名汽车企业面向中国消费者建立的以“汽车设计”为主题的大型协同创新社区开展研究。
首先,采用传统的人工推举法对该社区中的领先用户进行识别。在社区中随机抽取500 位用户发出调查邀请,请他们根据自己的感受推选出20位该社区中最具创新性、专业性、互动性和影响力的领先用户。共有326 名用户返回调查结果,调查的响应率为65.2%。根据调查结果,将最终得分居前的社区成员作为该社区的领先用户。
然后,采用所述的自动识别方法计算该社区中所有用户的领先性得分,并将得分居前的用户定义为领先用户。进一步将自动识别结果与之前的人工推举结果进行对比,具体如表2 所示(表2 中的用户ID 为数据库中的标识号,并非用户自行注册的ID)。可以看出,采用自动识别方法计算出领先值位于前10 位的用户,有6 人同样位居人工推举方法的前10 位,两者有60%的重合度;两种方法得到的结果具有一定的一致性。
表2 自动识别方法和人工推举方法的比较
进一步分析可以发现,一些在人工推举结果中排名较为靠后的用户,如用户U49250 和U26472,在自动识别的结果中排名居前。通过对他们所发主贴的分析可知:由于其发表的帖子具有较强的创新性和专业性,大多数的普通用户无法完全理解,因此,推举其作为领先用户的人数相对较少,导致其领先性被“低估”。而自动识别方法则对这种现象进行了一定程度的“纠偏”。
由此可见,笔者提出的自动识别方法具有较高的查准率和查全率。与人工推举方法相比,在提高推荐的客观性和准确性方面具有一定的优势。
领先用户识别是企业创新管理中的重要问题。笔者以协同创新社区为研究背景,提出了一种领先用户的自动识别方法,该方法利用用户留存在协同创新社区中的数据和信息,可以准确而高效地进行领先用户的识别。同时,克服了传统人工识别方法较为主观、容易误判的不足,为企业挖掘外部创新力量、提升创新绩效提供了一种新的途径。
[1]THOMKE E,HIPPEL E. Customers as innovators:a new way to create value[J]. Harvard Business Review,2002,80(4):5 -11.
[2]FÜLLER J,MATZLER K,HOPPEL M. Brand community members as a source of innovation[J]. Journal of Product Innovation Management,2008,25(6):608-619.
[3]SAWHNEY M,VERONA G,PRANDELLI E. Collaborating to create:the internet as a platform for customer engagement in product innovation[J]. Journal of Interactive Marketing,2005,19(4):4 -17.
[4]FÜLLER J,JAWECKI G,MUHLBACHER H. Innovation creation by online basketball communities[J].Journal of Business Research,2007,60(1):60 -71.
[5]NAMBISAN S,BARON R. Virtual customer environments:testing a model of voluntary participation in value co -creation activities[J]. Journal of Product Innovation Management,2009,26(4):388 -406.
[6]HIPPEL E. Lead users:a source of novel product concepts[J]. Management Science,1986,32(7):791-805.
[7]杨波,刘伟.基于应用扩展和网络论坛的领先用户识别方法研究[J].管理学报,2011,8(9):1353-1359.
[8]MORRISON P D,ROBERT J H,MIDGLEY D F. The nature of lead users an measurement of leading edge status[J]. Research Policy,2004,33(2):351 -362.
[9]LUTHJE C. Characteristics of innovating user in a consumer goods fields:an empirical study of sport -related product consumer[J]. Technovation,2004,24(9):683 -695.
[10]KOZINETS R. The field behind the screen:using netnography for marketing research in online communications[J]. Journal of Marketing Research,2002,39(1):61 -72.