网络水军对互联网文化市场影响的仿真研究

2014-09-21 08:47慧,欣,
关键词:水军灌水影响力

郭 崇 慧, 王 欣, 孙 磊 磊

(大连理工大学 管理科学与工程学院,辽宁大连116024)

一、引 言

互联网文化市场作为搭建在互联网上的新型平台,为人们在网络空间中的精神活动及其商品提供虚拟场所,包括网络新闻、网络动漫、网络视频、网络音乐、网络文学以及网络论坛,等等。相较于其他文化市场而言,互联网文化市场具有非常鲜明的优势,如内容的海量性、载体的开放性、传输的多样性、信息的共享性和主体的自由性。然而,正是由于互联网文化市场的这些特点,使得用户很难从海量信息中选择出心仪的商品。

为了提高互联网文化市场用户选择商品的效率,很多商品排名系统应运而生[1][2]。在互联网文化商品排名系统中应用最为广泛的排名方法是通过采集用户体验、下载、转发或者评价商品的次数,根据次数的多少进行推荐。用户可以依靠商品排名系统提供的信息去选择大家正在观看的电影、试听的歌曲、热议的新闻或者好评的图书,快速了解分享最新、最流行的互联网文化商品。然而在互联网文化商品排名系统给用户选择商品带来很多便利、节省很多浏览时间的同时,也不可避免地对互联网文化市场造成了一定的影响。Salganik等在现场实验研究中发现,商品排名系统在社会影响力的影响下加剧了互联网文化市场的不均衡性和不可预测性[3]。随后,Muchnik设计了一个大规模随机实验,将一个社会新闻网站上的新闻随机分为三组,分别对新闻的好评次数实施积极的、消极的和对应的社会影响力影响,实验结果表明积极的社会影响力有助于提高后续的好评数量[4]。通过以上研究可以看到,商品排名系统在社会影响力的影响下加剧了互联网文化市场的不均衡性,扩大了互联网文化市场固有的“富者更富”现象[5][6]。

图1 两阶段歌曲下载行为示意图

由于互联网文化市场“富者更富”现象的影响,如果商品排名系统的排名信息被恶意操纵,会将次优商品推荐给用户,将降低用户的满意程度、危害大众的消费权益和影响互联网文化市场的正常运营秩序。网络水军是通过集中点击、发帖和回复恶意操控商品排名信息,对特定目标进行宣传营销或恶意攻击的网络人员。目前,网络水军已经受到谭真[7]、王爱玲和Tang等多名研究者的关注[8][9],阐述网络水军危害性,并予以谴责。

因此网络水军是如何操控商品排名信息的,对互联网文化市场的危害有多大,就非常值得探索与研究。目前相关研究主要分为两大类:第一类是采用实验的方法[4][10][11];第二类是采用文本挖掘的方法[12][13]。

为了研究网络水军操控互联网商品排名信息的过程、影响要素及其对互联网文化市场造成的危害,本文通过仿真的方法建立了互联网文化市场中歌曲下载模型,采用控制变量法进行多次灌水实验,研究网络水军的危害性,明晰网络水军操控互联网商品排名信息的过程,同时发现了网络水军影响互联网文化市场的三点要素。

二、仿真建模

本文通过研究现场实验中歌曲试听和试听后下载的行为特点,建立了互联网文化市场中歌曲下载行为和网络水军灌水行为的仿真模型。其中,互联网歌曲下载行为模型分为两个阶段:第一阶段只受社会影响力影响选择试听歌曲;第二阶段只受歌曲质量影响决定试听后是否下载。两个阶段歌曲下载行为如图1所示。

1.现场实验简介

在Salganik等设计的现场实验中[3],共邀请了14 341个志愿者试听48首不流行的歌曲,志愿者可以根据他们的喜好选择是否下载歌曲。歌曲以16×3网格(实验1)或单个列(实验2)的形式展示在屏幕上,志愿者被随机分配到两个实验中。

如图2所示,两个实验又分别分为有社会影响和无社会影响两种条件。在无社会影响条件对照下,志愿者仅能看见歌曲名称和演唱者,去决定试听的歌曲,因此仿真模型通过无社会影响条件下仿真下载次数刻画歌曲质量q。在有社会影响仿真条件下,志愿者还能够看到先前志愿者的下载次数;在这种条件下,除了志愿者个人的音乐偏好,还加入了社会影响力s。在有社会影响仿真条件下,志愿者被随机分到8个组中,每组相互独立。通过研究多个相互平行的独立组,进而研究文化市场中的不可预测性。在无社会影响仿真条件下,志愿者被随机分为两部分进行不可预测性研究。

图2 志愿者社会影响力分组

2.仿真模型建立

仿真模型假设:

(1)歌曲质量q服从正态分布。

(2)志愿者i试听歌曲li数量服从正态分布。

(3)志愿者下载歌曲的数量d服从正态分布,仿真初始时,歌曲下载次数d均为0。

(4)在无社会影响条件下(即社会影响力s=0),试听歌曲为随机选择;在有社会影响条件下(即社会影响力s≠0),试听歌曲受先前下载次数和随机值扰动共同影响,社会影响力s符合正态分布。

(5)志愿者i个人偏好εi决定歌曲是否下载。

建立互联网文化市场中歌曲下载行为仿真模型的具体过程如下:

阶段1:选择试听歌曲。

志愿者i受社会影响力s影响,根据列表中歌曲j下载次数的市场份额∂j,利用随机值ri进行扰动,决定志愿者i试听歌曲j的概率为:

根据志愿者i试听歌曲能力Ci,利用Order排序算子,找到志愿者i试听歌曲概率从大到小前Ci首歌曲,即:

阶段2:决定是否下载试听歌曲。

志愿者i的个人偏好εi由市场品位差异μ和歌曲j的质量qi共同影响,利用随机值ri进行扰动,得到志愿者i对歌曲j的个人偏好程度。

如果志愿者i对歌曲j的个人偏好程度εi,j,达到下载阈值ti,该歌曲即被下载一次,反之则不被下载,可以表示为:

至此,建立了互联网文化市场中歌曲下载行为的仿真模型,接下来建立互联网文化市场中网络水军灌水实验模型。

歌曲j的胜出概率θi,α,表示在一次仿真实验中,网络水军对歌曲j集中下载α次(即灌水量为α),重复仿真实验x次,歌曲j在n首歌曲中下载次数排名达到前y名(即胜出)的概率。首先,利用Order排序算子对歌曲j的下载次数从高到低进行排名,歌曲j在灌水量为α的排名次序为:

利用πj,α判断歌曲j下载次数排名是否达到前y名,即:

仿真实验进行x次的胜出概率为:

3.模型评价指标及主要参数

在Salganik等的现场实验中,用基尼系数G衡量互联网文化市场的不均衡性[3],计算公式为:

其中,∂i表示歌曲i的地位,即歌曲i市场下载份示第i首歌曲的下载次数,n表示市场中歌曲的数量。

一个歌曲市场的不可预测性U表示为:

其中,U表示一个歌曲市场的不可预测性,n表示市场中歌曲的数量,ui表示一首歌曲i在影响条件相同下不同组(组或子集)中地位的平均差异,可以表示为:

其中,∂i,j表示歌曲i在组j的市场下载份额,W表示组的数量。

模型中主要参数值及含义如表1所示。其中,n、p、l、t的参数值是对现场实验提供的数据进行统计分析得到的。s、μ的参数值选取是由于基尼系数随s的增大而单调递增、随μ的增大而单调递减,根据现场实验的基尼系数计算得到的。x、y的参数值是本文根据灌水实验设定的。由于本文将无社会影响条件作为对照,所以在无社会影响条件下实验一与实验二参数一致。

表1 模型中的主要参数值

三、仿真模型有效性实验

建立仿真模型后,通过与现场实验结果进行对比分析,验证仿真模型的有效性。本文从互联网文化市场中的不均衡性和不可预测性两个方面具体分析,互联网文化市场中的不均衡性采用基尼系数G衡量,实验结果如图3所示。比较仿真模型和现场实验中互联网文化市场的不可预测性U,结果如图4所示。

图3 不同社会影响力对互联网文化市场基尼系数的影响

图4 不同社会影响力对互联网文化市场不可预测性的影响

通过图3与图4实验结果可以看到,仿真模型与现场实验拟合度很高,说明本文的仿真模型拟合效果良好。

四、网络水军灌水效果实验

1.不同社会影响力的灌水效果

当网络水军在灌水时刻T=0,歌曲质量q随机的条件下,对互联网文化市场中的歌曲进行灌水,灌水量α从1增长至100,每个灌水量α对应实验100次,被灌水歌曲的胜出概率θ如图5所示。从图5可知,随着灌水量α的不断增多,两组实验胜出概率θ随之升高。当灌水量α达到35,两组实验的被灌水歌曲均胜出,可见网络水军的参与使得文化市场胜出的预测成为可能。

图5 互联网文化市场被灌水歌曲胜出概率

社会影响力在本实验中具体表示为歌曲排名对参与者选择试听歌曲的影响力。社会影响力越大,表示参与者对歌曲排名越信赖,越容易选择试听胜出歌曲,也就越容易受到灌水的影响。因此,在初始阶段,实验一的仿真参与者受到灌水影响小,所以被灌水歌曲胜出概率低于实验二。最终实验一先于实验二达到百分之百胜出,这是由于实验二的市场不可预测性大。所以,互联网文化市场的社会影响力越大,市场的不可预测性越大。

2.不同灌水时间的灌水效果

如果网络水军在歌曲质量q随机,灌水时刻T不同的条件下,在两组实验中对文化市场中的一首歌曲进行灌水,灌水量α从1增长至100,每个灌水量α对应实验100次,被灌水歌曲的胜出概率θ如图6所示。图6显示,T越小,即灌水时间越早,同样灌水量的被灌水歌曲胜出概率越大,且实验二中不同T曲线差异更大,即社会影响力越大,灌水时间对胜出概率的影响越明显。

图6 互联网文化市场灌水效果受灌水时刻影响

3.不同歌曲质量的灌水效果

如果网络水军在灌水时刻T=0,歌曲质量q不同的条件下,在两组实验中对文化市场中的一首歌曲进行灌水,灌水量α从1增长至100,每个灌水量α对应实验100次,则被灌水歌曲的胜出概率θ的数据结果如图7所示。

图7 互联网文化市场灌水效果受歌曲质量影响(含灌水)

图7显示,在两组实验中,歌曲质量q即排名越高,完全胜出所需的灌水量越少。当歌曲质量最差,即q=48时,对两组实验灌水量α=10,该歌曲才有可能胜出,且胜出概率θ极低;对两组实验灌水量α=40,歌曲可以完全胜出。这表明当歌曲质量很差时,对该歌曲进行少量灌水,是不能达到胜出效果的;而对该歌曲进行大量灌水时,该歌曲虽然可以胜出,但其中包含大量灌水,就没有达到网络水军快速有效的操控网民意识的作用。

在现实网络文化市场中,灌水量是不会被删除的。为了分析灌水之后,下载次数中有多少是网民的下载量,本研究在灌水影响网民之后再减去灌水量α的胜出概率θ得到图8。从图8中可以看出,在互联网文化市场中,灌水效果也是由商品质量决定的,商品质量太差,那么即使灌水再多,效果也不好。也证明了在互联网文化市场中,质量好的商品,胜出概率不会很低,质量差的商品,胜出概率很难很高,而商品质量一般的, 则难以预测。

图8 互联网文化市场灌水效果受歌曲质量影响(不含灌水)

五、结 论

本研究得出以下结论:(1)网络水军的参与使得网络歌曲胜出的预测成为可能,网络水军的灌水量越大,网络歌曲的胜出概率越大。(2)互联网文化市场的社会影响力越大,歌曲排名受网络水军的影响越明显。(3)网络水军灌水时间越早,被灌水歌曲胜出概率越大,并且社会影响力越大,灌水时间对胜出概率的影响越明显。(4)被灌水歌曲质量越高,其胜出概率越大;如果被灌水歌曲质量过低,即使灌水再多,也不能控制网民意识,达到营销目的。

网络水军蓄意操控网民意识的能力是不可忽视的,将影响互联网市场的正常运营秩序。在未来的互联网文化市场监管中,应采取有效措施防范治理网络水军灌水这一不正当营销行为。

[1]GHOSE A,IPEIROTIS P G.Designing novel review ranking systems:predicting the usefulness and impact of reviews[A].ACM.Proceedings of the Ninth International Conference on Electronic Commerce[C].Minneapolis:ACM Press,2007.19-22.

[2]LIM K P.Ranking market efficiency for stock markets:a nonlinear perspective[J].Physica A:Statistical Mechanics and its Applications,2007,376:445-454.

[3]SALGANIK M J,DODDS P S,WATTS D J.Experimental study of inequality and unpredictability in an artificial cultural market[J].Science,2006,311(5762):854-856.

[4]MUCHNIK L,ARAL S,TAYLOR S J.Social influence bias:a randomized experiment[J].Science,2013,341(6146):647-651.

[5]CLAUSET A,SHALIZI C R,NEWMAN M E J.Powerlaw distributions in empirical data[J].SIAM Review,2009,51(4):661-703.

[6]大卫·伊斯利,乔恩·克莱因伯格.网络、群体与市场[M].李晓明,王卫红,杨韫利译.北京:清华大学出版社,2011.30.

[7]谭真.“网络水军”百害无一利[N].光明日报,2012-12-31(14).

[8]王爱玲.网络媒介下提升中国主流意识形态吸引力分析[J].大 连 理 工 大 学 学 报 (社 会 科 学 版),2013,34(4):103-107.

[9]TANG J,SUN J,WANG C,et al.Social influence analysis in large-scale networks[A].ACM.Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining[C].New York:ACM Press,2009.807-816.

[10]DAVIS C J,BOWERS J S,MEMON A.Social influence in televised election debates:apotential distortion of democracy[J].Plos One,2011,6(3):1-7.

[11]CHEUNG C M K,LEE M K O.A theoretical model of intentional social action in online social networks[J].Decision Support Systems,2010,49(1):24-30.

[12]CAO W Y.Explore the role of QQ groups in Chinese tuishou operations[D].Macau:University of Macau,2011.

[13]CHEN C,WU K,SRINIVASAN V,et al.Battling the internet water army:detection of hidden paid posters[EB/OL].http://arxiv.org/abs/1111.4297Ⅴ1,2013-07-05.

猜你喜欢
水军灌水影响力
番茄灌水掌握技巧
冬季棚菜灌水四关键
天才影响力
资深“水军”揭秘行业潜规则
网络水军
黄艳:最深远的影响力
水军
灌水秘笈
3.15消协三十年十大影响力事件
传媒不可估量的影响力