Android开源社区的人类行为动力学研究

2017-01-09 09:34罗伟平杨建梅

罗伟平+杨建梅

摘要:对于大众生产的人类行为动力学的研究还不多。本文基于Barabasi的任务优先权排队模型,研究Android开源社区的大众生产与沟通行为,发现加入后位优先权增加的机制或者中断机制的Barabasi优先权排队模型,更能解释该社区人类行为模式的生成机制。

关键词:开源社区;生产行为;沟通行为;人类行为动力学;任务优先权排队模型

中图分类号:文献标志码:A文章编号:1009-055X(2016)06-0047-05

doi:10.19366/j.cnki.1009-055X.2016.06.008

一、引言

人类行为是复杂的。对人类行为研究涵盖了心理学、社会学、人类学及统计学等诸多学科。[1]以往认为人的相邻两个行为的间隔时间服从指数分布。[3]因特网协议、路由器规则等都是以泊松过程为基础设计的。[4]然而近期的人类行为的数据显示,人的相邻两个行为的间隔时间并不服从泊松分布,而是服从长尾的幂律分布。2005年Barabasi提出了人类行为的幂律分布以及生成机制的任务优先权排队模型[5]开创了人类行为动力学研究的先河。随后Vazquez[6]等提出人类行为幂指数有1和1.5两个普适类。名人通信[7-8]、在线游戏[9]、电影点播[10]、打电话与发短信等人类行为的间隔时间的分布均显示出幂率现象。当然人类行为的时间间隔特性也存在其他分布的情况。[11-15]

学术界还进一步研究了人类行为幂率分布的生成机制。除了Barabasi的优先权排队模型外,还有自适应调节模型[16]、习惯模型[17]、记忆模型[20]、兴趣衰减模型[19-20]、截止时间模型[21,22]以及互动[23]模型等。

目前人类行为动力学的研究还较少涉及大众生产领域。[24]本文基于Barabasi的任务优先权排队模型,分析Android开源社区的大众生产与沟通行为,发现加入后位优先权增加或中断机制后的Barabasi模型更能解释该社区生产与沟通行为的生成机制。

二、Android社区大众生产与沟通行为的分析

(一)数据来源及处理

利用火车头(LocoyPlatform)数据采集平台,在googlecodehost的Android开源社区采集了16万多条生产行为的时间数据和28万多条沟通行为的时间数据。这里的生产行为定义为代码的修改和提交行为,沟通行为定义为发帖或评论帖子行为。

(二)生产行为的间隔时间分布

按照生产次数的多少筛选出排名前十位的生产者,分别对其生产的间隔时间分析如表1和图2所示。发现这些生产者的生产间隔时间服从幂律分布,幂指数在1.21与1.73之间,接近于Vazquez等提出的普适类指数1.5。

(三)沟通行为的间隔时间分布

同样取沟通次数最多的前十名沟通者进行沟通的间隔时间分析,如表2和图2所示,发现沟通的间隔时间同样服从幂律分布,幂指数在1.33与1.57之间,更接近Vazquez等提出的普适指数1.5。

综上,Android开源社区的生产和沟通行为的间隔时间均服从幂律分布,幂指数接近Vazquez等提出的普适类指数1.5。

三、生成机制研究

Barabasi的任务优先权排队模型假设优先权始终不变,而现实中有些后位任务的优先权会随着时间的推移而增加(这里称之为后位优先权增加机制)。此外,现实中往往也会出现紧急的任务打断优先权最高任务的处理(这里称为中断机制)。

下面在Barabasi优先权排队模型的基础上,分别加入后位优先权增加机制和中断机制来探讨Android开源社区的生产和沟通行为。

(一)加入后位优先权增加机制的仿真模型

加入后位优先权增加机制模型的具体做法是,在保持任务队列优先权基本模型各个参数不变的前提下,在每一个更新时点,给任务队列中比例为m(0

在m=1%、b为0.001,0.002,0.005,0.01的四种情形下,仿真出的生产与沟通行为的间隔时间均服从幂律分布,拟合优度均在0.92以上;四种情况对应的幂指数分别为1.7,1.5,1.4和1.2,与上文的实际间隔时间分布非常接近。值得注意的是,随着b的增加,幂指数不断减小;且b增加到一定程度后,时间间隔就不符合幂律分布了。如图3所示。

(二)加入中断机制的仿真模型

队列优先权基本模型中,在每一步任务执行方式中,Barabasi讨论了三种任务执行选择机制:先进先出,随机选择和优先权选择,他认为按照优先权选择最重要,因此在模型设定时,增加了参数p来描述每一步任务执行时按照优先权选择的概率,当p→1时,即表示完全按照优先权最高的方式来执行,当p→0时,即表示按照随机选择的方式来执行任务。考虑任务的执行方式选择中,基本模型或者按照一定概率的优先权来执行,或者按照随机的方式执行,围绕的原则仅有优先权和随机两种选择方式,最终的基本模型是以p→1时,即完全按照优先权最高的方式来执行,模型中并未考虑任务生成的时间先后顺序这一情形。

按照时间管理的概念,人的活动任务均会按照“轻重缓急”的程度分为四类,一般的做法是按照最重要的事情先处理,然后处理次重要的事情。但与现实中的情形更为接近的是,经常会出现一些突发的紧急事件,需要我们抛开当前认为最重要的事情,转而去处理该类紧急事情,也即最新发生的事情。从另一方面来说,生活中,并不是每个人都能很好地执行轻重缓急的时间管理概念。更多的情形是,人们会被当前刚发生的事情所打断,转而去处理最新发生的需要处理的事情,这一特点,更符合现实中的普通大众行为。因此为了让模型更加贴近现实情况,本文在基本模型的基础上,加入中断机制,以描述在优先权的任务执行方式中,偶尔会被最新出现的事情所打断,转而处理最新生成的任务。

仿真步骤如下:①设定优先任务被中断的概率Q。②按照均匀分布生成随机数作为概率q,当q>Q时,执行任务队列中的优先任务,当q

在Q=20%的情形下,仿真结果显示,加入中断机制的间隔时间符合幂指数为1.5的幂律分布,拟合优度达到0.97。如图4所示。同样也与上节的实证结果较一致。

四、结束语

本文分析了Android社区中的人类行为动力学模式,发现生产和沟通行为的间隔时间服从幂律分布,其幂指数接近于Vazquez等提出的普适类。同时也探讨了该社区人类行为的动力学机制,发现加入后位优先权增加机制或中断机制能较好地解释这些行为的生成机制。

参考文献:

[1]樊超,郭进利,韩筱璞,等.人类行为动力学研究综述[J].复杂系统与复杂性科学,2011(2):1-2.

[2]FELLERW.Anintroductiontoprobabilitytheoryanditsapplications[M].2rd,ed.NewYork:Wiley,1971.

[3]HAIGHTAK.Handbookofthepoissondistribution[M].NewYork:Wiley,1967.

[4]ANDERSONHR.Fixedbroadbandwirelesssystemdesign[M].NewYork:Wiley,2003.

[5]BARABASIAL.Theoriginofburstandheavytailsinhumandynamics[J].Nature,2005,435:207-211.

[6]VAZQUEZA,OLIVEIRAJG,DEZSOZ,etal.Modelingburstsandheavytailsinheavytailsinhumandynamics[J].PhysicalReviewE,2006,73(3):036127.

[7]OLIVEIRAJG,BARABASIAL.Humandynamics:darwinandeinsteincorrespondencepatterns[J].Nature,2005,437:1251-1253.

[8]LINannan,ZHOUTao.Empiricalanalysisontemporalstatisticsofhumancorrespondencepatterns[J].PhysicaA,2008,387:6391-6394.

[9]HENDERSONT,NHATTIS.Modelinguserbehaviorinnetworkedgames[C].Proc9thACMInternationalConferenceonMultimedia.NewYork:ACMPress,2001:212.

[10]ZHOUTao,KIETHAT,KIMB.J,etal.Roleofactivityinhumandynamics[J].Europhysicsletters,2008,82(2):28002.

[11]胡海波,王林.幂律分布研究简史[J].物理,2005(12):889-896.

[12]RABERTOM,SCALASE,MAINARDIF.Waiting-timesandreturnsinhighfrequencyfinancialdata:anempiricalstudy[J].PhysicaA,2002,314:749-755.

[13]QINW,JIN-LiG.Humandynamicsscalingcharacteristicsforaerialinboundlogisticsoperation[J].PhysicaA,2010,389:2127-2133.

[14]YEW,CHANGSZ,Jing-HuaXiao,etal.Evidenceforabimodaldistributioninhumancommunication[J].PNSA,2010,107(44):18803-18808.

[15]MAINARDIF,RABERTOM,GORENFLOR,etal.FractionalcalculusandcontinuoustimefinanceⅡ:thewaitingtimedistribution[J].PhysicaA,2000,287:4680481.

[16]韩筱璞,周涛,汪秉宏.基于自适应调节的人类动力学模型[J].复杂系统与复杂性科学,2007(4):1-5

[17]焦玉,刘衍珩,王健,等.基于习惯的人类动力学建模[J].科学通报,2010,(11):1070-1076

[18]VAZQUEZ.A.Impactofmemoryonhumandynamics[J].PhysicaA,2007,373:747-752.

[19]JINLG,CHAOF.Weblogpatternsandhumandynamicswithdecreasinginterest[J].TheEuropeanPhysicalJournalB,2010,1008:0042v3.

[20]郭进利.博客评论的人类行为动力学实证研究和建模[J].计算机应用研究,2011(4):1422-1433.

[21]邓竹君,张宁,李季明.截止时间对人类动力学模型的影响[M]∥郭进利,周涛,张宁,等.人类行为动力学模型.香港:上海系统科学出版社,2008:29-34.

[22]ALFIV,GABRIELLIA,PietroneroL.Howpeoplereacttoadeadlinetimedistributionofconferenceregistrationsandfeepayments[J].CentralEuropeanJournalofPhysics,2009,7(3):483-489.

[23]OLIVEIRAJG,VAZQUEZA.Impactofinteractionsonhumandynamics[J].PhysicaA,2009,(388):187-192.

[24]谢伟聪,杨建梅.维基百科贡献者中的人类动力学模式[J].科学学研究,2010,28(10):1054-1058.

Abstract:Toourbestofknowledge,therearefewresearchesfocusedonhumandynamicsofpeerproduction.BasedontheBarabasipriorityqueuemodel,thisessaydiscussesproductionandcommunicationbehaviorsinAndroidopensourcecommunity,findingthattheBarabasipriorityqueuemodelexpandedwithtailacceleratingorqueueinterruptionbetterexplainsthegenerativemechanismofhumanbehaviorsinthiscommunity.

Keywords:opensourcecommunity;productionbehaviors;communicationbehaviors;humandynamics;priorityqueuemodel

(责任编辑:潘江曼邓泽辉)