李张强 王海瑞 毕贵红
(1.昆明理工大学信息工程与自动化学院 昆明 650500)(2.昆明理工大学电力工程学院 昆明 650500)
基于AGENT动态加权无标度网络的双语竞争模型*
李张强1王海瑞1毕贵红2
(1.昆明理工大学信息工程与自动化学院昆明650500)(2.昆明理工大学电力工程学院昆明650500)
摘要近年来,濒危语言的灭亡速度越来越快,为了寻求濒危语言的保护措施,提出了以同一区域内的双语竞争为研究对象,利用基于agent的无标度网络构建接近实际的语言网络模型。模型以agent为网络节点生成无标度网络,agent的language等于1、2、3分别表示单语1 agent、单语2 agent和双语3 agent。语言网络通过agent之间的短期连接、长期连接、无连接三种关系之间的演化维持网络的动态特性,语言之间的传播竞争只存在于有连接的agent之间,语言的传播竞争分为语言学习和语言遗忘,引入了语言地位S1、S2和agent语言密度σ之间的乘积作为语言学习和语言遗忘的概率。仿真结果表明,提高弱势语言的地位、降低语言网络中agent个体的度和降低语言网络的动态性保证语言网络的稳定性,更有利于保护弱势语言。
关键词agent; 语言竞争; 动态网络; 无标度网络
Class NumberO157.5
1引言
语言是人类相互交流和沟通的工具,也是人类了解自己历史、文化、文明的工具。通过几千年历史文化的演变,到目前为止世界上已经累积了近6000种语言。然而在全球范围内,已经有超过750种语言灭绝,还有许多语言也只有少数的使用者[1]。据统计在今后的大约一个世纪中,目前世界上尚在使用的6000余种语言中,有一半左右将不再使用,也就是说,3000种或更多一点的语言在21世纪中将不复存在。为了保护这些濒危语言,有必要对语言传播、竞争、调控的机理和动力学特性进行深入研究,以揭示语言衰退、消亡和共存的原因,进而寻求濒危语言保护和干预措施。
人工社会[2]是一种研究社会科学的新方法,其基本思路是:人类社会是由大量的个体组成的复杂系统,因而可以在计算机中建立每个人的个体模型,这样计算机中的人类模型成为agent,然后让这些agent遵循一定的规则相互作用,最后通过观察这些agent整体的涌现属性找到人工社会的某些规律,并通过这些规律解释和理解人工社会中的宏观规律。语言作为人类社会的产物,当然也可以采用基于agent的人工社会仿真来研究语言在人工社会中传播竞争的机理。
2003年Abrams和Strogatz[3]在Nature上发表的论文提出了一个简单的确定性系统动力学方程(AS模型),用以描述在人群中两种语言竞争引起的语言使用模式变化情况。模型预测两种语言对使用者的竞争最终将导致一种语言的消亡,哪一种语言消亡取决于说话者在人群中的初始比例和它们的相对状态。Patriarca和Leppänen[4]扩展了AS模型,模型考虑了语言传播受到说话者扩散的影响因素,并在AS模型中引入了空间依赖关系,并扩展为扩散-反应方程。Pinasco和Romanelli[5]扩展了AS模型,模型描述了两种语言在同一竞争区域共存的机理,模型中引入了一个附加的Logistic人口增长变量。Kandler和Steele[6]在Pinasco-Romanelli方法的基础上将人口增长和空间扩散的人口学因素包含进反应-扩散系统中,同时考虑了两种语言的不同社会地位。Mira和Paredes[7]对AS模型作了存在双语者的扩展,模型中两种语言可部分相互理解,允许单语言者转变为双语言者。
社会人群结构是一种复杂网络,社会网络与人们的日常行为和个体之间的关系有密切联系,所以要构造一个真实的社会网络是非常困难的,为了生成一些在某些方面符合现实社会的网络特征的理想网络,研究者提出了小世界网络、无标度网络等,通过这些理想网络对语言传播与竞争进行研究,间接了解社会网络的结构特征。小世界网络具有高聚类系数和短平均路径的特征,其度分布接近幂律分布或者指数分布,而不是泊松分布和均匀分布。经典的无标度网络是一种增长网络模型,网络生成较慢,且该网络的聚类系数随着网络尺度的增大而迅速减小。
基于以上的考虑,本文提出了一个快速生成的无标度网络模型来对双语的传播竞争进行研究仿真。生成的网络其度分布服从指数可调的幂律分布,同时,将网络节点之间的关系分为长期连接、短期连接和无连接,通过网络个体之间三种关系的动态演化仿真现实社会网络中人与人之间关系的动态变化性。在双语传播和竞争上借鉴Castelló[8]在双语和社会结构对语言竞争动态的影响模型中提出的个体之间语言传播模型和V.Schwämmle[9]提出agent有性别差异的语言竞争仿真模型,来研究现实社会网络下语言的传播竞争和濒危语言的保护问题。在语言网络中,用整数1、2、3分别来表示单语1、单语2、双语3,在动态网络中,双语的传播竞争取决于该语言的语言地位以及agent网络邻居中的语言人口密度。
2基于配置模型的无标度网络模型
2.1基于配置模型的无标度网络生成
现实人工社会网络具有无标度特性,度分布服从幂律分布。幂律度分布形式如式(1)所示,其中pk表示度为k节点的概率,2≤λ≤3。
(1)
基于配置模型的无标度网络[10]生成算法如下:
1) 在二维仿真空间,生成N个节点,并给定语言网络中最大的度kmax,幂律分布指数λ和度为0的节点概率p0。
3) 构建无标度网络,将在2)步中求得的幂律分布系数C代入式(1),分别求出网络中不同度节点的概率pk(1≤k≤kmax,k∈N),从而可以求出度为k的节点个数Nk=N×pk,分别给网络中的每个节点分配度D=[k1,k2,…,kN1],构建网络节点数组Array,比如第一个节点n1度为k1,那么就将k1个n1放入Array数组中,以此类推,得到Array数组如下所示:
生成无标度网络时,每次从Array数组中选取两个节点ni和nj,如果ni≠nj并且节点ni和nj之间不存在边,则这两个节点建立连接边Eij,并确定边的状态,初始化边的维持时间为0,删除数组Array中ni、nj节点各一个,重复从数组中取出节点生成新的边,直到不能生成新的边为止,因为网络的动态变化特性,每次仿真都要更新Array数组,所以每次仿真结束后都要重新更新网络。
2.2语言网络动态演化
双语传播竞争网络是属于人工社会关系网络中的一种动态网络,为了保证网络的动态性,参照现实社会网络中人与人交往的情况,将双语竞争传播网络之中agent之间的关系分为三种即:偶然的短期连接、固定的长期连接以及无连接。agent之间的关系会随着时间的变化在这三种关系中变化。短期连接是指语言网络中个体之间的偶然联系,一般连接的时间比较短,比如现实社会网络中陌生人之间的接触;而长期连接是指语言网络中个体之间的固定连接,一般连接的时间较长,比如现实社会网络中朋友或者亲人之间的连接;无连接就是个体之间不存在连接边。同时,陌生人有可能变成朋友,朋友或者亲人也可能因为某些原因变成陌生人,所以短期连接有可能变成长期连接,而长期连接也有可能变成短期连接,短期连接也有可能变成无连接。agent之间的三种关系变化如图1所示。在生成的初始网络中,将网络中50%的连接定义为短期连接,50%的连接定义为长期连接。当网络中的两个节点建立连接,那么连接有可能是短期连接或者长期连接。当连接是短期连接时,判断连接的维持时间是否达到短期连接变成长期连接的时间定义,是则变成长期连接,否则以一定的概率断开连接并将这两个节点放入Array或者继续维持短期连接;当连接是长期连接时,以一定的概率变成短期连接,否则继续维持长期连接。每一个仿真周期结束后,当Array中的节点个数大于等于2时,将Array数组中的agent按照生成网络的算法重新生成连接加入网络中。
图1 节点之间关系转化图
仿真时定义一个属性style表示连接类型,style=0表示连接为短期连接,style=1表示连接为长期连接。在Netlogo[11]仿真软件中,黄色边表示短期连接,灰色边表示长期连接。
3agent动态语言网络模型
3.1Castelló复杂agent网络语言竞争模型
(2)
(3)
式(2)给出agenti从一种单语(A或B)变成双语AB的概率;式(3)反映agenti从双语到单语的转换概率。公式中sA和sB表示单语A和单语B的语言地位,在一个拥有两种语言的社会中sA+sB=1。公式同时表明,两种单语间的转换需要通过双语AB过渡。语言之间的转换概率由语言地位和邻域中某种语言的人口密度共同决定。
3.2agent动态加权无标度双语竞争模型
Castelló[8]模型是在静态网络上实现的,和语言网络的动态特性有着较大的差异,所以本文在借鉴的基础上提出了动态加权无标度网络双语竞争模型。
在动态加权无标度网络双语竞争模型中,将语言定义为agent的属性用变量language表示,当agent的属性language=1时,表示agent为语言1的使用者;language=2时,表示agent是语言2的使用者;language=3时,表示agent是双语者,既能使用语言1也能使用语言2。模型初始时只有单语者1和单语者2,模型中的节点数量代表仿真世界的总人口,其中节点的不同形状代表使用不同语言的个体。
动态加权无标度网络双语竞争模型中的agent受到与它连接的其它agent的影响,而按一定的概率改变其语言状态行为称之为语言的传播竞争,例如一个单语1个体agenti的网络邻居中使用单语2的agent比较多,那么单语1个体agenti为了交流的方便,就有一定概率学习单语2从而变成双语3个体agenti,而随着agenti个体使用单语1越来越少,agenti有一定的概率遗忘单语1,从而成为一使用个单语2的agent,这就是语言的传播竞争,可以将其分为语言学习和语言遗忘两个过程,单语者学习另外一种单语变成双语者,即1/2→3,称为语言学习;同理双语者遗忘一种单语变成单语者,即3→1/2,称为语言遗忘,双语3为agent语言变化的中间状态,如图2所示,为语言传播竞争模型。
图2 语言传播竞争模型
从图2中可以看出决定agent是否进行语言学习和语言遗忘为概率P1→3、P2→3和P3→1、P3→2,仿真时判断一个agent是否进行语言学习或者语言遗忘,是通过编程产生一个0~1之间的随机浮点数和P3→2、P2→3、P3→1、P3→2的对比结果决定。当P3→2、P2→3、P3→1、P3→2大于随机产生的随机浮点数时,agent进行语言学习或语言遗忘,P3→2、P2→3、P3→1、P3→2的计算公式如下:
P1→3=S2×σ2P2→3=S1×σ1
(4)
P3→2=S2×(σ2+σ3)P3→1=S1×(σ1+σ3)
(5)
式(4)、(5)中σ表示agent和其网络邻居之间的语言人口密度,σ的计算引入了带权连接的概念。语言网络的动态演化中,将个体与个体之间的关系分为三种短期连接、长期连接、无连接,无连接的个体之间不存在语言的传播和竞争,语言的传播和竞争只存在有连接的agent个体之间,考虑agent之间的连接关系,通过短期连接的agent个体之间和通过长期连接的agent个体之间的语言传播和竞争应该存在差异,所以引入了带权连接,即将长期连接的边权值设置为4,短期连接的边权值设置为1,用权值的差异表征短期连接和长期连接在语言传播和竞争中的差异,这种差异表现在网络中agent的σ计算过程中。
设agenti的网络邻居中有N1个agent个体通过长期连接与agenti连接、N2个agent个体通过短期连接与agenti连接,N1个长期连接的agent中单语1个体为n11个、单语2个体为n12个、双语3个体为n13个;N2个短期连接的agent中单语1个体为n21个、单语2个体为n22个、双语3个体为n23个,则有:
σ1=(n11×4+n21)/(N1×4+N2)
(6)
σ2=(n12×4+n22)/(N1×4+N2)
(7)
σ3=(n13×4+n23)/(N1×4+N2)
(8)
语言传播竞争模型的特点如下: 1) agent个体语言状态改变受它的语言地位和其网络邻居agent的影响; 2) 语言的学习只发生在单语者身上,语言的遗忘只发生在双语者身上,双语3是传播竞争的中间状态; 3) 语言的传播竞争只发生在有连接的agent之间。
4仿真结果分析
本文使用了基于agent的开发工具Netlogo[11]作为仿真软件,仿真参数初始值及其描述如表1所示。
表1 仿真参数初始值及其描述
4.1语言地位对语言传播竞争的影响
如图3所示为仿真参数为初始值时和改变S1、S2值都为0.5时,仿真进程中各个时间的语言人口对比图。初始时候S1=0.6,S2=0.4,从图4可以看出,单语1人口比例迅速增加,单语2人口比例迅速减少,并且在450步左右,单语2灭亡,随着单语2的灭亡中间状态双语3也随之灭亡。改变语言地位S1=S2=0.5后,单语1和单语2的人口比例随着仿真的进行大致相当,两种语言的人口比例都在0.5附近波动,而中间状态双语3始终都是少数,但是因为单语1和单语2一直存在所以双语3也一直存在,可以看出语言地位对语言的生存有着至关重要的作用。比如,新中国成立以来,国家推行汉语普通话,汉语普通话在全国范围内的地位大大提高,随之而来的是其它非汉语语言使用人数的大大减少,可以预见按照目前的趋势若干年之后将会有一些语言的灭亡。
4.2网络幂律分布指数λ对语言传播竞争的影响
如图4所示,为初始λ=2和改变λ的值至λ=3节点度分布图,可以看出当λ=3时网络中节点的度基本都小于5,度为1或者2的节点占了绝大部分;当λ=2时节点的度分布相较而言更加均匀。对比图5初始λ=2和改变λ的值为λ=3语言人口比例图,增加λ=3之后单语1的增加速度和单语2的减少速度都减小了,而双语3的人口比例波动基本一样,说明网络的度分布对语言传播竞争有影响,当语言网络中节点度相对较小时,表现在社会网络存在更多小社交圈子的个体时,更有利于网络中弱势语言的生存。
图3 改变语言地位语言人口比例对比图
图4 λ=3和λ=2节点度分布图
图5 改变λ语言人口比例图
4.3PdieLink0对语言传播竞争的影响
PdieLink0表示短期连接变成无连接的概率,如图6所示为初始时候PdieLink0=0.5和改变PdieLink0=0.8后的语言人口比例图。图中可以看出对比初始时候PdieLink0=0.8强势语言单语1的人口比例增加速率大大增强,弱势语言单语2的人口比例减少速率也增强了,并且弱势语言单语2在300步左右灭亡,而初始PdieLink0=0.5时弱势语言单语2在450步左右才灭亡。网络提高PdieLink0的作用是短期连接变成无连接的概率变大,即语言网络的动态变化增强,表现在社会网络中就是网络中流动人口和流动性增强,这种情况下是不利于保护弱势语言的。
图6 改变PdieLink0语言人口比例图
5结语
将基于agent仿真和复杂动态网络结合起来,利用社会网络的无标度、动态演化、长期连接、短期连接等特性,生成动态加权无标度网络双语竞争模型研究在杂居环境下双语之间的传播竞争,在网络中利用双语3作为语言传播竞争的中间状态实现agent学习和遗忘语言的过程,从而达到agent语言从一种单语到另一种单语的变化过程。在双语网络中考虑语言地位、网络的幂律分布指数以及短期连接变成无连接的概率对语言传播竞争的影响。模型的仿真结果得到一些有利于保护濒危语言的结论:提高一个区域内弱势语言的语言地位有利于保护弱势语言,并且如果一个区域内两种语言的语言地位相当那么这两种语言就能很好的共存;提高语言网络幂律分布指数λ即社会网络存在更多小社交圈子的个体更有利于网络中弱势语言的生存;减小PdieLink0更有利于语言网络中弱势语言保护,现实中可以适当减小社会网络人口流动性,保证社会网络的稳定性。
参 考 文 献
[1] 徐世璇.濒危语言研究[M].北京:中央民族大学出版社,2001:1-10.
XU Shixuan. The study of endangered languages[M]. Beijing: Minzu University of China Press,2001:1-10.
[2] 张江,李学伟.人工社会——基于Agent的社会学仿真[J].系统工程,2005,1:13-20.
ZHANG Jiang, LI Xuewei. Artificial society — Agent based social simulation[J]. Systems Engineering,2005,1:13-20.
[3] Abrams D M, Strogatz S H. Modeling the dynamics of language death[J]. Nature,2003,424:900.
[5] PINASCO J P, ROMANELLI L. Coexistence of language is possible[J]. Physica A: Statistical Mechanics and its Applications,2006,361(1):355-360.
[6] KANDLER A, STEELE J. Ecological models of language competition[J]. Journal of Biological Theory,2008,3(2):164-173.
[7] MIRA J, PAREDES A. Interlinguistic similarity and language death dynamics[J]. Europhysics Letters,2005,69(6):1031-1034.
[8] Xavier Castelló, Víctor M. Eguíluz ,Maxi San Miguel. Dynamics of language competition: effects of bilingualism and social structure[J]. New Journal of Physics,2006,8(12):308-322
[9] V. Schwämmle. Simulation for competition of languages with an ageing sexual population[J]. International Journal of Modern Physics C,2005,16(10):1519-1526.
[10] 何晓利,王海瑞,毕贵红.HIV传播度-度相关动态分层无标度网络生成算法及仿真分析[J].系统仿真学报,2014,2:279-288,293.
HE Xiaoli, WANG Hairui, BI Guihong. HIV Degree-degree Correlation Hierarchical Scale-free Dynamic Network Configuration Model and Simulation Analysis[J]. 2014,2:279-288,293.
[11] WILENSKY U. (1999) NetLogo. Center for Connected Learning and Computer-Based Modeling, Northwestern University, Evanston, IL, USA. [Z/OL]. (2012) [2012]. http://ccl.northwestern.edu/netlogo/.
Two Language Competition Model with Dynamic Weighted Scale-free Network Based on Agent
LI Zhangqiang1WANG Hairui1BI Guihong2
(1. College of Information Engineering and Automation, Kunming University of Science and Technology, Kunming650500)(2. College of Electric Power Engineering, Kunming University of Science and Technology, Kunming650500)
AbstractThe extinction of endangered languages is rapidly increasing in recent years. Based on language competition in the same areaas the object of study, an agent-based scale-free network is proposed to build closer to the actual language of the social network to seek methods to protect endangered languages. The model uses agents as node to build scale-free network and defines language as an attribute of agent. There are monolingual1 agents, monolingual 2 agents and bilingual 3 agents in the model. The network keeps its dynamicity by the evolution of three relations that long-term linking, short-term linking and no linking between agents. The language competition includes language learning, language forgetting and it only existed in the agents which are linking. The probability of language learning and forgetting is equal to the product of language status (S1,S2) and density of agent language (σ). The simulations reveals that to improve the status of language, reduce the degree of agents and the dynamicity of the language of network are useful methods in protecting endangered languages.
Key Wordsagent, language competition, dynamic network, scale-free network
* 收稿日期:2015年11月20日,修回日期:2015年12月31日
作者简介:李张强,男,硕士研究生,研究方向:复杂网络建模和仿真。王海瑞,男,博士,教授,研究方向:智能控制。毕贵红,男,博士,教授,研究方向:社会和经济系统仿真。
中图分类号O157.5
DOI:10.3969/j.issn.1672-9722.2016.05.024