雷羽潇,段玉聪
海南大学计算机与网络空间安全学院,海南海口570228
近年来互联网社区飞跃发展,用户数量呈几何式增长.虚拟社区为用户提供了可双向交流的平台,不仅可以进行生活经验和体会的分享,还可以作为传统商业的延伸进行广告宣传、使用经验分享、商品售后服务等并形成虚拟品牌.虚拟品牌社区中的内容可分为官方生成内容(official-generated content,OGC)和用户生成内容(user-generated content,UGC).OGC 质量高但更新缓慢且成本高,UGC 更新快且成本低.对于用户而言,UGC 除了可以提供信息或娱乐的潜力外,其吸引力还在于能让用户看到不受媒体影响真实数据[1].因此,许多社区用户更愿意相信UGC 内容中关于商品和服务的数据、信息评价等[2].UGC 内容的展现形式多样且用途广泛,如图像类UGC 包括图像本身、用户发布图像的时间点、附带文案等.同一个UGC 内容可以从不同角度分析理解,用于自我演示和新闻传播等不同途径[3].Susarla等[4]发现虚拟社区的用户的社交互动对YouTube 视频内容受欢迎程度产生显著影响.Daugherty等[5]则通过分析证实了用户动机和UGC 内容产出之间存在因果关系,同时表示用户态度是使用和创建UGC 时重要因素.已有研究表明虚拟社区中的自我防御等用户态度对用户创建UGC 产生了较大影响[6].
本文研究如何通过信息技术手段来影响虚拟社区中用户的态度,将社区中潜在的UGC 生成用户转变为活跃UGC 生成用户.在虚拟社区中,用户的任何行为都将留下“电子痕迹”,“电子痕迹”具有反映用户自身的性格与行为习惯的潜力,可将这些痕迹映射到数据、信息与知识(data information knowledge wisdom,DIKW)的多模态资源层面,本文使用类型化的DIKW 图谱对虚拟品牌社区中的用户痕迹内容进行建模,进而依据不同用户对不同DIKW 具体形态表达的相同内容的偏好与使用习惯差异等蕴含了个体内容储备和处理效率的不对称性差异将不同性格和行为习惯的用户进行分类和性格引导.DIKW 图谱是处理类型化的资源多层体系结构,分为数据图谱、信息图谱、知识图谱、智慧图谱4 个部分[8],可用于优化存储、传输与计算一体化的处理效率[9],也可用于隐私数据保护[10].本文借助DIKW 框架的元模型[11]对相关场景进行形式化表达,并结合自我建构理论[12]对用户按独立自我型用户与互依型用户进行划分,按照自我决定理论[13]中自我的3 种心理需求,根据用户的性格类型和个性偏好设计了不同的用户性格类型转换方法.
虚拟品牌社区用户之间存在差异,因而针对具有不同个性的用户应设计针对性的营销策略,鼓励用户与他人互动并促进UGC 的产生.本文中引入类型化资源分类和自我建构理论和自我决定理论,根据不同个性用户的不同需求对社区中的用户进行分类,方便以不同的方式进行营销.
虚拟社区是网络用户用于分享知识和信息,与有相同爱好或需求的人交流的平台.而用户在虚拟社区上留下的“痕迹内容”能够反映用户自身性格和兴趣偏好,这些“痕迹内容”统称为用户类型资源(TRDIK).本文用以“Human”和“Existence”两个概念为核心的数据、信息、知识和智慧框架UML 元模型[14],将TRDIK分类为DataDIK、InformationDIK、KnowledgeDIK三种类型并完成三者间的转换,进而构建用户的DIKW 图谱.如图1所示,用户在虚拟社区中留下的“痕迹内容”包括用户的基本属性和行为记录,通过观察“痕迹内容”可得到用户相关的类型资源(TRDIK),对TRDIK概念化评估处理,根据条件不同分为DataDIK和InformationDIK存储到DIKW 图谱中.同时DIKW 图谱中的TRDIK可代入Transition 模块中进行转换,所得结果可补充存储至DIKW 图谱中.
图1 用户类型资源的分类与转换Figure 1 Flow chart of personality classification and conversion method
1)Existence
虚拟社区中的确认与用户相关联的TRDIK内容,可按客观存在和概念存在两种类型划分.客观存在可用逻辑语言“True/False”回答,概念存在则与人的主观评价“Yes/No”相关,nonexistence 则为Existence 的否定语义项.
2)Nonexistence
Nonexistence 是以否定语义存在的TRDIK类资源,存在着几种不同情况,包括空项“Null”和经过在一段时间后消失或改变从而导致客观上前后不一致的客观存在Inconsistobjective,如式(2)所示.“Null”不仅包括空的概念,还包括未知但实际上存在的事物,如式(3)所示.
类型化资源TRDIK,可分为DataDIK、InformationDIK、KnowledgeDIK,在本文中以人类为主体核心展开.
1)DataDIK
由直接观察得到的离散元素,在没有上下文的情况下不具有任何意义,不与人类的某个特定目的相关联.DataDIK表达单个实体的属性内容,最简单的表达形式为“is_a”.Ex(IS(a))表示实体X具有的属性(a).
2)InformationDIK
记录人类的行为,用于挖掘、分析、表达两个实体之间的交互关系,实体既可以是另一个人,也可以是客观存在的事物.InformationDIK与人类的某个特定目的相关,透过目的去推断两个实体之间的关系,InformationDIK最简单的表达形式为“has_a”.用R(E1,E2)表示实体E1和E2之间的关系,如式(4)所示.
3)KnowledgeDIK
由DataDIK和InformationDIK经过结构化形式化的推导演绎获得,在InformationDIK的基础上对实体关系的进一步的完善,InformationDIK表示个体层面,单个实体与单个实体之间的关系.KnowledgeDIK在InformationDIK的基础上对实体关系进行了抽象化的归纳总结.如式(5)中,函数Type 将实体E类别化,函数ReverseType 将类型Class 实体化,Class1表示实体E1的所属类别.KnowledgeDIK可表示单个实体与某一类型事物,或是两种类型事物之间的语义关系.如式(6)所示,K1表示类别Class1和类别Class2之间的语义关系“A1”.K2表示类别Class1和实体E2之间的语义关系“A2”,K3表示类别Class1和实体E1之间存在从属关系.
Class 由多个下属类别viceClass 组成,viceClass 与Class 之间存在继承关系.如式(7)所示,Class 为viceClass 的父类,viceClass 为Class 的子类,实体E既是viceClass 的子类,也是Class 的子类.一般情况下,子类继承父类的属性与关系,Classx(IS(a))同一类别Class 事物共同拥有的属性a.
TRDIK的概念化是指将TRDIK映射到现有已知的概念.当观察到一个新事物(Thingnew),首先将Thingnew与现存已知的具有具体标签事物的DIKW 资源进行相同性评估,若相同性评估结果为肯定,则将Thingnew映射至现有概念Conceptexist;若评估结果为否定,则由函数CreateID 为Thingnew创建一个新的概念Conceptnew,并将Thingnew与Conceptnew联系起来.如式(8)所示,Thingexist表示已存在的事物或概念.
在相同性评估中,若Thingnew与某一项Thingexist评估结果为否定,则Thingnew为该Thingexist的否定语义项,二者之间的关系R(Thingexist,Thingnew)属于Thingexist的Nonexistence 类InformationDIK资源,如式(9)所示.
在特殊的情况下,实体E没有完全继承Class 的属性和关系,但E仍属于Class 的子类,是类别Class 中特殊的子类实体.如式(10)所示,ThingSpecial表示类别Class 中未继承父类某一种属性a 的子类实体.
数据、信息和知识三者之间可以相互转换,生成新的数据、信息和知识.
1)DataDIK→DataDIK
DataDIK之间的转换既可以在单个实体之间实现也可以跨实体实现,且单个实体和多个实体结合均能够转换,如式(11)所示.
如式(12)中,从一个人的出生年月日可计算得到他的年龄,从一周中每天的数据可得到一周内的平均数据,从班级中每个人的成绩可计算得到全班的平均成绩.
2)DataDIK→InformationDIK
若DataDIK的产生与人类的行为目的相关,则DataDIK与一个或多个特定的目的之间存在联系.DataDIK与人类目的联系可反映出人类行为的动机或是人类与另一个实体之间的关系InformationDIK.该实体可以是一人或多人,也可以是物或物体的组合.InformationDIK并不仅仅与现有已存在DataDIK关联,Nonexistence 类DataDIK作为否定语义存在,与人类目的相联系将表示实体之间的否定关系,生成Nonexistence 类InformationDIK.
例如,一名男子拥有一束玫瑰花,他将这朵玫瑰花递给了一名女子.若不清楚这名男子行为背后的目的,将无法确定这名男子与该女子之间的关系.如式(14)所示,若这名男子的目的是求爱,则二者是男女之间的恋人关系;若该男子的目的是售卖,则二者是商家和顾客之间的商业交易关系.
Nonexistence 类DataDIK资源也可以转换为InformationDIK,如式(15)所示,从病人前后不一致的体温症状中可得知病人体温已恢复正常状态
3)DataDIK→KnowledgeDIK
通过统计学的原理,DataDIK可直接转换为KnowledgeDIK.当DataDIK的规模达到一定程度时可推理生成KnowledgeDIK,表达事物的总体的发展或变化趋势,预测实体下一步的行为表现.例如,根据往年气温曲线能够预测出今年夏天最高温度出现的时间范围,如式(16)所示.
3)InformationDIK→DataDIK
DataDIK与特定的目的结合可以得到InformationDIK,将InformationDIK与目的剥离则能够生成与实体相关的属性DataDIK,如式(17)所示.
InformationDIK中记录了实体的行为,统计实体各个行为的频率Bfreq可得到与实体有关新的DataDIK,如式(18)所示.
5)InformationDIK→InformationDIK
InformationDIK之间能够互相转换,可以由InformationDIK和DataDIK结合转换生成InformationDIK,也可以由InformationDIK和InformationDIK结合转换生成新的InformationDIK.
6)InformationDIK→KnowledgeDIK
将InformationDIK的内容经过抽象化的分析归纳,可得到KnowledgeDIK如下:
实体的行为能够反映出其偏好,若仅从单一行为推理会产生很大的误差,将表示行为的InformationDIK与表示行为频率的DataDIK结合,可推理出实体的行为习惯和偏爱的事物.如式(21)所示,在一名女孩吃的苹果、草莓、葡萄几种水果中,葡萄出现的频率最高,可知该女孩相比其他水果更偏爱葡萄.
7)KnowledgeDIK→DataDIK
从KnowledgeDIK转换到DataDIK有两种方法,一是从由DataDIK推导而来的KnowledgeDIK反推得到DataDIK;二是从现有已存在的KnowledgeDIK预测未来DataDIK.
例如式(23),根据某地区往年的降雨量、降雪量、温度变化曲线等DataDIK资源可预测该地区今年的天气情况.
8)KnowledgeDIK→InformationDIK
根据现存已知的实体间的抽象关系KnowledgeDIK可预测实体下一步的行为或选择,如式(24)所示.
例如式(25),已知一个女孩在食物的选择上更偏爱冰淇淋,则可以预测当一个面包和冰淇淋同时摆在她面前时,她更有可能选择冰淇淋而不是面包.
KnowledgeDIK与InformationDIK相结合也能够转换为新的InformationDIK,甚至可能产生与上文中相反的观点.例如式(26),若女孩在进行食物选择前曾经接受过牙医的建议不吃冰冷的食物,那么女孩将更有可能选择面包而不是冰淇淋.
9)KnowledgeDIK→KnowledgeDIK
当KnowledgeDIK的数量规模积累达到一定程度将由量变引起质变,通过逻辑推理或是与其他DataDIK、InformationDIK、KnowledgeDIK之间的结合产生新的KnowledgeDIK,如式(27)所示.
例如式(28),已知K1:老鼠有磨牙的习惯,K2:老鼠门齿能终生生长.研究人员通过将K1和K2结合,根据实验观察总结出K3:老鼠磨牙是为了求得生存,保证生长平衡.
以上9 种转换为不完全转换,DataDIK、InformationDIK、KnowledgeDIK三者都不会完全转换为另一类型的资源,而是彼此之间达到了一个动态平衡,共同构成了一个以“Human”为核心的DIKW 图谱,包括数据图谱、信息图谱、知识图谱,如式(29)所示.
自我建构[15]是个体对自我的一种感知,对周围的世界以及他人对自己的行为的理解,是一个人定义自己的过程,已被应用在心理医学[16]、教育[17]、市场营销[18]等各个方面.根据自我构建理论,虚拟社区中的用户可分为独立自我型用户(Independent-self user)和互依自我型用户(Interdependent-self user)两种类型.独立自我型用户更关注自身的喜好和特质,互依自我型用户则更关注与他人之间的关系[19].将自我构建理论映射到DIKW 图谱上,如式(30)所示,独立自我型用户更关注与自我有关的属性TRDIK(self),互依自我型用户更关注自我与他人的关系R(self,other).
自我决定理论(self-determination theory,SDT)与人类行为的动机相关,研究人的内在成长倾向和心理需要及人类个体在没有外界影响和干扰下,如何根据自己的意愿做出自我选择,以及自我选择和自我决定的程度.
SDT 定义了个人的3 个普遍且与生俱来的心理需求[20],即能力需求、关系需求和自主需求,如式(24)所示,若满足这三类需求便能够最大限度的调动个人的行动积极性.在虚拟社区中,当用户认为其他参与者喜欢他们的UGC 并信任社交媒体网站时,用户的自主性将增强,对虚拟社区的依赖感增加,从而促进了用户创作UGC 的动机[21].
1)能力需求(Competenceneed)
用户知道自己有能力完成某项任务,任务的结果将在他的期望之内,这样他会愿意做这件事.如式(32)中,C(input)=output 表示自我拥有的某种能力,将某种的输入转化为输出的能力,其中input 表示输入,output 表示输出.Self(Cneed)表示自我个体所拥有的能力集合,满足用户自我的能力需求,将调动自我行动的积极性.
2)关系需求(Relatednessneed)
用户可以在虚拟社区中找到志同道合的人,愿意与他人互动建立联系并体验关爱他人.用Rdegree(self,other)表示自我与他人之间的联系,其中degree 表示自我与他人之间的关系程度,degree=1 表示自我与他人之间存在直接联系,互为一级交流关系用户,degree=2 表示自我与他人之间存在同一个一级交流关系用户.如式(33)中,Rdegree=n(self,other)表示自我与他人具有n级交流关系.Gdegree=n(Ua)表示所有与用户Ua具有n级交流关系的他人组成的群体.满足用户的关系需求Self(Rneed),需要满足用户对对一级交流关系群体Gdegree=n(Self)的需求,如式(34)所示.
3)自主需求(Autonomyneed)
用户有更多选择并且知道他的行为可以由他自己决定,掌握主动权.人们对事物的态度与自主需求有着很大的关联,但自主需求不代表独立于身边的任何一个人[22].自我的自主需求Self (Aneed)与能力需求Self (Cneed),关系需求Self (Rneed)相关.自我不同的目的将导致不同的自主需求,不同的自主需求导致不同的能力需求和关系需求,如式(35)所示.
如式(36)所示,用户Ua目的P1为完成任务T1;但其能力不足导致完成任务的自主性不够,因而在任务完成艰难的情况下用户Ua有可能放弃该项任务.为使用户Ua能顺利完成任务而产生了自主需求Ua(A1),而为了满足Ua(A1)需要用户具有完成任务T1的能力,因此产生了能力需求Ua(C1).
此外,用户Ub目的P2为完成一项科普任务T2;但其认识的人有限,无法将科普内容传播;同样完成任务的自主性不够而产生了自主需求Ub(A2),为完成任务T2而产生了用户Ub的关系需求Ub(R1).
能力需求Self (Cneed)和关系需求Self (Rneed)之间也彼此关联,一般情况下,满足一项自主需求需要满足能力需求和关系需求,如式(37)所示.
在式(38)中,用户Uc的目的P3为:结识某位有学识的教授;为了达到这个目的他既需要人脉Uc(R2),还需要提升自己知识储备Uc(C2),才能提高其完成该任务的自主性,满足自主需求Uc(A3)从而达到目的P3.
总而言之,自我的自主需求与能力需求和关系需求相关,一个人自我的能力越高,能解决的问题越多,自我的自主性就越大.同样,如果自我与他人的关系越多,自我可寻求的帮助就越多,自我的自主性也就越大.三种需求之间相互联系,可通过满足能力需求和关系需求来满足用户的自主需求.这三种需求对个人的心理健康和幸福感影响至深,如果用户的这三类需求得到了满足,用户对虚拟社区的好感度将得到提升,对用户创作UGC 的动机产生积极影响,有利于虚拟社区的建设.
在本文中,用户性格分类与转换方法通过三步来完成,如图1所示.首先根据用户类型资源TRDIK建立用户DIKW 图谱模型,DIKW 图谱中包括数据图谱(DGraph)、信息图谱(IGraph)、知识图谱(KGraph),分别储存着DDIK、IDIK、KDIK三种类型的资源.在Transistion模块中,DDIK、IDIK、KDIK三类资源通过相互之间的结合转换,将生成新的类型资源TRDIK.新的类型资源将被储存在DIKW 上,最终达到在DIKW 图谱上的动态平衡.其次从用户的DIKW 图谱中可提取得到用户与他人的交互关系元组Inter(user),将Inter(user)带入用户亲密度函数Intimacy 计算得到用户的亲密交流关系用户Confidants.将Inter(user)和Confidants 带入函数Personality 进行用户性格指数计算,根据计算结果将用户划分独立自我型和互依自我型用户两种性格类型.在用户类型的基础上根据用户不同的自我需求,采取不同类型的用户性格转换方法.
将虚拟社区中确认与用户相关的类型资源TRDIK进行初步分类,根据TRDIK自身的性质可分为客观型TRDIK资源和主观型TRDIK资源.二者之间的区分标准在于客观型TRDIK资源可映射到逻辑语言“True/False”,不因为直接观察者的变化而变化.而主观型的TRDIK资源属于概念类资源,属性值取决于观察者对事物的主观评价“Yes/No”,评价结果因人而异.例如,在医院资源库的病人DIKW 模型上的TRDIK资源中,确诊书、化验报告、体检报告、病人体温数值等客观存在的事实属于客观型TRDIK资源.而病人自己对自我身体健康状况的主观评价,例如头疼、胃痛、眩晕等口述的症状则属于主观概念类TRDIK资源.病人DIKW 模型上同时还包括的Nonexitence 类的TRDIK资源,例如针对某一种病毒,病人中的未感染者和无症状感染者在TRDIK资源上的数值皆为“Null”.而当感染者治愈后症状消失,将构成前后不一致的Nonexitence 类的TRDIK资源Inconsist,如式(39)所示.值得一提的是,“Null”不包括直接观察者没有客观保证情况下对事物的主观否认,如某位患者对自己的身体没有患病的主观评价并不属于Nonexitence 类的TRDIK资源.
图2 用户性格分类与转换方法流程图Figure 2 Flow chart of personality classification and conversion method
对TRDIK资源进行概念化,将其映射到现有已知概念中.例如,现在某一实验室中检测出了一种病毒基因序列(Virogenenew),将Virogenenew与现有已知的病毒基因序列Virogeneexist进行比较,若Virogenenew与一种现有病毒其中Virus(a)的基因序列匹配成功,则Virogenenew与Virus(a)相关联.若Virogenenew与所有病毒的基因序列匹配皆不成功,则该病毒属于未曾命名的新型病毒,由CreateID 函数根据其特性为其命名,如式(40)所示.
若某一病毒Virus(X)与已知病毒Virus(T)经过概念化相同性对比结果为否定,则Virus(X)与Virus(T)为否定关系R(Virus(X),Virus(T))::=“negative”.若Virus(X)的经过基因序列比对,结果显示它属于已存在的S 型病毒Virus(S)Class的一种,但经过时间和环境的变化导致病毒Virus(X)的属性产生了变异,丧失了原本S 型病毒Virus(S)Class都具有的某种特性,例如毒性减弱或是失去了传染性,此时Virus(X)是Virus(S)Class类别中的一个特例,用Virus(X)special表示,如式(41)所示.
1)DataGraphDIK(User)
使用虚拟社区中的用户相关的DataDIK资源来构建用户属性库,包括用户属性、属性值和属性权重.Attr(Ua)表示用户Ua的属性集,由一个个围绕在中心节点用户Ua之外的离散节点集合组成,共同定义了用户的基本属性.但这些节点彼此之间是离散无联系的,节点的数值可通过数据训练或是问卷调查的方式得到.如式(42)所示,Ex(IS(ai))(1< i < n)表示用户Ua的某个属性结点,共计有n个属性节点用于定义用户Ua.大量的DataDIK资源中存在一定比例的数据重复,统计DataDIK资源中各个属性节点出现的频率Attr(Ua)freq并将其储存到用户数据图谱DataGraphDIK(Ua)上.
2)InformationGraphDIK(User)
用户Ua的个体的属性能够反映出自我的一部分能力,将式(42)中的Attr(Ua)带入式(32)中,EUa(IS(ai))作为输入input,计算用户Ua的自我能力需求Ua(Cneed),如式(43)所示.将计算得到Ua(Cneed)储存到用户Ua的信息图谱InformationGraphDIK(Ua)上.
用户Ua的InformationDIK资源中记录了用户Ua在虚拟社区中的行为记录,包括上网记录、交互记录、购买记录、在线记录等,以及与其他用户之间的关系.用户Ua在虚拟社区中有五种基本的社交行为Inter(Ua),如式(44)所示,统计用户不同交互方法各自的频率Inter(Ua)freq,储存到用户数据图谱DataGraphDIK(Ua)上.
除了发布UGC 的行为Post 之外,Inter(Ua)中的其余4 种社交行为都发生在用户Ua与另一名用户Ub之间.在式(45)中,R(Ua,Ub)表示用户Ua与Ub之间的社交关系,并计算Ua与Ub之间的不同社交行为的频率R(Ua,Ub)freq.在R(Ua,Ub)中,Send(Ua,Ub)、Reply(Ua,Ub)、Like(Ua,Ub)为用户Ua的主动行为;Receive(Ua,Ub)、ReceiveReply(Ua,Ub)、ReceiveLike(Ua,Ub)则为用户Ua的被动行为;Send(Ua,Ub)的值等于Receive(Ua,Ub)的值.将Inter(Ua)、R(Ua,Ub)存储到InformationGraphDIK(Ua)中,计算R(Ua,Ub)freq储存到DataGraphDIK(Ua)中.
根据R(Ua,Ub)和R(Ua,Ub)freq计算用户Ua和用户Ub之间的交流关系等级Rdegree(Ua,Ub),若用户之间有直接交流,即R(Ua,Ub)不等于0,则用户Ua与用户Ub互为一级交流关系联系人.若用户Ua与用户Ub彼此之间没有联系但都与用户Uc之间存在联系,则用户Ua与用户Ub属于二级交流关系联系人,如式(46)所示.根据式(46)计算用户Ua的各个等级交流关系联系人群体Gdegree(Ua)并储存到InformationGraphDIK(Ua)上.
3)KnowledgeGraphDIK(User)
如式(47)所示,根据用户Ua的信息图谱InformationGraphDIK(Ua)上Inter(Ua)中的Post、Reply、Like 三项内容,可推理出K1:K(Ua,content)::=“preference”;通过K1可得知用户Ua在虚拟社区中所偏爱和感兴趣的内容.根据Inter(Ua)freq可推理出K2:K(Ua,behavior)::=“habit”;通过K2可得知用户Ua所习惯的社交行为方式.将K1和K2和其他推理得到的KnowledgeDIK都储存到KnowledgeGraphDIK(Ua).
2.2.1 用户关系计算
根据InformationGraphDIK(Ua)上用户Ua在虚拟社区中的社交行为记录Inter(Ua),在用户Ua的一级交流关系人群Gdegree=1(Ua)中筛选出用户Ua的亲密交流关系人群Confidants(Ua).如式(48)构造函数Intimacy,根据用户Ua与其所有一级交流关系人群(Ub∈Gdegree=1(Ua))之间的社交关系R(Ua,Ub)和社交频率R(Ua,Ub)freq,计算用户Ua与Gdegree=1(Ua)中的每名用户Ub之间的关系亲密度I(Ua,Ub),当I(Ua,Ub)大于阀值Iw时,则用户Ua与Ub互为对方的亲密用户Confidant.取Gdegree=1(Ua)中与用户Ua的亲密值I(Ua,others)大于Iw的用户组成用户Ua的亲密交流关系人群Confidants(Ua),即用户Ua的亲密用户Confidant 用户的集合,用Cn(Ua)表示Confidants(Ua)中的用户Ua亲密交流关系人群的总人数.
根据R(Ua,Ub)中各个社交方式所占比例,可将虚拟社区中用户Ua的一级交流关系人群Gdegeree=1(Ua)分为主动联系人(Initiator)、被动联系人(Passives)、好友联系人(Friend)三种类型.取用户Ua与Gdegeree=1(Ua)中每名用户Ub的R(Ua,Ub)中的Send(Ua,Ub)和Receive(Ua,Ub)两项,计算Send(Ua,Ub)在Send(Ua,Ub)和Receive(Ua,Ub)两项之和中所占的比例大小,若该计算值在区间UF内则两名用户互为好友联系人,如式(49)所示.在好友联系人关系中,两名用户的社交关系在一定程度上达到了平衡.
Gdegeree=1(Ua)中除用户Ua的好友联系人之外其他用户可分为主动联系人群体(Initiator)和被动联系人群体(Passives),分类标准是R(Ua,Ub)freq中主动行为和被动行为频率的占比,若用户Ua对用户Ub的主动行为Send(Ua,Ub)freq,Reply(Ua,Ub)freq,Like(Ua,Ub)freq在R(Ua,Ub)freq中所占比值越高则用户Ua对用户Ub主动性(Initiative)越高;反之,若被动行为Receive(Ua,Ub)freq,ReceiveReply(Ua,Ub)freq,ReceiveLike(Ua,Ub)freq在R(Ua,Ub)freq中所占比值越高,则用户Ua对用户Ub被动性(Passivity)越高.设立阀值Pw,若主动性数值(Initiative)或被动性数值(Passivity)大于Pw,则用户Ua属于用户Ub的主动联系人或被动联系人,如式(50)所示.
主动联系人和被动联系人之间存在联系,若Ua是Ub的主动联系人,则Ub是Ua的被动联系人.遍历R(Ua,Ub)中用户Ua的除好友联系人(Friend(Ua))之外的其他所有的联系人,得到用户Ua的主动联系人集合Initiator(Ua)和被动联系人集合Passives(Ua),如式(51)所示.
分析用户Ua与主动联系人集合Initiator(Ua)、被动联系人集合Passives(Ua)的交集.交集的内容反映了用户的另外两个属性需求(N)和价值(V),即用户Ua希望从别人那得到的和别人希望从用户Ua这得到的,如式(52)所示.
2.2.2 用户性格分类
计算用户的性格指数有两个指标,一是根据式(48)计算得到的用户Ua的亲密交流关系人群Confidants(Ua),Confidants(Ua)一共包含了Cn(Ua)名与用户Ua亲密值I(Ua,others)大于门槛值Iw的用户.Confidants(Ua)可在一定程度上反映用户的社交习惯与需求.若Confidants(Ua)中的两个指标I(Ua,others)和Cn(Ua)数值都偏高,则用户Ua更可能偏向于注重与他人关系的互依自我型用户;若I(Ua,others)和Cn(Ua)数值都偏低,则用户Ua更可能偏向于注重个人自我特质的独立自我型用户;若I(Ua,others)数值偏高而Cn(Ua)较低,则表示用户Ua有自己固定的社交圈,与社交圈内的人交流较多而与社交圈外的人交流较少.
二是InformationGraphDIK(Ua)中用户Ua的社交行为频率Inter(Ua)freq,用于分析用户Ua的社交习惯.例如,若Inter(Ua)freq中Send(Ua)freq,Receive(Ua)freq数值所占比重较高,Post(Ua)freq,Reply(Ua)freq,Like(Ua)freq数值所占比重较低,则用户Ua属于偏向于与多人存在交流关系的互依自我型用户;若Inter(Ua)freq中Send(Ua)freq,Receive(Ua)freq数值所占比重较低,Post(Ua)freq,Reply(Ua)freq,Like(Ua)freq数值所占比重较高,则用户Ua偏向于以自我为中心的独立自我型用户.
构造函数Personality,根据用户Ua的亲密交流关系人群Confidants(Ua)和社交行为频率Inter(Ua)freq来计算用户Ua的性格类型指数:
式中,z表示用户的性格类型指数,设定其取值范围为[−1,1],以零点为界限.若z属于[−1,0)区间内,则将该用户归类为独立自我型用户,若z属于(0,1]区间内,则将用户归类为互依自我型用户.
在虚拟社区中存在着大量不活跃的潜在UGC 创作用户,能否成功将这部分用户类型转换是促成虚拟社区中UGC 内容产出增长的关键.关于用户类型转换,Lee等[23]研究了语音韵律转换方法;Paloutzian等[24]研究了宗教对个人情感、态度和行为变化产生的影响;但二者研究的都是外部向个体实施的性格转换方法而忽视了用户之间存在的个体差异,本文设计了不同的营销方案,通过满足不同用户的不同的心理需求,调动个人的行动积极性和自主性[21],促进用户创作UGC 的动机的产生.有研究表明,通过边缘计算和云处理技术可使用户在虚拟社区中创作UGC 的动机内在化[25].
将虚拟社区内的与用户Ua相关的TRDIK资源语义形式化[26],对于独立自我型用户而言,他们更在意自我的特质如愿望、喜好、能力等,用户的能力需求大于关系需求;对于互依自我型用户来说,他们更注重于他人的关系,尤其是与亲密交流者confidant 的关系,用户的关系需求大于能力需求.
虚拟社区中的UGC 有不同的类型,包括有文本、图片、视频、音频等多种表达形式,以及新闻、娱乐、八卦、研究等多方面内容.从用户Ua的KnowledgeGraphDIK(Ua)提取KnowledgeDIK资 源K1:K(Ua,content)::=“preference”和K3:K(Ua,CreateForm)::=“Comptence”.将K1和K3分别与UGC 的内容和形式进行匹配,如式(54)所示.当函数Match计算得到的两项结果都为真,可筛选出用户Ua感兴趣且在能力范围之内能够完成的任务.面对这样的任务,用户Ua将感到自己的能力需求Ua(Cneed)得到了满足,任务的内容在他的能力范围之内,相比无法完成的任务,他会更愿意去完成这项可完成的任务.
Comptence(Ua)表示用户Ua的能力集合,将UGC 相关内容UGCcontent以某种UGC 形式UGCform输出的能力.CUGCform(Ua(i))(UGCcontent(Ua(j)))表示用户Ua所具有的将某项UGCcontent(i)转换为UGCform(j)的能力,其中,i,j ∈(0,n).在虚拟社区中,将CUGCform(Ua(i))(UGCcontent(Ua(j)))定向推送给特定用户Ua,能够提高UGC 产出的效率和质量.
将用户Ua的关系亲密群体Confidants(Ua)与用户Ua的关系需求Ua(Rneed)进行比较,若是Confidants(Ua)的总人数Cn(Ua)不能满足Ua(Rneed)的需求,则从用户Ua的二级交流关系群体Gdegree=2(Ua)中选择与用户Ua兴趣行为需求匹配的用户,通过推荐机制补充至一级交流关系用户中,如式(55)所示.
通过用户DIKW 图谱得出的用户能力需求(Cneed)和关系需求(Rneed)存在一定误差,针对误差设计测试反馈机制“TestFeedback”,降低误差对结果的影响.将“TestFeedback”机制结合式(5)中的Type 函数,可将测试范围拓展至实体E或子类vicecClass 中的父类Class,完善用户的DIKW 图谱.
如图3所示,根据K1得到与用户有偏好关系的实体E1.实体E1经过式(5)中Type 函数计算得到父类Class1.代入测试反馈机制“TestFeedback”,“TestFeedback”分为负反馈和正反馈,实体E1的父类Class1实体推向目标用户进行简单的“Yes/No”测试,用户反馈为“Yes”则生成用户相关新的TRDIK资源,反馈为“No”则生成Nonexistence 类TRDIK资源,两类资源补充进Transistion 模块进行DIK 转换,所得到的DDIK、IDIK、KDIK可补充至DGraph、IGraph、KGraph中,完善有关用户的DIKW 图谱.
图3 用户测试反馈机制示意图Figure 3 Diagram of TestFeedback mechanism of user
虚拟社区和UGC 内容与以往交流方式最大的优势就在于获取资源的低成本和便捷性,若获取资源所要付出的成本代价超过了一定的限度,用户出于对自身利益的维护会产生“战略性放弃”.在虚拟社区中,每名用户有不同的DIKW 图谱,每名用户的目的不同,处理事情的能力效率也不同,所愿意付出的代价成本也存在差异.
2.4.1 UGC 内容的生成成本(generate cost,GCost)
UGC 内容的生成成本(GCost)主要取决于用户的自我能力,如式(32)中的Self(Cneed),根据式(54)匹配各个用户与之对应的UGC 主题内容.在同一个主题Topic=CUGCform(UGCcontent)下,每位用户的能力高低决定了UGC 创作的效率,如式(56)所示.
虚拟社区中,用户创作UGC 需要时间来完成,每名用户所拥有的能够用于UGC 创作的空闲时间(LTime)之间存在差异.用户Ua的LTime 可根据InformationGraphDIK(Ua)中用户的上网时间记录(Recordonline)计算得到.在一般情况下,虚拟社区中上网时间越长的用户可用于UGC 创作的空闲时间LTime 越长,如式(57)所示.
UGC 内容对虚拟社区的好处显而易见,对用户的好处却并不明显.因此,虚拟社区内一般会设立奖励机制(Award),如社区积分、排名、创作徽章等.若奖励机制满足了用户的心理需求能够影响用户心中对UGC 创作成本的评估,用户就会愿意花费更多的时间去完成UGC创作的任务.用户Ua的TGCost 等于结合用户创作效率Efficiency(Ua)和用户空闲时间LTime(Ua)计算得到的成本减去奖励Award所抵消的成本,如式(58)所示.
2.4.2 UGC 内容的获取成本(acquisition cost,ACost)
在虚拟社区中,UGC 内容的创作者和阅读者之间是一种双向选择的关系.UGC 所涵盖的内容和形式不同,存在资源精细度(Fineness)差异,UGC 内容的精细度越高说明包含的资源量越多但精细度过高也同时提高了用户的获取成本,导致部分用户的选择性放弃.例如,用户Ua想要了解某种食物是否好吃,他不需要知道该食物使用的是什么原料如何生产出来的,他只需要知道大部分人对这个食物的评价即可.如式(59)所示,用户对UGC 内容的获取成本(ACost)既与UGC 内容的精度有关,也与用户自身所具有的能力有关.
在某虚拟社区中的随机选取n名用户组成集合Users={U1,U2,···,Un},统计用户近半年内的在虚拟社区中的社交行为记录Inter(user)并计算用户不同社交行为在总社交次数中所占的频率Inter(user)freq,统计结果为表1用户社交行为次数统计和表2用户社交行为频率统计.
根据表1和2,统计用户与用户之间的交互频率,取表1中第1 名用户U1作为示例用户Ua.表3中统计了用户Ua与一部分其他用户各自的交流频次,用户群Uax={Ua1,Ua2,···,Ua1n}组成了用户Ua的一级交流关系人群Gdegree=1(Ua).根据式(48)的Intimacy 函数计算用户Ua与Uax亲密值I(Ua,Uax),根据式(49)和(51)计算得到用户的好友联系人Friend(Ua),主动联系人Initiative(Ua)和被动联系人Passive(Ua).
表3中列出了与用户Ua与亲密值I(Ua,Uax)最高的11 名用户Uax.在本实验中,设定阀值Iw=1,区间UF=(0.35,0.65),可得用户Ua的一级交流关系人群Gdegree=1(Ua)分类如下:亲密交流关系人群Confidants(Ua)={Ua1,Ua2,···,Ua10},其中Cn(Ua)=10.好友联系人Friend(Ua)={Ua1,Ua4,Ua5,Ua8,Ua9,···}主动联系人Initiative(Ua)={Ua3,Ua7,Ua10,···}被动联系人Passive(Ua)={Ua2,Ua6,Ua11,···}根据以上步骤求出的亲密交流关系人群Confidants,根据Confidants 和用户社交行为频率Inter(user)freq,利用式(42)中的Personality 函数计算用户的性格类型指数z,如表4所示.
根据表4内容可得:独立自我型用户User(Independent-self)={U1,U3,U4,U6,U8,U9,···};互依自我型用户User(Interdependent-self)={U2,U5,U7,U10,···}.
表1 用户社交行为次数统计Table 1 Statistics of the number of social behaviors of users 次
表2 用户社交行为频率统计Table 2 Statistics of the frequency of social behaviors of users %
表3 用户U1 与部分用户之间的社交行为频率统计Table 3 Statistics of social behavior frequency between U1 and other users
表4 用户性格类型指数计算Table 4 Calculation of user personality type index
表5列出了用户Ua在虚拟社区中关联次数最高的20 个关键词,分析这些关键词并将其代入式(5)中的Type 函数计算,可得式(60)中关于用户Ua基本属性的定义Attr(Ua).将Attr(Ua)储存到DataGraphDIK(Ua)上.
表5 用户Ua 在虚拟社区中的关键词Table 5 Keywords for Ua in virtual communities
将用户Ua与其主动联系人Initiative(Ua)和被动联系人Passive(Ua)代入式(52)进行Ua(N)和Ua(V)的计算可得式(61),将结果储存至KnowledgeGraphDIK(Ua)中
将DIKW 图谱上与用户Ua相关的DataDIK、InformationDIK、KnowledgeDIK之间进行“DI-K”转换所得结果如式(62)所示.可知用户Ua从事法律方面的工作,平时的爱好是音乐、电影、芭蕾舞蹈等,将所得结果储存到KnowledgeGraphDIK(Ua)中:
根据KnowledgeGraphDIK(Ua),通过“TestFeedback”机制对用户Ua进行“测试-结果反馈-策略调整”计划.如式(63)所示,根据式(62)中的K(Ua,Ballet)::=“hobby”将其他芭蕾舞曲例如《Sleep Beauty》或《Quixote》代入“TestFeedback”机制推荐给用户Ua,若用户Ua回应为“Yes”,则表明用户Ua对其感兴趣,可生成新的TRDIK资源;若用户Ua若用户Ua回应为“No”,则生成新的Nonexistence 类TRDIK资源,将两项资源都存储至DIKWGraphDIK(Ua).
若用户Ua属于独立自我型用户,可根据式(62)中K(Ua,content)::=“hobby”中的内容向用户Ua进行定向邀请推送.根据式(58)计算用户Ua的UGC 内容的生成成本GCost,若GCost 较高则为用户Ua设立奖励机制,奖励的丰厚程度与UGC 内容的受欢迎程度挂钩,鼓励优质UGC 内容的产出.例如,获得点赞数越高的UGC 内容作者得到的奖励将越丰厚.在UGC 创作中,可向用户Ua发出有关音乐、芭蕾、电影类主题UGC 内容的创作邀请,并为用户Ua设定有吸引力的奖品,例如古典音乐会的门票、电影票等.除了为用户匹配感兴趣的内容之外,用户本身也是虚拟社区的一种资源,如根据式(60)中Ua(V)用户Ua是一种法律资源,可解决有法律需求用户的相关问题,比求助于虚拟社区的官方客服更快捷、比求助于其他无法律背景的用户更安全.
若用户Ua属于互依自我型用户,与他人的关系对用户Ua行为的影响更大.可分析用户Ua与Confidants(Ua)有交集的内容,鼓励多人合作完成UGC 创作,由Confidants(Ua)中的用户向用户Ua发出合作完成邀请,促进用户Ua的创作激情.若用户Ua的亲密交流关系人群Confidants(Ud)的数量偏少,可根据Gdegree=2(Ua)的条件,从用户Ua的二级交流关系用户中选出与用户Ua兴趣行为相匹配的用户向用户Ua推荐为好友.必要时可添加类人机器人,模拟用户的Confidants(Ua)的爱好和言行,通过邀请、合作等方式鼓励用户Ua进行UGC 内容创作.
本文主要基于DIKW 图谱,研究了虚拟社区中用户类型的分类与性格转换方法.通过对用户类型资源进行DIKW 分类和完成“数据-信息-知识”三者间的转换,生成用户DIKW 图谱并结合自我构建理论和自我决定理论,将社区中的用户进行性格分类,对不同用户采用不用的性格转换方法,促进虚拟社区内用户生成内容的产生,加强虚拟社区的内容可控性建设并进行了相关仿真实验.下一步将研究从内容的存在语义本质出发进行虚拟社区的多模态内容的性格综合转化优化设计,以及兼顾内容推广传播和隐私保护的多模态内容传播策略等.