张 敏 朱明星
(武汉大学信息资源研究中心,武汉,430072)
互联网一直是社交性的,自1971年ARPA(the Advanced Research Projects Agency)的学者发送世界上第一封电子邮件,社会化这一属性就开始在互联网上萌芽。在此后的约50年间,以博客和论坛为代表的基础社会化网络逐渐完成了到以社会化商务和社交旅游为代表的新兴细分社交时代的演变。作为 Web2.0时代用户自生成内容(User Generated Con-tent,UGC)技术的一种广泛应用,社会化媒体越来越受到社会各界的关注和重视。近年来,社会化媒体产业的发展如火如荼,于2014年5月23日利用国际知名网站Alexa对全球网站流量进行测算,结果显示在流量排名前10的网站中有5个为社会化媒体网站,分别为facebook.com、youtube.com、wikipedia.com、qq.com和twitter.com,由此可见其社会知名度和民众认可度均达到了前所未有的高度。从网络的角度看,社会化媒体一般可分为社会关系层、功能平台层和应用层,这三个层面相互匹配、相互支持,从而形成众多内容丰富、功能齐全的社交平台,并不断在打破社会信息壁垒、缩小社会信息鸿沟、简化媒体流程管理和实现有效信息共享等方面发挥着积极作用。在此背景下,学者们对社会化媒体的研究热情也日益高涨,并已形成了较为成熟的理论研究体系。
学科理论的知识体系是一个类似自然界的复杂的生态系统。主要组成部分包括:①支撑某学科发展的各种基础资源,例如学术机构、资助基金、合作网络和学术交流活动;②特定的历史,包括各种已存在的理论、已被证明的方法和已经解决的问题;③特定的知识贡献者与使用者群体,涵盖高发文量及共被引率高的核心作者;④发展的趋势与未来,即各种有待解决的问题、未经验证的方法以及特殊的现实社会环境下涌现出的新问题、新方法等。如何把握这个复杂系统的内在结构与演变,理解其在由理论、技术到政治、经济、文化及社会等各个方面所具有的意义,对学者来说是一个亟需解决的重大课题。
科学知识图谱是新近发展出来的解决上述难题的一种新型技术和研究工具,能帮助人们描绘出庞大的知识体系内各学科领域的详细结构,以可视化的方式理顺大量文献形成的复杂知识网络,并能有效地预测学科、理论和知识的热点主题、前沿发展及未来态势[1]。国内外学者已经利用其做了大量的科学研究,研究主题广泛涉及到例如健康、高等教育和科学文献的学术前沿与发展动态分析[2-3]。本文以知识图谱分析为主要手段,对来自Web of Science平台SSCl、SCl数据库内的社会化媒体研究主题相关文献进行处理和分析,旨在全面把握国际社会化媒体发展的动态过程、特点和规律。
本文研究对象的来源为Web of Science平台的SSCl和SCl数据库。目前国内外文献检索的主要方法是进行主题搜索。主题搜索一般同时包含了题名搜索、摘要搜索和关键词搜索三种搜索方式。为保证搜索文献的可靠性,在搜索时所获得的文献数据必须具备三个基本特征,即相关性、全面性和排他性。考虑到一些特殊情况如部分文献针对“Facebook”或“Twitter”网站展开研究,在主题的撰写过程中为了提高读者搜索文献的精准率,作者往往倾向于使用“Facebook”或“Twitter”而非“social media”。鉴于此,本研究需要对与主题密切相关的产业领域进行持续的关注。
根据上述原则,于2014年3月14日在WOS平台的SSCl、SCl数据库中以wiki、blog、microblog、YouTube、Facebook、twitter、Pinterest、Flickr、Linkedin、MySpace、social media、social network site、SNS等为检索词,同时设置检索年限为2004~2013年,经全面检索并予以筛选后共得到相关文献7806篇,历年发文量及其变化情况如图1所示。
图1中条纹区域表示历年的文献数量,灰色条形区域表示相对于上一年的该年文献变化数量,黑色折线表示历年文献增长率。从图1中可以看出,2004~2012年相关文献数量呈现持续增长趋势;2005~2009年由于众多具有代表性的社交网站的建立带来了学术界的新一轮研究热潮,研究主题不断成熟;在2011~2012年左右达到研究的巅峰状态,发文量非常集中,在2013年研究热度有所降低。
任何领域的学术研究都离不开一定的社会现实,因为其本质目的和意义都在于解决正在发生的或者即将发生的社会问题。就社会化媒体而言,其发展势头如此迅猛的原因也正在于传统社会下公众话语权的极度缺失,言论自由成为衣、食、住、行等基本需求得到满足后的重要精神需求。简而言之,学术界与产业界发展都是基于一个共同的社会现实,即制度化参与渠道的不足,从这种意义上来说学术界的发展与产业界的发展是密切相关的。产业发展与科学研究的空间对比分析能识别出本研究领域内的各个国家的重要性并展示其间的相互交流合作情况,有效地指导后续研究者展开国际学习与合作。
图1 2004~2013年国际社会化媒体研究相关文献数量分布
本文根据研究机构BV4与苏黎世应用科技大学(HWZ)发布的2013年全球社交媒体品牌价值报告数据绘制了国内外社会化媒体发展的产业发展轴谱,如图2所示[4]。图2中共显示了品牌价值最高的前三十个网站,图中横坐标表示时间,坐标轴上方的圆形表示国内的社会化媒体,坐标轴下方的圆形则表示国外的社会化媒体,圆心对应到横坐标轴的数值则代表该媒体创立的时间,圆圈的面积大小则表示由BV4所统计的该社交媒体所对应的品牌价值。在22个国外社会化媒体网站中,美国以17个网站居于首位,其余为英国(Weeworld、Badoo)、比利时(Netlog)、芬兰(Habbo)和俄罗斯(Odnoklassniki),中国则以8个网站居于第二位。
图2 国内外主流社会化媒体产业发展图谱
从图2中可以看出,无论以数量或是品牌价值的视角,美国和中国的社会化媒体发展均位于世界前列。美国的Facebook、YouTube、Twitter、Linkedln以及Tagged分别作为最知名的基于关系的社交网站、基于内容自生成技术的视频网站、微博网站、社交求职网站和基于兴趣的社交网站引领世界社会化媒体的发展趋势,其17个网站品牌价值的总和约为1289亿。中国社会化媒体产业的实力也不容小觑,8个社会化媒体的品牌价值总和约为561亿。其中以社交为主的有QQ空间、开心网、朋友网、人人网,社会化视频网站有土豆网、优酷网,微博为主的有新浪微博、腾讯微博等,其中腾讯是目前我国社会化媒体产业应用最为成功的企业,腾讯发布的官方数据显示截至到2013年底QQ的用户数量已超过8亿,其中活跃用户超过2亿,占据中国社会化媒体产业的最大份额。从单一品牌价值来看,以Face-book、Twitter以及YouTube为最优,其品牌价值总和约为30个社交网站品牌价值总和的43%,为17个美国网站品牌价值的67%。中国品牌价值最大的三个社交网站分别为QQ空间、新浪微博和腾讯微博,其品牌价值总和为8个中国社交网站品牌价值总和的64%。由此可以看出国内主流社交媒体集中在博客、即时通讯和视频领域,垂直细分的社会化媒体还没有得到很好的发展。此外,从图2中也可以看出国内的社会化媒体产业发展相对滞后。
CiteSpaceⅡ可将各国发表的论文数量及相互间的合作情况以类似“年轮”的方式直观地展示出来。“年轮”的面积或字体的大小表示该国发文量的多少,“年轮”间连线的密集程度或粗细则表示国家间交流程度的大小。在本研究中将软件界面的“time scaling”取值设置为1,将2004~2013年分为十个时间段进行处理。选择网络节点(country、institution)、主题词来源(title、abstract、descriptor、identifies)、算法(pathfinder),同时将数据抽取对象设置为top50,运行软件即可得到社会化媒体研究领域国家分布图谱。
图3显示了发文量前十的国家及其相互联系情况,从图中可以看出美国所对应的“年轮”和字体均为最大,表示2004~2013年间社会化媒体研究文献主要来自于美国,美国在本领域的研究力量和研究成果均居于世界首位。中国的发文量为全球第二说明了我国在这一领域的研究也处于世界先进水平。紧随其后的为英国、澳大利亚、加拿大和德国等,上述国家均在社会化媒体研究领域做出了突出贡献,其研究力量和研究成果的总和构成了国际社会化媒体研究的核心支柱。此外,图3中各节点之间的连线较为密集,表明在社会化媒体学术研究领域,各国间的交流与合作较为频繁。
图3 社会化媒体科学研究空间分布图
从上述国际社会化媒体产业发展与科学研究的空间对比分析中可以看出,两者的地理空间分布是保持基本一致的。产业界和学术界的密切联系可以解释如下:社会化媒体最大的特点在于平民化,而恰好是这一特点使其迅速得到了众多用户的认可和使用,因而持续快速地渗入到公众生活的各个方面,所带来的结果是产业界的这一社会现实催生了巨大的学术研究空间。首先,虚拟化的交流方式产生了许多与现实社会网络交流不同的特点,如关系强弱、网络结构、语言文化、信任关系、心理变化、性格掩盖等等。这种不同在对媒体和用户产生深刻影响的同时也给科研领域带来了新的、有价值的研究课题;其次,数以十亿计的用户进行在线娱乐、工作和社交活动,所产生的海量数据又可为科学研究提供强大的信息基础;再次,就社会化媒体本身而言,其不仅仅是数字环境下公众之间的交流媒介,也是科研人员之间、公众与科研人员之间实时互动交流的重要渠道。
任何领域的进步与创新离不开前人的辛勤劳动,在科学研究领域,前人成功的研究成果为后来的研究者提供了宝贵的思想源泉与理论基础,而其早期的不断试错也为后来者指明了正确的前进方向。基础理论一般是指创立时间较早,同时对本领域的发展起到了指导性作用的各种观点和理论。在CiteSpaceⅡ中,知识基础存在于奠基性文献的引文和共引轨迹中。在软件界面选择每年被引用率最高的50篇文献,选择cited reference作为网络节点,在图的显示方式中选择Time Line图可以展示知识基础间的递进关系。
图4所示即为社会化媒体研究领域奠基性文献时间序列图,该网络图由152个节点及226条边组成。观察图4中的时间线不难发现,早在20世纪70年代关于社会化媒体的研究就已经开始出现。鉴于奠基性文献一般特指发表时间较早且对本领域的研究起到指导和引领作用的著作,因此图4虽然显示了9篇奠基性文献,但鉴于Facebook、Twitter和You-Tube等国际知名社会化媒体均成立于2007年之前,因此本研究仅选取2007年之前的7篇进行分析。
图4 社会化媒体研究领域奠基性文献时间序列图
通过对上述文章进行深入阅读和分析,可以得出早期的理论基础集中于三个方面:①连接强度:连接强度由学者Granovetter于1973年首次提出,在最初的研究中多被用来分析线下的关系网络。除了连接强度这一具有里程碑意义的概念外,Granovetter还提出了另一个具有革新性的概念:弱连接[5]。强连接是指存在于性别、年龄、教育程度、职业身份、收入水平等社会经济特征相似的个体之间的关系,而弱连接则是指存在于不同群体间的关系,与“桥”这一概念所代表的意义非常接近。这两个概念的提出为后续的科学研究提供了非常重要的理论支持,例如意见领袖识别、社会资本分析、谣言传播分析中均运用了连接强度这一概念。社会化媒体的重要特征之一就是将传统的线下社交网络转移到了线上,因此人与人在互联网中的关系也由代表用户的节点和代表关联的边组成。关联强度这一概念同样适用于社会化媒体中的网络分析。②技术接收模型:技术接受模型(Technology Acceptance Model,TAM)由行为学研究大师Davis于1989年提出,影响因素主要为感知有用性和感知易用性。这一模型为后续学者在技术接受、使用与持续使用行为研究上提供了基本的研究方向。此后TAM模型得到了广泛的传播和研究,学者们针对不同研究领域,结合社会学、心理学、经济学等学科内的相关理论和模型对经典TAM模型进行完善和修正,形成了丰富的研究成果。例如Venkatesh等在2003提出的“整合型科技接受模型”(UTAUT)及Gefen等基于在线购物环境所提出的Trust-TAM模型[6-7]。③基础社会化网络综述性研究:基础社会化网络指以在线百科和在线论坛为代表的第一代社会化网络平台。因此相关研究也聚焦于在线社区与在线百科,例如Rheingold描述到“在虚拟社区的人使用屏幕上的文字交流、寒暄和争论,搞知识分子话语,进行交易,交流知识,分享情感上的支持,出谋划策,集思广益,八卦,世仇,谈恋爱,找朋友,玩游戏,调情……在虚拟社区中做的只是一切人在现实生活中所做的”充分体现了虚拟社区的特点及其与现实世界间的联系与区别[8]。Wenger则指出实践社区的根本目的是“从根本上激励知识分享、学习和改变”,表明了社会化媒体建立的初衷。Cunningham则是介绍了wiki的实现和开发过程。这些综述性的文章为学者了解社会化媒体的本质提供了非常重要的帮助,为社会化媒体领域学术研究的不断进步打下了坚实的基础。
科学文献之间的共被引关系形成了复杂的科研引文网络。在由CiteSpaceⅡ生成的引文网络中,圆形节点代表一篇文献,节点大小代表文献的被引用次数,圆环厚度与对应年份的引文数成正比。在图论中常采用节点的中间中心性来量化该节点在网络中重要性的强弱,网络中链接任意两点的最短路径经过某一特定节点的次数越多则表示该节点的中心性越高,反之则低[5]。
本研究的被引文献图谱如图5所示。将被引用文献按中心性进行排名,前10个关键节点的详细信息如表1所示。对表1中文献的研究主题进行分析发现,高中心性节点文献主要分为两大类,第一类是探讨关系、关联尤其是虚拟的关系、关联对于社会的冲击、人际关系的影响和社会结构的调整。第二类涉及到具体的计算技术、数据分析处理方法的探讨等。
图5 社会化媒体研究领域关键被引文献图谱
表1 基于共被引关系的社会化媒体关键节点文献列表
关键词是文章主题的高度概括和凝练,代表着一篇文章的核心和精髓所在;而学术期刊一般都具有较强的研究方向针对性,在某种程度上也能代表期刊上所登载论文的研究方向。本文结合关键词聚类和期刊聚类分析国际社会化媒体研究领域的研究热点。在CiteSpaceⅡ软件界面选择每年被引用率最高的50篇文献,先后分别选择“key word”和“cited journal”作为网络节点,在图的显示方式中选择“Time view”图,则可以展示关键词或者期刊之间的关联状况。运行软件得到如图6所示的关键词分布图和如图7所示的引用期刊分布示意图。
图6 社会化媒体研究文献关键词分布图(频次≥4)
图7 社会化媒体研究文献引用期刊分布示意图(频次≥100)
图6和图7主要是通过关键词与关键词之间、期刊与期刊之间的连线来表示其关联状况。对图6进行分析可以看出关键词的分布主要可以分为以下几个类别:①用户接受与使用行为 研 究(acceptance、motivation、online community);②用户信任与满意度研究(trust、participation、loyalty、satisfaction);③信息技术研究(technology、innovation、design);④信息共享与协作(collaboration、knowledge、Wikipedia、Twitter、microblogging);⑤基于 web2.0的文本挖掘与语义分析(web2.0、YouTube、ontology、semantic、text-mining);⑥基于Facebook平台的研究,其中又有三个子研究方向:隐私研究(privacy)、在校学生的教育研究(student、education)、青少年的Facebook使用特征研究(identity、personality、gender、internet use)。
在上述6个研究热点之外,还有三个值得注意的关键词群体:首先是图6中非常小的两个研究团体:健康和社会资本研究。这几个关键词虽然出现次数较少(字体和“年轮”较小),但是却代表着其为近年来新兴的研究方向;其次是图6中处于最中间的一个关键词团体,主要关键词有online community、behavior、model、management、virtual community 和 performance。这个关键词群体的特别之处在于其与周边研究热点之间的连线较多,意味着这些关键词与其他研究热点的关联度较大,模型构建、行为研究、效果评价与管理在上述8个研究热点中都有可能会涉及。这也充分说明了社会化媒体研究所涉及到的各个知识领域存在着交叉与融合现象。
对图7进行分析可以看出所引用期刊的分布主要集中于计算机科学、市场营销与商务、管理学、信息系统、心理学、社会学、新闻传播学、教育学、医学与行为学等领域,每个领域在图7中均表现为一个期刊团体。由此可以看出社会化媒体研究学科边界之广。结合图6和图7,本文将上述8个子研究热点知识群归为以下4个大类:
(1)在线学习、在线教育和知识共享研究类。这一研究历时最久,这与社会化媒体建立的最初目的是相一致的。目前国际上最大的在线百科平台—维基百科所包含的条目已经超过了《大不列颠百科全书》成为世界上最大的百科全书,在社会化媒体上不仅可以交流科学知识,还可以交流主观的经验和想法。
(2)基于媒体的用户心理与行为研究类。这一研究以信任和满意度为基础,主要结合计划行为理论(TPB)、技术接受模型(TAM)、创新扩散理论(lDT)等其他行为模型来研究影响用户在媒体接受、使用与持续使用行为以及信息分享行为的影响因素。
(3)基于现实的用户心理与行为研究类。主要研究用户媒体使用特征与现实世界中个人性格、心理和行为之间的关系。该领域研究的一个重要理论是社会补偿假设(Social Compensation Hypothesis),该假设认为个体在现实世界中所缺乏的东西会以其他的形式予以补偿。在具体的研究过程中多以媒体丰富度(media richness)、自 我 表 现 度 (self-presentation)、朋友数量、使用时长、使用频率等媒体使用行为作为因变量,以自尊、自我感知(selfperception)为自变量,运用大五人格量表测度用户的性格并以此作为调节变量。通过对这些因素之间关系的研究得出了一些重要结论:Facebook用户自尊度越低就越有可能在网站上面发布更多的信息[9];用户自尊度与Facebook的使用频率及使用时间之间存在着明显的负向相关性[10];自尊度、私人自我感知与Facebook上所拥有的朋友数量越多负向相关,公共自我感知与朋友数量正向相关[11]。
(4)语义分析与数据挖掘类:该领域的研究起源于行为经济学的一个现象:人的行为可以深刻的影响个体的行为和决策。社会化媒体领域的相关研究人员则把个体扩大到社会大众或集体来讨论情绪与行为之间的关系,通过分析社会化媒体上的用户自生成内容来对票房、股市、歌曲和图书排名进行各种预测,并形成了丰富的研究成果:在信息决策领域社会交互行为能传递情绪从而影响包括消费者、个人和机构投资者、公司、厂商等在内的所有类型的决策制定者[12];在政治活动领域,微博、twitter等社交媒体能够作为表达现实中人们政治意见的一个指示器[13];在产品和服务销售领域,情感分析能够预测图书销量排名[14],或者预测电影票房收入[15];在财经领域可以使用其来预测股票走势或者证券市场动态[16]。
本文以知识图谱的方式展示了近十年来社会化媒体学术研究的现状,得出了以下重要结论:
(1)学术界的发展与产业界的繁荣密切相关。产业发展与科学研究在空间分布上显示了完美的一致性,再次证明产业中涌现出来的社会问题能成为学术研究的兴趣点和切入点,新兴社会化媒体企业产业的交叉和融合使科研选题的边界不断向外扩展,学术研究成果则为产业界的进一步发展提供了理论指导与技术支持,两者相互依存、共同进步。
(2)国际社会化媒体研究热点呈现出多元化、交叉学科的特点,所涉及的四个研究热点主题群:知识共享与在线学习类、数据和文本挖掘及情感分析类、基于现实的用户心理类与行为和基于媒体的用户心理与行为类涵盖了管理学、行为学、心理学、社会学甚至物理学和化学的相关知识。
(3)国际社会化媒体研究具有以技术为主导、以行为为补充的研究力量分布特点。尤其是学术群体关联状况分布数据显示了相关特性。在数据、文本挖掘与情感分析领域内投入的研究力量最为强大,其次为信息共享与在线学习领域,基于现实和基于媒体的用户心理与行为研究处在后列,说明目前国际主流研究集中在技术方面,而行为和心理的研究相对处于次位。
(4)国际社会化媒体领域研究具有外延性的特点。最先受到关注的研究是其互动性和自由性,学者多从概念的定义、应用的特征、用户行为的特点进行描述性的研究和分析;后继学者则补充了关系网络与社会资本相关的研究,将线上与线下的生活不断地进行结合,社会化媒体的最终形态从网络总体应用发展到具体的社交平台,学科边界在不断地向外扩展至教育学、医学、心理学、社会学、行为学、经济学等学科领域,并不断与移动社交开始融合展开探索性、预测性的研究。因此,未来的研究不断融合其他学科的理论形成交叉学科的创新性研究将成为重中之重。
[1]刘则渊,陈悦,侯海燕.科学知识图谱:方法与应用[M].北京:人民出版社,2008
[2]Chen C.CiteSpace ll:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for information Science and Technology,2006,57(3):359-377
[3]Chen C,Hu Z,Liu S,et al.Emerging trends in regenerative medicine:a scientometric analysis in CiteSpace[J].Expert Opinion on Biological Therapy,2012,12(5):593-608
[4]BV4,HWZ.2013年全球社交媒体品牌调查报告[EB/OL].[2013-04-24].http://www.campaignchina.com/Gallery/341034,2013全球最具价值社交网络品牌排行榜新鲜出炉.aspx
[5]Granovet M S.The strength of weak ties[J].American journal of sociology,1973(6):1360-1380
[6]Venkatesh V,Morris M G,Davis G B,et al.User acceptance of information technology:Toward a unified view[J].MlS quarterly,2003:425-478
[7]Gefen D,Karahanna E,Straub D W.Trust and TAM in online shopping:an integrated model[J].MlS quarterly,2003,27(1):51-90
[8]Rheingold H.The virtual community:Homesteading on the electronic frontier[M].Cambridge:MlT press,1993:68-69
[9]Zywica J,Danowski J.The Faces of Facebookers:lnvestigating Social Enhancement and Social Compensation Hypotheses;Predicting Facebook and Offline Popularity from Sociability and Self‐Esteem,and Mapping the Meanings of Popularity with Semantic Networks[J].Journal of Computer‐ Mediated Communication,2008,14(1):1-34
[10]Mehdizadeh S.Self-presentation 2.0:Narcissism and self-esteem on Facebook[J].Cyberpsychology,Behavior,and Social Networking,2010,13(4):357-364
[11]Lee J E R,Moore D C,Park E A,et al.Who wants to be“friend-rich”?Social compensatory friending on Facebook and the moderating role of public self-consciousness[J].Computers in Human Behavior,2012,28(3):1036-1043
[12]Nofsinger J R.Social mood and financial economics[J].The Journal of Behavioral Finance,2005,6(3):144-160
[13]Hong S,Nadler D.Which candidates do the public discuss online in an election campaign?:The use of social media by 2012presidential candidates and its impact on candidate salience[J].Government lnformation Quarterly,2012,29(4):455-461
[14]Gruhl D,Guha R,Kumar R,et al.The predictive power of online chatter[C]//Proceedings of the eleventh ACM SlGKDD international conference on Knowledge discovery in data mining.New York:ACM,2005:78-87
[15]Liu Y,Huang X,An A,et al.ARSA:a sentiment-aware model for predicting sales performance using blogs[C]//Proceedings of the 30th annual international ACM SlGlR conference on Research and development in information retrieval.ACM,2007:607-614
[16]Zhang X,Fuehres H,Gloor P A.Predicting stock market indicators through twitter“l hope it is not as bad as l fear”[J].Procedia-Social and Behavioral Sciences,2011,26:55-62