张文 王强 杜宇航 张思光
摘要:随着科技的发展和信息化进程的推进,中国科普工作的方式和内容都在发生巨大的变化,网络化和社会化科普已经成为新时期科普传播的必然要求。因此,对新时期科普传播的现状进行整体把握和脉络梳理也就显得至关重要。通过以“人工智能”在微博中的传播为例探究微博在传播科普内容中所起的作用,并使用大數据对所科普的内容进行分析,对比国外网站推特对“人工智能”内容的探讨,结果表明,微博在科普传播中对青年人群起到关键作用,国内外对于“人工智能”的讨论具有相似性。
关键词:科学传播;人工智能;科普微博
中图分类号:G2;N4
文献标识码:A
文章编号:1673-5595(2021)05-0098-08
一、引言
截至2019年6月,我国网民规模达8.54亿,微博月活用户达4.86亿,[1]微博已成为重要的信息传播媒介。微博在信息传播过程中具有即时性、高效性、便捷性、交互性等特点,微博已成为公众获取信息、企业进行宣传的重要渠道。有专家认为,微博已经成为当下最热门的互联网服务,彰显着微博时代的到来。在微博上进行科普成为新时期科普工作的重点。
科普事业是提升全民科学素质的重要领域,互联网的普及衍生出网络科普模式,这种模式可以借助社会新闻事件嵌入科普知识,展开科普活动,也可以融合线上线下的传播模式,借助移动互联网高效、快速的信息传播优势,加大全民科普力度。[2]然而现阶段网络科普还存在着许多问题,公众对网络科普关注度不够,参与积极性不高,其中科普网站实力不强,无法成功引流是其主要问题。[3]移动互联网、新媒体、大数据等新兴技术的发展为我国科普工作带来了机遇与挑战。在“移动互联网+”背景下,我国科普的主体由传统网站科普向科普机构和个人媒体科普转变,其中个人媒体承担了大量的科普工作,诸如微博、抖音等新社交媒体平台中的个人媒体在科普活动中担任了重要传播角色。
互联网时代的到来和大数据应用的普及都极大地改变了人们的认知和行为方式,大数据技术不仅在商业领域应用广泛,而且在公共管理领域的作用也逐渐被研究者所认识。[4]随着人工智能的普及和飞速发展,大众开始聚焦于“人工智能”话题,人们在微博上对“人工智能”的讨论也随之增多,研究“人工智能”信息的科普传播能够很好地反映当下微博科普传播的现状。研究表明,移动互联网、新媒体、大数据分析技术已经成为研究科普传播机制和影响的重要手段。时代的发展赋予了科普事业新的使命,[5]研究人员也纷纷借助移动互联网、新媒体、大数据技术展开一系列关于科普的研究。目前围绕科普内容的研究主要包括两个方面:一是借助移动互联网、新媒体、大数据研究科普对社会层面的影响,将其与各行各业进行深度融合;二是将移动互联网、新媒体、大数据应用于科普研究技术层面的操作方式,借助数据分析与数据预测功能把控科普信息传播过程。
陈海琳等在对金融科技科普活动的研究中提出了“移动互联网+科普”的整合模式,[6]这种模式在加大科普信息传播广度的同时还能够提高科普效率,对于整合线上和线下的金融科技科普活动有很好的促进作用。高慧艳借助媒体融合探究科普期刊微信公众号运营模式,[7]在推广科普期刊内容时需要借助媒体融合及有影响力的微信公众号实现科普信息的推广。此外,很多学者也在研究中强调了科普期刊在科普工作中的重要作用,以及需要借助媒体融合的方式来推动科普期刊的发展,提升科普期刊在科普工作中的科普力度[8-10]。杨凌讨论了大数据下的现代科技馆科普服务创新模型,他在研究中指出大数据技术为现代科技馆科普活动和服务模式提供了新的机遇,科普服务需要在探究其创新模式的过程中借助大数据推广科普活动,提高科普效率。[11]研究人员在电视科普节目传播[12]、科普信息化建设[13]、科普资源开发[14]的研究中也强调了大数据的作用,提出需要借助大数据和互联网提高公众对网络科普的关注度,以增强科普网站实力,提高公众参与的积极性。
本文以“人工智能”在微博中的传播为例,探究微博在传播科普内容中所起到的作用,并使用大数据技术与方法对微博科普的内容进行分析,将大数据的特征与科普教育相结合,研究微博科普的广义需求与目前的应用现状及提升方向。借助大数据技术与方法研究“人工智能”信息在微博上的传播机制将有助于了解大众对于“人工智能”的看法和接受度,有利于人工智能更好地发展,同时,探究以微博为代表的新社交媒体传播对于促进科普服务工作的发展也具有深远意义。
二、微博传播网络的结构及其测度参数
(一)微博整体网络结构
三、“人工智能”微博传播案例研究
截至2019年2月,中国拥有人工智能企业745家,占全球总数的21.67%,2018年中国人工智能相关专利申请数达76876项。[1]随着人工智能逐渐走入大众,在微博上对“人工智能”的讨论也随之增多,研究“人工智能”在微博上的传播机制,有助于了解大众对于“人工智能”的看法和接受度,有利于人工智能更好地发展。
以“人工智能”为关键词,在新浪微博上可以搜索到6692万余条相关微博。人们就人工智能的安全性、应用场景等问题展开激烈争论,由此形成了复杂的“人工智能”信息微博传播网络。在微博平台上,普通网民貌似已经成为新的意见阶层,成为公共舆论的主体,但实际上真正在引导公众注意力的是网络意见领袖。他们是一系列热点信息的源头,普通用户发布的信息也只有经过他们转发后才有可能广泛扩散,意见领袖间的微博互动行为将在很大程度上决定信息的流向、速度以及公共舆论倾向。另外,“关注”关系是微博中最为基本的关系,它比“转发”“评论”关系更为稳定,而且直接反映了信息的流向以及行动者主动选择特定信息来源的意愿。因此,作为探索性研究,本文以该网络为基础,探究由“人工智能”微博意见领袖引导并基于“关注”关系构成的“人工智能”信息微博传播网络。
在开展微博科普中“人工智能”网络传播的案例研究时,首先根据“人工智能”微博大V及他们之间的相互关系构建了“人工智能”微博传播的网络结构,将“人工智能”微博传播过程可视化;其次对“人工智能”微博传播网络整体结构进行分析,通过网络的密度、可达性、凝聚力等指标测度“人工智能”传播网络的整体信息传输性能;然后本文用度中心性、接近中心性和中介中心性三个参数分析微博传播网络中节点的位置结构;最后根据“人工智能”微博传播的网络结构对“人工智能”微博进行内容分析和受众用户分析,探究“人工智能”在微博科普传播中的主要内容和主要受众群体。微博科普中“人工智能”网络传播案例研究框架如图1所示。
(一)微博传播网络构建
本文将“人工智能”微博大V定义为:微博空间内,在“人工智能”议题上具有较大影响力的微博用户。概念进一步量化为:(1)粉丝数量超过1万,如果是业内知名人工智能专家,可降低要求。(2)在“人工智能”议题上表现活跃,发表过一定数量的关于“人工智能”的微博。(3)至少有一篇“人工智能”微博转发量超过100次。样本的抽取采用滚雪球法,其基本过程是:首先从某些公认的在“人工智能”议题上具有重要影响力的微博用户出发,从其关注对象中寻找其他潜在的意见领袖用户,列出潜在意见领袖清单;然后通过比较清单用户在上述三个标准上的表现,筛选研究样本;最后筛选出97个人工智能领域大V。
样本基本特征包括以下方面:(1)个人用户57个,企业机构用户40个。(2)认证用户82个,占84.5%。(3)平均粉丝数341万。(4)在该行业中,男性作为重要的领导者,其人数明显多于女性,达到87人,占89.7%。(5)依据群体之间的区别将“人工智能”微博大V分为研究机构、企业及企业相关人员、高校、媒体。(6)在分析的大V中,有69人来自北京,占71.1%,这表明北京是人工智能发展的核心地带。(7)大V的教育背景均为国内外顶尖名校,如北京大学、清华大学、中国科学院大学、美国麻省理工学院等。(8)通过分析大V的工作机构可以看出,在高校任教的大V较多,也集中在国内顶尖名校,如清华大学、北京大学、武汉大学、中国科学院大学、复旦大学,也有的在国内外知名企业工作,如阿里巴巴、百度、小米、微软等。
本文通过结点之间的“关注”关系进行数据联系,并采用有向网络结构图。在“人工智能”信息微博传播网络的“互动关系矩阵”中,成员A 关注了成员B,则代表A 与B 的联系为1,反之,成员B 没有关注成员A 时,则B 与A 的联系为0。通过各个节点之间的联系,整理排列出97×97邻接关系矩阵,该矩阵的可视化图如图2所示。
(二)整体结构分析
在97个节点组成的“人工智能”微博传播网络图中,实际连接数为1170,即1170对节点间存在关注与被关注关系,而节点对总数为9312,因此网络密度为0.126。在网络可达性方面,网络直径为6,平均距离为2.4。这意味着每个节点最长通过6个节点将信息传播到网络中的其他节点,且每个节点平均通过2.4个点与其他节点进行信息的交流。这说明信息在网络中依托节点的传播较为便利,速度较快。此外,网络中节点的平均聚类系数为0.309,表示多数节点之间的信息交流范围较宽。通过模块化分析并计算它们之间的相互关系,“人工智能”的大V基本分为三类:一类是科技界的企业、媒体和个人,另一类是学术界的知名人士,还有较少的一类则是人工智能最基本应用的机器人企业。在图2中可以看出,网络中没有孤立节点且分散的节点较少,导致平均聚类系数较高。综合上述参数发现,“人工智能”信息微博传播网络整体上比较紧凑,连通性比较好。
(三)个体位置结构分析
1.度中心性
“人工智能”信息微博传播网络中,节点的入度较高意味着其信息被大量其他节点接收,而节点的出度较高则意味着该节点能够较多地接受来自其他节点的信息。“人工智能”信息微博传播网络节点中心性序列(前10位)见表1。表1显示,节点入度中心性排名前10的意见领袖中有8个是个人用户。其中,清华大学教授“马少平THU”最高,达到40,意味着其能将信息直接传递给网络中接近半数的其他节点,这表明在自媒体时代,个人媒体在微博科普传播中扮演着重要角色。
出度中心性排名最高的也是個人用户,北京大学教授“晓如微博”的节点出度中心性最高,为47,这意味者其主动接收的信息来源覆盖了接近一半的传播主体。因此,综合考量入度中心性和出度中心性可以发现,在“人工智能”信息微博传播网络中,个人媒体主要扮演行业专家的角色。此外,“蒋涛CSDN”“刘知远THU”的入度中心性和出度中心性都很高,与众多节点存在密切的双向信息交流,可谓意见领袖中的“意见领袖”。
2.接近中心性
“人工智能”意见领袖关注关系网络为有向网络,节点存在接近中心性,它衡量某一节点向外传递信息时不受其他节点控制的能力,值越大,传递信息就越容易和顺畅。经过计算,节点平均接近中心性为0.42,其中,“刘成林_NLPRN”最高,为0.508,说明该网络中的节点较容易向其他节点传送信息。
3.中介中心性
通过对“人工智能”信息微博传播网络节点中心性序列表相关结果的计算可以看出,网络节点的中介中心性都不大,平均值仅为0.010,其中中介中心性值最低的“科大讯飞”甚至为0,这说明在“人工智能”信息微博传播网络中,特定节点对资源的控制能力并不强,失去任意特定节点,对信息传播的路径和效率没有很大影响。
(四)内容分析
本文通过网络爬虫技术收集了97名大V关于“人工智能”和“AI”的微博,由于网站没有可用的应用程序编程接口(API),所以本文只能使用非API的数据抓取技术从这些网站抓取页面,所需的信息从这些页面抓取。收集的数据包括微博名、微博内容、时间,总计收集了97名大V共2538条微博数据。将其分词以后做出“人工智能”大V词云图(如图3所示),人工智能在机器人、互联网、汽车、医学、数学、商业等领域有重要的应用,同时人工智能是依赖于研究院和科学家的,已经逐渐融入到我们的日常生活中。
本文将大V分为4类,分别是研究机构、企业、高校和媒体,通过对各个群体下所讨论的高频关键词做统计分析,发现每个群体所关注的“人工智能”的内容会有少许差别,各群体关键词如表2所示。
利用TF-IDF[19]选出文本中较为关键的词,制作出如图4的共词图,通过Modularity模块化计算,可以根据词共同出现的频率及哪些词经常在一起出现将词分成不同的模块,在该图中,词主要分为两个模块:一个模块是人工智能的“诞生”,也就是人工智能由研究人员利用计算机技术,通过各种创新使机器思维类似于大脑的思维;另一个模块则是人工智能在各个方面的应用,如无人机、汽车、医疗、语音识别、同步翻译、家居、手机等多个方面。
(五)受众用户分析
对97名大V所发布的“人工智能”微博进行受众分析发现,在总计发表的2538条微博中,总转发量达到47万,分析转发用户的粉丝量发现,97名大V所发布“人工智能”微博的总受众群体接近千万,其中通过比较大V的不同群体转发数据发现,媒体类和知名科技企业的转发量和受众人数明显多于其他几类。一方面原因是媒体和企业被大众所熟知,粉丝基础量较多,另一方面原因是这些大V发布的大多是贴近大众生活的微博信息,而人工智能界的专家所发的内容较为专业,粉丝量较少。“人工智能”各群体转发量占比如图5所示。
“人工智能”信息微博量和转发量序列(前10位)见表3。从表3可以看出,尽管研究机构和专家所发微博量较多,但是转发量依然低于媒体和知名科技公司。分析个体大V后发现,企业大V的单条最高转发量明显多于研究机构,这是由于企业或者该企业领袖往往被当作该领域的领袖,得到普通大众的认可。但由于媒体在人工智能的微博数量较多,导致总转发量多于研究机构。
在对4个大V群体的转发用户分析后发现:转发企业微博的用户大部分是80后、90后,其中90后大部分为高校学生,80后多数有高校和IT企业背景;转发媒体微博人群与转发企业微博人群较为相似,80后、90后依然是主力军,同时也存在较少的60后、70后,但是其人群的教育背景明显不如企业人群,他们所关注的内容均是和大众生活息息相关的部分;对于高校的人工智能界知名大V而言,它的转发用户大都是该领域的专业人士,其中高校教师占46%,还有较少量的学生,他们的教育背景大部分为硕士及以上,也有少量的人工智能领域企业从业者,他们所讨论的内容过于专业,而不被大众所关注;转发科研机构微博的用户多为一些人工智能领域从业人士,也有高校教师。
四、推特(Twitter)对比分析
在对国内关于“人工智能”的微博传播情况进行分析之后,为了更好地了解国内外关于“人工智能”内容方面的差别,本文对比了国外类似微博的网站推特(Twitter)关于“人工智能”的讨论。通过数据爬虫技术,将“artificial intelligence”(人工智能)作为关键词,从Twitter收集了11333个用户从2016年1月到2018年3月的总计93256条数据。通过对这些用户的分析发现,回复数量较多的账号属于企业、媒体,转推数量较多的账号通常是有影响力的个人(包括专家和高管)和媒体,但是这类人发表Twitter数量较少。
Twitter用户基本特征包括:(1)用户基本分为三类:第一类是企业和机构账号,第二类是高校教师和机构专家,第三类是科技行业高管及从业人员。(2)用户大部分来自英语世界国家,其中美国占总用户的60%左右,英国占大约15%,美国依然是世界人工智能发展的领导者。(3)在该行业中,男性作为重要的领导者,其人数明显多于女性,占行业的90%以上。
关于“人工智能”的Twitter时间序列如图6所示。从总体趋势来看,关于“人工智能”的讨论发文量呈逐年递增的趋势,需要强调的是,在2016年3月alphago问世以后,关于“人工智能”的讨论发文量陡然上升,全世界对人工智能的重视程度都达到了一个新的高度。
通过对Twitter上发布的内容进行分析,本文做出词云图(如图7所示)。从图中可以看出,伴随着“人工智能”出现的热词还包括“大数据”“深度学习”“物联网”“神经网络”“机器学习”“自然语言处理”等等。
利用词频统计技术对Twitter相关数据中的词做出统计,选取词频较高且与人工智能相關度较高的技术词进行趋势分析(见图8),我们选取了“BigData”(大数据)、“IOT”(物联网)、“NLP”(自然语言处理)、“ML”(机器学习)、“Cloud”(云)、“NeuralNetwork”(神经网络)、“DigitalTransformation”(数字化转型)、“Robotics”(机器人技术)、“DeepLearning”(深度学习)、“DataScience”(数据科学)、“BlockChain”(区块链)、“CyberSecurity”(网络安全)作为分析重点,可以发现,有关这些技术的讨论都在随着时间而递增,但“ML”一直处于讨论的高点,明显高于其余技术,“BigData”“DeepLearning”“CyberSecurity”的讨论量增长较为迅速,逐渐成为热点,并且“BlockChain”在2017年11月份的讨论量陡然上升,其余技术讨论量增长缓慢。
本文借助TF-IDF选取出文本中较为关键的词,制作出如图9的共词图。在该图中总计有57个节点、542条边,每个节点表示所选出的关键词,每条边表示两个词同时出现在8个以上Twitter用户所发表的内容中。
通过计算发现,在57个节点组成的“人工智能”关键词的网络图中,实际连接数为542,即542对节点间存在共同出现在Twitter的关系,而节点对总数为3912,由此得出网络密度为0.139。在出入度方面,平均度为19.018,也就是说平均一个节点与另外9个节点相连。网络直径为2,平均距离为1.66,这意味着关于“人工智能”方面的内容连接紧凑,各领域之间的连通度较高。此外,网络中节点的平均聚类系数为0.892,表示多数节点之间的信息交流范围较宽,聚集程度较高。这一点也可以从图9中看出,关键词网络中没有孤立节点且分散的节点数较少,导致平均聚类系数较高。
五、結论
在构建“人工智能”微博传播的网络结构时,本文发现个人媒体在微博科普传播中扮演着重要角色。在自媒体时代,微博科普应注重发挥个人媒体在科普工作中的意见领袖作用,促进科普工作在微博中的快速扩散和传播,提高信息传播的效率。在微博科普传播内容中每个群体所关注的人工智能的内容会有少许差别,在微博科普工作中需要针对不同的群体制定相应的科普传播内容,同时也需要根据微博及时更新被广泛关注的科普信息,提高微博科普传播效率。此外,本文在分析微博科普受众用户时发现,媒体类和知名科技企业的转发量和受众人数明显多于研究机构和专家的转发量和受众人数,因此,在微博科普中需要注意科普信息的易理解性。
本文综合运用大数据挖掘、网络关联分析、聚类分析等多种方法对“人工智能”微博用户及内容进行了详细分析。通过案例分析发现,利用大数据技术对微博科普传播进行分析,能够把握微博科普传播的规律和特点,有利于今后科普工作的开展。未来,我们将对大数据科普进行进一步研究,使大数据技术在科普工作中发挥更多的作用,促进科普事业的发展。同时在对比国内外关于“人工智能”的讨论中发现,国内外的讨论较为相似,在前沿科技领域的讨论保持了一致。
参考文献:
[1]中国互联网络信息中心. 第44 次中国互联网络发展状况统计报告[EB/OL].(2019-08-30)[2020-02-19].http://www.cac.gov.cn/2019-08/30/c_1124938750.htm.
[2]林雪涛,杨柳. 新媒体时代科普创作与传播策略[J].传媒, 2019(21):61-62.
[3]楚亚杰,梁方圆.科学传播的公共参与模式分析:以NASA社交媒体表现为例[J].全球传媒学刊, 2019(4):54-69.
[4]Hu S, Li Z, Zhang J, et al. Engaging Scientists in Science Communication: The Effect of Social Proof and Meaning[J]. Journal of Cleaner Production, 2018, 170: 1044-1051.
[5]Hart P S, Nisbet E C. Boomerang Effects in Science Communication: How Motivated Reasoning and Identity Cues Amplify Opinion Polarization about Climate Mitigation Policies[J]. Communication Research, 2012, 39(6): 701-723.
[6]陈海琳,袁裕辉.“移动互联网+”科普整合模式创新研究——以金融科技科普活动为例[J].科技管理研究, 2020,40(5):146-151.
[7]高慧艳. 媒体融合背景下的科普期刊微信公众号运营——以“中国国家地理”为例[J].中国科技期刊研究, 2019(6):621-628.
[8]王可慧,刘筱敏,张晓丹,等. 国内外科普期刊网站资源及功能建设调研分析[J].中国科技期刊研究, 2018,29(4):66-72.
[9]闫伟娜. 全媒体视域下科普期刊用户类别化运营机制探索[J]. 中国科技期刊研究, 2018, 29(7):93-99.
[10]武瑾媛,俞敏,袁睿. 科普期刊新媒体融合发展的机遇与实践[J]. 编辑学报,2017, 29(3):214-217.
[11]杨凌. 试论大数据下的现代科技馆科普服务创新[J]. 科技视界, 2016(23):272-273.
[12]刘峰. 大数据时代电视科普节目的传播策略探析[J]. 科普研究, 2013, 8(5):53-57.
[13]王法硕,王翔. 大数据时代公共服务智慧化供给研究——以“科普中国+百度”战略合作为例[J]. 情报杂志, 2016(8):179-184.
[14]邱成利. 推进我国科普资源开发与建设的若干思考[J]. 中国科技资源导刊,2015, 47(3):1-6.
[15]Freeman L C. Centrality in Social Networks Conceptual Clarification[J]. Social Networks, 1979,1(3):215-239.
[16]康伟. 基于SNA的突发事件网络舆情关键节点识别——以“7·23动车事故”为例[J]. 公共管理学报, 2012, 9(3):101-111.
[17]戴维·诺克,杨松.社会网络分析[M].李兰,译.第2版.上海:格致出版社, 2012:84-87.
[18]Ulrik Brandes. A Faster Algorithm for Betweenness Centrality[J]. Journal of Mathematical Sociology, 2001, 25(2):163-177.
[19]Zhang W, Yoshida T, Tang X J. A Comparative Study of TF*IDF, LSI and Multiwords for Text Classification[J]. Expert Systems with Applications, 2011,38(3):2758-2765.
责任编辑:赵 玲
Abstract: With the rapid growth of science and technology and information process, the popularization of science in China is undergoing a significant change in the aspects of methods and content,and networking and socialization have become the inevitable requirement. Therefore, it is crucial to grasp the whole situation and context of the science popularization in the new era. This paper aims at studying the role that Weibo plays in popular science communication, with the dissemination of "artificial intelligence" on Weibo as a case. The contents involved in the popularization of the artificial intelligence are analyzed via big data and compared with that in Twitter abroad. The results show that Weibo plays an important role in the popularization of science and that the discussions on artificial intelligence at home and abroad are similar.
Key words: science communication; artificial intelligence; science popularization Weibo