大数据与舆论研究的“知识图景”:基于“人与技术”分析框架

2020-05-18 06:47唐嘉仪
新闻与传播评论(辑刊) 2020年3期

张 宁 唐嘉仪

一、问题意识与研究设计

(一)问题意识与研究缘起

舆论的概念最早可追随到洛克所著的AnEssayConcerningHumanUnderstanding一书。李普曼在《舆论学》中称舆论是“他人脑海中的图像——关于自身、关于别人、关于他们的需求、意图和人际关系的图像”[1]。陈力丹结合中国实际,对舆论进行如下定义:“舆论是公众关于现实社会以及社会中的各种现象、问题所表达的信念、态度、意见和情绪表现的总和。具有相对的一致性、强烈程度和持续性,对社会发展及有关事态的进程产生影响。其中混杂着理智和非理智的成分”[2]。

技术的更新换代在不断改变舆论的环境和形态,同时也加大了舆论研究的难度。首先,互联网作为民间公共领域的重要组成部分,在形成公共舆论方面的作用和地位日益突出。社会化媒体所构建的舆论空间表现出“复合式场域的特征”[3]。有研究者指出,“利用Twitter等社交媒体来搜集信息并作为新闻来制造舆论存在着信息真实性风险”[4],网络舆论监督借助于网络平台的交互性使分散的舆论产生共振合力,强大舆论压力倒逼政府改革现象时有发生[5]。其次,诸如个性化新闻系统等算法推荐技术的普及可能使公民无法接触到必要的信息从而做出明智的行动和决策。更有甚者认为,新媒体环境下的社会互动过程,将导致以心理群体或舆论群体形式存在的社会公众出现意见极化[6]。网络的去个人化特质有利于群体认同的形成,扩大群间的差异,使得网络舆论容易朝原有偏向的方向继续移动,最终呈现出极端的观点[7]。第三,过去,对舆论和图像的信息和表达方式加以控制,一直是国家权力的维系工具,“在大众传媒时代尤其完善无比”[8],然而随着社交媒体等现代传播技术的兴起与发展,舆论监测和管理的难度在不断加大。舆论的形式当前也超越了传统的主要以文字为载体的存在方式,近年来网络“表情包”的出现和风靡使得越来越多网民通过这种非文字的表达方式进行意见表达,而诸如此类的“通过对娱乐符号加工的方式,使得当下的公众重新掌握了一种新型的话语权,并以此形成舆论”[9],在权力场域的争夺中获取一席之地,也使得舆论监测和挖掘的难度大大增加。

正如卡斯特所宣称的,“技术就是社会,若无技术工具,社会也无法被了解或再现”[10]。大数据作为一项技术,其开发和应用为舆论研究带来了全新的思路和可能性。卡斯特也曾预言,“计算机的功能之一,是为了某种特殊的目的而搜集、加工和使用大量的个人信息”[8]。据麦肯锡全球研究所称,“大数据是指数据集的大小超出典型数据库软件工具捕获、存储、管理和分析的能力”[11]。大数据在信息挖掘、情感分析、语义分析、实时追踪等方面均有独特的属性与应用潜力,大数据的视野与思维使得舆论研究有了新的范式和思路。如何引入大数据思维来构建现代舆论研究体系,提升舆论研究的质量与水平,拓展舆论研究的深度和广度,是业界和学界共同关注的焦点议题。

有学者指出,“公众是舆论的主体”[12],要想研究舆论,离不开对舆论主体的研究。在大数据时代,“公众既是大数据资料库信息的主要来源,同时也是数据库的使用主体”[13]。曼海姆相信,技术的方法一旦被运用到人类社会中,则会“引起人本身的深刻变化”[14],人与技术的关系随着技术的发展不断地被形塑和改变。正如艾卢尔所说,“技术是被人们从后面推动的”[15],笔者认为,作为技术的一种,大数据的出现也改变了舆论研究的范式,而“大数据与舆论”研究在本质上就是围绕“人”(舆论)与“技术”(大数据)的结构关系研究。

从研究现状来看,尽管已有学者对大数据应用于舆论的研究现状进行梳理,但这些梳理大多数是综述类的回顾[16],或是对研究现状进行宏观的陈述[17],尚未有研究通过文献计量的方法对大数据与舆论研究的具体情况进行分析,而且分析思路较为零散,没有提供较为清晰的分析框架。有学者认为,在技术与人的互动关系中,最基本的关系问题是“控制与被控制的问题”[18]。我们认为,“大数据与舆论”研究从本质上看是关于“人和技术”关系的反思。

为提供一个兼具现实意义与学术价值,同时又能促进国内外学术对话的研究框架,本文创造性地提出“人-技术”的分析框架,围绕此研究框架,重点关注在现有的大数据与舆论研究的学术话语中,人和技术的结构关系如何被认知和呈现。梳理学者在现有的文献中如何讨论和认知人与技术的关系,一方面可以帮助我们了解目前这一重要的结构关系在学术话语中如何被呈现和理解——了解“大数据时代,技术如何影响人和舆论”“人是否会在大数据时代对技术产生反作用”等问题的思考在学术研究中如何被解答;另一方面可以发现现有关于大数据与舆论研究的不足与限制,寻找人与技术的互动关系中尚未被学术研究深入讨论的重要问题,为后续的研究提供有价值的反思。

通过文献内容分析和文献计量分析的方法,本文以国外SSCI核心数据库和国内CSSCI核心数据库中的相关文献为分析对象,紧扣“人-技术”的分析框架,从结构特征和焦点叙事两方面对国内外大数据与舆论研究的进展进行梳理,探寻在现有的大数据与舆论学术话语中,学者们围绕人与技术的关系提出哪些学术主张。本次研究同时涵盖国外SSCI数据库和国内CSSCI数据库文献样本,既可以同时了解不同地区学者的研究进展和特点,同时可以进行横向对比,直观地比较国内外学者在这一领域的研究差异,并在此基础上对现有的研究进行述评,为国内学者未来开展相关领域的研究提出展望。

(二)研究方法与编码说明

本次研究采用文献计量和内容分析的综合方法,不拘泥于传统的内容编码手段,从“人-技术”的框架出发,对2013—2018年间国内外大数据与舆论研究的焦点议题进行梳理,并在相关计算机软件(统计软件R和社会网络分析软件Ucinet)的辅助下对样本文献的标题和摘要高频词进行统计,以及对关键词之间的共现关系进行分析。

在文献样本方面,笔者以“big data”和“public opinion”为关键词在Web of Science数据库中进行主题检索,同时以“大数据”和“舆论”为关键词在中国知网数据库进行主题检索。选择以“主题”进行检索的原因主要是用“关键词”和“标题”进行检索的覆盖率过低,可能会遗漏大量文献,而以“全文”进行检索则发现检索出无关文献过多,故综合考虑下选择以“主题”作为检索条件。喻国明等人在2013年提出,“借助大数据,舆情研究的视角将更加多元化”[19],为验证这一研究设想,以及了解经过五年发展后大数据与舆论研究的整体态势,本次研究将样本文献检索范围限定在2013—2018年间,检索时间为2019年3月,共得到相关英文文献(SSCI核心数据库)82篇,中文核心文献(CSSCI核心数据库)110篇,剔除无关文献后,最终样本文献量为182篇,其中英文文献75篇,中文文献107篇。需要说明的是,本次研究从“人-技术”的分析框架出发,探寻以“大数据和舆论”作为研究焦点的文献如何对人和技术的结构关系进行定义和描述,因此分析样本中不仅涵盖了使用大数据技术作为舆论研究方法的文献,也包括了以其他研究方法讨论大数据和舆论研究关系的文献材料。

本次研究的“知识图景”分析框架主要分为结构特征和焦点叙事两方面,分析编码设计如下:

表1 文献研究编码表

知识图景细分内容编码设计结构特征人与技术关系认识a(1)技术可以对公众舆论进行挖掘(2)大数据技术可以引导公众舆论(3)大数据改变和影响公众舆论(4)技术与公众舆论相互作用(5)大数据可以预测人的舆论和行为(6)其他关键词共现借助社会网络分析软件Ucinet完成焦点叙事研究焦点b(1)大数据与社会治理(2)公众舆论与舆论引导(3)大数据在舆论研究中的应用(4)大数据与舆论监测(5)大数据与传播改革(6)大数据与公共传播(7)大数据引起的问题(8)其他议题标题、摘要高频词借助统计软件R编程完成

a由于一篇文献所提到的“人-技术”关系可能不止一个,故在实际编码中“人与技术的关系”的总体数量可能高于文献总数;b由于一篇文献所关注的核心问题可能不止一个,故在实际编码中焦点话题的总体数量可能高于文献总数。

为了检验编码条目的信度,本研究随机抽取了中英文文献各20篇,由两位编码员独立完成文献编码,并通过内容分析相互同意及信度检验公式进行测量(Holsti,1969)。经编码检验,英文文献信度检测结果为:焦点话题82%,“人-技术的关系”81%;中文文献中信度检测结果为:焦点话题84%,“人-技术的关系”80%。对未一致的编码部分,两位编码员进行二次讨论和再编码,以保证编码的一致性和统一性。根据社会研究方法的要求,一般来说内容分析的信度达到80%就符合要求,由检验结果可得,本研究在类目分类及指标设计,以及具体的编码上都比较符合信度标准,具有较高的可信度。

二、知识图景:大数据与舆论研究的进展描述

(一)大数据与舆论研究的结构特征

1.“人与技术”:预测还是引导?

在大数据的介入下,舆论研究中人与技术的关系被重新建构和理解。通过文献内容分析,我们发现在国内外大数据与舆论研究中,人与技术的关系可以被大致归纳为六大面向:“技术可以对公众舆论进行挖掘”“大数据技术可以引导公众舆论”“大数据改变和影响公众舆论”“技术与公众舆论相互作用”“大数据可以预测人的舆论和行为”和“其他”。人与技术不同的结构关系在SSCI和CSSCI文献中的分布情况如图1所示。具体来看,从“人-技术”的结构关系视角出发,国内学术研究更强调大数据对公众舆论的引导和挖掘作用,而国外学者则更多地从大数据对公众舆论的挖掘和预测角度切入:

图1 国内外学术研究中“人与技术”结构关系的分布对比

在国内大数据与舆论研究话语中,学者们对人与技术的关系建构主要体现为“技术对人的影响”,具体细分成两个重点——“舆论引导”和“舆论挖掘”。在“舆论引导”中,学术研究重点讨论了两大关键点:其一,在社交媒体传播时代,信息量呈现指数级增长,因此也容易造成舆论风险,尤其是意识形态方面的建设工作难度加大,大数据这项技术被认为应该充分应用在意识形态教育[20-22]、文化思想塑造[23-24]、社会动员[17]等领域;其二,在风险社会中,谣言管理问题的重要性凸显,大数据技术可以帮助政府和社会管理者实现高效的谣言治理和舆情回应[25-27],提高风险事件中的舆论引导能力,并为政府传播带来更多有效引导舆论的传播手段和渠道。而在“舆论挖掘”中,“人”被理解成可以通过人工智能、算法等大数据工具识别、分析和预测的对象。有学者提到,大数据时代数据使用的关键是“挖掘数据的潜在价值、实现数据重组的创新价值”[28]。在大数据技术的帮助下,社会管理者可以识别“重点风险人群”[29],并对其行为、社会网络、人口特征进行综合分析[30],为舆论预测提供科学的方法,降低社会舆论风险,而这种应用潜力不仅对国内公众有效,还可能被应用在国际舆论的研判与传播工作中[31-32]。笔者认为,国内学者在开展大数据与舆论研究时,对人与技术的关系描述存在某种“简化论”的理解现状,过分强调技术对人的作用,而对人如何反作用于技术方面的思考不够。

而在国外研究中,学者们更关注大数据技术对公众舆论的“挖掘”和“预测”作用,同时强调了技术与公众舆论的相互影响关系,认为大数据技术在影响公众舆论的同时,舆论本身也在反作用于大数据技术的发展和具体应用进程。从大数据对公众及其舆论进行挖掘的角度来看,国外学者的研究重点提及了三个方面:一是通过大数据挖掘公众舆论背后的心态和情感,从而对社会运动,尤其是政治运动中的公众舆论进行研究[33-34];二是在商业领域中,借助大数据的舆论挖掘功能寻找营销和商业机会[35-36];三是从方法论的角度着眼,介绍通过何种方式具体实现大数据在舆论信息收集和挖掘方面的功能[37-38]。而关于大数据在公众舆论方面的预测功能,国外学者的研究则以政治运动为主要的讨论方向。具体来看,在政治运动的领域,有学者指出,通过大数据信息收集、模型建构和验证,可以在政治选举等政治行动中预测公众的舆论走向甚至行为举动[39-40]。也有部分研究针对大数据在舆论和行为预测方面的具体操作方法[41]和存在的问题与困境进行分析[42]。

从发文数量的年度发展趋势来看,自2013年开始,国内外有关“大数据与舆论”的相关研究都处在稳定、快速、持续增长的状态,且国内外研究从数量的增长情况来看呈现出较为一致的趋势,尤其是在2015年之后更是呈现出近乎“井喷式”的发文趋势。可以说“大数据与舆论”的研究正成为目前国内外学术界的一个关注焦点,笔者相信,这一焦点议题将在未来持续吸引学术界的关注和讨论,引发更多具体的讨论话题和发展方向。

图2 2013—2018年CSSCI论文发文数量与占比趋势

图3 2013—2018年SSCI论文发文数量与占比趋势

此外,笔者从纵向的时间维度开展分析,对2013—2018年间国内外大数据与舆论研究中人与技术的关系定义情况分布进行统计(图4)。如图所示,进入2015年以来,大数据与舆论学术研究的数量激增,和前文分析一致,“舆论挖掘”和“舆论引导”是这几年学术研究中围绕人与技术关系所提出的核心观点。其中“舆论挖掘”在2016和2018年数量最多,而“舆论引导”则在2017年出现较为集中。此外,关于大数据与舆论引导、大数据对公众舆论的影响以及大数据对公众舆论的挖掘这三方面的研究数量在整体上均呈现出上升的发展趋势。

图4 国内外学术研究中“人与技术”结构关系的年份分布

2.关键词共现分析:社交媒体舆论是研究焦点

结合社会网络分析软件Ucinet,我们对样本文献的关键词共现关系进行了分析,由于样本文献数量较大,涵盖的关键词数量较多,因此在下图中只呈现词频大于2(中文文献)和大于3(英文文献)的关键词共现情况。在共现关系中,节点越大代表关键词与其他关键词连接次数越多,线条越粗表示共现次数越多。共现分析可以反映关键词汇之间的结构关系,直观地呈现大数据与舆论研究的核心内容和研究指向。

如图5所示,与前文分析一致,从“人-技术”的分析框架出发,国内大数据与舆论研究强调大数据技术对公众舆论的引导作用,同时突出网络舆论的重要性,并与社会动员、社交媒体、媒体转型、意识形态等现实关怀相结合。结合文献内容分析可以发现,国内大数据与舆论研究呈现出较强的应用性特征,即中国本土的大数据与舆论研究在研究指向和目的上强调以研究服务实践的价值取向。

图5 中文核心论文关键词共现分析(词频>2)

如图6所示,与前文分析一致,国外大数据与舆论研究有三大重点议题:一是网络舆论,尤其是社交媒体舆论在大数据技术背景下的研究问题是重点;二是在舆论研究的众多子议题中,大数据在情感分析中的应用是重中之重;三是区别于国内研究中对媒体转型、意识形态等议题的关注,从“人-技术”的分析框架出发,国外学者对大数据与舆论方面的研究,更关注政治选举、政治参与等政治传播和医疗卫生、疾病预防等健康传播问题。

图6 SSCI核心论文关键词共现分析(词频>3)

无论是国内还是国外的研究,我们从文献关键词共现分析中都可以发现,围绕社交媒体开展大数据与舆论研究,是国内外当前的研究热点。从“人-技术”的视角出发,在大数据时代,舆论研究的“人”容易被简化成“网民”尤其是“社交媒体用户”这一类型主体。一方面这显示了随着社交媒体不断的发展和普及,社交媒体对社会舆论的影响不断深入;另一方面也凸显了现有的学术研究在开展大数据与舆论研究时对其他类型社会主体的舆论关注有所欠缺,大数据与舆论研究似乎已经逐渐等同于大数据与社交媒体舆论研究,这是国内外学术研究普遍存在的问题和特征。

(二)大数据与舆论研究的焦点叙事

1.研究议题:实践价值驱动的问题意识

如图7示,在八个主要的研究焦点中,国内学者最关注的“公众舆论与舆论引导”“大数据与传播改革”和“大数据与社会治理”三大议题,其中舆论引导和传播改革的重要性尤为突出。具体来看,在“公众舆论与舆论引导”问题下,从“人-技术”的视角出发,国内学术研究的焦点又大致分为三大重点:一是从风险社会视角出发,关注突发事件发生后大数据对公众舆论引导的作用[43];二是结合重点人群,讨论大数据如何对特定人群(如青年、大学生)进行意识形态教育和舆论引导工作[44-45];三是突出方法论的研究导向,从实践指导的层面讨论大数据时代公众舆论的引导工作有哪些工作思路,包括司法层面[46]、教育层面[47]、媒体层面[48]等。

图7 国内外学术研究中研究议题的分布对比

而相比之下,国外学者对大数据与舆论的研究则以社会治理作为焦点问题。同时,国外学者在探讨“大数据与社会治理”方面的问题时涉及的具体议题较为广泛。在这些大数据与舆论的相关研究中,除了强调大数据与政府治理相关的舆论问题[39],还重点提及了大数据在医疗和公共卫生问题治理[49-50]和环境风险治理方面的应用问题[51]。此外,“大数据与舆论监测”和“大数据在舆论研究中的应用”也是国外学者普遍重视的关键议题。前者偏向于讨论通过大数据这项技术,对公众舆论背后的社会态度和社会情绪进行分析,尤其是社交媒体数据承载的公众舆论意义[34]。后者则呈现出较强的反思性和批判性,从两个方面反思大数据在舆论研究中的应用问题:一是反思大数据作为一种方法本身存在的有限性,强调在现行条件下大数据对公众舆论的研究仍有一定的困境和限制,认为大数据并不能解决舆论研究中的全部问题[52];二是将大数据对公众舆论的研究与传统舆论研究方法进行对比,在提出大数据在舆论研究方面具有优势的同时,强调将大数据舆论研究与其他方法相结合的重要性[53-54]。

总的来看,国内外学者在大数据与舆论的相关研究中,主要提出的研究问题呈现出强烈的实践价值层面驱动的学术特征,结合“人-技术”的分析视角可以发现,无论是国内还是国外的学术研究,在围绕大数据与舆论提出研究问题时,大数据技术被视为一种新的社会权力手段,社会控制论和技术决定论的片面认识论普遍存在,相对忽视了公众舆论对大数据这项技术的反作用。

2.标题、摘要高频词:情感引导还是情绪认知?

借助统计软件R,笔者对样本文献标题和摘要中的高频词进行了统计,并根据统计结果绘制词频云图。如图8所示,从“人-技术”的分析框架出发,国内大数据与舆论研究有两大焦点:首先,研究范围以网络舆论为主要对象。单从舆论的定义和中国互联网的普及情况(1)参见CNNIC发布的第44次《中国互联网络发展状况统计报告》。来看,社会舆论不等同于网络舆论,但正如有学者所指出的,“2017年互联网开始掌握社会舆论主导权”[55],网络舆论对社会舆论的影响越来越深,互联网在中国的发展速度和现状引发广大学者对大数据如何认知、挖掘、引导网络舆论的关注。其次,大数据如何对舆论进行引导是学术研究的核心关怀。通过对文献具体的内容分析可以发现,意识形态教育、公众舆论引导、舆论环境净化等都是当前国内大数据与舆论研究的重点议题。

如图9所示,在SSCI核心论文中,“大数据与舆论”研究的重点也呈现出两大特征:其一,利用大数据对人的情感和情绪进行分析是舆论研究的重点议题。“Opinion Mining and Sentiment Analysis”(意见挖掘和情感分析)是过去几年国外相关研究中反复强调的话题之一,目的是将人类情感的观点和表达转化为可量化的数据,以确定公众对特定问题的态度。这些研究主要探讨两个方面的话题:一是从操作的层面介绍大数据的情感分析方法[56],二是从应用的层面介绍大数据对舆论背后的情感分析可以被应用在哪些领域[57-58]。其二,对以Twitter为主的社交媒体用户的舆论研究重要性被凸显,这与国外长期以来在舆论研究方面的学术脉络一致——因循始于20世纪30年代的大众媒体对舆论影响研究。从网络媒介尤其是社交媒介中收集舆论承载的社会信号的可能性带来了一个新研究领域的发展。单以Twitter为例,利用大数据对推文进行舆论分析就被应用在社会运动研究[59]、气候变化预测[60]、地缘政治分析[34,38]、公共危机管理[61]等多个领域。

图8 中文核心论文标题、摘要高频词云图

图9 英文核心论文标题、摘要高频词云图

总的来看,从学术文献的标题和摘要高频词来看,国内外大数据与舆论研究都突出了网络舆论,尤其是社交媒体舆论的重要性,其中国内学者的研究更强调如何通过大数据对这些舆论背后的情感进行引导和影响,而国外学者的关注焦点则更多地体现在大数据对公众情绪的监测和挖掘。从“人-技术”的视角出发,以探讨人的“情感”“情绪”为焦点的舆论研究将在未来持续一段时间内成为国内外学术研究的焦点之一,其中社交媒体的重要性将被持续凸显。

三、文献述评:国内外大数据与舆论研究的图景概述

技术哲学家J·M斯塔迪梅尔认为,“脱离开人类背景,技术就不可能得到完整意义上的理解”[62]。大数据与舆论研究经历过去几年的发展,已经初步形成一个整体体系,进入了一个高速发展的研究阶段,在相关领域开拓出丰富而多元的研究议题,且中西方学者的研究分别呈现出各自明显的倾向性和选择性。总的来说,从“人-技术”的视角出发,当前国内核心论文中关于“大数据与舆论”的研究呈现出两大本土化特征:第一,尽管国外学者的研究也会提及大数据对公众舆论的影响,但几乎没有直接提及“舆论引导”的概念,而在国内的“大数据与舆论”研究中,“舆论引导”则被放置在极其重要的位置。受到社会转型时期特定的社会背景和社会发展现状,以及长期以来中国社会文化和舆论生态环境等综合因素的影响,笔者认为,“大数据对公众舆论的引导”将在未来相当长一段时间内继续成为国内大数据与舆论研究的重点问题。第二,从整体上看,大数据与舆论的相关研究主要服务于政府的舆论管理需求,互联网思维的“受众中心”“以人为本”在目前国内“大数据与舆论”研究中仍没有充分体现,结合国内相关研究的两个重点议题——舆论引导和社会治理可以发现,在学术话语体系中,我们可以发现大数据更主要被理解和定义为可以帮助政府、企业等相关机构识别、发现、跟踪、监控、分析公众的工具,而缺少对大数据时代公众舆论如何反作用于大数据这项技术的探讨和论述。

从“人-技术”的视角出发,国外学者的研究整体上也呈现出两大偏向:首先,国外的大数据与舆论研究有更多批判性和反思性的讨论,包括大数据在预测和挖掘方面的局限性、公众数据隐私和数据收集的伦理道德、公众对大数据这项技术的态度和认知等。国外学者在进行相关研究时不仅从技术对人的影响角度切入,也会关切人本身如何对技术产生反身性的影响。其次,过去几年国外“大数据与舆论”的应用在商业领域中的相关研究中备受关注,相比起国内学者更倾向于从政府治理的视角出发讨论如何使用大数据进行舆论方面的应用探讨,国外学者们的研究提出更多与商业和营销领域相关的问题,这一点在国内的相关研究中少有出现。

总的来说,国内学者相比之下更强调大数据对公众及其舆论的改变、影响和引导,国外学者则更多地聚焦于大数据在预测、预判、模拟公众舆论、情感甚至行为方面的潜在功能,尤其是在政治选举、金融市场、商业银行方面的公众研究,是国外学者在“大数据与舆论”研究所重点关注的视角。尽管国内外“大数据与舆论”研究存在一定的差异和偏向,但是在对“人与技术”的关系理解上,国内外学术话语建构也表现出一定的相似性,主要可以概括为三方面:第一,在研究对象上,对网络舆论尤其是社交媒体高度关注。文献分析显示,当前学术研究中利用大数据进行的舆论研究大多与社交媒体相关联,国内的微博、微信,国外的Twitter、Facebook和Google+都是学者们重点关注的案例。在这些学术研究中,“社交媒体舆论”在很大程度上已经被等同于“网络舆论”,进而等同于“公众舆论”。一方面这体现了当前社交媒体在移动互联网社交时代的重要地位;另一方面也让我们警惕这样的研究取向是否会忽略了其他语义下的公众舆论,造成研究与现实的差异甚至“鸿沟”。第二,国内外研究均重点提到了大数据对舆论挖掘的重要性。通过数据挖掘,获取社会管理、金融经济、文化传播、国际关系、医疗健康等多领域的关键数据信息,是目前国内外学者们共同提及的关于大数据时代人与技术关系的重要视角。同时,意见和舆论挖掘也常常与社会情绪分析相联系,重点探讨大数据作为一种信息分析工具如何对舆论背后的情感意义进行挖掘。略有不同的是,国内学者在相关论述上更多以应用前景的描述性分析为主,而国外学者的研究则重点提及方法论,即通过何种技术工具可以实现相关挖掘功能的介绍。第三,在学术关怀上,从“人-技术”的视角出发,大数据与社会治理是国内外学者共同关注的焦点议题。国内外相关研究都不谋而合地认为大数据在舆论研究中可以实现不同方面的社会治理功能。具体来看,国外学者更多地提及大数据在医疗健康、公共卫生、和平稳定、环境保护等方面的治理应用;而国内学者的研究则更多联系到金融经济、教育管理、政府改革等问题,现实导向性强是现有大数据与舆论研究的普遍特征。

四、研究结论:大数据与舆论研究中应该坚持“人本”导向

正如有学者所强调的,“互联网思维的核心要义是用户思维”[63],笔者提出:大数据时代的舆论研究应该体现“以人为本”的理念和导向。基于对样本文献的梳理和分析,结合中外学术对话的比较结果,笔者认为,从“人-技术”的视角出发,未来国内关于“大数据与舆论”的研究存在几个重要的发展方向和有待解答的关键议题:

其一,对大数据将如何被应用在舆论研究这一领域的问题,国内学者缺乏对存在的问题进行批判式的思考,即使在一些带有反思性的研究中,也大多数是针对现存的问题提出“隔靴搔痒式”或“千篇一律式”的对策和建议,缺乏对大数据与舆论领域存在的问题进行探讨,也较少结合中国国情提出本土化、在地化的对策和建议。其中“数据隐私”和“人才培养”这两个问题已经被不少国外学者所关注,但是在中文样本文献中,对这些问题的讨论仅有少数。如刁生富和赵亚萍反思了大数据时代个人隐私和自由权利可能会受到侵犯的客观现实,提出在大数据传播时代法律应该明确对“隐私”的边界进行划分的观点。张志安和邹禹同也认为大数据时代“被遗忘权”引入中国具有极强的社会现实意义。谢耘耕和万旋傲认为大数据要充分应用在舆论研究的领域中,一个无法避免的话题是数据分析型人才培养的现实问题。这些研究为我们提供了一部分反思大数据与舆论研究现状的思路,启示我们未来国内大数据与舆论的学术研究应更多考虑技术给社会带来的多重影响,

其二,当前国内大数据与舆论研究的焦点议题之一是大数据在舆论监测和引导方面的应用,但是对如何利用大数据这项技术对公众舆论背后的社会心态进行解剖则仍待进一步研究。公众通过发表言论形成公众舆论,社会管理者利用大数据了解这些舆论背后的心态和诉求后做出回应并满足其中的合理诉求,实际上是公众在借助大数据行使自身合法权利的一种新手段。从研究现状来看,关于大数据工具如何在收集公众舆论的基础上分析社会心态和社会情绪等问题,从而发现和解决社会问题的讨论,国内学者的研究仍相对停留在“纸上谈兵”的阶段。笔者认为,未来国内学者在讨论大数据与舆论的相关问题时,理应在关注舆论监测和引导的基础上,进一步探寻如何借助数据对人类情感情绪和社会行为进行预测、分析和反思,从而实现大数据对社会心态的研究分析。

其三,国内学者对大数据与舆论相关议题的研究需坚持以人为本的中心要旨,进一步突出“以技术服务人”理念,坚持“技术向善”“数据向善”而不是“以技术控制人”的中心要旨,避免陷入技术决定论的片面思维模式,使学术研究更具有社会温度和人文情怀。一如有学者所指出的,“技术是人功能的延伸,被寄予了为人服务、为人谋利的情感态度”[64]。然而当前国内学者更多把大数据与公众舆论之间的关系定义为技术(大数据)对人(舆论)产生影响,忽略了人在这种互动关系中的能动作用,关于人如何反作用于技术则缺乏深入讨论。例如,笔者认为,在“监测”“挖掘”和“引导”之间至少还有“回应”的环节,从“人-技术”的视角出发,对大数据与舆论问题展开的研究还有更丰富和多元的思维方式和学术关怀。

本次研究以2013—2018年间英文SSCI核心数据库和中文CSSCI核心数据库中关于大数据与舆论的文献作为分析样本,结合内容分析和文献计量的研究方法,从“人-技术”的分析框架出发,关注现有的大数据与舆论的相关研究中,人和技术的结构关系如何被呈现,并通过关键词共现分析、标题和摘要高频词等统计,描绘出国内外大数据与舆论研究的知识图景概况。在本次研究中,存在两点局限需要做出说明:其一,考虑到篇幅和研究精力的限制,部分国内外非核心数据库中的论文尚未包含在本次研究的文献库中,抽样时间的限定也会对文献样本的全面程度有一定影响。在未来的研究中,可以采集来源更广泛而完整的文献样本,从而扩大文献样本的覆盖面,提高研究结论的普适性与指导意义。其二,在研究方法上,本文引入了统计软件R和社会网络分析软件Ucinet,充实了文本分析的方法论意义。但是对计量结果的分析主要还是依赖于研究者本身对数据结果的认知和理解,未来随着数据分析和信息挖掘手段的不断进步和完善,我们相信可以进一步利用更多不同的研究方法获得更加客观、科学的文献分析和研究效果。