周葆华
大数据和计算方法的出现正在影响和改变着社会科学的版图,其中包括舆论研究。一方面,互联网特别是社交与智能媒体的发展使得大规模的网络数据成为舆论的重要表征;另一方面,文本挖掘、机器学习、网络分析等计算方法的发展使得对大规模网络舆论数据的分析成为可能。“计算舆论”(computational public opinion research, CPOR)的概念指向一个以社交媒体等网络空间的意见表达为研究对象,以文本挖掘、机器学习、网络分析等计算方法为主要研究方法,以与经典舆论理论对话并发展面向数字舆论的理论为核心目标,以面向促进公众意见表达与讨论、推动社会福祉与进步为价值追求的舆论研究新领域、新取向。
“计算舆论”既是舆论研究发展的前沿领域,也是计算社会科学,以及倡导文理交叉融合的“新文科”发展的重要组成部分。“计算舆论学”不仅关心计算方法如何运用于舆论相关的各个专题,更关心如何藉由计算方法的应用,推动、促进舆论研究的理论发展与创新,以及经由研究更好地理解和把握舆论规律,促进国家发展与社会进步。
其一,计算舆论研究是学科发展的内在需求。舆论研究历史上存在两条“河流”,称之为“大众意见式”与“社会过程式”。传统上,囿于理论、方法与数据的多重缺陷,社会过程式的舆论研究总体不足、滞后明显。计算舆论研究的发展,一方面,对推进作为“大众意见”的舆论研究带来了新的契机——社交媒体上的意见表达、搜索指数等在线档案、短视频内容下的留言等均可被视为数字时代舆论的重要表征,因此,文本挖掘、视觉分析、在线档案分析等多元计算方法的运用可以刻画数字时代的“大众意见”,并将之与传统民意调查或社会事实结果进行比较、校验与预测,以及探讨两者之间的相互影响关系,从而促进对数字时代“大众意见”的精准理解;另一方面,也是更重要的,计算舆论研究具有支持过程与动态演化研究的天然优势,特别是在弥补理论与数据落差方面具有重要意义。首先,由于大数据采集自然行为的连续性,极大地扩展了舆论数据的刻度,使得原本很难采集的历时性数据得以比较便捷地获取,从而得以在集群层面观察议题、框架、意见、情感的动态演化与发展过程;其次,网络数据的特征与网络分析等计算方法,允许精确刻画公众舆论发展过程中信息、观点和情感的扩散、流动过程,分析在线交往与讨论网络的结构形态及其时间演化规律;再次,使用仿真模拟等方法,可以通过设定个体状态与交互规则来观察舆论动力机制及其演变的后果,分析舆论发展的跨层次涌现过程。中国本土经验为计算舆论研究提供了丰富的土壤,我们应当在此基础上推动理论发展,贡献数字时代舆论学、传播学的新概念,甚至新理论。
其二,计算舆论研究是科学治理的内在需求。党的十九大报告明确指出:“保障群众基本生活,不断满足人民日益增长的美好生活需要,不断促进社会公平正义,形成有效的社会治理、良好的社会秩序,使人民获得感、幸福感、安全感更加充实、更有保障、更可持续。”这提示舆论研究的社会价值出发点是以人民为中心,倾听民意。计算舆论研究是在大数据时代,运用计算研究方法更好地分析舆论规律、理解舆论过程,从而更好地倾听民意、吸纳民智,实践以民为本。这也是中国本土经验研究背后的规范性价值。对于计算舆论研究的发展,还要强调如下几点:
第一,保持对舆论理解的开放性。尽管计算輿论研究为分析网络舆论带来了巨大契机,但要注意避免大数据研究常见的“路灯效应”——因为数据获取问题影响对真正问题的研究。即因为只能“抓取”某些特定的数据,便以为采用计算方法挖掘到的是“舆论”,殊不知往往只是舆论作为社会过程之“冰山一角”。因此,需要加强对线上舆论与线下舆论的关系研究,在“大数据”与“小数据”、计算方法与传统方法的比较、整合中更好地理解和把握社会舆论。那些数据无法获取的隐匿、下沉的“舆论”,同样值得高度关注。
第二,保持研究领域的开放性。虽然计算舆论研究是从新闻传播学的角度切入,但正如舆论研究历来具有多学科交叉融合的传统,计算舆论研究的发展也是开放的。计算舆论研究特别是舆论过程与演化研究,受到物理学、计算机科学、管理科学、复杂科学等诸多学科领域的激发与推动,传播学作为舆论研究所寄身的主要人文社会科学,需要更好地与这些学科融合,共同推动兼具人文关怀、社会价值与科学精神的计算舆论研究。
第三,坚守研究的价值立场。“计算”是数字时代研究舆论的重要创新方法,而不是“算计”。计算舆论研究应当始终服务于社会福祉与发展进步,也需要高度重视公民隐私保护、数据伦理等问题。
(作者系复旦大学新闻学院教授、博士生导师)
【特约编辑:纪海虹;责任编辑:李林】