朱芷瑶
(作者单位:吉林大学新闻与传播学院)
量化研究方法具有客观性、具象性、数据化的特点,能够有效地排除人文社科学科研究过程中研究者掺杂主观情感,可以把研究结论形象清晰地呈现出来,有助于人们全面理解各种社会现象。因此,梳理我国新闻传播领域量化研究的整体脉络并详细总结其规律和方法,对推动量化研究在该领域的广泛运用具有重要作用。
本文设定中国知网(China National Knowledge Infrastructure,CNKI)数据库为数据来源,使用文献计量工具CiteSpace对研究数据进行可视化分析,直观展示研究概况与趋势。首先以“量化”为主题词检索近20余年的文献,并对其进行比对分析,以此把握研究的整体概况。其次检索近一年全文含有“量化”字眼的文献,由此窥探研究前沿。经过编码一致性检验后得到用以研究整体趋势的820篇文献。
由于文献数量过大,笔者借助学者陈美超研发的文献计量工具CiteSpace对文献数据进行可视化分析,绘制特定领域的知识图谱以清晰地展示关键词族群,并对每个族群进行主题词概括。文献计量法能够详细展示学者发文量、研究领域、所属机构,并对量化方法在新闻传播中可应用的话题提供了参考。
研究者在CNKI知网文献库以“量化”作为主题词,限定文献分类目录为中文—人文社科版块—学术期刊—新闻与传媒学科。为了保证获得综合期刊或其他学科领域有关“量化”“新闻传播”的文献,笔者同样以“量化”作为主题词,同时选取“图书情报与数字图书馆”“宏观经济管理与可持续发展”“出版”“计算机软件及计算机应用”等相关学科,搜索全文含有“新闻”“传播”或“传媒”字眼的文献,剔除广告等无效文献后再进行人工筛选,最后得到820篇文献,时间跨度为2000年至2021年。
根据检索,“量化”这一主题词最早出现在陆原于1986年在《新闻界》上发表的文章《运用系统方法搞好采、编、播》。此后,此类文章发表数量整体呈现波折上升趋势。1986年后的近20年时间里,相关学者一直保持每年不超过50篇的发文数,并于2010年迎来拐点,首次突破50篇。发文数量在2021年达到顶峰,为211篇(见图1)。
图1 文献年度分布
在研究方法与内容方面,新闻传播领域的量化研究在2010年之前集中在电视信号(2010年)、电视节目收视率(2003年)、央视招标价值评估(2004年)、报纸差错(2007年)、报业经营(2010年)等方面。2010年之后,网络媒体相关研究逐渐热门化,数据新闻(2014年)、网络舆情(2014年)、社交媒体(2019年)、用户生成内容(2021年)等都是代表性的关键词,并在对应年份集中出现(见图2)。
图2 量化研究热点时区图谱
经过详细的文献阅读,笔者发现,新闻传播学科的量化研究方法主要集中在以下两大种类:一是文本分析软件;二是各种统计学和数学模型。
文本分析的量化研究工具在前期以单纯阅读或观看文字、图片、视频为主,后期转向了各种编程语言或计量软件。文本分析的数据来源在前期以图书或纸媒、电视、广播为主,后期以网络数据、采访文本为主。2004年,汤晓羽选取改革开放初期《人民日报》典型报道的文本进行解读[1]。2005年,刘自雄把《超级女声》看作一部以声音和影像作为叙事语言的戏剧,并从文本角度分析其成功原因[2]。2017年,冉华、窦瑞晴综合利用Python、SPSS、NetDraw等工具,以CSSCI期刊为研究数据来源进行文献计量分析,探究媒介融合机制研究的热点议题[3]。2018年,叶凤云、沈思、李君君使用NVivo11对新媒体环境下青少年用户错失焦虑症的相关访谈进行编码,总结出了错失焦虑症的相关特征[4]。2018年,王建磊借助DiVoMiner对2017年至2018年的关于“日常化网络直播”相关报道进行开放式编码,研究得出该类直播方式吸引用户的原因:主体、内容、互动这三大直播要素互为补充形成的场景机制契合受众需求[5]。2021年,孔明、刘鸣筝利用编程语言Python抓取新浪微博中关于伊朗突发新闻的用户评论作为数据母本进行词频统计和隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题分析,得出用户对战争类的硬新闻的关注点集中在事件本身[6]。
统计学和数学模型也被广泛应用于新闻传播学科的量化研究中。前期研究统计方法相对单一,以数量统计或对比分析为主,后期采用复杂的数学模型并配合各种统计软件进行统计。2006年,强月新、郭韶明开展了5种主流新闻类学术期刊的传媒经济相关研究,通过生成图表的方式进行了简单的数量统计,认为思想方式的转变促进了传媒经济的发展[7]。2010年,周云倩、陈信凌利用网站流量统计平台Alexa的数据对英国广播公司(British Broadcasting Corporation,BBC)、美国有线电视新闻网(Cable News Network,CNN)、央视国际网站的综合评价指标数据进行对比分析,以此为参考探寻提高我国广电媒体的传播力和影响力的方法[8]。2014年,尤薇佳、李红、刘鲁首先通过问卷调查比较4类网络信息传播渠道对于突发事件信息的传播效果,其次构建突发事件信息渠道信任模型,最后运用结构方程对上述数据进行了分析[9]。
为了紧跟热点,本文依旧从知网文献库文献分类目录中搜索全篇含有“量化”字眼的文献,筛选出2021年1月至2021年12月一年内共2448篇文献作为数据来源,探索新闻传播领域量化研究的研究前沿。
本文使用CiteSpace对2021年1月至2021年12月的2448篇全文包含“量化”字眼的文献进行分析,绘制并生成了关键词共现词谱(见图3)。
图3 量化研究前沿关键词共现图谱
其中出现频率较高的关键词如下:媒体融合(N=136)、短视频(N=127)、新媒体(N=107)、网络舆情(N=68)、社交媒体(N=62)、融媒体(N=55)、大数据(N=45)、主流媒体(N=39)、算法(N=28)、扎根理论(N=16)。形成了10个主题聚类:#0短视频、#1媒体融合、#2人工智能、#3新媒体、#4网络舆情、#5新闻传播、#6融媒体、#7大学生、#8对外传播、#9算法。
笔者挑选N>100的3个关键词聚类分别进行文献综述。
媒体融合聚类:林信焰结合媒介经济学理论构建结构方程,探究了媒体各类绩效因素对中国媒体融合渠道管理的作用机制[10]。张苏秋、王夏歌基于文献计量学方法,利用UCinet对中国知网收录的媒介融合相关文献进行了知识图谱分析,总结出国内近20年的媒介融合研究热点[11]。刘丹借用卡尔·皮尔逊相关系数分析了网红、书店、图书品牌、出版社的短视频账号作品数与互动情况的相关性,得出结论:知名出版社短视频账号能够凭借高知名度吸引大量粉丝,但在互动方面不如网红账号和书店账号[12]。
短视频聚类:安宁、安璐基于ELECTRA和REDP方法分别对新浪微博和抖音两大平台的短视频数据舆情文本信息进行实体抽取和关系抽取,并分析二者的知识图谱,得出二者的舆情信息既有相同内容,也存在不同的衍生内容[13]。黄艳、刘默扬、李卫东以抖音和快手平台的“青年学党史”作品合集为数据来源,使用结构方程模型构建政务短视频用户信息分享的实证研究模型,研究发现用户满足感在其中起到中介作用[14]。盖晨飞基于字节跳动旗下的巨量星图平台数据统计了抖音内容创作者的商业数据,指出了内容生产者存在就业稳定性差、多频道网络(Multi-Channel Network,MCN)孵化能力欠佳等问题[15]。
新媒体聚类:徐丽芳、周伊利用CiteSpace、VOSviewer软件进行数字阅读研究知识图谱分析,详细考察了数字阅读相关研究在作者、机构、研究领域等方面的状况[16]。谢秋逸、周年兴、朱净萱基于SEIR信息传播模型和广告预算模型描述了新媒体对旅游地生命周期的非线性影响[17]。
首先,在发文量方面,新闻传播学科中使用量化方法的研究呈现波折上升趋势,整体上呈现攀升趋势。这是因为新媒体时代层出不穷的新型媒体平台和长时间在线的大量用户使媒体存储了海量数据,单一的质性研究无法满足研究需求,适度匹配量化研究方法有助于使研究结果清晰、客观,同时巨量的数据也为研究者提供了丰富的研究对象。
其次,在研究方法方面,新闻传播学科中的量化研究方法主要有文本分析和利用统计学知识构建数学模型两大类,通过分析1986年至2021年的研究数据,笔者发现,从只是简单分析数量到构建复杂的数学模型,学者选取的量化方法难度越来越大。这是由于研究对象的复杂程度随着媒介形式的升级不断增加,从曾经以文本内容为主的纸媒到文字、图片、视频汇集的融媒体,媒介包含的信息数量越来越多,这些因素增加了学者的调查难度。
再次,通过对研究前沿的分析,笔者发现媒体融合、短视频、新媒体、网络舆情、社交媒体是使用量化方法的研究者比较偏好的领域,这也与当下的媒介发展趋势相吻合,未来要持续关注新媒体发展的最新动向,结合实际进行调研分析,利用量化研究方法关注社会热点问题,作出具有真正人文价值的研究。