智媒体:新闻业数字技术应用研究的知识图谱分析

2022-08-16 03:32郑勇华
贵州师范学院学报 2022年7期
关键词:发文人工智能文献

郑勇华,何 美

(贵州民族大学传媒学院,贵州 贵阳 550025)

引言

当前数字技术正在改变传统媒体产品的基本形态和运营模式,正在颠覆普通大众新闻获取方式和生活方式,数字经济已经成为世界经济增长新的增长极[1]。《“十四五”数字经济发展规划国发〔2021〕29号》(草案)强调推动数字技术与实体经济融合,且国家发布的《关于加快推进媒体深度融合发展的意见》(2020)中明确要求加强数字技术在传媒行业的前瞻性研究应用。可见,数字技术已成为传媒行业加快深度融合的关键性技术驱动力。通常说,数字技术主要是指大数据(BD)、物联网(IOT)、人工智能(AI)、机器学习(ML)、区块链技术(BT)和5G等新一代信息技术[2]。而中国作为世界互联网用户最多的国家,数字技术在传媒领域的应用较为广泛并发展迅猛,涌现出抖音、微信、快手等智能型平台[3],也出现媒体大脑、央小广、人民日报AI合成主播[4]、腾讯新闻写作机器人等智能化采编播的媒体设备[5]。

与实践相比,有关新闻业数字技术应用研究稍显滞后,目前中国关于该领域的研究刚刚起步[6]。相关的综述文献寥寥,如清华大学张梦、陈昌风[7]团队用文献精读的方法研究国内外人工智能在新闻业中应用热点和伦理问题,但该研究在文献选取和研究方法的科学性上值得商榷,且研究只关注人工智能技术,未关注到其他数字技术。因此,十分有必要对新闻业数字技术应用这一领域的文献计量进行系统梳理,促进国内媒体研究者了解新闻业数字技术应用的研究热点、演变逻辑和未来研究方向,以期更多中国学者关注和开展新闻业数字技术的相关研究,为新闻业数字技术应用和发展贡献知识。

一、数据来源和研究方法

(一)数据搜集

本研究选择CNKI数据库中的CSSCI作为数据来源类别,以“智能媒体”“智慧媒体”“智媒体”“人工智能+媒体”“5G+媒体”“区块链+媒体”“机器学习+媒体”“传感器+媒体”为主题进行精确检索,检索时间跨度为2003—2020年,检索时间为2021年1月31日,共检索到532条结果,去掉会议、书评、会议报道等无关文献,经筛选后共获得有效文献总量500篇。

(二)研究方法

1.文献计量法是一种综述研究中常用的信息统计方法,按照研究文献分为发文时间、发文量、发文期刊、发文作者进行文献计量,并结合NoteExpress进行文件格式转换,用Excel进行二维可视化的呈现。

2.知识图谱的可视化工具较多,本文选择美籍华裔学者陈超美教授研发的CiteSpace5.7.R1文献可视化软件[8],目前该软件广泛应用于挖掘学科热点和捕捉学术前沿的研究。本文将500篇文献按要求格式导出,并进行计量分析。

二、智能媒体研究主题的文献计量分析

在CNKI检索结果中导出NoteExpress格式的文件,之后把文件导入NoteExpress软件并导出Excel格式的文件,再用Excel进行发文作者、发文机构、发文期刊的计量分析。

(一)发文作者

由表1可知,高校新闻与传播学院学者是该领域研究的主要研究者,北京的高校和研究机构人员占据绝对优势。国内智媒体研究领域首次发文时间最早和发文量最多均是喻国明教授。彭兰教授共发表22篇与智媒体相关的论文,包括大数据、人机关系、新闻算法与伦理、新闻生产、信息茧房等,单篇论文最高引用次数高达445次。喻国明教授共发表38篇与智媒体相关的论文,包括智能化转型、信息茧房、内容生产、算法与伦理、传播模式、平台媒体等,单篇引用率最高达到163次。其他发文量超过5篇的作者有陈昌凤、黄楚新、胡正荣、郭全中、王丹、段鹏、张志安、李鹏等。

表1 发文量前十作者一览表

表2 智媒体研究发文量前十研究机构

根据普赖斯原理[9-10],该领域发文量最多为喻国明的38篇,即Npmax=38,求得Mp值为5,即发表文献5篇以上的作者可视为该领域的核心作者。由此,可见智能媒体研究领域核心作者共21位,核心作者共发表文献178篇,仅占相关文献总量的35.6%,远未达到普赖斯提出的核心作者发表数量之和占总文献数量50%的指标。可见,国内智能媒体领域虽然形成了较为明显的作者合作集群,但核心作者群尚未形成。

(二)发文机构

由表2可知,中国传媒大学发文量最多,达到62篇,其次中国人民大学达到45篇,前10家机构共发文266篇,占总量的53.2%,基本涵盖国内重点高校和社科院。根据普赖斯定理该研究领域存在核心研究机构。

从论文研究内容来看,这10家单位均利用自身的优势和专长来开展相关研究,如中国传媒大学,自2019年起与新浪AI媒体研究院联合启动了中国智能媒体发展研究系列课题,每年发布《中国智能媒体发展报告》成果,已形成智媒体产业研究团队;北京师范大学在喻国明教授带领下形成计算传播研究团队;清华大学形成算法与大数据舆情的研究团队。

(三)发文期刊

根据检索结果统计该主题的研究共有77个期刊发文,总体而言,期刊分布相对比较分散,并没有集中于某几个期刊,由此反映该主题研究涉及学科相对广泛。由表3可知,发文量最多的是《传媒》,达到71篇;其次是《新闻与写作》,达到70次;其他大于15篇期刊按照数量从大到小依次有:《现代传播》《出版广角》《电视研究》《中国编辑》《编辑之友》《当代传播》《中国出版》《新闻爱好者》。而该领域发文最早是《当代传播》,在2008年发表《从“地球村”到“地球脑”——智能媒体对生命的融合》一文,该文是最早从学术上涉及智能媒体,但只是把智能媒体作为背景[11]。真正开始研究智能媒体是在2015年之后,刊文量前十的期刊累计发文328篇,占发文总量的65.9%,反映出该领域的研究还是以新闻传媒类与出版类期刊为主。

表3 智媒体研究载文量前十发文期刊

三、智能媒体研究高频词与研究热点

(一)智能媒体研究高频词分布

关键词是对整篇论文研究重点的高度概括和提炼,也是作者对研究发现重要体现[9]。本文用CiteSpace5.7.R1软件计算高频关键词及中心性,并结合普赖斯原理来确定核心关键词,计算得到关键词的阈值为9.67,因此选取频数大于10的关键词作为高频关键词,并将中心性在0.03以上高频关键词作为研究对象,如表4所示。

表4 前十高频关键词与中心性统计表

由表4可知,新闻行业中“人工智能”“智能媒体”“媒体融合”“5G”“大数据”“算法”等新一代信息技术是研究热点。

(二)智能媒体研究热点

为了进一步厘清研究热点的聚类情况,笔者将关键词出现最小频次设置为6,并选取主题和关键词选项进行关键词的聚类分析运算,经过CiteSpace5.7.R1进行数据的聚类分析,最终得到如图1所示关键词聚类图谱。笔者结合高频关键分析结果和文献精读情况,将关键词聚类图谱分为三大类研究热点。

图1 关键词聚类图谱

第一类:数字技术应用发展。图1可知,这一主题包含#0智能媒体、#1人工智能、#3信息传播、#5媒介融合、#65G、#9新媒体、#10智能传播等聚类关键词。从宏观层面来看,彭兰(2019)从新闻产业视角提出数字技术不仅重塑了整个新闻行业的业态面貌[12],也在微观上重塑了传媒产业的业务链[13];胡正荣(2017)也认同数字技术为加快传统媒体深度融合提供重要动力[14]。从中观层面来看,喻国明(2017)从组织视角提出信息技术改善传统媒体组织部门自成体系、各自为战、相对独立、相互割离的问题,促进部门之间融合发展,提升组织管理效率[15]。从微观层面来看,许向东、郭萌萌通过调研发现数字技术加快新闻生成的速度和总量,拓展新闻报道的范围,提高新闻稿件的质量,媒体行业出现大量的新兴岗位[16]。当前大量研究重点关注人工智能技术对新闻选题[17]、新闻策划[18]、新闻写作[19]、新闻推送[20]等采写编评播环节等方面的研究,也有零散研究关注5G新形态[21][22]、区块链+新闻[23]、VR新闻[24]。

由此可见,既有的研究更多从新闻业务方面展开,重点探讨新闻智能分发机制局限(低俗化、信息窄化、意见极化),但实践中数字技术被广泛运用到新闻传播领域中的内容生产、内容分发、人机交互和用户管理等生产与运营的各个环节,其推动新闻行业从光电时代走向智能时代,即内容生产从单一(专业生产)走向多元化(专业生产+用户生产+机器生产),传播方式由粗放走向精准,运营模式从单一走向全产业链运作[25]。可见,既有理论研究落后于实践,究其原因,一方面是数字技术在新闻业应用研究时间较短,另一方面是容易将该研究归结为数字技术在新闻业的应用。实际上,与其他行业相比,新闻行业具有政治和服务的双重属性,显然有必要对其数字技术在新闻行业的相关理论进行深入研究,尤其是新闻业与区块链、机器学习、VR、5G等技术融合的相关研究还相对缺乏。

第二类:数字技术应用反思。图1可知,这一主题包含#4智能媒体、#8人工智能、#11等聚类关键词。技术是一把双刃剑,数字技术在给新闻业带来巨大变革的同时,也带来很多新的新闻伦理失范的问题[26],因此,如何规避这些技术带来的新问题,成为数字时代必须面对的问题。根据聚类关键词进行文献精读发现主要有“信息茧房”“隐私安全”和“人文价值”等三类问题。一是信息茧房概念是由美国学者Cass R(2002)在《信息乌托邦———众人如何生产知识》一书中提出,即用户只选择自己感兴趣和喜欢的内容,进而形成一种知识窄化和同质化,易导致“回声室”效应和形成“群体极化”等社会问题[27]。彭兰(2020)的研究认为信息茧房的形成与个人因素、社交网络、平台、算法等因素相关[28]。而喻国明、方可人(2020)从媒介多样性和信源信任视角运用实证研究的方法发现,算法并不是导致用户信息茧房的原因,并发现收入和学历等社会差别容易到信息鸿沟产生[29]。可见,信息茧房效应的存在导致形成两种不同观点,还有待以后用科学研究方法进一步深入研究。二是隐私安全是指用户数据存在被泄露和被乱用的风险[30]。当前数据隐私泄露和用户信息被平台过渡获取是当前数字时代的一个严重问题,张静认为这种情况会导致新闻算法伦理失范、版权侵犯、算法偏见、新闻失真甚至假新闻[31]。曾振华(2017)也发现数字时代个人隐私被侵犯或信息泄露具有很强的隐秘性[32],甚至会形成算法霸权。为此,如何保护用户的隐私安全成为学界研究热点,如盛小平和焦凤枝从法律视角[33]、张春艳和郭岩峰从技术[34]的视角展开相关研究。三是人文价值是指数字技术融入新闻怎么具备人思维和情感,怎么用技术实现具备人类真实情感和思维的报道,甚至关照到人内心世界,走出机器人僵化和模板为报道方式。孟育耀从技术依赖、数据权利蔓延、人本层面三个视角研究人工智能技术新闻缺乏人文价值的主要原因[35],周葆华和骆陶陶(2018)从人机协同的角度来看,人机要做明确边界,利用人工智能技术优势,规避其情感缺点,即实现人机协同才能实现更好的新闻业局面[36]。

由此可知,数字技术对新闻业来说是把双刃剑,数字技术已改变甚至颠覆传统新闻行业,既有研究多用纯理论和实践视角展开对新闻生产、用户、传播的新形态来开展研究。如信息茧房到底存不存在,但缺乏权威的系统研究去证实。整体上,现阶段研究多属于提出问题,但缺乏相应解决问题的研究,目前还没有一个系统微观模型来刻画数字技术引发的新闻负面影响内在机制。

第三类:全媒体人才培养。由图1可知,这一主题包含#2人才培养。数字时代如何培养顺应时代发展的全媒体人才引起诸多学者的关注[37-38],主要有三种人才培养模式。第一种是业界培养:加强实践能力的训练,如通过任务导向来提升业务能力,全媒体人才必须具备全媒体思维、社会责任能力、核心业务能力、情境内涵的认知能力[39];第二种是学校培养:提倡多学科多领域交叉线融合[40],高校走多学科融合的新文科、新工科和新艺科的发展道路[41],探索建立与数字时代相适应的数字化传媒教育范式,并有学者提出全媒体人才既要有人工智能本专业的人才,也要有跨学科、跨领域的交叉型、高层次人才[40],与此同时,高校应着重培养硕士生适应智媒时代的业务实践能力、多学科理论视野,以及数据和研究方法素养,例如在教学方式上可考虑智能媒体平台化教学、合作项目式教学等新模式;第三种是学界与业界联合培养:同时巩固增强理论和实践,结合校内、网络、业界相关资源,制定融合媒体人才教育策略[42]。媒体和高校可在一定的政策支持下实现对口定点合作,共建新媒体实验室教学和实习实训平台等[43]。

由此可知,学者们主要聚焦智媒体时代下全媒体人才培养模式和渠道问题,以及人才培养过程中关键性问题,但现有研究没有从微观的视角分析全媒体人才可分为哪些类别,如生产制作类、运营维护类、决策统筹类、创意创造类,每一类别具备什么特征,以及影响全媒体人才培养的内外部因素是什么。

四、智能媒体研究主题的演化路径与前沿

(一)智能媒体研究主题的演化路径

演化主题、演化路径研究通常用关键词词频随时间突变态势来进行研判[9]。在CiteSpace5.7.R1使用时间图谱(Timezone)来进行分析,首次出现时间相同关键词节点聚合在同一时间段,时间分割为1年,按照时间从2003—2020年进行排列,具体情况见图2。由图2可知,该主题的研究中最大节点是“人工智能”,其次是“媒体融合”“大数据”“智能媒体”“算法”等关键词,通过这些关键词及关联文献的研读进行分析,发现这些关键词时间跨度大、网络结构相对比较复杂。牵涉因素包括政策、环境、新一代信息技术、社会治理等,表明智媒体研究内容呈现多元化。综合时间图谱和当前智媒体发文态势,可将该领域的研究演化过程划分为三个阶段:

图2 智能媒体研究热点时区图

第一阶段(2003—2015年)智能媒体研究的起步阶段。这一阶段时间跨度超过10年,但总发文量只有12篇,仅占总量的2.4%。表明该主题的研究尚未引起学界大量的关注。这一时期研究大多关注是“大数据”“算法治理”,只有个别学者专门对智媒体展开研究。张雷最早论述智能媒体对生活的积极影响,并指出智能媒体是未来社会媒体主要形式[11];彭兰对数字媒体、网络媒体、新媒体进行系列研究[43]。总之,第一阶段出现这些关键词对智媒体研究产生了深远影响,并奠定智媒体研究的理论基础,起到抛砖引玉的作用。

第二阶段(2016—2018年)智媒体研究的发展阶段。期间,随着2016年国务院编制的《国民经济和社会发展第十三个五年规划纲要(草案)》中提出要“重点突破新兴领域人工智能技术”,国家发改委发布的《“互联网+”人工智能三年行动实施方案》中提出要培育人工智能新兴产业,推进重点领域智能产品创新,提升终端产品智能化水平。2017年国务院印发的《新一代人工智能发展规划》提出了“三步走”的战略目标,宣布举全国之力在2030年抢占人工智能全球制高点。2018年3月5日,“人工智能”继2017年后第二次被写入政府工作报告,这些政策的出台体现了人工智能技术产业化的趋势,智能媒体的发展根据政府政策的指导,顺应了AI的落地走向。智能媒体体系建设得到有力推动,促进了相关领域的理论研究发展。该阶段文献发表数量总体上多于第一阶段,增长趋势较为明朗。这一阶段时间跨度占总体时长的27.3%,文献数量为117篇,占总文献数的23.4%。

第三阶段(2019—2020年)智媒体研究纵深发展,国内智能媒体相关研究处于快速发展阶段。在国家大力扶持人工智能产业等多项背景下,智能媒体领域文献数量实现了爆发式增长,并且未来也会处于持续上升趋势,说明未来智能媒体依然有极高的研究价值,依旧会是研究的重点。这一阶段时间跨度虽不长,但文献数量占总文献数的74.2%。总体而言,在过去近20年中,我国智能媒体研究历经起步、发展、纵深发展三个阶段,CSSCI期刊中的相关文献数量明显增加,未来也会持续成为研究热点。

(二)智媒体研究前沿

研究前沿通常表示一个领域最新的研究动态,一般随时间变化而不断更新。知识图谱获取研究前沿主要通过测量关键词或者关键词使用频率的变化幅度确定。基于此,笔者运用CiteSpace5.7.R1软件进行“burstness”关键词突现度计算,运算结果如表5所示。分析得出智能媒体领域热门突发词如图2所示,其中根据关键词突现度从大到小的依次有:大数据、算法向善、算法治理、治理能力、社会治理、算法伦理、算法新闻、媒体融合、物联网、人工智能。从这些关键词本身蕴含的意义以及出现的时间来分析,主要分为两个阶段。

表5 关键词突现度分析

第一个阶段(2003—2014年),突发词较多,在新一代信息技术应用到媒体的大背景下,大多数研究围绕大数据、算法、算法治理、算法伦理展开。在此阶段对智能媒体的研究还处于算法初始阶段,这些关键词充分说明媒体受到信息技术影响较大,具有非常强的技术特征和技术导向。

第二阶段(2015—2018年),此阶段的突发词为媒体融合、物联网和人工智能。从这些关键词出现的时间和含义来分析,媒体融合的主题研究紧跟国家政策实施,具有典型的政策导向性。如《关于推动传统媒体和新兴媒体融合发展的指导意见》(2014)、《国务院关于积极推进“互联网+”行动的指导意见》(2015)、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》(2017)。这些政策建议的出台,催生人工智能技术、物联网技术等新一代信息技术在媒体行业的深度应用及相关问题(智媒体产品、智媒体生态、媒体智能化转型)的结合成为学者们的研究前沿。

五、研究结论与展望

(一)研究结论

本文以智媒体为研究主题,以中国知网2003—2020年的关于智媒体的核心期刊和CSSCI数据库为研究对象,使用CiteSpace5.7.R1文献可视化软件并结合文献计量软件进行计量分析,较深入分析智媒体的研究现状、研究热点、演化路径和研究前沿。

结论一:自2003年起,智能媒体研究呈现逐年增多趋势,2018起发文量呈现倍增态势,成为现阶段新闻传播学科研究热点之一;发文作者跨单位之间合作较为稀少,大多数都是本单位之间小范围合作,合作关系不明显,尚未形成稳定的研究团队;研究人员和研究单位都集中在北京高校和科研院所,并根据所在单位优势和研究专长来开展研究,形成一定研究特色。其中,中国传媒大学、中国人民大学的发文量位居前两位,中心性强,喻国明和彭兰两位学者贡献较大;智媒体研究的刊文期刊部分比较分散,反映这一主题研究呈现多元化态势。

结论二:智能媒体研究主题出现多样化特征,并具有明显的政策导向和技术应用特征。根据高频和中心性发现,核心研究热点包括:算法、媒体融合、5G、大数据、新闻生产、新闻推送、媒体治理等。进一步进行高频词和背后相关文献研读,智媒体研究的热点可分为三个方面:(1)新一代信息技术对媒体组织和媒体业务的影响,包括“人工智能”“信息传播”“5G技术”“传统媒体”“新媒体”“智能传播”等;(2)新一代信息技术对媒体的负面影响,包括“信息茧房”“算法伦理”“社会治理”“媒体治理”等;(3)全媒体人才培养,包括“人才培养”“人机协同”等。

结论三:智媒体研究的演化过程可分为3个阶段,即起步阶段、发展阶段和纵深阶段。起步阶段主要停留在智媒体本体的研究,虽其相关研究较少涉及,但该阶段奠定了该领域研究基础;发展阶段多从微观视角进行研究,主要集中在新一代信息与新闻生产各环节,如信息采集、智能编辑、新闻推送等。通过分析关键词中心度和突现强度发现,人工智能处于研究前沿位置;纵深阶段侧重于深入研究新一代智媒体,同时结合新的政策导向和舆论引领的要求,算法向善、人机协同、新型主流媒体、智媒体高质量发展等将成为研究前沿。

(二)研究展望

首先,从研究整体现状而言,研究机构以高校为主力军,媒体机构研究成果较少,未来学界与业界的深度合作值得期待;其次,从研究领域和主题来看,研究范围相对较窄、深度不够,缺乏创新理论和交叉学科研究;最后,从研究方法来看,现阶段思辨型研究较多,规范化的研究是未来研究趋势。目前该领域的研究已走过启蒙阶段进入发展阶段,越来越多业界和学界人士开始关注,预计未来的研究将进入快车道。一方面,可以把握数字技术赋能新闻业深度融合发展的现实意义,进一步拓展研究主题,深度挖掘新闻业务链各环节与数字技术融合的问题,如机器新闻与用户阅读行为、虚假新闻治理、数据污染与新闻治理、智能技术应用与员工工作满意度等。另一方面,积极推进具有中国特色的新闻理论研究与智慧媒体实践研究的紧密结合,特别是在一些新理念、新做法和新业态的基础上,可以进一步提高理论研究的水平,坚持科学精神对话经典理论,重视规范化的研究。

猜你喜欢
发文人工智能文献
Hostile takeovers in China and Japan
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
2019:人工智能
人工智能与就业
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
数读人工智能
The Role and Significant of Professional Ethics in Accounting and Auditing
下一幕,人工智能!