国内媒体个性化算法推荐研究热点分析

2020-09-06 13:48景佳琦
新媒体研究 2020年13期
关键词:个性化推荐文献计量算法

景佳琦

摘  要  算法推荐作为近年来新兴的计算机技术,成为新媒体革新的重要方式之一。文章以CNKI为数据库,借助CiteSpace软件对2016—2019年国内新闻传播领域的1 163篇期刊论文进行量化分析,展示国内在媒体个性化算法推荐领域的研究热点,试图分析当前的研究现状,指出相关研究的借鉴与启示,旨在推动该领域的创新与发展。

关键词  算法;个性化推荐;文献计量

中图分类号  G206      文献标识码  A      文章编号  2096-0360(2020)13-0007-04

1  研究背景

学界关于算法的研究最早可追溯到20世纪,而它作为一项新技术应用于新闻业则发生在近10年,今日头条的横空出世更是将算法技术推上了风口浪尖。截至2016年10月,今日头条的激活用户数量就已达6亿,其中1.4亿的活跃用户,每天每个用户的平均使用时间为76分钟[1]。同年,算法推荐正式超过人工编辑成为新闻媒体类应用的主要分发模式,所以2016年也可称之为“算法元年”。作为一个拥有破亿量级用户的新闻资讯类媒体,今日头条一直饱受争议,连带着算法技术也被打上不好的烙印。官方媒体如“人民日报”三评算法推荐:“不能让算法决定内容”“别被算法困在‘信息茧房”“警惕算法走向创新的反面”,更是让算法技术一度成为众矢之的,饱受指责。此外,抖音的用户依赖、Google的性别歧视、Facebook的隐私泄漏等一系列问题,都让算法技术的应用受到无数指责。但技术更迭的历史潮流不可逆转,算法作为移动端市场的重要技术方式之一,已经渗透在各个领域之中,算法时代已然到来。

前面提到,新闻传播领域针对算法的研究主要起于近10年,所以本文就将由此切入,提取了近10年CNKI数据库中有关算法推荐的文献,尝试对其进行量化分析。

2  数据来源与研究方法

2.1  数据来源

选择CNKI数据库中的新闻传播领域论文为数据源,采用主题检索,以“算法”作为主题词,时间跨度限定为2004—2019年,经筛选,共检索到1 479篇论文。

分析可知,国内新闻传播领域关于算法的研究大致可分为3个阶段:2004—2010年为第一阶段,这一时期新闻传播领域对于算法的研究文献较少,年发表论文量在17篇以下,发展较为缓慢;2011—2015年为第二阶段,年论文量由24篇迅速增长到96篇,属于快速发展期;2016—2019年为第三阶段,该阶段累计发文量1 163篇,占样本总量的78.6%,年均发文量290篇。

整体来看,该研究领域在2015、2016年引起了學界广泛关注,分析认为,2016年今日头条的全面爆发,让算法推荐技术成功进入学者们的研究视野,针对算法的讨论也推动了文献的快速增长,自此之后学界对于算法推荐的关注程度也一直高居不下,2019年全年的论文数量高达438篇。

通过笔者人工识别后发现,虽说新闻传播领域对于算法的研究最早可追溯到十年以前,但是在2016年之前发表的文献更多还是偏向从技术的角度探讨算法的优化设计,而非具体研究算法在传媒领域的应用及其涉及的相关问题。此外,2016年作为算法编辑超过人工编辑的拐点,一度被称为“算法元年”,自此之后,针对算法的研究文献即呈现出爆发式增长的趋势。基于以上两点原因,本文将选择2016—2019年间的1 163篇文献进行量化分析。

2.2  研究方法

CiteSpace是当前研究人员广泛使用的一种文献计量与可视化分析工具,辅之以内容分析,可以帮助完成特定学科领域的定量和定性分析。为了使文章更具可信度,选择采用CiteSpace软件对这1 163篇论文进行量化分析,试图剖析国内在媒体个性化算法推荐领域的研究热点。

3  研究热点分析

利用CiteSpace对算法相关文献的关键词进行聚类分析,根据聚类结果和文献内容解读,归纳出七大研究热点。

3.1  媒体个性化算法推荐机制研究

随着个性化推荐系统的不断优化,其技术已经广泛应用于各个领域,包括电子商务(比如京东、淘宝)、视频网站、音乐电台、社交网络、阅读平台等。而推荐算法是整个推荐系统中的核心和关键的部分,在很大程度上决定了推荐系统的性能和推荐效果[2]。目前主流的推荐算法大致有以下几种:协同过滤算法、基于内容的推荐、基于知识的推荐、混合推荐模式等。

3.2  媒体个性化算法推荐的应用研究

众所周知,国内最知名的两个使用算法推荐技术的App均隶属于“字节跳动”,分别是“今日头条”和“抖音TikTok”,它们分别承担着新闻分发和休闲娱乐的功能。除此之外,算法技术还可以被应用于社会问题的治理。首先,针对当前互联网空间的谣言泛滥问题,有学者提出可以搭建一个基于节点紧密度挖掘的谣言抑制算法,从而实现对谣言等负面信息的控制[3]。此外,针对当前的恐怖主义媒介化趋势,有学者提出利用更具专业技术色彩的算法对恐怖言论、涉恐图像、极端视频等内容进行识别处理,同时,对恐怖行动进行智能预测和反恐宣传的智能化推送,以更好的实现全球反恐目标[4]。

3.3  传播内容争论:信息茧房or信息减负

自个性化算法推荐系统走入大众视野以来,“信息茧房”似乎就成为算法推荐挥之不去的阴影,始终伴随着它,任何对于算法的批判,“信息茧房”效应都首当其冲,具体是指人们更愿意接受和观看让自己感兴趣的内容,进而排斥一些其他内容,最终导致个人的信息“窄化”,产生“回音室效应”。成为“单向度的人”。并且在流量经济的影响下,信息低俗化现象也愈发严重[5]。同时,群体内部的意见在算法的助推下愈发极端,最终加剧网络群体极化,导致社交圈层的分隔,社会阶层不断固化。

但同时,也有学者提出对于“信息茧房”,学界一直存在误读,它其实一直存在,并非是由算法推荐一手促成。早在香农时期,其实就已经存在“信息茧房”的雏形。传播学四大奠基人之一的霍夫兰所提出的“个人差异论”其实也已经注意到了受众对于信息的选择性注意和理解。同时由于互联网信息的海量化与社会存在的“独异性”,“信息茧房”的存在是一种社会的必然,其与算法推荐系统的应用并非是一种因果关系[6]。同时,不可质疑的是,算法的出现也为我们当前互联网时代的信息超载现象提供了新的解决范式,算法链接了人与信息,简化了人和信息的关系,最终实现了人与信息的协同。

3.4  传播主体更迭:从“人”到机器

传统媒体时代新闻信息的分发都由媒体机构的专业从业人员进行把关,但是使用算法推荐系统后,传统把关人逐渐让位于机器算法。“今日头条”“一点资讯”“天天快报”等个性化新闻客户端的兴起,让机器编辑这一现象完全浮出水面[7]。通过算法分发的新闻更多是根据用户的喜好做出的判断,所以这时候新闻价值要素的权重也发生了变化,趣味性得到凸显。但很明显,这种把关是片面的,在这种情况下,许多优质内容会被边缘化,而迎合人们喜好、贩卖焦虑的内容会越来越多地出现在用户的面前,这也是咪蒙等自媒体能迅速崛起的原因之一,造成“劣币驱逐良币”的后果。同时,这种权利的让渡带来的把关人的缺失也导致了许多严重的社会问题,比如说虚假新闻出现的几率也呈几何式上升。

3.5  传播伦理批判:工具理性指引下对人的异化

算法作为一种新兴的大众传播技术宣称具有中立性和客观性,但是实际上这种中立客观却是不存在的。首先,算法的信息源并不是所存在的全部信息,而是有选择的信息系统。比如前段时间关于“百度已死”的讨论就充分证明了这一点,百度将流量全部引向自家旗下的百家号,本身已经失去了中立客观的立场,是完全基于个人利益的考量。其次,算法分发过程中其实隐含着极为隐秘的网络等级制度,表面上的个性化算法推荐机制实现了网络公民的平权,但实际上用户已经被进行了等级区分。平台的资源会优先集中到头部枢纽,也就是通常意义上的“网红”“大V”“明星”等,而头部用户的信息拥有“特权”,会被算法优先分发。此外,通过算法推荐所形成的高度仿真的“拟态环境”会通过算法推荐不断与用户的“脑海图景”重叠,由此会导致接受者“译码”能力与选择权的丧失,这其实就是一种对人类智慧的变相剥夺,其行为本身就带有一定的目的性[8]。

3.6  用户体验探究:体验升级or隐私泄露

在个性化算法推荐出现之前,互联网用户都是通过搜索引擎、门户网站、新闻客户端等方式来获取信息,是一种主动寻求信息资源的获取方式,这就对用户的信息检索能力提出了较高的要求,同时需要用户能够在纷繁复杂的信息中自行提取出个人所需的资料。但是个性化算法推荐的出现带来了全新的信息获取方式,人们不再需要主动搜寻信息,不再是“人找信息”,而是“信息找人”,此类模式在很大程度上便利了用户的网络生活,是顺应当前“懒”用户的一种新型信息分发方式,是用户体验的再升级。但这种便利的获取却是以大量用户的个人隐私为代价。

但由于个性化算法推荐系统运行的基础就是基于对用户数据的挖掘与分析进而实现对用户画像的搭建,所以在整个过程中用户的信息是被完全公开的,这就无可避免地带来了个人隐私权的侵犯问题。与此同时,更为可怕的是,在算法大面积应用的情况下用户没有选择的权利,一旦下载应用软件就默认应用商可以任意提取数据,用户无处可逃,就算有些软件设置了隐身功能供用户选择,但之后就会发现,其所推送的信息依旧是根据过往浏览记录测算出来的,也就是说,所谓的隐身功能也不过是对用户自己隐身,但对应用商来说数据依旧是公开透明的。所以在这种情形下,用户的数据会被永久保存在数据库中,所有人都处在一个被时刻监控的“圆形监狱”中,没有逃脱的可能。因此在算法推荐的使用过程中,就不可避免的会侵蚀个人权利,造成用户隐私的泄漏与永久记忆。

3.7  算法优化之道:从上至下通力合作

首先,就国家战略高度而言,需要加强对于算法推荐系统的行政监管和法律治理。针对当前算法推荐带来的一系列诸如信息低俗化、隐私权侵犯、著作权风险等问题,需要主动进行理论创新和制度创新,以应对人工智能时代的风险。

其次,就技术平台自身而言,需要不断优化其算法机制,建设多指标的推荐系统[9]。例如内容的重要性、时新性、接近性、显著性等,增加优质内容的信息到达率。同时针对算法“黑箱”,即不透明性的问题,技术平台也需要不断加强行业自律,有效传递正确的价值观。

再次,就传统从业人员而言,需要实现新闻专业主义的现代转型。伴随着媒体智能化的进一步深化,技术逻辑的介入让新闻专业主义面临前所未有的挑战。但是面临挑战不代表新闻专业主义会就此消解,恰恰相反,在这个技术当道的自动化时代,对媒体人的职业素养要求被提升到一个前所未有的高度。专业媒体或自媒体需要具有更好的辨识能力,才能尽可能减少失误,在纷繁复杂的线索中,去探求事物的真相,解读事物的发生、发展规律,完成深度报道[10]。

最后,就用户自身而言,需要不断提升其媒介素养。但在这个智能化时代,媒介素养的概念也需要进行新一轮的扩充升级,它不再仅仅指用户的媒介使用素养、信息传播素养、社会交往素养、社会参与素养等,还应该建立对于数据的理解和认识,即数据素养的养成。所谓数据素养,是指人们有效且正当地发现、评估和使用信息和数据的一种意识和能力。就我国当前的传媒业态而言,不论是专業从业人员还是普通用户,数据素养的建立都是必不可少的。

4  简要评介

传媒领域自诞生起就与技术演进息息相关,每一次传播媒介的迭代更新都会引发人类传播活动的重大变革。电磁铁的发明让人类首次实现了长距离即时通信,电报的出现大大加快了信息的流通速度;此后,电话、传真机的发明都为人类的交流活动提供了多种途径。20世纪初,无线电波的发明实现了声音的输送,广播就此诞生,此后几十年间,广播一直是人类了解信息的重要工具,直到电视的大规模流行。同时拥有声音和图像的电视机很快取代了广播,成为人们生活中获取信息的重要工具,如果没有互联网的出现,也许电视会一直制霸通讯领域。但很可惜,1969年阿帕网的出现,让这一新兴技术成为接下来对世界产生最深远影响的发明之一,当前人类的生活已无法离开互联网。互联网技术的出现也让人类的传播活动再一次发生巨大变革。从电脑端的网站到移动端的App再到未来的AI,人们的传播活动一直随着技术的演进而不断发生变化,这也是为什么个性化算法推荐能成为当前研究热点的重要原因,技术在整个新闻传播领域发挥着越来越重要的作用。

通过对2016—2019年间的1 163篇文献进行量化分析后,笔者总结出当前学术界的七大研究热点。第一,是针对算法技术本身的研究,要想弄清楚个性化算法推荐对传媒领域的影响,那么首先就需要清楚算法运行的机制和原理;第二,就是针对算法推荐系统的应用研究,这也是备受学界关注的一大热点,一项技术的发明最终还是要落实到具体应用,个性化算法推荐如何能更好的作用于互联网空间一直是学界关注的热点议题;第三,由于个性化算法推荐的应用导致用户开始只关心其感兴趣的话题也就是出现了学者们常常讨论的“信息茧房”现象,但也有学者持相反意见,他们认为这种个性化推荐为用户实现了“信息减负”,所以针对算法推荐究竟导致“信息茧房”抑或者“信息减负”就成为学界热议的话题;第四,自人类传播活动诞生起,无论是口语传播时代、文字传播时代、印刷传播时代还是电子传播时代前期,人类永远是讯息的把关者,但是个性化算法推荐的出现,打破了这一定律,把关人逐渐由“人”过渡到“机器”,这无疑会引起大家对未知的恐慌,尤其是当前的机器把关依旧具有机械性、模式化的缺点,导致信息推送的同质化、极端化,此番种种也都引起了学界的关注,成为研究的热点话题之一;第五,则是关于算法中立性的讨论,其实这一争议并不仅仅局限于算法,自技术诞生以来,关于技术中立性的讨论一直就是学界关注的热点议题,区别仅仅在于宏观与微观的差异,即将针对整个技术环境的讨论细化到具体某一技术领域;第六,算法技术能够实现个性化精准推送所依赖的就是对于用户信息的搜集与分析,但是用户体验的升级却是以隐私泄漏为代价,这些无疑让学界甚为担忧,尤其是近年来互联网公司也频频爆出泄漏用户隐私的丑闻,如“Facebook数据门”事件等,无疑让这一话题成为讨论的重点;第七,不难看出,算法技术在当前仍旧是一把双刃剑,但技术发展的历史潮流不可阻挡,所以针对算法存在问题提出优化之道,就是学界非常关注的研究重点,学者们期盼能更多的发挥其优势作用,规避其不利影响。

学界针对算法推荐机制的研究除了具有学术价值外,还具有一定的实用价值,尤其是为政府管理者和企业提供了部分建议。

首先,从政府角度而言,算法推荐机制带来的诸多弊端是需要引起足够重视的,作为一个监管者和规范者,政府更需要从宏观角度审视算法技术,做好顶层设计,加强法律监管,尽可能发挥出技术的最强优势,当然现在很多国家和地区也都重视到这个问题,比如美国在2017年制定的《算法透明与追责原则》,从知情原则、接入和纠正原则、追责原则等七个方面规范算法。

其次,从企业角度来看,平台作为技术的管理者和使用者,在最大限度挖掘技术亮点的同时,也要兼顾社会效益,实现经济利益与社会效益的结合发展。

纵观近年来有关算法推荐的学术文献,可以看出,针对该领域的研究非常多样且丰富,但是也确实还存在一些研究空白。

首先,在针对主体的研究上,学者们的视野主要还是集中在政府、平台和技术本身,却恰恰忽略了技术制定者——算法工程师的重要作用,截至目前,有关算法工程师的研究也只有严三九教授及其学生袁帆发表在2019年9月《现代传播》期刊上的一篇题为《局内的外人:新闻传播领域算法工程师的伦理责任考察》的文章。

其次,从总体上来看,针对该领域的量化研究还比较少,更多还是从经验性的角度去探讨这一话题,缺乏可视化的数据进行佐证。

再次,由于近年来算法推荐机制暴露的问题比较多,所以学界针对算法技术更多还是倾向于从一个批判的角度出发,笔者通过分析后发现,该领域中批判性的文章超过半数,但是从实际来看,算法推荐技术确实有其不可替代性,“信息茧房”等问题也不应全部怪罪于算法,因此针对改领域的研究需要更加客观中立。

最后,就是由于学科限制问题,作为纯文科领域针对技术板块的研究,很难触及背后的技术原理分析,所以难免浮于表面,无法精准抓住問题的痛点,这一现象也是当前众多高校关注的重点。由于新传领域的跨界研究特征越发凸显,很多高校在人才培养上开始出现工文结合的特点,跨界培养的趋势愈发明显,但同时,这也是未来高校人才培养面临的一大挑战,如何兼顾技术背景与文学素养成为一大难题。

参考文献

[1]王茜.打开算法分发的“黑箱”——基于今日头条新闻推送的量化研究[J].新闻记者,2017(9):7-14.

[2]黄仁,孟婷婷.个性化推荐算法综述[J].中小企业管理与科技(中旬刊),2015(3):271-273.

[3]田亚平,杨力,王小琴,等.基于节点亲密度挖掘的谣言抑制算法[J].网络与信息安全学报,2016,2(11):61-69.

[4]李龙,支庭荣.“算法反恐”:恐怖主义媒介化与人工智能应对[J].现代传播(中国传媒大学学报),2018,40(9):13-18.

[5]孙海龙.新闻算法推荐对社会价值观的影响——基于人文主义视角[J].新闻世界,2019(1):28-32.

[6]喻国明,曲慧.“信息茧房”的误读与算法推送的必要——兼论内容分发中社会伦理困境的解决之道[J].新疆师范大学学报(哲学社会科学版),2020,41(1):127-133.

[7]彭兰.机器与算法的流行时代,人该怎么办[J].新闻与写作,2016(12):25-28.

[8]李林容.网络智能推荐算法的“伪中立性”解析[J].现代传播(中国传媒大学学报),2018,40(8):82-86.

[9]李墨涵.抖音算法推荐机制的局限与对策分析[J].新媒体研究,2019,5(2):28-29.

[10]彭兰.更好的新闻业,还是更坏的新闻业?——人工智能时代传媒业的新挑战[J].中国出版,2017(24):3-8.

猜你喜欢
个性化推荐文献计量算法
Travellng thg World Full—time for Rree
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
我国医学数字图书馆研究的文献计量分析
基于链式存储结构的协同过滤推荐算法设计与实现
国内外智库研究态势知识图谱对比分析
个性化推荐系统关键算法探讨
基于协同过滤算法的个性化图书推荐系统研究
国内外政府信息公开研究的脉络、流派与趋势