黄 琪
(安徽省明光市人民法院,安徽 明光 239400)
在时下的网络传播时代,一方面信息大爆炸,另一方面,个体却难以在信息海洋中获取自身所需要的信息,在信息过剩中,个体陷入信息匮乏这样奇怪的境地。算法推荐被认为是解决这一窘境的有效手段。近年来,算法在新闻传播领域得到广泛深入的运用。在国内,今日头条、天天快报、一点资讯等算法型资讯平台相继诞生,由于其用户黏性强、渗透率高,很快成为新闻App市场受众追捧的应用。在美国,以News Republic为代表的新闻App发展迅猛,诞生不久便在竞争激烈的新闻市场拥有一席之地。算法推送新闻主要有两种方式:一是个性化、定制化的新闻被单独推送给用户;二是公众普遍感兴趣的新闻在资讯类App中被置顶。这两种方式的交叉运用,使传统媒体在新闻分发领域的控制权受到极大削弱,用户获得信息的渠道更为多样且可自控。新的内容分发机制,不仅建立了新型的新闻与受众之间的联系,重塑了传播领域的权力生态,也带来了信息茧房、回声室效应、把关人缺失等不可忽视的问题。如何面对此种变局,正是本文讨论之所在。
算法是科技、经济发展到一定阶段的产物,互联网、大数据与人工智能的三位一体是算法得以产生的技术基础。对于互联网资讯企业而言,用户的注意力(点击率)是最珍贵也是最稀缺的资源。因此,读懂用户的兴趣偏好、增强用户的黏性、吸引新用户成为关乎企业发展甚至生死存亡的关键。此种经济压力(动力)倒逼它们研发并应用具有强大数据挖掘与精准信息投送能力的算法系统,以增强市场竞争力(或维持市场竞争优势),提高经济效益。另外,随着消费理念及模式的变革,用户的自我意识不断增长,愈来愈不满足于被动接收信息,注重追求个性化的服务体验,渴望有求必应,而算法推荐恰巧符合用户理想中的要件,故而具备广泛的群众基础。互联网资讯企业与用户的互推需求是产生算法推荐的经济与社会基础。此外,各国为抢占人工智能这一新技术革命的制高点,纷纷从政策层面鼓励、支持、引导人工智能的发展。例如,美国的《未来人工智能准备》(2016)、中国的《新一代人工智能发展规划》(2017)等都对本国人工智能的发展作了战略规划与设计[1]。另外,政府等公共机构也愈来愈依赖于人工智能进行决策,而人工智能的核心是算法,这使算法得以在宽松的政治环境中不断发展进步。
上述层面因素构成算法蓬勃发展的主要背景,这也使得算法应用的触角渗透到包括新闻传播在内的当今社会生活的方方面面。实际上,算法已经深度介入人类的生活,只要打开网络,最终推送到眼前符合我们需求的信息基本上为算法决策的结果[2]137。
目前,在全球范围内,占据主导地位的IT类资讯公司均将算法应用于核心业务。人们通过搜索引擎、社交媒体或新闻聚合器浏览到的新闻基本为算法推荐的结果。Facebook通过算法系统将新闻以信息流的形式推送给用户。谷歌新闻(Google News)的启动标志着算法直接侵入了人类的编辑判断领域。在我国,算法推荐在以今日头条为典型的资讯分发行业大行其道,无论是传统门户网站推出的移动新闻客户端(以网易、新浪为代表),还是聚合类新闻App(以今日头条、天天快报为代表),均显示着数字新闻的分发渠道逐渐被算法推送所代替。在网络传播领域,算法除了作为“制导武器”向用户精准推送个性化信息外,还能自动计算出热点信息的内容、主题词、标签、体例结构等以指导新闻发布机构创作符合用户需求的新闻,形成了以用户为导向的新趋势。需要注意的是,当前的算法技术还存在缺陷,且在洞察用户方面的数据收集还不完整,因此本文提及的新闻算法推送的个性化与精准化均为或然率层面大概率的个性化与精准化,并没有达到完全满足用户所有的以及深层次需求的程度。这导致当前的算法还带有显著的工具属性,离真正意义上的智慧型算法还有相当长的距离[3]。
在当今大数据与人工智能的洪流中,数字新闻正经历“算法转向”是一个不争的事实。算法在新闻传播领域的应用所带来的不仅仅是新闻生产模式的改变,更多的在于内容分发机制的变革,毕竟新闻话语的传播最终需要释放的渠道。在数字新闻业中存在三种推送方式:媒体型、关系型与算法型[4]。媒体型以网易、新浪等门户网站以及传统媒体的数字平台为代表,通过以频道或栏目的方式分发新闻内容。关系型以社交关系(如转发、订阅)进行推送,主要代表是微博与微信。算法型则是通过计算用户的个体特征与环境特征,实现信息与用户的匹配。在数字新闻中,用户流量无疑是首位的,而获取用户流量的关键在于吸引用户眼球。因此,迎合用户个性化需求的算法型推送成为主流,其他类型的推送也逐渐转向算法。
随着移动互联网的发展、资讯App的产生,用户无须借助统一的媒介即可点击阅读不同类型的新闻,这是个性化推送得以出现的前提(以往需要通过报纸、电视台、广播等单向渠道了解“天下事”,且传播的对象是不特定的社会公众,不会考虑所谓的个性化)。算法为实现新闻推送的预定效果,就要解决好用户、环境与资讯三者之间的匹配问题,这属于算法推荐系统的三个变量[5]。其中,用户包括年龄、职业、性别、兴趣等要素;资讯内容包括图文、视频等,每种内容具有不同的特征,需分别提取;环境包括时间、地点、场景等,这些环境要素会影响用户对信息的偏好。以这三个变量为依据,推荐模型便会计算出相关性、环境、热度、协同性等方面的特征,以决定是否推送以及推送何种类型的信息予终端用户。
新闻算法推送存在两个层面:个体层面与总体层面。其工作机制为:基于大数据技术对用户在网络空间的注册、浏览、点击、收藏、评论等数字痕迹进行收集、分析,挖掘用户的爱好、行为习惯等个人信息,形成用户画像,同时筛选平台信息内容,为用户推送量身定制的新闻,实现需求与传递之间的匹配[6]。个体层面解决的是用户的个性化需求,而总体层面则着眼于类属需求,即通过算法推送符合社会公众的新闻,这属于算法新闻的底层逻辑。公众由众多用户组成,每个用户之间的需求或关注点不可能完全一致,算法通过优化对巨量用户数据进行操作的计算机系统,凸显用户行为的特定消费模型,产生一个“长模化”的社会平均值,排除边缘性与非主流信息,推送满足大多数用户需求的内容[7]。另外,算法通过版块的分类、公共热点的抓取、新闻之间以及用户之间的关联等方面在总体上推送满足公众需要的新闻。以今日头条为例,每个用户智能手机中头条App的内容都是不一致的,但每个用户均能从中找到自己感兴趣的新闻。这两个层面的交叉使用打破了传统媒体对于新闻分发权力的垄断,形成了一种新的权力格局即“算法权力”,给新闻业带来颠覆性的嬗变。
新闻传播的本质在于在现实社会之外创造一个拟态环境,通过理性和客观性的话语来支持其权威性,塑造人们的认知与行为模式,建构我们对世界的看法与主张。在传统媒体时代,信息较为稀缺,受众对新闻的阅读难以被计量记录,并且受众范围具有区域性,阅读时间也存在先后,因此,新闻的传播(分发)所致影响一般不会形成一个整体固化的模式。另外,因信息资源稀缺,人们为搜寻符合自身需求或感兴趣的信息还得有目的地发挥自身主观能动性,信息稀缺与受众需求之间的矛盾导致无法有效构造受众对外部环境的认知。
随着算法介入数字新闻业,凭借着极强的素材抓取、深度学习与数据搜集能力,个性化推送成为算法新闻的“标配”,对展现在眼前满足我们要求的信息,算法已经进行了分类、筛选与取舍,致使用户不自觉陷入“被计算好的领域”,生活在过滤后的泡沫之中,使社会形成较为统一的认知行为模式。尽管在传统媒体时代新闻的分发也是编辑等职业把关人判断或抉择后的结果,但他们更多考虑的是新闻的价值并依靠自身的专业(经验)判断,至于用户的兴趣与口味并非是唯一的考量因素。而算法推送是以用户为导向,分发的本质目标在于吸引用户的注意力,如不计算好用户的需求与偏好,将无法实现其预期目的。
当今的互联网新闻资讯以算法为主导,用户阅读的选择权被让渡给算法。通过收集用户的个人数据乃至隐私,算法能精准地计算出个体与信息之间的匹配度,排斥非主流或边缘信息,将用户本身所认同(感兴趣)内容以不同形式重复推送给用户,固化用户已有的思维或形成新的思维枷锁。如果将单个信息比作一根茧丝,那么在越来越多的同质化信息被推送时,茧房就逐渐会被编织地越严密,同理,回声室也会越坚固。当无数被计算好、过滤后的个性化信息源源不断地涌向用户时,信息茧房与回声室效应就慢慢形成了。在“茧房”与“回声室”中,个体容易沉浸在自我满足中,将自我的认识作为真理,容易形成认知偏见,排斥其他合理信息的输入。信息茧房与回声室效应的背后隐藏着“同一化”的内核,长期置身于此种场景,将割裂社会的整体交往,最终会形成一个个“信息孤岛”[8]。算法推送带来同质新闻的泛滥,而新闻作为一种特殊的信息,兼具社会教化的功能。若长期沉浸于同质新闻之中,在个体层面,不仅会降低新闻品位与知识素养,亦会脱离社会情境,造成责任意识与公共意识的缺失,导致个体的扭曲与异化。在社会层面,会导致新闻内容失衡,削弱新闻媒介的舆论监督作用,使大众媒介的公共服务职能受到侵蚀。
在新闻传播领域,把关人的职能便是对即将发布的信息内容进行核查。在传统的把关模式下,受众处于传播链条的末端,是被传播主体所控制的客体,把关人通过新闻价值的判断掌握着信息流通的“生死大权”。在传统媒体时代,记者、编辑等新闻职业者担任着新闻分发的把关人角色,作为客观现实与表征现实之间的把关人,他们通过自身的专业技能、经验判断与人格操守,大体履行着新闻业施予把关人的职操。虽然也会出现价值观偏差、利益交换等现象,但总体上维持着一个良性的均衡态势。
传统的新闻生产、分发的流程为:客观现实→记者/编辑→表征现实。随着数字新闻转向算法新闻,新闻分发阶段的把关人由记者、编辑等从业者让位给算法。而由算法推送技术所产生的“内容下降的螺旋”问题——虚假新闻或低俗信息经常会被算法选取并加以推送,最为人诟病[9]。算法的出现以及职业把关人的式微,使得虚假新闻、低俗信息迅速泛滥,并进而成为一个严重的公共问题,甚至触犯法律底线。推送过程中出现的这些问题并非可以简单地归咎于算法本身,更多的在于资讯平台缺乏必要的把关意识与技术手段,有些平台在主观上甚至还企图借此以提高用户流量,追逐经济利益。
长期以来,我们存在这样一个误解:算法是公正的,它由代码构成,根据自身的技术规则而非“种族”“肤色”等外在因素做出判断与决策。一些IT巨头也经常向社会灌输这样的理念,比如,今日头条提倡“去主编论”“唯算法论”,Google鼓吹算法的客观性与中立性。在传统媒介时代,若出现虚假新闻或低俗信息,公众可以快速找到源头并指责记者、编辑、报社、电台等,甚至还可以请求追究他们的责任。而在算法新闻时代,面对虚假新闻、低俗信息的泛滥,资讯平台的管理者往往两手一摊,作一脸无辜状,“不是我们的错,都是算法导致的,我们已经尽力了”。实际上,作为中介的算法并不是完全中立的,它也有价值观,只不过这种价值观隐蔽在代码中悄然运行[4]。算法并不能识别虚假新闻。2016年,Facebook将“热点话题”版块全盘自动化并取消了这个版块的内容管理团队,仅仅几天之后,一则完全被捏造的假新闻被推送出来并成为头条话题,这表明“有时算法会让系统自动传播假新闻”[10]。另外,极具话题性与热度的虚假新闻或低俗信息更容易被算法捕捉并被推送,从而出现被广泛传播的现象。而且,算法所体现的是设计者或使用者的价值取向与利益追求,其对新闻的推送代表着“幕后人”的思想认识与价值理念[11]。这种隐蔽性使得当下的资讯类平台中的把关职能形同虚设。
算法深度介入的新闻业,是更好的新闻业,也是更坏的新闻业。在新闻分发渠道被算法把控的情况下,对于新闻业应如何突围、还复其原本的面貌而言,我们可以从以下路径进行综合思考:
“选择性接触理论”是大众传播理论中一个重要的理论,无论在传统媒体时代还是当前的算法新闻时代,受众并非不加区别地对待任何传媒内容,均倾向于关注或接触与自身相同或近似的观点或立场[9]。进入算法时代,算法将用户需求的满足摆在首位,虽然推送技术精准,传播效率得以提升,但也不可避免地陷入信息茧房与“回声室”。本质上,信息茧房与“回声室”的出现主要为信息不完全所致。在传统媒介时代,虽然也会存在由于公众的选择性接触以及把关人的特定价值取向而产生认知偏差,但由于信息资源与传播渠道的匮乏,这种认知偏差并没有达到“作茧自缚”的地步。在社交网络时代,用户的需求(活动)范围是有限制的,或囿于自身,或囿于技术。另外,用户的需求不是一成不变的,可能会随着环境特征的改变而改变,而这引致用户的场景化需求。之所以会陷入信息茧房与“回声室”,根本原因仍在于数据收集的不完整以及算法的技术缺陷。
算法精准化推送新闻虽然以收集、分析、利用用户的信息甚至隐私为前提,但推荐系统的初始设定一般都是根据用户点击的历史数据来判断其内容偏好或将信息的“热度”等同于“重要性”而产生的,由此导致点击率(量)高或热度高的内容类别会被作为初始设定,被推送给其他类似用户。但是用户在点击时很可能并没有强烈的目的意识(有时纯粹为消磨时间或者从众心较重)。由此可见,点击并不代表用户需求的全部,但算法通过源源不断的推送在满足用户某方面需求的同时,挤占了用户关注其他信息的注意力。要走出信息茧房与“回声室”,应打破行业壁垒,在隐私与数据安全得到严格保障的前提下,应允许具有社交媒体资源的平台(比如腾讯)与不具备社交媒体基因的个性化新闻推送平台间的数据交易或数据共享,深度挖掘用户的潜在信息以及数据之间的关联,反映用户的深层或动态需求,形成用户洞察,从而实现新闻资讯的场景化供给。此外还应完善算法技术,使算法不仅仅停留在针对特定的表面刺激给予反馈的“弱算法”阶段,而是通过行为与条件的设计与调适,使算法进位到“强算法”或“超算法”阶段,提高算法反馈的准确性[1]。
对于算法推送的新闻,一般用户并不具备专业的鉴别与评判能力,容易陷入算法预先设计好的“舒适区”。对此,在社会范围内加强算法素养的宣传与教育尤为必要,公众也应学习必要的算法知识(虽然不要求达到专业级别,但应了解算法基本的“套路”),审慎对待和评价算法推送的新闻,反思它所带来的负面问题,培养自身独立的思考意识与批判思维,不过度依赖算法,自觉抵制它所带来的不良影响[12]。
算法在新闻分发链条中扮演着信息匹配中介的角色,它贯穿于数据的输入与结果的输出,并代替记者、编辑行使新闻传播把关人的职能。算法中隐藏的偏见与利益取向致使新闻的分发出现上述负外部性问题,而我国法律在此方面的规制尚为空白。对此,立法可从事前干预算法与事后追责两方面着手。
在算法推送的模式下,记者、编辑等传统把关人所遵循的职业规范与新闻伦理并不约束算法研发者或设计者,而后者所从事的工作恰恰影响着新闻的分发与消费[13]。算法要发挥功效,必须依赖初始设计与后期的数据输入。算法缺乏表面的公正性与普适性,它毫不掩饰地服务于设计者或使用者[14]。这就需要靠算法的顶层设计来防止消极后果。对算法进行顶层设计,最主要的是制定相关规则对算法设计者进行约束,对算法预设法律准则,进行伦理指引,也即在设计过程中将人类社会的法律、伦理、道德等规范嵌入算法之中[15]。另外,数据是算法运行的养料,数据的净化可以很大程度地优化、纠偏算法。对此,新闻媒体机构应严格把关信息的可信度与准确性;互联网资讯平台须屏蔽虚假、低俗信息,避免产生负面数据[16]。通过干预算法设计以及净化数据,让算法推送的结果符合社会与法律的主流价值理念与追求,维护不特定公众的合法权益。
对于事后追责,实质在于权益弥补与责任承担。算法推送新闻所产生的负面问题不仅仅作用于个体,更多的在于破坏了社会的公共治理体系,而在事后追责中,建立算法责任体系是解决这一问题的核心。算法推送所产生的负面问题可能是算法设计者或使用者故意造成的,也可能是由算法自身的缺陷导致的。无论是恶意为之还是缺陷所致,根据当前算法的工具属性,责任仍应由算法设计者或使用者承担,而不能以所谓的算法“技术中立性”规避责任。当使用者使用算法时,监管者应首先检查使用者是否能证明其已经采取控制措施以确保算法按照预期目的运行,如果使用者无法识别与纠正算法的负面后果,其将被认为对减少算法的潜在损害没有尽到应有的义务,而这将受到法律的追究[17]26。需要注意的是,追究算法责任的目标并不在于实现完美、零错误的算法,而在于最小化算法的风险,好比汽车安全标准并非要求汽车绝对安全,而是达到合理程度的安全。
除了法律规制外,政府监管与公共监督也为重要的补充举措。与法律的滞后性相比,政府监管在短期内效果明显,通过约谈、责令整改、行政处罚等措施可以减少或剔除算法推送新闻所带来的不良影响,改善网络空间环境。公众是算法新闻的受众与潜在侵权对象,公众的监督与举报,对遏制虚假、低俗不良内容的扩散,引起政府重视以及法律规制具有举足轻重的作用。此外,专业媒体的监督也属于公共监督的一部分,相比社会公众,专业媒体的从业人员更清楚传播的规律,更了解算法新闻背后的运作机制,具有更强的追求事实真相的责任感。因此,建立专业媒体的算法问责机制对完善监督体系无疑具有特殊的意义。
在传统媒体时代,由于人力限制(记者、编辑等新闻从业人员是有限的)以及空间限制(版面、频道、电台等分发渠道是有限的),新闻产品的数量是有限的,所以把关人可以较好地履行其职责,新闻的生产与分发无不被深深地刻上职业把关人的烙印。随着大数据时代的来临以及数字新闻向算法新闻的转型,无论是新闻的数量还是新闻的分发渠道均呈几何级增长,传统的把关模式已不再适合情势要求,于是对新闻生产、分发的判断由人工转向算法,算法判断代替人工判断。新闻分发的依据由专业判断的“什么值得关注”转为算法判断的“这个人想要什么”[11]。过去强调新闻价值,现在注重个性化与娱乐化,由此导致把关价值的偏差,甚至没有把关,任由虚假、低俗内容横行,致使传播伦理失范。
若要解决当前算法在新闻分发应用中产生的问题,除了需要改进算法外,还需对甄别信息真伪与优劣的手段进行完善。目前,一些IT巨头如Facebook、Google等一般通过采用第三方核查的方式以甄别信息的真伪优劣,但是此类方式属于事后应对,难以提前防范虚假信息的发布和传播。随着各种网络资讯平台的用户规模不断扩大,虚假、低俗信息一旦被传播,就可能形成“燎原之势”,无论采取何种措施都难以控制、弥补后面的负面舆情效果。因此,从源头上避免虚假信息的传播无疑是根本性解决方案。但如上文所述,算法并没有识别虚假新闻的当然性,甚至算法会让系统自动传播假新闻。在算法已不能担任合格把关人的情况下,把关重回“人工影响模式”就势在必行,但这里的“人工影响模式”并非回到之前单纯的人力模式,而是通过建构“算法+人工”模式阻止不合理信息的传播。社交媒体网络与互联网资讯平台应重新定位和认识人的价值,保留甚至增加审核成员,将人类判断与算法判断结合起来,构筑拦截虚假新闻、低俗内容传播的防火墙。另外,还要建立实时追踪与反馈系统,对于漏网的不合理信息,不管是主动还是被动发现的,要及时删除或屏蔽。通过“算法+人工”模式的构建,使人类不再纯粹沦为技术的附庸,实现工具理性与价值理性的平衡、技术应用与内容选择的平衡。
算法深度介入新闻业对提高传播效率、提升用户体验、拓展互联网资讯平台的价值、改变新闻产业格局无疑是巨大的,尤其是算法在新闻分发渠道的权力不可谓不是新闻业“未有之大变局”。尽管数字新闻转向算法新闻,但传媒的使命仍然没有变化,在谋求更精准的推送时,也要优化公共信息服务,达到个性化传播与公共传播、个体满足与社会整合的平衡。即便技术无比强大,但人不可以失位,在技术进步已不可逆的情况下,我们应顺应潮流,提高对技术的理解与驾驭能力,而不能为工具所奴役。