新媒体环境下算法推送的伦理规制探讨

2022-02-09 00:24吴昭晖
传播力研究 2022年9期
关键词:算法内容用户

◎吴昭晖

(山西师范大学,山西 太原 041081)

一、新媒体与算法推送

(一)当前我国新媒体发展现状

互联网发展至今,“新媒体”有了更多的外延,尤其集中在视听方面。“《2020中国网络视听发展研究报告》中显示,网络视听用户规模突破9亿,网民使用率91.8%,新增用户主要来自低线城市,其中五线城市用户增长33.6%,三至五线城市用户增量占总增量的72.2%。在新增用户里,看短视频的人占比15.2%,短视频成为了仅次于即时通信的第二大网络应用,短视频用户规模达8.18亿,近九成网民使用短视频应用。”[1]数据表明基于移动互联网的传播形式进一步下沉,逐步普及到了五线及以下城市,这是人类传播历史上绝无仅有的。

(二)新媒体信息传播的算法推送

新媒体对于信息传播的重要性不言而喻,而以短视频为代表的网络视听更是越来越成为新媒体领域中不可或缺的一环。几乎所有重要的领域中都会有技术的“加持”,现下,新媒体的信息传播正是和“算法推送”紧密结合。“算法推送”通常是指通过安装在计算机后台的程序,将定制化的内容准确推送到受众一端,这样平台就可以实现受众爱看、提高黏性的目的。从2015年开始,算法对新媒体信息内容的生产和制作作用则愈发明显。目前,算法推送主围绕四点:

1.基于用户基本信息的协同过滤

用户的基本信息意为在用户注册账户时所创建的如性别、年龄、喜好等的信息。算法会从已注册用户的数据库中搜索与新用户相似程度高的用户,并向新用户推荐已注册用户所看过的内容。

2.基于用户圈子的分发

以抖音为例,它会依据用户的关注列表,也可以理解为朋友圈来进行推送。换句话说,关注你的人对你越感兴趣,平台向你的关注者推送你发布的内容时也就越积极。用户的点赞、评论、转发,投币(打赏)等行为都会纳入算法的考量范围,从而使内容在社交圈子中裂变。

3.基于用户画像内容的推荐

该算法测量图像等内容的相似性,并由机器根据内容、观看数据等维度进行计算。即计算机会从数据样本之间抽象出关系进而机器学习,通过相似性将标好节点的标签传递给其他未标好节点的标签,并评估顺序。基于用户注册时的数据、浏览记录和观看数据对用户构建画像,这个画像是一个数据模型,反映了用户的兴趣,并通过用户日后持续的反馈,完善和更新模型,以达到发现适合该模型的内容分发给用户的效果。

4.基于内容流量池的叠加推荐

平台会根据内容流量的受欢迎程度向用户推荐用户兴趣不大但非常受他人欢迎热点内容。“叠加推荐是以内容的综合权重作为评估标准。综合权重的关键指标有完播率、点赞量、评论量、转发量”[2],当指标达到了一定量级,平台以算法和人工相结合的机制进行推荐。

二、算法推送带来的改变、困境和挑战

(一)改变——算法改变了传播格局和受众地位

算法链接了人与信息,若没有算法的介入,海量信息将无法完成更为有效的传播。1974年卡兹等人在《个人对大众传播的使用》中,将媒介接触行为概括为一个“社会因素+心理因素→媒介期待→需求满足”的过程,提出“使用与满足”过程的基本模式”[3]。虽然这个模式重视了受众的主观能动性,但在传统的传媒行业中,“中心化”大众传媒的议程设置是不可避免的,所以以现代人的视角来看,在当时用户的需求是难以得到满足的,换言之,算法的引入大众传播使得要求更高的“使用与满足”成为可能。原本在“大众传媒”和“大众”之间桥接信息的节点是记者、编辑和媒体,这些环节对观众需求的判断是“大颗粒化”的,是一种“公倍数需求”的传播模式;而当今的传播系统是信息去中心化的、用户个性化的,算法通过先进的技术将个性化需求和庞大的信息量联系起来,这正是算法得以快速发展的充分条件。“尽管智能算法分发中应用了各种模型或公式,但其基础原理是朴素的:更好地了解待分发的内容,更好地了解待接收的用户”[4]。在这个信息量指数增长的背景下,信息接受和信息生产都面临着一个大难题——用户难以在大量信息中找到目标内容,信息生产者很难使他们的内容脱颖而出,从而引起用户的关注。所以算法推送系统正是解决这一难题的不二之选。其任务便是连接用户和信息,信息接受者,或者说信息消费者和信息生产者之间不再是零和博弈甚至是负和博弈,而是可能存在更优化的解法——接受者可以根据喜好发现目标信息,生产者可以更快捷的找到对应的受众群体,理论上这是一个双赢的局面。然而,实际上运用过程中亦有困境和挑战。

(二)困境——“信息茧房”

算法是基于用户画像的个性化推荐,在推荐系统中,用户在社会群体中的属性,消费行为和兴趣习惯等特征抽象出的一个个标签构成了用户画像的轮廓。根据上文对算法的技术机制介绍,用户所喜欢的内容是来自于推送系统对用户平时浏览的数据进行收集和分析,据其特点、属性、习惯、偏好等形成了用户画像。一言以蔽之,用户的种种显性表达让算法更加了解用户,从而用户所接收到的正是用户喜欢的。这看似美好,但实则存在隐患。设想生活当中存在一个总是逢迎讨好的人,我们是否会安于这个人给我们带来的满足感而不再拓宽社交边际?答案自然是否定的。算法虽能分析出用户的喜好,给予用户满足感,但只是将用户鲜少涉猎的领域排除在边际之外,甚至用户点击量、观看时常等正反馈越多就越持续推送,长此以往便仿佛是困入了一个信息筑成的茧房之中,这一现象被称为“信息茧房”。

(三)挑战——同“流量至上”伴随的低俗低质内容

之所以算法看似是客观、理性的,是因为人们直观地认为算法在传播中缺少人的参与。然而程序、算法的中立性只是体现在运行和计算过程中的执行,实际上,算法推送在实践中依然存在着算法偏见——代码本质上也是由技术开发人员进行的算法设计和编辑,即算法设计若加入了主观观念就易产生“流量至上”缺陷。这种价值取向插入算法推荐就会影响算法客观性。“在2016年Facebook的‘偏见门’事件中,揭露出了Facebook的趋势话题功能过滤掉了保守派信息,而自由派的信息仍然保留”[5]。这种优先分配其他内容的分发方式会导致用户接收信息的不平衡。同时,算法设计不仅会受到设计者本身的价值判断,也会受设计者所面对的开发任务影响。这是由于算法设计者往往不是一个人完全出于非功利角度而开发程序,所以其价值准则和行为决策会难以避免的受到源自于劳资关系中资方的压力,并直接作用于算法设计中。在竞争激烈、各新媒体平台都在尽力攫取更大利益的市场环境中,算法设计人员很难不受流量导向的影响:他们更加重视低俗的内容,在用户点击之后,反复推荐从而获得更多流量。不良内容和骗局诈术屡见不鲜的同时能屡试不爽,就在于这些内容利用人性弱点获得高点击量,而算法更是助长了不良内容的传播速率和范围。可见,以流量和点击量作为算法编写的指导方针,难以保持客观、中立,算法技术的中立性目前还是一个“理想”。

三、算法推送的伦理规制

(一)算法推送带来的伦理问题

伦理一词本意为人与人相处的道德准则,而近年来该词开始与机器和技术等相结合,这说明人的创造物,尤其是高科技附加值的产物(人工智能、克隆、基因编辑等)愈发产生和人类道德、社会秩序间的联结,算法推送也不例外。“信息茧房”会对人的多元化造成影响、“流量至上”的设计会带来低俗低质的问题,如果将算法喻为人,那么算法已经对我们流露了不尽然道德的一面,所以有必要面对问题进行规范,使此算法不断优化、更契合社会基本价值。

(二)算法的“伦理规制”

犹太裔美国科幻小说作家艾萨克·阿西莫夫的《我,机器人》一书中塑造了一个机器人违反了人类社会伦理,成为了人类仇敌的世界。阿西莫夫给后世的启示是:如今机器人被打造的越来越像人,加之人工智能、机器学习的发展,如有一天机器人拥有了远胜于人的智力(即强人工智能),也因遵守人类社会的伦理规制而不走向人类的对立面。“由此阿西莫夫提出了《机器人学的三大法则》,一是机器人不得伤害人类,或袖手旁观坐视人类受到伤害。二是除非违背第一法则,机器人必须服从人类的命令。三是在不违背第一法则及第二法则的情况下,机器人必须保护自己”。三大法则之间互相约束,对后世有关机器人的科幻创作有一定的指导意义。

依据三大法则的启示,本文认为算法作为服务于人的技术和工具,也应提出一系列规制以符合人类社会基本价值。

第一,将多元化还于人。考察用户的精神消费行为及其动机时会发现,人在选择的过程中是复杂的——有时指向性明确,有时彰显出无序性;情绪上,有时稳定,有时波动幅度大。而人性的复杂、情绪的多变恰恰是人所独有的,故而这一点被视作最为根本的公理。如果算法没能考虑到个体的多元化、群体的多样化,算法便是偏颇且单一的。

第二,在优先遵循第一点的前提下,要将人的注意力还于社会价值。几乎所有流量大、具有媒体特点的大公司,都在接受采访时表示,他们不是媒体,而是互联网公司。自媒体环境中,大量的资金并未分配给真正的高质量内容制造商,而是分配给“营销号”,让“营销号”以引人注目的标题和侵犯版权的内容来吸引流量。劣质和重复性内容仍然以点击量仍然是其唯一衡量标准,流量经济的拥趸们更关注的是用户关注数量、浏览量、完播率等,并不认为自己对社会价值观负有重要的责任。人的注意力就是媒体的生命,人们的眼球就是媒体赖以生存、争相争夺的资源,而猎奇和低俗正是人们注意力和兴趣点的“最大公倍数”,如果新媒体平台长此以往的以这样的标准去推送内容,社会恐怕会被“愚民”所充斥。所以即便是互联网平台,只要流量大、受众广、分发信息,就要承担社会责任,履行媒体职责。

第三,在能够遵循第一点、第二点的前提下,最好将公共价值还于专业主义。公共价值是媒体不容忽视的责任所在。“2018年,Facebook曾宣布将招聘2万人从事内容安全审核工作。美国纽约城市大学教授指出,全美国的记者不到3万人,这个社会宁可选择雇用2万人来处理别人生产的‘仇恨、偏见、谎言和愚蠢’,而不是将这些资源投放到更直接带来正面影响的。”[6]这个案例可以归纳为:资源与人力的分配侧重到公共价值很低的事务之上,大量有能力从事新闻媒体、数据筛选的人员冗余在社会意义和公共价值较低的领域,审核着多数是低质量的内容,这样的业态是发育不良的。倘若大量的资金、资源和人才流入制作水平、内容生产能力较低的自媒体,甚至是“营销号”,这将对整个新媒体行业产生巨大的伤害。因此,算法需要在优化的过程中为优质的UGC或PGC赋权、赋能、赋值。

(三)算法的优化

面对当前互联网的飞速发展,结合国家发展战略的要求,针对目前广泛存在的大数据个性化推送问题,我们亟需建立起一套科学完善、有法可依的体制机制,从各个层面规范科技伦理,力图既能“求真”,更能“求善”。

在2021年7月的中央全面深化改革委员会第九次会议中,《国家科技伦理委员会组建方案》排在首位通过审议,快速组建委员会,目的就是要从国家层面加强统一指导、统筹协调,应对新形势下的新问题,“构建覆盖全面、导向明确、规范有序、协调一致的科技伦理治理体系”[7]。

1.建立信用评级管理体系

除了国家层面的推动,行业管制和企业优化也必不可少。针对行业乱象和暴露出的问题出台相关监管办法,以抖音、快手为头部的自媒体平台对用户注册、账号认证和信用管理进行综合分类评级,根据个人信用和内容质量进行择优推荐,对于没有通过认证和信用评级较低的用户进行观察监控。也可以建立分级分类的规范机制,如按照网民年龄,依照《网络安全法》等法律和规范性文件对媒体内容进行筛选划分。

2.建立内容标签分类管理体系

应对技术伦理困局最重要的一环是技术本身的革新。“建立科学合理的算法推荐模型。按照价值观正确的总体要求,优化算法推荐权重配比,关注内容来源规范、文章评价评分、自媒体信用评级、用户反馈意见等质量类要素,辅以用户浏览历史、所在位置及文章阅读量、转发量、评论量等兴趣类要素”[8]。在被约谈和整改后,微博热搜和今日头条都建立了内容标签的分类管理机制,置顶消息均为每日时政要闻;商业推送设有固定标签,不同门类的信息各有占比,尤其对于同质化内容做出限制。

3.健全人工核查机制

针对具有敏感性、关键性内容的消息应健全和完善人工审核机制,运用科学合理的算法并人工介入核查,规范内容质量标签的量化标准,文章阅读量、转发量、评论数、点赞数等热度到达阈值时立即使用人工复核,并配合舆情监测系统,掌握公共事件舆论发酵程度,对事件真相及时公布,对舆论进行引导。

4.健全平台技术监测预警机制

要求平台升级内容监测技术系统,切实保障低龄网民的健康上网环境。健全内容监测预警机制,不仅要“监测”还要“预警”,这意味着既要“测的出”也能“掐源头”——要强化对负面、有害信息的识别能力,还要加强对内容举报、核查和限制流量一系列环节的相互协调配合的能力。

5.健全个人信息保护制度

作为用户本身,我们也应该增强法律意识,注册时关注平台对个人信息的保护规范,遇到信息泄露时及时进行反馈,促使平台在收集使用用户信息时,遵循合法正当、最少必要的原则,公开收集使用规则,明示收集使用信息的目的、方式和范围,并且获得用户同意。严禁平台在使用算法推荐时滥用用户个人信息、侵犯用户隐私。

猜你喜欢
算法内容用户
内容回顾温故知新
Travellng thg World Full—time for Rree
进位加法的两种算法
关注用户
主要内容
关注用户
一种改进的整周模糊度去相关算法
关注用户
一种基于L-M算法的RANSAC图像拼接算法
如何获取一亿海外用户