算法治理:信息服务订制的风险及主流媒体应对策略

2022-10-31 10:59吴方卉姚广玥蒙思思
声屏世界 2022年6期
关键词:内容用户算法

□吴方卉 姚广玥 蒙思思

在互联网高速发展的今天,人们已经渐渐迷失在信息海洋之中,筛选信息耗费了人们大量时间和精力,以适配个性化需求为目的的订制新闻应运而生。订制新闻指的是媒体通过大数据技术,综合分析用户社交关系、媒介习惯、地理位置等相关数据,为用户生产和推送可能感兴趣的新闻内容。订制新闻是个性化新闻的更高目标,体现了当下互联网时代用户地位的提高。

目前,订制新闻主要包括三种类型:即内容订制、生产者订制和信息服务订制。“众筹新闻(Crowd funding Journalism)是新闻内容订制的典型代表,它以受托人模式,通过向广大网友筹集资金来实现新闻报道的内容订制。”生产者订制是对于新闻采写人员的订制,找寻最适于该新闻选题的采写团队。信息服务订制则是根据用户阅读习惯而实现的有目标的新闻推送,让合适的新闻被合适的用户看到,受制于各种原因,当面发展势头最为旺盛的就是信息服务订制。

谁是头条:信息服务订制的发展历程

早在1995年尼葛洛庞帝出版《数字化生存》(Being Digital),就有提出过“我的日报”(Daily Me)概念。这种报纸只会呈现读者最关心的新闻,广告也会通过根据读者的观看不断做出适应性的调整。2004年谷歌实验室提出了个性化搜索,2009年谷歌推出了40多种语言的全球个性化的搜索服务。同时,谷歌还推出了Google Social Search,目的是帮助用户从更广泛的社交圈中发现更相关的公开内容。Facebook、Twitter等社交网络新媒体巨头因为新闻个性化推送服务也获得更多用户。2019年《纽约时报》推出最新个性化新闻策略:将个性化新闻置于首页和中心,强调“只为你而存在”。

在国内,信息服务订制率先在信息聚合类平台引爆。2012年张一鸣创立“今日头条”,其推荐引擎基于数据挖掘对新闻资讯再分配,强调“你关心的,才是头条”。2013年前雅虎中国区研究院院长郑朝晖创立“一点资讯”依托“机器画龙、编辑点睛”,对用户兴趣进行挖掘。腾讯、网易等众多平台也开始引用个性化推荐机制。而主流媒体对于算法的态度却暧昧不明,2015年6月新华社客户端强调引入算法搜索引擎,2016年12月、2017年9月《人民日报》发表多篇文章批判算法。信息服务订制是算法型分发模式的典型代表,将“把关”的权力借由算法,从政治力量和商业巨头下沉至用户,由用户自己决定想看的内容,这也导致主流媒体失去了占有统治地位的话语权。2018年6月开始,《人民日报》发文强调用主流价值观引导算法,可见算法虽被主流媒体实践应用,但也仍然怀有审慎的态度。

技术原罪:信息服务订制技术逻辑及弊端

内容订制、生产者订制主要集中在信息生产领域,而信息服务订制则作用于信息分发与传播的过程中。目前信息分发主要依据三种方式:“倚重人工编辑的媒体型分发;依托社交链传播的关系型分发;基于智能算法对于信息和人匹配的算法型分发。”这三种模式带来的价值挑战也是信息服务订制被长期诟病的原因。

基于协同过滤的推荐机制导致隐私泄漏。“协同过滤算法”遵循这样的技术逻辑:计算兴趣爱好的相似程度,把东西推荐给“臭味相投”的人。常见的协同过滤算法有两种:一种是基于用户的(user-based),计算用户之间的相似性,如果A和B的兴趣相近,那么A喜欢的内容,B也很有可能喜欢:另一种是基于物品的(item-based),计算物品之间的相似性,如果电影C和电影D很相似,那么喜欢电影C的人,可能也会喜欢电影D。

因为算法黑箱,依托协同过滤推荐机制呈现的结果存在解释力缺位。当系统给用户推送一些对其来说比较陌生或从未关注过的信息内容时,可能会让用户感到疑惑,不知道为什么会被推荐相关信息,更不无从得知自己是和谁一起被算法“协同”了。

协同过滤系统往往需要抓取用户在社交关系和社交网络使用行为等方面的信息,极易对用户的关系隐私和信息性隐私造成侵犯。2019年9月15日,在由国家计算机病毒中心发布的《移动APP违法违规问题及治理举措》报告中,今日头条因泄露用户隐私和超范围采集用户隐私信息等问题被点名批评。

目前,网络科技公司跟踪用户在浏览互联网或使用客户端时产生的数据文件,包括用户浏览过的文字、图片以及空间位置等信息。“用户在互联网上的个人数据遵循选择性加入原则或选择性退出原则,许多网络科技公司只要用户没有明确禁止个人数据的分享,就会随意处理这些数据。”当用户使用公共场所的wifi时,如果没有相关的信息加密措施,那么用户在使用wifi期间产生的个人数据可能将对外暴露,并被反向窃取以往既有的数据信息。

随着流氓爬虫软件的升级迭代和大数据的发展,不管是选择性加入还是选择性退出,抑或是匿名化或模糊化,这些隐私保护策略都已逐渐失效。美国在线曾做过一项调查,84%的受访者表示不会在网络上公开自己的收入,但事实上,多达89%的受访者浑然不知自己的相关信息已经能够在网络上被抓取。

基于内容的推荐机制导致信息茧房。基于内容推荐机制指的是平台根据用户兴趣爱好推荐相关信息。内容推荐机制依托用户原有数据建构用户信息偏好模型,通过算法建模将信息文本以结构化的形式保存至数据库,最后建立信息偏好与数据相关性指数,匹配度高的信息则被优先推荐。内容推荐机制多用于文本内容推荐,而在音视频等非结构化数据抓取与分析上存在缺陷。

基于内容推荐机制推荐的内容往往有据可依,多数是基于用户从前喜爱的某条信息,帮助用户在最短的时间范围里找到最感兴趣的内容,但从另一方面来说,当用户喜爱被奉上神坛,新闻的公共性价值也将低落尘埃。算法基于内容的推荐算法越精准,用户也将越被困死在信息茧房之中,新信息的接收反而越来越少。消费主义主张“you are what you buy”,而相类似,基于内容推荐机制掉算法则会强化“you are what you read”的信息使用。算法可以随时了解用户偏好并过滤掉异质信息,塑造信息和观点的“茧房”。然而,信息茧房仅仅是第一步。从社会稳定方面来说,在封闭的环境下相近的意见不断重复,个人所认同的意见和观点以及所感兴趣的事物,都会在这种传播场域中得到“正反馈”式的激励和放大。这会导致人们成为认知上的“井底之蛙”,误把“私域”的事物和观点等同于“公域”的事物与观点,当自己在圈层内的观点与圈层以外的观点对冲时,人们会感到迷惑茫然,甚至可能走向认知上的极端,产生群体极化。

人民网在2017年9月18至20日连续发布三篇评论《不能让算法决定内容》《别被算法困在“信息茧房”》《警惕算法走向创新的反面》,点名批评以今日头条为首的算法推荐平台为传媒业与用户带来的风险,而批判的算法机制正是基于内容的推荐机制。

基于时序流行度的推荐机制导致信息娱乐化。时序流行度的推荐机制是将“将单位时间的瞬时点击率等动态特征作为考量因素,同时综合考虑新闻的信息熵等指标,以便将特定时间窗口内流行度较高的新闻推荐给用户。”

基于时序流行度新闻分发可以近乎等同于“热搜”。信息不单单由稿件质量决定,而是完全被细化至点击量、评论量、转发量甚至是留存时间等明确数据。国内外主流媒体都不惜投入更多人力物力,强化对于信息评价体系的优化。《纽约时报》开发Stela数据分析工具,将包括点击率、浏览比例、评论数量、转发数量、流量来源等指标提供给记者。Stela挖掘出在社交媒体上活跃度较高的文章,记者会根据访问地来源,用不同的语言进行改写,扩大报道的影响力。编辑根据Stela提供的社交媒体活跃度,决定是否为文章增删超链接、边框栏、视频等栏目。不可避免的是,当信息的评价体系开始被明确为量化的数据,意味着信息的价值评判将完全交由用户手中。

根据中国互联网络信息中心(CNNIC)发布的第47次《中国互联网络发展状况统计报告》显示,“截至2020年12月,初中、高中/中专/技校学历的网民群体占比分别为40.3%、20.6%。”在当前的网络生态中,严肃新闻必然被搁置一旁,标题党、娱乐化性信息大行其道。《华尔街日报》发行人彼得·凯恩指出:“那些过于注重娱乐性的新闻几乎注定会导致歪曲事实和产生误导。那些冒充新闻的娱乐产品更为阴毒,因为它们玷污了真正的新闻。”

革新优化:主流媒体促进信息服务订制健康发展

从技术逻辑而言,平台往往是多种算法综合使用,单一算法模式的弊端会被其他模式中和。协同过滤机制发掘用户兴趣点,本身就是在破除内容推荐机制造成的信息茧房,同样基于时序流行度的推荐模式也是在弥补短时间内算法对用户了解不足的弊端。然而,当主流媒体拥抱算法时,又如何避免“算法风险”。

以话语权力约束“技术权力”。主流媒体具有先天话语权,2017年《人民日报》发文三批算法,批判算法产生的内容低俗、信息茧房、虚假信息,指出今日头条等新媒体公司将走向创新的反面。同年12月,《人民日报》发文“在尚未获得互联网新闻信息服务资质下,今日头条手机客户端违规转载新闻信息,且‘标题党’问题突出,严重干扰了网上传播秩序。”今日头条部分频道遭遇24小时停止更新,由此开始,算法平台多次遭遇“约谈”与“整改”。主流媒体借助话语优势,消解技术权力的合理性,今日头条从此闭口不言“算法主导内容筛选”的宣传口径,破除了“技术权力”的迷思。今日头条创始人张一鸣在《声明与致歉》中,承诺“加强党建工作,提供权威媒体内容的分发,强化总编辑责任制,全面纠正算法和机器审核的缺陷”。

其他借助算法的平台也纷纷改革,腾讯“天天快报”结合人工和算法优化内容品质,阿里UC降低低质内容权重,避开算法容易被诟病的内容质量问题,强调价值引领。以此达到“建构批判立场的算法话语,试图通过话语和行动将算法平台‘主流化’收编到管制框架下,让技术运用更好地服务于政治宣传和舆论引导。”

实行党媒算法疏解“流量焦虑”。信息服务订制的快速崛起,导致平台竞争升级,加剧了传统媒体和互联网平台的“流量焦虑”。信息越迎合用户越会赢得高关注度,数据称为衡量信息价值的最重要标准。因此,信息服务订制更加强化信息茧房和信息娱乐化,低俗新闻大行其道。

主流媒体借助自身权威性,拥抱算法技术,建构党媒算法。2017年年末,新华社和阿里巴巴合作推出中国第一个媒体人工智能平台“媒体大脑”。建构全球范围内最丰富的新闻信息库,内容结构化、标签化,建立一个可信的媒资列表,降低出现不良内容。

2018年6月11日,《人民日报》在“人民号”发布会上指出,《人民日报》将以主流价值观为生命线建立算法机制,强调“一是用主流价值纾解‘流量焦虑’与‘算法焦虑’,二是用社会责任规范‘内容创新’与‘内容创业’,三是用优质平台凝聚‘众人之智’与‘众人之力’。”人民号吸纳党政机关、媒体、企业机构,邀请生产优质内容自媒体和各领域的意见领袖,提供优质内容。

“在机器推荐之外深度融入传统媒体的专业算法,让新闻专业逻辑介入算法优化的过程。”2018年全国“两会”期间,百度百家号联合包括《人民日报》、新华社、中央广播电视总台等权威媒体打造了强大的“两会”资讯矩阵,将大数据、信息流精准推荐、权威媒体内容完整融合联手打造新闻专题信息流页面。主流严肃的“两会”报道获得平台优先推荐,百度信息流“两会”的内容总推荐量达到150亿,网民互动总量超7亿。党媒算法本身就是在消解基于内容推荐机制的信息茧房和基于时序流行度的推荐机制的信息娱乐化所带来的弊端。

西方国家涉及到更多政治观点的对立,相较于国内西方媒体更加注重信息茧房问题。尽管《卫报》读者大多偏左派,但《卫报》设推“右派”文章的专栏。每篇文章都附有文章来源、荐读原因和内文选摘,拓宽读者视野,应用程序Read Across the Aisle(过道阅读),在界面中会设有一个光谱带,当受众一直阅读某个观点趋向极端的时候它就会推另一派的观点或中立立场来提醒受众阅读面的均衡。通过版面和技术优化,有意识地去导引“室外”观点也不失为未来主流媒体进一步改革的方向。

细化隐私条款保护隐私数据。在信息服务订制方面,目前主流媒体更多在实现信息精准推送、破除信息和智能审核内容等方面发力。但主流媒体在拥抱和创新新闻算法的过程中,采用了哪些技术手段或新创举来保护用户个人隐私,几乎未见有详细的研究文献或新闻报道。

从三大央媒手机APP在用户隐私政策和权限申请设置来看,主流媒体新闻客户端在嵌入新闻算法进行信息订制服务的同时,在用户信息的使用方面采取了相当审慎的态度,并制定了较为详尽的用户隐私政策。其中,《人民日报》APP和央视新闻APP的用户隐私协议内容均达到了2000字以上,主要从如何收集和使用用户信息,如何使用cookie和同类技术,如何共享、转让、公开披露用户个人信息,如何保护用户信息、用户权利,如何处理未成年人信息,用户信息如何在全球范围内转移,隐私政策如何更新等重要方面进行了详细说明。

在保护用户信息方面,三大央媒均声明将遵循相关法律法规,并主动采取符合业界标准的安全防护措施,已取得公安部信息安全等级保护认证。在涉及到信息服务订制所需的信息获取权限方面,也将信息披露的主动权还给了用户,用户可以选择仅在使用APP时授予相关权限。可以说,主流媒体在用户隐私保护方面已经达到了良好水平。不过由于我国现行的有关法律还有需要完善的地方,相关监管机制也还未达到理想状态,媒体在进一步保护用户隐私方面仍大有可为。同时,这也是媒体未来在升级信息服务的同时必须同步进行优化的重要方面。

未来,使用区块链技术保护用户隐私获将成为主流媒体未来的选择。区块链技术具有去中心化的特征,为用户分布式加密储存个人信息和“按需披露”个人cookie提供了技术可能,并且能够帮助用户找到隐私泄露的具体节点,及时阻断泄露源。同时,区块链技术还可以在实现隐私内容共享的同时,通过其特有的防篡改技术来保证数据的安全性。目前,区块链技术与新闻业在隐私保护方面还未形成一个公认的成熟模式。由新华社和阿里巴巴集团共同投资成立的大数据人工智能科技公司新华智云,已经在2019年11月推出的“媒体大脑3.0融媒中心智能化解决方案”中探索将区块链技术应用在新闻审查和版权维护上。下一步,主流媒体或许能够在学习借鉴这一系统的基础之上,继续积极探索运用区块链技术保护用户隐私,肩负起应有的社会责任和带头作用。

同时,主流媒体还可以通过不断学习移动互联网行业的隐私保护先进方案来为用户提供更好的服务体验。例如2020年4月,小米推出的MIUI12系统就新增了一个管理虚拟身份的功能。用户在开启虚拟身份保护后,该系统将向第三方应用提供虚拟的身份ID,用来代替用户的真实身份识别,防止应用对用户cookie进行追踪。此外,这个系统还允许用户重置虚拟身份ID,达到更好保护用户隐私的效果。按照这种技术思路,用户既能够使用虚拟身份享受新闻媒体提供的信息订制服务,又降低了个人隐私泄露的风险,不失为一种可行的解决方案。

如今,在“个人日报”成为大势所趋的背景下,如何善加利用算法优化信息订制服务,优化用户消费体验,进而为做大做强主流舆论赋能,已经成为摆在主流媒体面前的一道重要“必答题”。通过前述内容,不难发现,以《人民日报》、新华社、央视新闻等为代表的主流媒体在信息订制服务方面都已经有所行动,并注重在顶层设计方面规避现有三种新闻推荐机制所带来的负面影响,积极探索与商业媒体既往实践有明显区别的主流特色信息订制方案。随着5G的到来,信息订制也将迎来新一轮的发展,未来主流媒体能做的还有更多。

猜你喜欢
内容用户算法
内容回顾温故知新
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
关注用户
主要内容
关注用户
一种改进的整周模糊度去相关算法
关注用户
如何获取一亿海外用户