唐天健 张 晓
1.2.中国海洋大学文学与新闻传播学院 山东省 青岛市 266100
所谓算法,是推荐算法的简称。推荐算法是计算机行业中针对达成推荐或推销目的所编写算法规则。通过一些数学推算及模型,推测用户可能会青睐的东西。算法在新媒体时代运用非常广泛,算法媒体指利用算法进行用户个性化定制的媒体,这类媒体多为信息集成媒体,内容多为搬运,通过自己独特的算法体系分析用户行为,从而进一步整合内容推送。
今日头条是算法媒体中较为具有代表性的案例。2012年8月今日头条上线,短短数年时间迅速发展,成为新闻信息类媒体中的领头羊。以2016年数据为例,今日头条累计激活用户达7亿,平均日活跃用户量达7800 万,用户平均日使用时长达76 分钟,可谓是流量王者。业界针对今日头条的研究较多,主要集中于成功案例分析,新闻伦理分析、传统媒体与新媒体间对比,而针对今日头条与边际效益及信息茧房的研究,相对来说较为稀缺。
信息茧房(Information Cocoons)概念在2006年被提出,美国教授凯撒·R·桑斯坦在《信息乌托邦:众人如何生产知识》一书中阐释,在信息传播之中,公众对于信息的需求是不全面的,充满个性的。公众会按照个人偏好有选择的接触媒介信息,由而形成公众个人的信息茧房。此外,桑斯坦认为信息茧房主要以公众个人日报(dailyme)的形式呈现——这份日报完全为个人量身打造,所呈现的内容出发点均为公众本身。
信息茧房的理论渊源最早可以追溯到19世纪,托克维尔认为,民主社会会自然而然的促进个人主义的形成,并随着身份平等的扩大而扩散。同样的,信息茧房理论也与有限效果论高度契合——有限效果论认为,大众传播没有直接力量改变受众导向,人们在做决定之前,许多因素起着重要作用,包括个人的政治、文化等因素,这些因素影响了受传者的信息需求和选择性接触机制。
伴随着大数据、新媒体时代的来临,信息茧房现象在公众身上已然非常普遍。除公众本人通过各种渠道在浩渺如烟的信息中搜寻信息外,众多新媒体会通过算法、大数据等技术分析用户行为,从而进行私人定制服务来优化用户体验。
近年来由于技术的不断发展,媒体私人定制服务的不断完善,信息茧房现象成为了众多学者和专家关注焦点。多数学者着眼于信息茧房形成后对于社会产生的后果,例如对于公共领域的破坏、个人与现实世界的主动隔离等等。或者是研究信息茧房打破的可能性。笔者认为,信息茧房造成的影响及如何突破固然重要,但是信息茧房的形成过程亦值得研究,我们不能将原因简简单单归结于个性定制化服务等技术因素。
边际效益理论来源于边际效用学派。该学派作为传统经济学的对立面出现于19世纪70年代初。1871年,英国经济学家杰文斯在《政治经济学理论》中,提出了最后效用程度价值论。同年,奥地利法学家门格尔在《国民经济学原理》中提出类似观点,即物品价值取决于其能提供的欲望满足中、最不重要欲望满足对人福利的意义。1874年,洛桑学派经济学家瓦尔拉斯亦在《纯粹政治经济学纲要》中提出稀少性价值论。三位的观点构成了边际效益理论的先决基础。1884年,维塞尔在其著作《经济价值的起源及主要规律》 一书中正式命名此类效用为“边际效益(用)”,从此边际效益被沿用至今,边际效用学派由此产生。
边际效用学派的理论基础便是边际效用价值论。边际效用价值论批判了古典政治经济学的劳动价值论,主张抽象演绎法方法论和以主观价值论为分配基础,把人的欲望和满足作为研究的对象和出发点。边际效用学派在19世纪80-90年代迅速发展成熟,成为现代微观经济学的重要组成部分,后又被凯恩斯推广应用至宏观经济学范畴。其以人欲为研究出发点的特征,对后世诸如经济学、社会学、心理学、传播学等学科产生了广泛而深远影响。
由于传媒市场的特殊性,利用边际效益分析新闻传播现象及传媒个体的研究数量较少,尤其是以边际效益理论分析传媒经济现象的论文乏善可陈。
涉及受众使用媒介动机与获得满足的研究始于20世纪40年代,但是直到1959年卡茨才在《大众传播调查和通俗文化研究》中提到这一概念。使用与满足理论由卡茨于在1974年在其著作《个人对大众传播的使用》中首次提出。他将媒介消费的动机及寻求满足和是否得到满足两个概念区分开来,它是一种受众行为理论。只有在媒介内容、传播渠道单一时,媒介才可能与受众达成完全的满足与被满足。受众接触媒体是基于个人需求的、主动的,而并非被动的。
随着媒介的发展和丰富。受众渐渐展露出对媒体丰富的使用动机和愿望,受众的能动性在不断增强,满足受众对于媒体来说日渐困难。人们接触和使用媒体是为了满足自己的需求,且需要有接触媒体的可能性和对于媒体的印象,在选择使用媒介内容后,可能满足或不满足,从而影响之后的使用行为,且修正媒体印象。
使用与满足理论被广泛应用于大众传播研究领域,成为众多以受众行为分析为导向的学术成果的重要分析理论。随着媒体的发展,使用与满足理论也被用来分析新出现的新闻传播案例,如热门节目、热门电视剧、app 等。利用使用与满足理论分析新闻信息类新媒体的论文数量相对较少,研究主体也多为传统众推型新媒体,针对个性化推荐的新闻信息类新媒体的此类学术成果比较稀有。
本文通过对知名算法媒体“今日头条”相关内容及评论数进行分析。主要回答以下问题。
RQ1:今日头条的推送内容反映怎样的特征?
RQ2:今日头条体现了怎样的消费者行为和运营策略?
RQ3:今日头条的媒体与信息二者有何边际效益表现?
RQ4:今日头条对于形成信息茧房起到了何种作用?
本研究致力于分析今日头条的边际效益,以及对用户信息茧房形成起到的作用。由于传媒市场具有二元性,本次分析仅考虑一次售卖的消费者行为,即今日头条的受众。边际效益的出发点为消费者本身,而今日头条用户群极其庞大。我们除统计推送本身各项属性外,以评论数作为消费者反馈表现以便统计分析边际效益。为了保证数据具有广泛代表性,且在最大程度上去除算法对于结果的干扰。笔者以初次下载,未注册时今日头条为其推荐的内容作为抽样标准,选择了不同年龄段、不同性别的18位新用户的推荐作为全部样本,统计其前10 条推荐和初次使用体验。18位新用户中,年龄主要分为30 岁以下、30 岁到50岁、50 岁以上三级,且各级别下男女数量均等。统计下载app 后的首次推送情况,再去除重复及错误样本后,共获得有效样本106 条。
根据前面所叙述问题,本研究所涉及变量分别为“推送内容”“信息可靠性”“视频评论数”“初次使用体验”及“是否继续使用”五类,在此基础上,我们考量新闻常见分类和分析需要等因素。我们在这五类变量下设定了不同的类目。
本研究将推送内容分为以下七种类目:娱乐体育类、社会时政类、文化教育类、健康心理类、科技数码类、军事冲突类、生活方式类。
由于今日头条推送内容较为庞杂,笔者将根据个人判断,以推送主要内容作为判断标准进行分类。
本研究将推送信息的可靠性分为以下三种类目基本可靠、部分可靠、信息可靠性不详。
笔者根据推送内容判断其类目归属,如果消息具有确切新闻要素(时间、地点、人物、事件、过程等),或者引用来源清晰等则归为可靠信息。若仅具备部分新闻要素,或要素模糊,文章来源模糊等,则归为部分可靠消息。如果信息未出现任何新闻要素,或前后要素矛盾,来源不明等情况则归为信息可靠性不详。
关于视频评论数的分析将依照“信息可靠性”和“推送内容分类”两类目进行,根据“信息可靠性”类目,分别计算三种类型信息的总评论数和类型下平均获得评论数。总评论数考量媒体不同类型推送所获关注程度,平均获得评论数则用来考量受众对于不同类型评论的反馈程度。根据“推送内容内幕”,计算不同类目所获得的总评论量,用来反映受众的关注度集中点所在,初次使用体验及是否继续使用。
根据18位实验对象对于今日头条的初次使用感受,我们将“初次使用体验”变量分为以下三个类目:感觉良好、感觉一般、感觉糟糕。由各位实验对象根据自己感受自行选择反馈。
针对是否继续使用变量,我们下设:继续使用、观望状态、不会使用三种类目,用来分析今日头条是否有能力保持新用户黏度。
根据标准误差公式,笔者分别对两套样本进行分析计算。编码员共三位,分别为笔者和两位编码者。正式编码前,研究者与两位编码者进行了多次沟通。编码完成后,研究者从样本中随机抽取25 条进行检验,两组不同抽样信度分别约为88%和85%。编码员间信度达到了多数内容分析的要求,分析检验结果为双尾。
如图1所示。本次获取的样本中,社会时政类数量最多,达27个(约占总数25%),科技数码类最少,仅5个(约占总数的5%)。所涉及的所有类目中,社会时政类较之其余六种类目信息内容,与社会个人生活联系较为直接、密切。社会时政中,受关注度较高的推送多与经济、金融等事件有关、其次为民生类。而其余六种类目(约占总数75%)信息则与社会及个人生活联系较为间接。
图1 分析样本内容数量图
图2 分析样本分类评论数量
如图2所示,社会时政类所获得的总评论数最多,达36838 次(约占总评论数的47%),将近半数。健康心理类获得的总评论数最少,达2122条(约占总评论数的3%)。结合前文进行比对,社会时政类内容数量约占总数四分之一,但总评论数却占据评论总数近半数,显示出受众对于社会时政类内容具有较大的热情和参与度。而其他内容数量虽超过75%,却仅获得53%的评论数。参与度明显逊于社会时政类内容。
图3所示是分析样本分类下,平均每条信息所获得的评论数。社会时政类单条信息平均评论数最多,为1364 条。其次为科技数码类和军事冲突类,分别达1209 条、1022 条。平均评论数较低的是文化教育类和健康心理类,分别为226 条、163 条。
图3 分析样本分类单条评论数
根据笔者定下的分类标准,笔者对于106 条样本的可靠程度进行分类。如图4所示,其中27条信息符合基本可靠要求,约占总数的25%。57条信息(约占总数的54%)归属于部分可靠。22条信息(约占总数的21%)可靠性不详。在笔者摒弃算法影响,尽力保证性别、年龄等条件平衡所收集的初次推送内容中,约四分之三的内容是可靠性不高的。只有四分之一的内容具备证明可靠性的因素。
图4 分析样本信息可靠程度
为进一步分析不同内容类型下的可靠程度。笔者设计了一个信息可靠比公式。设可靠比为N,基本可靠信息数量=JK,可靠性假设为100%;设部分可靠信息数量=BK,可靠性假设为50%;设可靠性不详信息数量为XK,可靠性假设为0%。公式如下:
借助公式,我们可以得出分析样本信息的总平均可靠比约等于0.52。以此为标准来分析。社会时政类、军事冲突类及科技数码类三类超过总平均信息可靠比。其中社会时政类最高,约0.61,其次是科技数码类0.60 和军事冲突类0.55。信息可靠比最低的两类分别为健康心理类(0.08)和文化教育类(0.07)。
图5 分析样本信息可靠比
前文主要针对今日头条的各项数据对今日头条用户进行间接分析。如图6所示,18位实验对象在初次使用过今日头条后,10位认为一般(约占总数的55%),5位认为使用感受良好(约占总数的28%),只有3位表现出来对于今日头条的不满意,给予糟糕评价(约占总数的17%)。
笔者又调查了实验对象是否愿意继续使用今日头条。如图7所示,7人表现出了继续使用的意愿(约占总数的39%),8人表达了中立的、观望的态度(约占总数的44%),仅有3人明确表示不会使用(约占总数的17%)。
图6 今日头条实验对象的初次使用感受分布
图7 今日头条实验对象是否继续使用情况
RQ1:今日头条的推送内容反映怎样的特征?
今日头条的推送内容呈现了多样化的趋势。以初次下载的新用户首先阅读的前十条推送为例,信息覆盖娱乐体育、社会时政等七个大类,可以说今日头条所提供的信息种类是较为多元化的。以信息比例来说,社会时政类信息数量最多,约占四分之一,这部分信息相比其他类别与社会生活联系最紧密,将近四分之三的信息是较为娱乐性、消遣性的内容。从推送内容上来说,今日头条所推送的大多数内容多具有“标题党”的特色,标题情绪化呈现,且具有煽动性。且很多信息无论是从标题上,还是内容上,都呈现出低俗化、冲突化的特征。在健康心理类、军事冲突类表现的最为明显。
从消息可靠性来说,多数推送不具备可靠要素。仅有约四分之一的内容能被初步判定为可靠消息,超过四分之三可靠性不足,甚至不具备可靠性判断因素。依照笔者设计的信息可靠比公式,最理想状态时信息可靠比为1(信息全部判为为基本可靠信息),最差状态为0(信息全部判断为可靠性不详),今日头条所推送的平均信息可靠比约为0.52,可靠性比仅约为理想状态的半成。且按照内容分类进行分析,仅有军事冲突类、科技心理类及社会时政类(最高约为0.61)超过平均可靠信息比值。其余四类均低于平均值,更有文化教育类与健康心理类的比值不足0.1。总体上来说,今日头条推送的信息真实性是较为堪忧的。
RQ2:针对今日头条的分析体现了怎样的消费者行为和运营策略?
在本次实验所分析的样本106 条中,评论数量分配很不均衡,最低的信息评论数为0,不足10 条评论的信息有9 条。最高评论数达9225 条。极差值达9225,且最高最低均隶属于社会时政类信息。总体来看,社会时政类所获得的评论数最多,其占总评论数比例近一半。健康心理类信息无论是总评论数还是单条平均评论数,均为最低。然而社会时政类信息数量仅约为分析样本的四分之一。说明社会时政类信息在今日头条所发布信息中收获了较高的受众反馈,体现了受众对其关注度较高。
相比之下,其余六类信息所获得的评论数总数仅比社会时政类多出6%,但信息数量却比社会时政类所占比例多出近50%。且考虑到所有信息的可靠比因素。社会时政类信息可靠性为最高,说明大多数今日头条消费者对于可靠的、与社会生活相关的信息更有兴趣,且更容易产生反馈。
从今日头条本身来说,本次统计的信息已尽力摒弃算法影响,发布的信息虽门类丰富,种类多样。但是总体可靠性并不高。考虑信息分类问题,社会时政类信息虽具备较高的可靠性,但是因为其生产牵扯众多偶然因素(事件突发、周期等),所以该门类信息的生产效率并不高。相比之下,其余的娱乐类、非严肃的信息虽可靠性不高,但生产效率却比社会时政类信息高出很多。不考虑信息分类问题,基本可靠消息数量仅为总数约四分之一。其余四分之三的消息均不具备长足的可靠性,消息具备的可靠性因素越多,生产效率越低。
从本次实验抽样对象来说,今日头条虽然并没有获得一致好评,但超过百分之八十的实验对象没有认为今日头条的使用感受糟糕。且实验对象中也有相当的人数认为可以继续使用。说明今日头条的初体验评价较好。随着算法的作用不断强化,信息越来越符合个人口味。这种用户黏度便会形成且不断加强。
综上所述,今日头条的卖点并不在其信息质量和可信度上,而在于如何为用户实时提供足够的信息推送,以便具备长足的吸引力,方便广告市场的二次售卖。非算法影响下,可靠消息与非可靠消息的数量比约为1:3,我们不能保证消费者对于信息内容类型的喜好是单一的,举例说明,消费者可能只对部分社会时政类信息(可靠性较高)感兴趣,却对娱乐体育信息更感兴趣的话,算法的逐步修正会不断加大娱乐体育类信息的比例。这时,今日头条的信息生产效率会被进一步的提升放大,且更符合消费者的信息需求。
RQ3:今日头条的媒体与信息有何边际效益表现?
传媒产品与一般经济产品有所不同,普通经济学中,一种产品的各类要素不变的前提下,达到生产量后若扩大生产,边际成本会不断增加,边际效益也会递减。但是传媒产品的不可消除、易复制、无损耗性导致其边际成本很低,扩大再生产不需要过大投入,所以边际效益递减速度相对缓慢。今日头条作为app,其传媒产品不需要实际载体,结合前文分析的今日头条的营销策略。今日头条所推送的内容中有众多可靠性不足的内容,且这类内容在推送所占比重较大。通过算法的介入,这类信息的重复利用率极高,且不必考虑时效、真伪等因素为信息本身带来的边际成本。实时发生的可靠性热点事件也会为今日头条的推送内容收获更高的关注度和受众参与度,即便这类信息会因各方曝光过多导致边际效益递减。但是其偶然性和数量的局限性对于今日头条整个信息产品整体的边际效益影响是较小的。综上所述,今日头条的信息推送的边际成本极低,算法与运营机制让其所推送的信息边际效益递减速度大大放缓。今日头条的信息具有超乎寻常的生命力。
从今日头条app 本身来说,极高的信息推送速率和算法的私人定制让其在维持用户粘度上具有出色的控制力。其边际成本主要集中于app 及算法更新上,边际成本相对于其他需要内容自生产的app 来说要低,且不存在信息生产核心人员的更新换代等问题。今日头条推送的内容质量虽不高,但今日头条注明转载出处,加之其宣扬的搬运口号,有利于将用户不良使用体验转移到信息源媒体和信息本身。随着用户的使用时间的不断增多,推送内容随着算法的不断优化更具个人日报特征,用户便会形成牢固的使用关系。且结合前文分析,初次使用用户近八成都选择继续使用或观望。综上所述,今日头条app 本身作为媒介产品在长期经营中边际成本可以长期保持较低状态,随着推广的不断增加,新用户不断转换为固定用户,其边际效益可以很长一段时期内保持平衡甚至递增,近年来今日头条的年收益数据更证明了这一切。
RQ:4:今日头条对于形成信息茧房起到了何种作用
以桑斯坦的理论出发,公众对于信息的需求是不全面的,充满个性的。公众会按照个人偏好有选择的接触媒介信息,由而形成公众个人的信息茧房。这种概念假设是一种公众主动性的行为。对于今日头条来说,用户看似可以选择性的接触信息,但实质上,用户对于信息的接触却是被动的。今日头条对于信息的转载并不是全面的,其内容上普遍低质量,低真实度的特色,可能是为保证其运营效率的策略。今日头条用户所接触到的信息本身就已经是被选择的,被筛选的,这种前提下的主动性选择本身就是限制性的,受到控制的。
随着用户的使用周期不断延长,算法起到的作用也日益增加。由于人会按照个人偏好选择性接触信息。众多重要信息很可能因为与个人偏好不符而被忽略掉,且用户长期暴露于符合自己兴趣偏好的、低真实度、低质量的信息中,会逐渐失去对于信息的鉴别能力,且受到不良影响。
一旦这种信息茧房形成,人对于媒介信息的接触、对于媒介的选择会形成依赖路径,对于自己的信息茧房具有毒品般的忠诚度。不仅仅限制了个人对于真实社会的体验能力,且长期处于恶劣信息环境中,导致各种各样的后续问题。笔者将这种现象总结为信息茧房的被动性恶化。这种现象对于受众的不良影响是深刻且显而易见的。
以经济状况分析今日头条的话,今日头条无论从关注度、特色,还是收益上,都是中国媒体行业的经营典范——其运营机制满足了其源源不断的信息源和更新速度,其算法系统保持着用户较高的用户黏度和忠诚度,汇集了较高的受众关注度。这种运营模式让今日头条在媒介的二元市场中具备了较高的优势,其边际效益保持着稳定的递增态势。而随着今日头条的不断发展,众多媒体成为今日头条的合作伙伴或被其收购,今日头条也在发展上表现出来十足的决心和野心,近些年来逐渐加大对其的宣传和推广,用户群和经济收益逐年增加。但是,今日头条所推送的信息质量参差不齐,许多信息来源不明,真伪度不详,情趣低俗、暴力。标题多骇人听闻,博人眼球。今日头条的信息中大量充斥着此类不良信息,覆盖各种信息门类,众多信息门类因其本身属性原因,不良信息比例极高。这种问题也一直为学界和舆论界所批评。
今日的技术水平,让信息茧房概念成为了可能,受众有能力选择自己想要接触的信息。将自己封闭在自己所建构的认知世界里。长期下来,很可能造成个人认知与现实世界的偏差。今日头条的用户在长期使用中所形成的信息茧房是受到外力影响控制的——他从其中获取的信息是不全面的,质量参差不齐的,且大量信息真实性堪忧,质量不佳。这种媒介环境导致了公众信息茧房的进一步恶化,这种恶化可能是公众不自知的,一旦形成,比一般意义上主动建构的信息茧房还要糟糕,公众个体可能不仅仅是封闭的,还可能是具有危险因素的,长此以往,这种信息茧房的被动性恶化对于社会的发展和进步无疑埋下了巨大隐患。
经济体寻求盈利最大化固然重要,但是传媒行业具有特殊性,不能仅仅为了盈利孤注一掷不计后果,而应该具备更多的社会关怀和责任感。针对今日头条一类新型的、繁荣的算法媒体来说,希望今后它们可以加强信息的筛选和检验,在如今新媒体发展迅速,信息茧房不断强化的今天,让公众与真实社会的距离更贴近一点,而不是在浩渺如海的垃圾信息中沉沦,失去一个公民本该具有的感知力。