赵心树 叶济舟 孙淑欣 甄颖彤 张振宇
互联网技术的持续升级,促成社会生活的移动化、手机化,即文字、图像、影像、音像中的大部分或绝大部分都通过移动端进行传递。与此相伴,网帖标题吸引网民注意,影响网民选择,起始、推动、维持和指引选择螺旋的作用更显其重要性,理应受到更多学术关注。
标题先于文本[1],影响文本的阅读、转发、再阅读、再转发的行为循环和信息螺旋,决定或规限螺旋的广度、速度、长度。但是,已有研究多侧重新闻标题的写作技巧、修辞结构,用控制实验模拟新闻消费场景,探讨如何通过祈使动词[2]、隐喻框架[3]、专家话语[4]、负性偏见(negativity bias)[5]或其他阐释包裹(interpretive package)来“优化故事与读者之间的相关性”[6],很少注意文本长度的影响。同时,以网帖标题为对象的研究仍旧依照“信息—认知(态度)”的逻辑展开,鲜有进一步关注认知之后的行为,例如评论、转发、下载等。
本项研究从新闻聚合平台今日头条,抓取网帖标题和包括点击阅读(简称“点读”)、点击转发(简称“点转”)在内的用户行为数据,在选择螺旋的理论框架下,将网帖标题长度(即标题字符数,简称“题长”)作为选择因素,估测题长对点读和点转行为的影响。
纸媒时代,“总结”与“索引”是新闻标题的核心功能。“好的标题可以立即告诉读者新闻的要点,使‘标题读者’快速理解新闻,因为事实上没有人能每天阅读所有新闻”[7]。“题目如编辑得法,应为新闻之结晶,以少数简明之字,叙述其中重要之事实”[8]。而随着互联网的接入与大规模运用,受众开始习惯于按需获取信息,无法准确区分用户生产内容(user-generated content,UGC)和传统媒体内容(traditional media content,TMC)之间的信源差异[9],并且基于互联网新闻列表式的呈现方式,大多数受众仅会采用“扫描”的方式进行文本的浅层阅读[10]。因此,为在“扫描式”阅读中实现受众点击并由此提高用户黏性,“抓取注意力”开始成为互联网时代网帖标题的主要功能与特征[11]。但该种转变也在一定程度上影响了新闻的正常制作与互联网的健康生态。媒体基于受众需求进行新闻制作,其网帖标题往往具有“高度的意见性、误导性、未经核实或其他不可靠的特点”“没有体现情绪克制和事实核查”[12]的应然状态。其中一些修辞技巧也被业界人士批评为是一种“点击诱饵(click baits)”[9]。
网帖标题对选择螺旋的“启动”和“定调”作用,促使学者和新闻工作者思考标题制作策略。许多研究从文本切入,关注网帖标题的写作方式与技巧。Tandoc和Dick指出,记者、编辑记者会通过调整标题的单词、短语和语言风格来吸引读者。[13-14]Dor提出优秀新闻标题的十个标准,包括恰当的修辞框架、信息增量、高新闻价值等等。[6]眼动实验发现,标题长度、情感倾向、副词使用、位置择序等特性与读者的点读、点赞行为量之间存在统计上被承认的相关。[15]此外,标题在列表中的位置也可能影响用户的反应。[16-17]
也有少量研究或评论关注标题长度。教科书多主张短标题;但也有作者主张长标题。Dor认为网帖标题应简明扼要,减少整体信息。[6]KuiKen等认为信息量更大的标题未必更有效。[11]Subotic和Mukherjee报告,学术论文标题越短,被引概率越大。[18]但Horne和Adali认为,长标题包含更多信息,有助受众关联已知信息。[19]
注意是选择性的,只有部分信息被选择,被注意,被感知[2]。选择有高低之分,选择有度,是为选择度(selectivity)。[20-22]经典理论“选择曝光”(selective exposure)以英语“选择”的形容词形式命名。[23]该理论主张受众把信息所透露的态度或观念作为选择因素,即受众更愿选择关注、阅读、消化和记忆符合自己态度和观念的信息。
标题的主要功能之一是帮助读者选择。Lindemann指出,小报的新闻标题类似一个“相当复杂的谜语”,从而触发受众大脑中的框架和信息系统。[24]Horne和Adali认为读者可以从网帖标题辨别新闻真假,因为“假新闻标题会使用更少的停顿词和名词,而使用更多的专有名词和动词短语”。[19]Aslam等人研究有关新冠肺炎疫情的新闻标题,认为新闻标题能够引发读者恐惧、信任、愤怒等情绪。[25]也有学者发现,在新闻标题的选择中,与故事型标题相比,数据型标题引起参与者较高的愉悦度和唤醒度,进而引发参与者点击该标题以查看详情内容。[15]
近年,中文文献中出现“选择螺旋”理论。[26]该理论关注人类信息传播的四种基本行为,即发布(release)、接收(reception)、转发(relay)和反应(reaction)。一人一次发送、一人一次接收、一人一次反应和一人一次转发构成信息传播最小的完整单位,即轮(round),详见图1。
转发是信息的再次发送,而反应行为也发出信号,转发和反应信息可能被再次接受、再次转发、再次反应,构成再一轮的信息传播,这种重复构成第五个R行为,即环生(recycle)。长时间的环生,使得一人一次的行为不断扩大,从而产生反应(reaction)和影响(repercussion)。上述R行为各具选择性,即选择发布(selective release)、选择接受(selective reception)、选择转发(selective relay)和选择反应(selective reaction)、选择影响(selective repercussion)、选择环生(selective recycle)。[20]
信息平台所记录的点读、点转、点赞、点踩等,均为图1描述的选择螺旋起始轮(首轮、零轮、round zero)的行为。起始轮的行为影响和预示以后各轮的行为;要理解螺旋,不能不理解起始轮。转发的内容发散至大量不同平台,而起始轮的行为信息集中在一个平台。搜集和分析起始轮数据的成本相对较低。有鉴于此,本项研究专注于分析螺旋首轮。
螺旋的首轮转发,是首轮的总结,也是下一轮的起始,预示以后无数轮的转发。首轮转发是承前启后的关键,值得特别关注。[20]基于这个理解,本项研究把首轮(起始轮)转发列为因变量,将题长视为选择因素,探讨题长与点读对转发的影响。
“题长→点读→点转”三者之间的关系,可被视为图1所示理论模型的一个简化型。这个模型的特点包括:其一,忽略起始轮(零轮)以后各轮,于是也就忽略了“环生”和“影响”。其二,在起始轮中,忽略“反应”,固定“发布”。由于分析单位是网帖,发布自然固定为零,成为常量,形成“分析单位控制”(unit-of-analysis control),其作用等同于统计控制(statistical control)。其三,选择题长作为选择因素,选择点读代表接收,选择点转代表转发。其四,专注考量题长对点读和点转的影响。
图1 选择螺旋理论模型
Wilson和Sperber主张的“关联理论”(Relevance theory)认为,“所有的表象刺激都带有对自身最佳性的推定,而人类的认知过程则是为了在最小的处理努力中达到尽可能大的认知效果”。[27]刘果和汪小伢研究新闻评论类微信公众号,发现标题字数在15到19的标题占比最多。[28]
本文提出“适效理论”(Just enough information theory),其核心包含三个原则:
1.足量信息(Enough information)
受众需要足量的信息。“使用与满足”理论要求研究者重视受众使用媒体和信息的动机。[29-30]本文预设,网民的动机在于获取广义的信息,包括事实类、观念类、娱乐类等所有以字、词、标点、图片、视频以及所有其他符号所承载的内容。许多动物有传递信息的能力,但只有人类能使用文字传递信息,而文字的最主要功能也就是传递信息。信息传递需要一定量的字词。标题字数太少造成信息不足,降低网帖对读者的吸引力。据此,足量原则预期,当网帖标题短于一定字数时,长度与点读正相关。
2.高效用字(Just information)
读者期盼从文本和其他语言符号中获取信息,而处理字、词和其他语言符号需要消耗时间、精力和感情等认知资源。有些字词不含读者需要的任何信息或是完全重复的已知信息,是无效率字词。有些文本用字用词多却所含信息少,是低效率字词。有实证研究报告,读者倾向于跳过频率高而无实义的词汇,如英语“the”,中文“的”。[31-32]高效原则把读者处理字词的资源视为付出,而将接收的信息视为获取。无效与低效词语降低了标题的性价比和读者的感受质量,从而降低预期的文本性价比,降低点读的兴趣或冲动。据此,高效原则预期,当网帖标题超过一定字数时,长度与点读负相关。
3.限量信息(Just enough information)
相对于大千世界或网络空间的所有信息,人类处理信息的时间、精力、资源与需求极其有限。标题的首要功能,就是为读者摘要,提示内容。标题所含的信息量,理应有所限制。标题内的超量信息,可能超过读者的需求、预期、能力或习惯[33-34],降低读者的读题感受,从而降低对网帖内容质量或性价比的预期,进而降低点读的兴趣或冲动。鉴于题长与信息量正相关,限量原则预期,当网帖标题超过一定字数时,长度与点读负相关。
4.适效原则(Moderation and sufficiency)与∩(倒U)效应
足量和限量合称“适量(moderation)”。足量、高效和限量三原则可合称“适量、高效”(moderation and sufficiency),简称“适效”原则。
综合三个原则的三个预期:当网帖标题低于一定字数时,长度与点读正相关;当网帖标题超过一定字数时,长度与点读负相关;换言之,长度对点读的效应先升后降,先正后负,呈∩形。由此导出下一章的几项预测。
如上述,足量原则预期,当网帖标题短于一定字数时,长度与点读正相关;而高效原则和限量原则预期,当网帖标题超过一定字数时,长度与点读负相关。综合三个原则的预期,可得预测H1(Hypothesis 1):
预测1:题长预测点读,呈∩效应
人们很少转发自己没读过的内容。包括今日头条在内的大多数平台要求用者必须先点读,才能点转,从程序上杜绝了“不读而转”,这意味着点读对点转的强正向效应。已有一些实证研究报告这个强正效应。[35]
点读对点转的强正效应,是选择螺旋的强力引擎。这个强正效应,意味着受者的偏好强烈正向影响信息的转发,促使螺旋中的两个关键选择——接收选择与转发选择——同向(synchronize)。如图1所示,启动螺旋首轮的发布者群体,发布之后即刻退出;此后直到螺旋终结,决定信息选择的只有两个群体,即接收者与转发者。接收者群体对转发的强烈影响,以及接收主导的同向化(congruent selectivity),意味着选择螺旋的单一化倾向(monotonizing tendency)。这是强化螺旋(reinforcing spiral)[36],失衡螺旋(spiral of imbalance)[37],以及惰性螺旋(spiral of inertia)[26]等现象背后的部分行为机制。据此,有预测H2(Hypothesis 2):
预测2:点读量预测点转,呈正向效应
如上述,点读与点转的强正相关(H2)意味着,读者关于题长的偏好会以高比率传达至点转;读者的∩状偏好(H1)传达到点转,导致题长对点转也呈∩效应,即,中等长度标题的网帖被点转最多,较短或较长标题的网帖被点转较少,而极长标题或极短标题的网帖被点转最少。于是有预测H3(Hypothesis 3):
预测3:题长预测点转,呈∩效应
既然标题不能太短又不能太长,就有这样的问题:多长的标题最好?于是有以下研究问题(research questions):
研究问题1:多长的标题预测最高点读量
研究问题2:多长的标题预测最高点转量
题长→点读→点转之间的∩中介关系。上述三个预测,隐含着题长、点读、点转三者间的中介关系。转发承上启下,是每一轮的终点,又是下一轮的起点。这是选择螺旋理论的一个关键认定。[38]本项研究专注于螺旋起始轮,因此把点转定位为题长→点读→点转关系中的“标准变量”(criterion variable,即“因变量”)。
中介效应不是本项研究的重点。但是,我们关注的变量客观上构成中介关系。了解这个背景模型,有助于解读分析结果。
本研究选择了中国最大的新闻聚合平台之一——今日头条作为数据来源。根据QuestMobile(2020)数据[39],截至2020年6月,今日头条拥有总数超过7亿的用户和每月4.1亿的活跃用户,人均单日使用次数为9.6次,人均日使用时长超过30分钟的用户占用户总数的36.3%。其高频次、高使用时长在业内居于领先地位。我们抓取2015年3月中前三周(3月1日—3月21日)的数据,除去重复内容后,获得58,000条网帖。
大数据研究中,变量单位相互间一般不等价。如本项研究中,平均约百次点读触发一次点转,这使得一次点读未必等价于一次点转,称为“单位异价”。当变量之间单位异价时,基于这些变量的回归系数(b)互不可比。有研究者用标准离差(standard deviation,SD)作为变量单位,以为据此测得的回归系数即标准系数(beta)相互可比。其实,从传统理论的视角考量,没有理由说某个变量的标准离差必然等价于另一变量的标准离差。而且,同一变量的标准离差会跨时间跨样本而变化,很不稳定。所以,标准离差相互异价,不应把beta看作主要的或唯一的互比指标。再者,由于标准离差通常缺乏明确的理论或实践的意义,标准系数(beta)一般不可或难以解读。[40]本文作者一直主张并践行百分标尺(0-1 normalization),将变量值的单位统一为百分比,在此基础上获得的回归系数称为“百分系数”(percentage coefficient,即bp)[40-41]。
公式1是“0-1标尺化”的一个主要工具,其中ps(percentage score)为转换后标尺上的百分值,so为原标尺上的原始值(original score),mn代表原标尺上的理论最小值(conceptual minimum),mx为原标尺上的理论最大值(conceptual maximum):
Ps=(so-mn)/(mx-mn)
(公式1)
题长、点读与点转的理论最小值均定为0,应无争议。理论最大值均取六个标准离差(SD)以上、观察最大值(observed maximum)以下的方便整数,据此得理论最大值分别为:题长100,点读100万,点转2万(见表1)。
表1报告了变量的基本情况。在58,000条网帖中,标题长度从0个字符数到78个字符数,转发量从0到453,928次,点读数从0到6,399,130次。余见表1。
表1 基于“0-1标尺化”的变量值转换表(n=58,000)
如上述,中介效应本非本项研究的关注重点,但研究预测和研究问题客观上构造了一个中介模型。表2列明估测这个中介模型的线性和非线性部件(components)的回归公式。表3说明这个中介模型的主要线性部件所测量的用户心理或行为、统计指标以及2019年七城研究[20]所使用的对应指标。
表2 题长→点读→点转中介模型的非线性分析
符号a,b,d,c分别代表间接第一段,间接第二段,直接和总效应
表3 “题长→点读→点转”中介线性模型各部件意义及指标
科学发现的可靠性体现在跨研究的比对与重现。本研究将尽量与2019年七城研究比较。但这种比较不可能直接精确。本项研究采用网帖作为分析单位,于是发布成为常量,从而全面控制了发布的影响。七城研究以选择因素城市为分析单位,所以发布是一个变量。如果这是唯一的区别,那么,七城研究中的统计指标,如相关系数(correlation),可与本项研究中的控制发布后的对应统计指标(如控制发布后的偏相关系数,partial correlation)比对。但还有其他不同。其一,七城研究的选择因素,即城市名,是一个定性变量,而本研究的选择因素,即标题长度,是一个连续变量。其二,七城研究中每个选项(北京、上海等)只有一个案例,七个城市就是七个案例(N=7),使得许多牵涉选择因素的常见统计指标,如回归系数或p值,无法计算,或计算结果因不稳定而不可靠,所以七城研究开发了一系列统计指标用于分析此类“大变小”(big-made-small)数据;而本项研究中每个选项(20个字符、30个字符等)可能有数量不等的案例,总共有58,000个案例,所以可以计算常见统计指标。有鉴于这三个区别,表3最后两列的指标,都只能做近似和粗略的比对。
为了给读者更直观的感受,特从数据中抽取若干实例如下。
例1:怀化城市公共客运管理办:出租车司机不打表乘客可拒付车费(27个字符,近于对应最高点读的最佳题长)
例2:米兰无意行使买断权,德斯特罗将回归罗马(19个字符,近于对应最高点转的最佳题长)
例3:夜(极短标题)
例4:礼物(极短标题)
例5:金融圈工作压力排行榜:投行基本睁眼就进入战斗状态,交易员压力瞬间爆发(极长标题)
例6:加拿大央行利率决议:全球经济形势符合1月份预期,原油价格接近1月份所给假设(极长标题)
以上的讨论隐含题长→点读→点转的中介关系,其中题长→点读的关系被预测为非线性的∩关系。这个非线性中介模型主要由表2所列的四个回归方程来测试和分析。
本文用符号a、b、c、d分别代表间接路径第一段、间接路径第二段、直接路径,以及总效应。[42]
表4 标题长度对点读和点转的影响
表4列出了回归分析的主要发现。表中回归系数b估测,当自变量增加一个单位时,因变量的增量;而百分系数bp估测,当自变量从理论最低值跃升至理论最高值时,因变量的百分点增量。如表4题长(TL)一行,B=-14.394,表示:若标题长度增加一个字,相应地,点转减少近14个点击。又如点读(RD)一行,bp=0.377,表示:若点读数从最低值0跃至最高值1,相应地,点转增加37.7个百分点。百分系数(bp)所基于的变量都统一在0-1标尺上,因此百分系数相互可比,可跨自变量比,可跨因变量比,也可跨两者比[40-41]。
本研究分别检验了上文提出的3个预测并回答了两个研究问题。
预测1预估,题长预测点读量的曲线呈∩状。表4与表2显示,题长平方TL2预测点读量的回归系数a2被统计承认(a2=-124.774,bp=-1.248,p<0.001,statistically acknowledged)[43-45],该系数取负值而题长TL的系数取正值,且图2明显呈∩形。据此,预测H1成立。
图2 题长对点读的∩效应
预测2预估,点读量预测点转量的曲线呈单向上升状。表4与表2显示,点读量对转发量的回归系数b1取正值且统计可认(b1=0.008,bp=0.377,p<0.001,statistically acknowledged)[43-45]。据此,预测H2成立。
预测3预估,题长预测点转量的曲线呈∩状。表4与表2显示,题长平方对转发数量的回归系数c4统计可认(c4=-1.035,bp=-0.518,p<0.001,statistically acknowledged)[44-46]。该系数取负值而题长TL的系数为正值,且图3明显呈∩形。据此,预测H3成立。
值得注意的是,题长对转发的直接效应呈负向线性(d3=-14.394,bp=-0.072,p<0.001),意味着标题越短,转发越多。但题长对转发的总效应(图3)与题长对点读的关系(图2)相若,说明读者对于中等题长的偏好,主导了题长对转发量的总效应。这一发现,为选择螺旋中的“同向选择”(Congruent Selections)[26],提供了新的实证细节。
研究问题1问,多长的标题能够带来最多点读;研究问题2问,多长的标题能够带来最多点转。图2显示,当网帖题长为27.13时,点读达峰;图3显示,当网帖题长为19.44时,点转达峰。由此结论,题长27~28个字符时,预测点读数最高;题长19~20个字符时,预测点转数最高。
如前述,三个预测隐含∩形中介效应,题长→点读→点转。其中题长对点转的直接效应,由方程Eq.3和Eq.4检测(表2)。Eq.3(d2=-0.094,bp=-0.047,p>0.05,表4)显示,关于此模型中的直接效应的非线性预测统计上不被支持(statistically unacknowledged)[43-46]。而Eq.4的d3呈负值且被统计承认(d3=-14.394,bp=-0.072,p<0.001,statistically acknowledged at.001 level)[43-44,46],从而支持关于该直接效应的负线性预测。这个结果表明,转发者偏好短标题,越短越好。排除点读的中介效应后,每增加一个字符平均减少约14个点转。
图3 题长对点转的∩效应
以上数据揭示了两个关键角色群(role players)的不同偏好:读者群偏好中等长度标题,27~28字为最佳;而转者群偏好短标题,越短越好。
点读主导的读转协调是本研究的一个发现。这一现象可能有重要的理论意义,此前又未见于文献。以下报告必要的细节并附说明,以便其他研究者验证或复现(replication)。
1.读转协调(read-relay negotiation)
作为零轮总结和下轮起始的转发内容是读转两群体协调的结果。证据之一是,代表读者和转者两个群体协调结果的“题长→转发”总效应(图3),既不同于代表读者一家偏好的“题长→点读”效应(图2,间接效应第一段),也不同于代表转者一家偏好的“(题长→转发)/题长”直接效应(负线性,bp=-0.072,p<0.001,Eq.4,表4,未作图),前者(图3∩形)是后两者(图2∩形与负线性)的综合体,又称妥协体。
读者的影响,最清晰地体现在上述两个∩形的相互近似;是读者对中长标题的偏好(图2),造就了两群体对中长标题的总和偏好(图3)。与此相对,转者的影响,最明显地体现在上述两个∩形的相互不同。以高转发为标准,最佳题长是19~20个字符(读转妥协的偏好);而以高点读为标准,最佳题长是27~28个字符(反映读者偏好)。前者短了约8个字。是转者群体的“越短越好”的偏好,造就了这约8字的区别。
2019年发表的七城研究也曾报告读转协调的现象。其证据包括,对转发量的影响,读者占比近79%,而转者占比略过21%(七城研究表5最后一列;参见本文表3最后两列)。该研究和本研究采纳了不同的数据,不同的选择因素,不同的分析单位,不同的分析模型,以及不同的统计指标;但两项研究都发现读转协调,从而相互印证。
2.点读主导(read domination)
虽说是两家协调,但读者的影响主导了协调结果。证据之一是,协调结果(图3∩形)较近于读者偏好(图2∩形)较异于转者偏好(负线性)。证据之二是,代表读者影响的“题长→点读→点转”间接效应(bp≈0.677×0.377=0.255,p<0.001,Eq.2& Eq.4,表4“点读”和“题长”行)大大超过代表转者影响的“(题长→点转)/点读)”直接效应(bp≈-0.072,p≥0.05,详见Eq.4,表4“题长”行),前者相当于后者的约3.5倍(|0.377|/|-0.072|=3.542)。注意证据二的分析作线性预设,而读者的偏好实为∩形。若作非线性效果量分析,读者影响会更显其大。
上述七城研究也发现点读主导,其证据包括,对转发量的影响,读者占比近79%,而转者占比略过21%,前者相当于后者的近3.8倍(七城研究表5最后一列;参见本文表3最后两列)。
3.读者选择强于转者选择
两个因素导致读者主导。第一个因素是“选择曝光”强于“把关”(gate keeping)。证据是,代表“选择曝光”的间接效应第一段(bp=0.377,p<0.001,Eq.4,表4)大于代表“把关”的直接效应(bp=-0.072,p<0.001,Eq.4,表4),前者相当于后者的5倍多(|0.377|/|-0.072|=5.236)。
注意三点。第一,“选择曝光”就是“读者偏好”,其程度也就是七城研究所说的“读者(读每发)选择度”;在本项研究中,这三个术语可视为同义词。第二,“把关”也就是“选择转发”,其程度也就是七城研究中的“转者(转每读)选择度”;在本项研究中,这三个术语可视为同义词。第三,以上分析对选择曝光即读者偏好作线性预设,而读者偏好实为∩形。若作非线性效果量分析,选择曝光会更显其大,其相对于把关的优势也会更显其大。
这个现象,可做较通俗的表述:网民对“读什么”较多挑剔,而对“转什么”较少挑剔。换言之,被点读的内容分布差别巨大,中长标题有机会霸屏刷屏,而极长和极短标题几乎无人问津;与此相对,被点读后,被点转的内容分布更近于平均,虽然较短标题读后被转的机会稍多些。
上述七城研究也报告了读者选择度远高于转者选择度。例如,读每发的选择度sl=0.171,而转每读的选择度sl=0.0551(七城研究表2),前者是后者的3倍多。
4.读转强正效应
导致读者主导的第二个因素,是点读(读每发)对点转(转每读)的强正效应,也就是间接效应第二段的强正相关(bp=0.377,p<0.001,Eq.3,4,表4)(strong & positive read-relay path)。
七城研究中也有读转强正相关的踪影,即代表读者意愿的读每发(ds)与代表读转协调后意愿的转每发(ls)之间的有向r2超0.9(dr2=0.922,表4第2行)。当然,这个相关(dr2=0.922)未控制选择因素(城市名)的效应,而本项研究的间接二段(bp=0.377)控制了选择因素(题长)。但是,本项研究Eq.6(表4)控制了题长也没有显著降低读转相关(bp=0.376,p<0.001)。由此猜测,控制选择因素与否不影响点读相关,点读对点转的强正效应不像是偶然或个别的现象。
从中介模型而言,选择因素(题长)对点读的效应是间接效应,间接效果量是两段的乘积(a×b),两段各自为必要因[47-48];每一段都须成立,间接效应才能成立;每一段(a×b)都需足够大,才能使直接效应的效果量(a×b)接近直接效应的效果量(d)。
从螺旋结构而言,读者间接影响点转,而转者直接影响点转,使读者处于天然劣势。读者偏好要有竞争机会,必须有两样东西,缺一不可。①读者偏好本身须足够强,也就是读每发选择度须够高,也就是a段效果量须够大。②这种偏好必须足够高效准确地传递到点转,也就是读每发到转每读的效应(简称“读转效应”)必须足够大地大于零。
根据这个理论框架,表3(2行)把间接效应第二段名之为“读转通道”,又称“读转光缆”。这个通道传递的不是物体,而是信息,是“效应”。传递后的效应要够大,不仅效应本身(读者偏好)须够大,而且通道或光缆的精确度(读转相关)必须够高。运输有损耗,运输损耗太大则送达物品少。这个道理也适用于信息和效应的传递。
从这个意义上,可以说,读转强正效应是读者主导选择螺旋的必要和关键的因素。
“读者影响转发,大于转者影响转发”,乍闻可能感觉有悖直觉;若无数据和理论指导下的细致分析,很难凭经验、直觉或推论作此断言。
为理解此现象,首先需要了解信息数量和信息分布的区别;此处所说的“转发”,非指转发数量的多少,而是指转发内容的分布。以读转关系为例,本项研究发现,每100次点读带来约1次转发(点读均值47,393对转发均值466,详见表1)。这也可以理解为日常话语中“点读影响点转”的一个侧面;这个侧面可以用因变量与自变量的均值比率(如1%)来测量,但该侧面不是本项研究关注的重点。本研究关注的“影响”特指自变量(如点读)的不同类别的分布对因变量(如转发)的不同类别的分布的影响;当自变量和因变量都是连续变量时,这种影响可以用相关性指标,如回归系数(b,bp,beta)或相关系数(r,r2,dr2)等来测量。如本研究发现点读与点转正相关(bp≈0.38,p<0.001;r2≈0.20,p<0.001;无论控制题长与否,Eq.4和Eq.5,表4),且效果量远大于模型中的其他效果量;这种强正相关意味着,被点读的信息分布强烈影响被转发的信息分布,即:被点读的标题多中长而少极短或极长,导致被转发的标题也是多中长而少极短或极长。理解了两个侧面的区分,才可以理解某因素(如转者偏好)影响某个侧面(如转发数量)较多而影响另一侧面(如转发分布)较少的现象。
数量与类别分布的关系,类同于自然科学中数量(quantity,magnitude,volume)与方向(direction,valence)之间的关系。后两者的某种形式的结合,例如相乘,则可形成向量(vector)而作用于社会。这三个社会层面的V(social valence,volume,and vector)之间的关系,值得社会科学家的深入探讨。
其次,要了解直接效应与间接效应的解构关系。说读者影响大于转者“有悖直觉”,是因为,按照直觉,直接影响通常大于间接影响。但是,有“通常”就有例外。当间接影响中的每一段影响都足够大,而直接影响足够小时,间接影响就会大于直接影响。三个因素使得上述“例外”变成现实:读者强选择度+读转强正相关+转者弱选择度。
本项研究主要发现简述如下。
1.两个∩效应
本研究发现,网帖标题长度对网帖的点读和点转呈∩效应。中等长度吸引最多点读和点转,更长和更短的标题使点读和点转下降,极长和极短的标题使点读和点转趋零。
2.27~28字预测最高点读
标题含27或28个字符的网帖的每贴平均点读量约6万,高于其他任何题长所预测的点读量。
3.19~20字预测最多点转
标题含19或20个字符的网帖的每贴平均转发量约500,高于其他任何题长所预测的转发量。
4.适度信息
中长标题包含适度多样的信息,能吸引多个群体的兴趣,从而吸引最多的点读,大量点读导致大量点转。过短标题承载太少信息,不能大量吸引兴趣点互不相同的读者,因此,从无字、极短标题到中长标题这一区间,平均每贴点读量逐步上升,点读上升导致点转上升。是为“雪中送炭”。过长标题有更多机会包含无信息字符、少信息字符、重复信息或过多信息,徒增读者处理信息的心理成本,减弱阅读享受,削弱网帖吸引力。因此,从中长到极长的区间,平均每贴点读量下降,点读下降导致点转下降。是为“过犹不及”。
5.接收主导的收转协调
读者与转者共同影响转发内容的分布,读者群体的影响大于转者群体。换言之,选择螺旋中关于题长的内容分布,是读者偏好和转者偏好协调(negotiation)的结果,简称“读转协调”(read-relay negotiation)。以点读代表信息接收,读者代表信息接收者,“读转协调”可抽象为“收转协调”(reception-relay negotiation)。收者偏好对螺旋信息分布的影响强于转者偏好的影响,简称“接收主导”(reception domination)。
鉴于首轮转发在选择螺旋中承前启后的关键作用和读者和转者是决定后续螺旋的仅有的两个群体,可以说,读转协调就是协调螺旋(negotiated spiral),接收主导的读转协调就是接收主导的协调螺旋(reception-dominated spiral of selective reception and relay)。
1.适度高效
本研究的发现支持了适效三原则,即:网帖标题需提供足量信息(足量),避免低效率用字(高效),以及避免提供过多信息(限量)。其中最后一个原则,与各领域研究发现的“过犹不及”(Too much of a good thing)现象相呼应[49-50]。
鲁迅言:“文章写完后,至少看两遍,竭力将可有可无的字、句、段删去,毫不可惜。”[51]课本、教师、编辑和作者常以鲁迅之言互勉自勉,使成名言。适效理论以足量原则和高效原则注解“可有可无”,以高效原则和限量原则注解“竭力……删去,毫不可惜”。因此,可视鲁迅所言为适效理论的先声,亦可以适效理论为鲁迅主张的实证。
2.选择螺旋
作为一个预设理论,选择螺旋的思路为本项研究提供了关键预设和理论框架。研究的顺利实施和众多发现证明了这些预设和框架的价值。作为一个预测理论,选择螺旋理论预测了选择曝光(点读)和选择把关(转发)。本项研究用数据说明,当选择因素为标题长度时,选择曝光和选择把关确实存在;而且,此时的选择曝光呈∩型,而选择把关呈负直线型。更进一步,选择螺旋的理论框架使我们能综合考察这两种选择行为,比较其异同,测量其互动,解读其综合作用,由此获得读转协调、点读主导的发现。
3.认知协调和知识社会学
知识社会学(sociology of knowledge)被认为是最有影响的社会学理论之一[52]。该理论的核心思想包括:所谓“现实”,其实是人们认知的现实(perceived reality),而人们的认知是在社会互动中协调(negotiated)和构建(constructed)的;于是有“现实协调”或“认知协调”(socially negotiated reality)的概念。
知识社会学强调信息意义的协调(negotiated meaning),而读转协调关注信息环生和再环生的协调(negotiated cycle and recycle)。可见,知识社会学可以为读转协调的现象提供更广更深的理论视角,而基于大数据的读转协调研究可以为知识社会学充实经验基础,扩充理论内涵。
4.强化螺旋、心理螺旋、社会螺旋及同向螺旋
Slater提出“强化螺旋”(reinforcing spiral)[53]理论,强调个人心理与行为的螺旋,也就是信息的选择曝光、选择接受与价值信念及身份认同之间同方向(congruent或consistent)的重复环生、不断强化,是为内螺旋(intra-person spiral),或称自螺旋(endo-spiral)、心理螺旋(psychological spiral)。例如,Slater定义强化螺旋的核心思想为:“个人意图找寻与其价值观、信仰和社会身份相一致的中介和人际沟通经验,这类经验反过来又助其维系自身愿意维系的社会身份。”[54]
与内螺旋相辅相成、互依互促的是“互螺旋”(inter-people spiral),又称外螺旋(exo-spiral)或社会螺旋(social spiral),也就是人与人之间发送、接收和转发之间的重复环生、不断强化。例如本文作者曾担忧,“信息市场中,发送者和转发者热烈追求读者,发送和转发的选择被接收的选择所控制,接收主导螺旋,促成同向选择”[26]。
而本研究发现的读转协调、点读主导的现象,提出了强化螺旋的第三种可能机制:读者群体的意愿在轮与轮之间不断重复,反复克服转者群体的较弱的异向选择,导致轮与轮之间的群体同向选择(collectively congruent selective exposure),从而不断强化某些信息在意见市场上的分布占比,再通过重复曝光(mere exposure effect)[55]、篷车效应(bandwagon effect)[56]、社会学习(social learning)[57]等机制潜移默化地修改甚至颠覆个人和社会的观念、态度和行为,固化和强化在某一时刻看似微弱短暂的倾向,导致长时间、大范围的影响,例如分化和极化效应。
强化螺旋的第三种可能机制,不依赖也不否认前两种机制所依赖的同向选择,即曝光与观念之间的同向选择,以及曝光与转发之间的同向选择。如果三种同向选择中的任何两种如人们担心的存在(一项研究未发现前两种不等于它们不存在),那么,由于三种螺旋都以选择曝光为扁担两头中的一头,所以它们相互之间也必然同向,从而更强化和更加速强化螺旋。
5.阅读脑、跳扫读与传者误判
如上述,本研究发现,作者群体偏好中等长度的标题,平均题长18~19个字符。读者群体同样偏好中等长度的标题,但最佳长度27~28个字符,比作者认为的最佳题长多约9个字符。而转者群体偏好短标题,越短越好。
作者与转者都是信息发送者,即传者。假定两者选择题长的主要考量包括吸引读者兴趣,鼓励读者点读,那么,上述三个最佳题长之间的区别,说明作者与转者都低估了读者对标题中信息的量的需求和处理能力,其中转者的错估更甚于作者。
于是问,何以如此?一种猜测是:爆炸增长的网络信息和急剧加速的选择螺旋,已经改变了网民阅读习惯乃至人类大脑结构,催生了浏览、屏扫、略读和跳读等阅读方式,甚或造就了“阅读脑”[58]。
更多、更多样、更多变的信息刺激扩张了读者对信息的需求,强化了他们的信息处理能力,改变了他们的信息使用习惯。例如,2017年至2018年间,用户浏览新闻网站的每次时长缩短了17%,至每次2.0分钟。[59]面对这种变化,作者和转者的感受、判断和操作滞后,在制作标题、发布网帖、转发网帖时仍然依循旧习惯和旧教条,偏爱较短标题。比较作者群体,转者中非专业传者的比例更大,专业敏感更低,于是转者对最佳题长的低估更甚于作者。
适效原则给网络作者、编者以下启示:第一,作文配题应力求“言必达意”。这个“意”,指信息。换言之,每词、每字、每个字符,都应高效传递信息。第二,订立“参考标杆题长”,简称标长。当草拟题短于标长,修改应向“足量”倾斜,注意补充必要或有用信息。当草拟题长于标长,应向“高效”和“限量”倾斜,注意搜寻、修改、减少低效字符或过多信息。但应注意,标长是参考,“参考标杆题长”不是“法定必须题长”。考虑特定需要或特定环境,题长可短于或长于标长。第三,若追求高点读,暂以27~28个字符为标长。若追求高转发,暂以19~20个字符为标长。第四,追踪实证研究,据此修订标长。例如,今后的研究可能报告,新闻报道与时事评论不一样,或青年网民与老年读者有区别,或此平台与彼平台多不同,或人们处理网络信息的能力随时间而增长,导致标长随内容、对象、平台或时间而变化。
本研究的主要发现,是在特定平台、特定时段的平均效应,这种效应可能在不同平台、不同时段、不同内容、不同读者、不同转者中表现不同。再现(Replication)研究至关重要。随着网络通信、移动技术和社会环境的持续发展,人类的传通方式和阅读习惯也将继续变化,使得求再现、测变化的研究更显必要。
在再现“题长→读转”效应的基础上,或可考虑两个方向的扩展。第一,扩展自变量的考察,探测其他相关自变量的效应,例如网帖种类(新闻、广告、娱乐等)与配题图片(有图无图,图片大小或多少)的影响,它们与题长效应的比较,以及可能的交互(调节)作用。第二,扩展因变量的考察,探测对其他相关因变量的效应,例如上述自变量对点赞、点踩的效应,以及赞、踩效应与读、转效应的比较与综合。