马逸纯 马森涛 温惠妮 杨湘穗
摘要:标题在新媒体推文的传播中发挥着重要作用,因此了解其标题特征对提高推文传播效果有着十分重要的意义。本文以微信公众号推文为例,收集了高阅读量推文的标题文本数据,采用计量统计和定性分析相结合的方法,从标题长度、词频、词性分布、文章阅读量变化趋势四个角度对高阅读量推文标题的特征进行探讨,获得标题长度、词性分布比例、高频词汇组成、不同细分主题标题的特征差异与推文阅读量之间的关系,以期为优化推文标题提供一些参考。
关键词:微信公众号;推文标题;语言特点;高阅读量推文
中图分类号:G206 文献标志码:A 文章编号:1674-8883(2021)12-0019-03
课题项目:本论文为广东省科技创新战略专项资金(大学生科技创新培育)项目“高阅读量公众号推文标题特征的研究——基于神经网络词向量”研究成果,项目编号:pdjh2020b0822
一、引言
在新媒体盛行的时代,微信公众号作为极具代表性的新媒体形式之一,成为当下信息传播的主要渠道。与传统媒体不同的是,读者在接收新媒体信息时,最先看到的便是文章的标题,它能帮助读者在大量信息中快速定位自己喜欢的内容[1]。一篇文章是否能够抓读者眼球,取决于推送信息的标题能否快速吸引读者。因此,研究和把握高閱读量的公众号推文的标题特征和特点,对发挥新媒体优势、提升传播效果、扩大影响力有着重要意义。本文从高阅读量推文标题的文本要素即标题长度、词频、标题词性结构、阅读量变化量四个方面对推文标题文本特征进行探讨。
二、研究现状
目前,有关新媒体推文标题的研究多集中在单一主题,如新闻或情感等,其研究视角多为新闻传播学、句式特点和语言技巧等。例如,杨捷(2018)分析了情感类微信公众号文章标题的特点,从用词特点、内容特点和句式特点三方面进行阐释[2];张丹琪(2020)对新闻媒体编辑微信公众号新闻标题的语言技巧进行分析[3];李彦迪(2021)基于言语行为理论,分析了人民日报微信公众号文章标题的言语行为,揭示了文章标题的构成性规则与调节性规则[4]。从上述研究可知,对不同主题的推文标题文本的长度、词性组成、词频分布等形式要素的研究还处于空白。
三、研究方法
(一)样本选择
研究标题特征的主要目的是提升推文的传播效果,因此本文以具有高阅读量的微信公众号推文为研究对象。本文定义的高阅读量推文是指阅读量进入所在主题的日排行榜前80的推文,以“微小宝”网站的微信推文排行榜为筛选标准。本研究基于自主开发的Python网络数据抓取工具,收集数据的样本来自23438个公众号,742371条推文,共25个主题,总计742371条样本;收集的时间跨度为2020年5月 27日至2020年7月8日,数据元素包括收集日期、推文标题、所属公众号、近24小时阅读量、近3天阅读量、近7天阅读量、近30天阅读量。
(二)文本预处理
文本预处理主要包括去停用词、无效的字符和分词等。其中停用词主要包括以下几类:第一,语气词,如吗、否则、吧、吧哒、吱、呀、呃、呕、呗、呜、呜呼等等;第二,介词,如自从、随着、当、朝、顺、本着、通过、根据、沿着、依照等等;第三,结构助词,如的、地、得,以及其他没有实际意义的虚词和连词等。无效字符则包括#$%&‘‘()*+,-./:;<>=?[]\^_`{}~。!——丨|“”?…、()《》;:︰【】|「」 ·q④+等符号。分词处理采用jiebaR开源工具。
四、标题特征
(一)标题长度特征
公众号推文标题的长度受微信官方平台规定的64个字符的限制。根据本研究全体样本的标题字数统计,公众号推文标题的平均字数为22个,其中标题字数的高频率区间为12~31个字。这里我们定义高频率区间是第一四分位(Q1)到第三四分位(Q3)的区间。高频率区间是标题长度出现得比较集中的区域,其大小可以反映分布离散程度。高频率区间越大,分布就越离散。
进一步对25个主题的推文标题进行统计分析发现,不同主题的标题长度及其分布也有一定的差异,分别体现在平均长度和标题长度的高频率区间大小不同。在字数分布上,标题长度大致呈正态分布,但不同主题的离散程度不同。例如,娱乐主题的推文标题长度分布的高频率区间达16个字宽,而宠物主题的高频率区间宽度仅为9个字宽,与娱乐主题相差7个字宽,说明娱乐主题的推文标题长度的分布更为离散,涉及的字数较多。
总而言之,不同主题之间标题长度的高频区间各异。从高频区间的宽度来看,娱乐、财经、国际、军事、旅游、时事、社会、家居、美食、汽车、时尚、体育、音乐等13个主题的高频率区间较宽,而健康养生、教育、科技、母婴育儿、文化、动漫、搞笑、历史、星座运势、情感、游戏、宠物等12个主题的高频率区间较窄。高频区间的宽度越窄,此类标题的长度在高频区间内的浮动越小;而高频区间较宽的主题标题长度的浮动较大,撰写标题时对长度把控的灵活性较强。
(二)词频
为了更好地研究标题的组成结构,本文对分词结果进行了同质化合并处理。例如,将具体人名分为领袖人物、娱乐明星、社会名人、体育明星四类。其中领袖人物指古今中外的政界领袖;娱乐明星指著名歌手、演员、模特、网红、偶像等等;社会名人指著名科学家、经济学家、文学家、企业家及商界名人等等;体育明星指国内外体育界知名运动员。此外,对数字也进行了同质化合并,记为数字。词频定义为该词出现次数与总词数之比。本研究分析了25个主题的推文标题词频分布,部分主题的分析结果如下表所示。
对25个主题的词频进行分析可知,第一,在所有主题的标题中,数字出现的频率最高,可以反映出公众号标题关键的编辑手法——巧用数字。通过具体数字的运用,可以给读者传递可视化的信息,既增强了文章的真实性、专业性,也能够赢得读者的青睐,从而提升文章的阅读量。第二,从词频分布可知,每个主题下都有领袖人物、社会名人出现,并占据较高的比重。标题中含有名人能够让读者在看到标题时产生有自然而然的信赖感,从而提升文章的点击量。第三,运用热词的特征明显。本文资料收集期间的热点事件包括中美贸易、疫情等,这些内容既属于社会事件也属于时事新闻,备受大众的关注。因此,相关热词也出现在了多个主题的推文标题中,如中国、美国、确诊、疫情、病例等热词被迅速运用到了标题中。第四,传统热点话题也可出现在多个不同主题的推文标题中。不同主题下会出现相同的热词,大部分用户都更倾向于关注轻松娱乐性的热点话题文章,因此休闲八卦娱乐文章更容易受到欢迎,如国内外名人明星的婚姻状况一直备受群众的关注,一旦有任何变动都会得到媒体的报道。
结合以上结论,在标题创作时可以灵活地运用以上特征,以激起用户的阅读兴趣,从而提高文章的点击率。词频分析表明,微信公众号推文标题主要由“热点+数字+领袖名人+相关主题热词”等四个要素组成。
(三)标题词性结构
词类是可量化考察的语体标记之一,词类选择和使用频率上的差异反映了语体的差异[5]。按照jiebaR的词类划分标准,并参考分词黄伯荣、廖旭东(2013)[6]的词类划分标准,本研究将推文标题的分词库划分为11种词类,并与代表性的传统媒体如报纸的词类分布进行了比较分析(见图1)。
从整体上看,在传统媒体和公众号推文标题的分词占比中,名词和动词占比均较高。从分布上看,与报纸相比,公众号推文标题在占比和次序上均有较大差异。在占比方面,推文标题中的数词、代词、副词和连词的占比均有大幅提升,而报纸标题中的名词、动词、区别词、介词、量词、助词占比较推文标题有大幅提升。两者在次序方面也有明显的变化,推文标题中的代詞、连词和区别词的比重次序较传统媒体有较大提升,而报纸中的介词、量词和助词占比次序较公众号标题更靠前。传统媒体的标题的词性分布更为全面,语法结构更为完善。
在传统媒体新闻标题的设置中,标题在引人关注的同时更需要注重语句的完整性和事实的还原程度;相比之下,公众号一类新媒体的推文标题更关注关键词和具有冲击感的词汇,如数词、代词、副词等,一定程度上放弃了标题的语法完整性,更加偏向碎片化。在公众号推文标题中,标题词性有侧重地分布,更强调语句的信息冲击力和简短程度,多使用名词、动词、数词和代词作为标题的词性组成去撰写标题。名词和动词可以充当任何一种句子成分,并能作为句子的核心成分表达句子含义[8]。名词和动词的活用除了可以表达事物本身的含义外,还可以凸显语意,让语言变得新颖别致,更具当代新词语的韵味[9]。代词和数词可以用于修饰和限制名词,“代词+名词”“数量词+名词”的形式可以比较具体地说明人或事物的性质、状态、数量、所属和质料等,从而区别事物之间的不同特征[10]。由此可见,名词、动词、数词和代词是构成公众号推文标题的四种主要词性,受标题长度的限制,可以在一定程度上放弃标题的语法完整性。
(四)阅读量变化趋势
为了探究公众号推文发布后阅读量变化的趋势,总结微信公众号文章标题的传播效果及文章热度的时效性,本研究随机选取8个具有代表性的推文进行了分析。图2是累计阅读量随时间的变化情况。
从图2中可以发现,在发布推文的前几天时间内,推文的累计阅读量增长较快,但达到某一阅读量后,增长会变缓并逐渐趋向稳定。从数据结果来看,所有推文累计阅读量在三天内有较大幅度的提升,从第三天开始,增长幅度减小,第七天后其增长几乎停止。这说明在新媒体领域文章标题传播效果在发布后的三天时间内效果最佳,文章热度时效性通常不超过七天。
五、结语
在当下新媒体环境下,标题是整篇推文的“灵魂”和“窗户”。在微信公众号推文创作过程中,标题的制作十分重要。本文从标题长度、词频、词类及其分布的视角出发,对微信公众号推文标题进行了分析,得出四点结论。第一,不同主题之间标题长度及区间分布具有一定差异,如平均标题字数和高频区间等都有所不同。在撰写推文标题时,应根据相应的主题,将标题字数控制在对应的区间之内。第二,根据对标题词汇的研究,可以发现公众号推文的标题通常由“热点+数字+领袖名人+相关主题关键词”等四要素组成。在标题创作时可以从这四个要素出发,并根据实际主题对相关要素进行自由组合。第三,公众号推文标题中标题词性有侧重性地分布,更强调语句的信息冲击力和简短程度,名词、动词、数词和代词是主要使用的词性。第四,新媒体领域,文章标题传播效果在发布后的三天时间内效果最佳,并且文章热度时效性不超过一周。
参考文献:
[1] 王玲.新媒体新闻标题的重要性探讨[J].新闻研究导刊,2020,11(22):175-176.
[2] 杨婕.情感类微信公众号文章的标题研究[D].湘潭:湘潭大学,2018.
[3] 张丹琪.新闻媒体微信公众号的新闻标题语言技巧分析[J].传媒论坛,2020,3(23):39-40.
[4] 李彦迪.言语行为理论下的《人民日报》微信文章标题研究[J].传媒论坛,2021,4(06):155-157.
[5] 黄伯荣,廖旭东.现代汉语[M].北京:高等教育出版社,2011:158-171.
[6] 胡明扬.现代汉语词类问题考察[J].中国语文,1995(05):381-389.
[7] 赵雪,顾晓玉.抗战时期报纸新闻标题语言的计量语体分析 ———以《新华日报》《中央日报》为例[J].理论与现代化,2015(05):114-119.
[8] 胡明扬.现代汉语词类问题考察[J].中国语文,1995(05):381-389.
[9] 邹冰羿.现代汉语中的词类活用及其修辞效果[J].西部素质教育,2017,3(06):273.
[10] 宁致远.掌握不同词类的特点,准确地遣词造句(一)[J].人民司法,1981(03):37-38.
作者简介:马逸纯(1998—),女,广东汕头人,本科在读,研究方向:电子商务。
马森涛(1999—),男,广东汕头人,本科在读,研究方向:电子商务。
温惠妮(2000—),女,广东揭阳人,本科在读,研究方向:电子商务。
杨湘穗(1999—),女,广东茂名人,本科在读,研究方向:软件工程。