吴昊
摘 要:随着我国互联网用户群的持续扩大,作为信息传播的载体,互联网正日益成为现代人获取体育资讯的重要渠道。本研究采用数理统计法,选取互联网上受众面较广的体育资讯网站的语料文本,运用杨孝濚先生提出的易读性公式分别从“理解指数”和“闭塞指数”对其进行计算,根据所得结果对我国互联网体育资讯易读性和当前所存在的问题提出建议。
关键词:互联网 体育资讯 易读性
中图分类号:G80 文献标识码:A 文章编号:2095-2813(2020)03(b)-0214-03
2019年8月30日,中国互联网络信息中心发布第44次《中国互联网络发展状况统计报告》,报告指出,截至2019年6月,中国互联网用户达8.54亿,较2018年底增长2598万,互联网普及率达61.2%[1]。由此可见,作为现代化的体育资讯传播平台,互联网的重要性不言而喻。因此,只有充分利用好互联网的独特优势,以互联网为媒,才能更好地向大众传播体育资讯。目前国内对于体育资讯易读性的研究多从文体结构、用词规范等写作角度进行阐述。本文运用客观的数理统计法,对互联网体育资讯文本进行易读性测量,并根据所得结果对我国互联网体育资讯易读性提出建议。
1 对象与方法
1.1 对象
以我国互联网上受众面较广的体育资讯网站的语言材料为研究对象。
1.2 方法
1.2.1 语料来源与选取方法
根据Alexa网站统计数据,选取“虎扑”“新浪体育”“腾讯体育”“搜狐体育”“网易体育”,这5个网站为文本语料库。从每个网站随机选取一段至少包含150个字的文本作为测试语料(标点符号、数字及空格不计入)。选取方法为:从段落首字开始计算,至第150个字所在句子句尾为止。
1.2.2 研究方法
采用数理统计法,运用杨孝濚先生提出的“理解指数”“闭塞指數”易读性公式[2]来测量互联网体育资讯的易读性。
(1)理解指数公式。
X1=3.5921+0.8826X2-0.0179X3
其中,X1为理解分数;X2为计一到十率,指被测试语料中含有笔画数为一画到十画的汉字的总数和语料总字数的比率;X3为特殊词率,指被测试语料中的专有名词比率。
(2)闭塞指数公式。
X4=0.3344+1.4593X5-0.168X6
其中,X4为闭塞指数;X5为完全对称字率,指语料中对称字和总字数的比率,完全对称字指汉字中对称的字,如“田”“中”“申”;X6为难词率,指测试语料中的难词占总字数的比率,难词以《汉语水平词汇与汉字等级大纲》[3]中的5253个基本词汇为参照,不在此范围内即为难词。
运用易读性公式对被测试文本进行计算,将所得分数对照表1[2],从而对互联网体育资讯易读性进行评价。
2 结果
2.1 网站语料的选取结果
所选取的互联网上受众面较广的体育资讯网站分别是:虎扑(https://www.hupu.com/)、新浪体育(http://sports.sina.com.cn/)、腾讯体育(https://sports.qq.com/)、搜狐体育(http://sports.sohu.com/)、网易体育(https://sports.163.com/)。在上述网站中,各随机检索一段至少包含150个字的文本作为被测试的语料(标点符号、数字及空格不计入),从段落首字开始计算,至第150个字所在句子句尾为止。检索时间为2019年10月10日,选取的5段语料见表2[3-7]。
2.2 易读性评价结果
经计算,5段语料中的计一到十率X2、特殊词率X3、对称词率X5、难词率X6统计见表3。
根据易读性公式[2],对各语料进行“理解指数”和“闭塞指数”计算(计算结果保留小数点后四位),过程如下。
(1)语料1。
理解指数:X1=3.5921+0.8826X2-0.0179X3
=3.5921+0.8826×0.9200-0.0179×0.1988≈4.4005
闭塞指数:X4=0.3344+1.4593X5-0.168X6
=0.3344+1.4593×0.1429-0.168×0.0373≈0.5367
(2)语料2。
理解指数:X1=3.5921+0.8826X2-0.0179X3
=3.5921+0.8826×0.8291-0.0179×0.1899
=4.3205≈4.3205
闭塞指数:X4=0.3344 +1.4593X5-0.168X6
=0.3344 +1.4593×0.1772-0.168×0.0316≈0.5877
(3)语料3。
理解指数:X1=3.5921+0.8826X2-0.0179X3=3.5921
+0.8826×0.8395-0.0179×0.0988≈4.3313
闭塞指数:X4=0.3344+1.4593X5-0.168X6=0.3344
+1.4593×0.0864-0.168×0.0432≈0.4532
(4)语料4。
理解指数:X1=3.5921+0.8826X2-0.0179X3=3.5921
+0.8826×0.8756-0.0179×0.0784≈4.3635
闭塞指数:X4=0.3344+1.4593X5-0.168X6=0.3344
+1.4593×0.1765-0.168×0.0131≈0.5898
(5)语料5。
理解指数:X1=3.5921+0.8826X2-0.0179X3=3.5921
+0.8826×0.8301-0.0179×0.0654≈4.3236
闭塞指数:X4=0.3344+1.4593X5-0.168X6=0.3344
+1.4593×0.1961-0.168×0.0784≈0.6074
对照表1[2],将5段语料易读性统计如表4所示。
从统计结果看,5段语料样本的理解指数均为“易”,说明从文本角度讲,互联网体育资讯较为容易阅读。闭塞指数仅1个为“易”,2个“中等”,1个“难”,1个“极难”,出现理解指数与闭塞指数不同步的情况。从统计过程可知,闭塞指数受“难词率”的影响,作为体育类资讯,不可避免出现较多该领域的术语,从而给读者在理解方面造成一定影响。研究过程中发现,在我国互联网体育资讯报道中极少对体育专业术语作注释说明。
3 结语
经过上述研究发现,我国互联网体育资讯易读性方面存在的主要问题在于特殊词、专业术语等注释率偏低,从而给读者在阅读和理解的过程中造成了一定的障碍。据中国互联网络信息中心(CNNIC)发布的报告显示,我国网民以中等教育水平的群体为主,截至2019年6月,初中、高中/中专/技校学历的互联网用户占比分别为38.1%、23.8%,受过大学本科及以上教育的占比为9.7%。作为体育类资讯,不可避免会出现该领域的专业词汇,但在创作过程中应考虑不同类型的受众群体的接受能力,对于可能给阅读者的理解造成障碍的词汇、术语,应加以注释说明。同时,应充分利用互联网传播的独特优势,以互联网为媒,改变以往多以文字形式出现的方式,将体育资讯“图片化”“视频化”,从而更全面、直观地传达给受众。
注释:“虎扑”“新浪体育”“腾讯体育”“搜狐体育”“网易体育”的选取基于网站http://www.alexa.com的统计数据,浏览日期为2019年10月10日。
参考文献
[1] 第44次中国互联网络发展状况统计报告[R].北京:中国互联网络信息中心(CNNIC),2019.
[2] 杨孝濚.实用中文报纸可读性公式[J].新闻学究,1974(13):43-60.
[3] 虎扑.老骥伏枥!39岁岁郑智刷新国足世预赛最年长国脚[EB/OL].(2019-10-10).https://voice.hupu.com/china/2486534.html.
[4] 新浪体育.中超围攻未果反遭重手恒大0-1卓尔遭三轮[EB/OL].(2019-09-22).http://sports.sina.com.cn/china/j/2019-09-22/doc-iicezueu7645207.shtml.
[5] 腾讯体育.德国新生代上位四人迎处子秀 勒夫最大优势曝光[EB/OL].(2019-10-10).https://sports.qq.com/a/20191010/000120.htm.
[6] 搜狐體育.老米为获伍兹外卡出战总统杯继续全勤今秋忙参赛[EB/OL].(2019-10-10).http://www.sohu.com/a/345921839_114977?scm=0.0.0.0&spm=smpc.fb-sports-home.content1-n-15.5.1570705935068pmywxU.
[7] 网易体育.阿森纳宣布与威洛克续下长约 20岁天才潜力巨大[EB/OL].(2019-10-10).https://sp orts.163.com/19/0913/07/EOUIRDSK00058781.html.
[8] 国家汉语水平考试委员会办公室考试中心.汉语水平词汇与汉字等级大纲[M].北京:经济科学社,2001.