基于文献计量的我国共享单车热点研究①

2018-09-10 23:42杨柳李铭鑫
中国商论 2018年17期
关键词:共词分析文献计量共享单车

杨柳 李铭鑫

摘 要:运用文献计量的方法,基于CNKI中国重要报纸全文数据库的检索,将2017年有关共享单车的新闻报道作为研究对象。从新闻报道数量、报道来源、作者分布、主题分布、高频关键词以及报道情感态度几个方面进行分析,可以发现2017年共享单车新闻报道数量有所下降,部分报社对行业发展有较为持续性的追踪报道。并通过聚类分析得出了共享单车新闻报道主要聚焦于4个热点话题:交通安全、用户行为缺乏约束、企业粗放式经营以及行业的发展对策,这为共享单车在下半场精细化运营发展提供了参考思路。

关键词:共享单车 新闻报道 文献计量 共词分析

中图分类号:F724.6 文献标识码:A 文章编号:2096-0298(2018)06(b)-161-05

1 研究背景与意义

2017年是共享单车飞速发展的一年,一方面各种各样的单车挤满了城市街头,满足了用户可随时骑行的要求;另一方面,由此引发的城市治理问题愈演愈烈,共享单车引起了社会各界人士的广泛关注,早已成为民生热点话题。

2017年中,新闻界对共享单车的关注达到了井喷状态。在CNKI中国重要报纸全文数据库中以“共享单车”为主题进行检索,仅2017年发文数就有1980篇。这些新闻报道的主题分布广泛,能够客观地反映出行业内的热点问题。本文基于文献计量分析和共词分析的方法,对与共享单车有关的新闻报道进行统计分析,从而揭示出当前共享单车行业的客观现状,为共享单车在下半场中精细化运营发展提供了参考。

2 数据来源与研究方法

2.1 数据来源与处理

本文选择CNKI中国重要报纸全文数据库作为数据来源,在高级检索中,以“共享单车”为主题词进行文献检索,选取了2017年1月1日—2017年12月31的新闻报道进行研究。

为了能够更好地分析共享单车新闻报道的主题分布,热点关键词以及情感态度,在这三部分中,本文运用了构造周抽样方法。有关的研究成果表明,在对报纸进行内容分析时,一年抽取2个构造周的样本便能可靠地反映总体[1]。具体抽样方法如下:在2017年上下半年中各抽取一周作为样本,考虑到报纸内容以星期为单位周期性变化,将总体按时间分段,在不同时间段里抽样。以上半年为例,在6个月的26周里,将前2周分给星期日,将后24周均分给星期一至星期六。随机抽取了(1月8日)为星期日样本,随后每4个星期随机依次抽取星期一至星期六的样本,构成一周。最后选取了1月8日(星期日)、2月6日(星期一)、2月28日(星期二)、3月22日(星期三)、4月13日(星期四)、5月19日(星期五)、6月24日(星期六)为一个构造周。下半年也是26周,将前两周分给星期日做同样的处理,依例取7月2日(星期日)、7月31日(星期一)、8月22日(星期二)、9月13日(星期三)、10月12日(星期四)、11月3日(星期五)、12月9日(星期六)为第二个构造周。通过抽样一共得到了71篇新闻报道,经过内容筛选,去掉与研究主题不相干的内容,最终得到用于研究新闻报道内容特征的数据样本61篇。

2.2 研究方法

文献计量分析法。文献计量分析法采用数理统计学方法来定量描述、评价和预测学术现状与发展趋势[2],本文将从新闻报道数量、报道来源、作者分布、高频关键词、主题分布、情感态度几个方面客观反映我国共享单车行业的热点问题。

共词分析和聚类分析法。共词分析法利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密[3]。本文将利用 Excel 软件构建高频关键词的共词矩阵,分析发现高频关键词之间存在的亲疏关系,并通过计算Pearson系数将共词矩阵转化为相异矩阵,便于后续开展聚类分析。本文利用SPSS22软件通过系统聚类的方式将高频关键词相异矩阵进行聚类,得到不同主题词团,从而分析出共享单车新闻报道所关注的热点问题。

3 研究结果与分析

3.1 新闻报道数量统计

新闻报道的数量能够反映出新闻舆论对于共享单车的关注程度,报道数量随着时间的变化亦能反映出公众对共享单车关注度的变化情况,因此本研究对2017年1月1日—2017年12月31日的新闻数量按月进行了统计,如图1所示。

从图1中可以看出,近一年来各月有关共享单车的新闻报道数量整体呈现出先上升后下降的趋势,2017年3月~8月期间报道数量较多,3月和8月新闻报道数量达到了最高峰,而8月之后报道数量呈现出明显的下降趋势。

出现上述情况的原因可能与我国共享单车近一年的发展进程有较大的关联。虽然共享单车的概念由来已久,但在2016年共享单车才开始正式进入公众的视野。2016年9月—2017年8月的一年中,共有包括小鸣、小蓝、悟空、酷骑等超过70家共享单车企业入局,投放车辆超过1600万辆。大量资本涌入共享单车市场,该项目受到了资本的疯狂追捧,我国共享单车行业发展势头迅猛。与此同时,共享单车的野蛮生长、管理失位也致使一系列的城市治理和行业管理问题产生,这引起了企业、政府、学者以及普通民众对该问题的高度关注,“精细化”“智能化”运营的呼声越来越高。因此8月以前有关共享单车的新闻报道数量较多,这与共享单车上半场经营火拼、资本大战的局面不无关系,紛繁变幻的经营局势使得众多媒体聚焦于该领域。而2017年8月之后,相关新闻报道数量呈几何倍数下降,这与共享单车行业发展进入下半场“精细化”“智能化”运营阶段有关,在下半年中资本市场也逐渐冷静下来,行业火爆局面难以重现,因而媒体报道数量也相应地有所回落,社会各界更加客观冷静地看待共享单车的发展问题。

3.2 新闻报道来源统计

从相关新闻报道的来源分布统计情况来看,2017年的全部新闻报道分布在了251种报纸当中。其中,《北京商报》发布的有关共享单车的文章数量要远远超出其他报纸,一共发布了68篇报道,占全部新闻报道数量的5.89%。除《北京商报》外,《南方日报》、《北京日报》《深圳特区报》等国内知名媒体发布的共享单车报道都在40篇以上。发布相关文章数量在30篇以上的报纸共有13种,共计533篇,约占全部文章的27%,如表1所示。这说明了近一年来共享单车的发展受到了重要新闻舆论的关注,反映出共享单车已经成为社会民生的热点话题,与人民的生活息息相关,更加凸显了解决共享单车发展过程中的城市治理问题和行业管理问题的必要性、紧迫性。

3.3 作者分布研究

在2017年全部1980条与共享单车有关的新闻报道中,一共有1268位第一作者,另有22篇报道未注明作者信息。按第一作者统计,发布文章数量最多的是来自《北京商报》的记者魏蔚,一共发表了20篇报道,他所撰写的文章主要集中在2017年6月之后发布,平均每月都有两篇报道被刊登在报纸中,反映出了该记者对共享单车行业连续性的追踪,对整个行业都有比较深入的了解认识。在这些作者中,发布文章数量在5篇以上的共有10人,共计新闻92篇,在全部报道中仅占4.64%,同时有945名作者只发布了一篇新闻报道,由此可见,大部分的新闻工作者对共享单车的发展变化缺乏动态认识,报道缺乏连续性和深入性,关注点仅仅是集中在某个时间点上,不便于公众对共享单车的发展情况有完整的了解,在一定程度上会影响到发展困境的破解。值得一提的是发布文章数量5篇以上的作者中有6名都是来自于《北京商报》,这也与上文中对新闻报道来源的统计分析结果相一致,充分反映出了《北京商报》对共享单车发展的高度持续关注,如表2所示。

3.4 主题分布

与共享单车有关的报道内容比较繁杂,为了更加有条理、清晰地展示其内容特征,本文对样本抽取61篇报道的内容进行了主题划分,将文章大致划分为行业发展现状,应对措施和方案,行业未来发展前景,商业模式和盈利模式,市场竞争这5个主题。对样本所选取的61篇报道按上述分类办法分类统计后得到表3的数据。

从表3数据可以看出,在61篇新闻报道中有46篇是有关共享单车行业发展现状的,占样本数量的75%,其中有40篇报道主要谈及共享单车发展过程中存在的种种问题,并给出针对性的建议。这也反映出在进入2017年后,共享单车的野蛮生长给城市治理带来了更为严峻的考验,这违背了共享单车改善城市交通,打造慢行系统,为公众提供便利的初衷,反而制造了新的管理难题。同时还有8篇报道从不同的视角设计了应对共享单车发展问题的措施方案,2篇有关行业未来发展前景的文章则主要聚焦于我国共享单车企业未来的国际化道路。除此之外,作为新生事物,共享单车的商业模式和盈利模式以及企业之间的竞争关系也引起了媒体工作者的注意。总体而言,媒体对共享单车的新闻报道主题比较广泛而全面,各主体基本都有涉及,报道分类统计数量直观的反映出了共享单车行业发展不容乐观,存在着一系列亟待解决的问题。

3.5 关键词分析

3.5.1 构建共词矩阵

由于CNKI中国重要报纸全文数据库下载题录中机器标引的关键词不完全准确,同时网络中许多现成的词频统计软件在进行词频统计时,需要先给出特征词库,再对词库中给出的词进行词频统计,这样就带有一定的主观色彩,人为设定了被关注的对象,不具有普适性[4],因而本研究对抽样样本中的每一篇新闻报道进行研读,人工提取出与报道主题相关的关键词。同时本研究为了集中体现主题,把某些意义相同或相近的关键词进行了替换,如“人为破坏”统一替换为“蓄意破坏”,“公共秩序”和“交通秩序”均用“秩序”代替。把关键词中意义相同或相近的词语进行合并去重后,共提取出了203个关键词,为便于研究,本文只选取了词频≥3的高频关键词52个如表4所示。

分别统计这52个关键词在61篇新闻报道中共同出现的次数,可以得到一个52×52的高频关键词共现关系矩阵Zij,其中Zij表示关键词i与关键词j共同出现的次数,主对角线上的元素表示每个关键词的词频,如表5所示。

将高频关键词共现矩阵Zij导入社会网络分析软件Ucinet中(将主对角线上的元素全部替换为0),然后通过Ucinet的绘图软件工具Netdraw直接展现原始共词矩阵中关键词之间的共现关系(如图2所示)。该网络图将原本孤立的新闻报道关键词以网络形式综合为一个整体,刻画了样本文章中各关键词的分布情况,可视化地展示了共享单车新闻报道的核心词团与边缘词团。

结合高频关键词表,可以看出“乱停乱放”“挤占道路”“押金难退”的频次都在15次以上,属于共享单车报道所关注的焦点问题。其中“乱停乱放”出现的频次最高,一共出现了29次,在接近半数的样本中都被反复提及,这是共享单车发展过程中急需解决的问题。在关键词共现网络图中,与共享单车发展困境有关的关键词都位于核心词团,“乱停乱放”与“挤占道路”共现次数最多,达到了13次,其次是“乱停乱放”与“押金难退”“蓄意破坏”等词共现较多,均达到了8次以上。关键词频数可以直观反映出共享单车作为新生事物,在满足城市生活“最后一公里”需求,带来一定程度环境保护效益的同时,也存在着诸多的问题,规范停放与随骑随停之间的矛盾,城市道路基础设施不完善与单车扩张速度过快的矛盾,盗损率过高与押金征收之间的矛盾,监管主體不明与城市空间治理的矛盾……这些问题尖锐而复杂,不能简单依靠技术手段支持或是法律法规进行约束,单车乱停乱放、人为损坏、非法私占的背后是社会诚信体系的不健全和公众信用的缺失。在表4中,“信用”“信用分”“诚信”“信用体系”“征信平台”这些关键词都出现了5次以上,社会信用体系的建立已经受到了众多新闻媒体的关注,破解共享单车乱局还需信用机制约束。

3.5.2 构造相异矩阵

考虑到关键词频次不同对聚类分析结果造成的不利影响,本文通过计算Pearson相关系数,将共词矩阵转换成为相似矩阵,其计算公式为:

在前文构建共词网络图谱时,已经对共词矩阵进行了适当处理,将主对角线上的元素全部替换为0。共词矩阵中对角线上元素不为零表示在包含52个高频关键词的所有新闻报道中只含有该关键词的文章数量,人为的将其修改为0不会影响最终的聚类分析结果。

在得到消除共词词频差异的相似矩阵后,需要对矩阵中出现的负相关关系进行处理,对于大于0的数据用1减去,小于0的数据用1减去它的绝对值(ABS函数),这样最终得到一个相异矩阵。

3.5.3 系统聚类结果分析

经过转换的相异矩阵作为聚类分析的数据源。聚类分析采用系统聚,选择离差平和和欧式距离平方法。选择系统聚类是因为它能够生成比较规整的类集合,聚类结果不依赖文档的初始排列或输入次序,与聚类过程的先后次序无关,聚类结果比较稳定,不易导致类的重构[5]。得到系统聚类树状图得出聚类结果,在分类阈值大约为5的位置划分阈团,可以得到4个词团,每个词团如表6所示。

为了更加直观和形象地反映聚类的结果,本文将相异矩阵导入SPSS中绘制MDS散点图。得到高频关键词MDS散点图,如图3所示。

3.5.4 词团内容分析

词团(1):共享单车交通安全问题。

该词团由“秩序”“毁损”“行业标准”“安全隐患”“交通事故”“征信体系”“烧钱”“核心技术”8个关键词组成。自2017年5月首起共享单车意外事故赔偿案发生以来,媒体对共享单车的交通安全问题都给予了高度的关注。从新闻报道中,可以得知共享单车存在着不少安全隐患,交通安全事故主要由四个方面原因所致:第一,共享单车产品质量存在问题,不符合行业标准,核心技术不过关;第二,车辆毁损故障未能得到及时维修;第三,用户使用不当,不遵守交通秩序;第四,骑行人不满足骑行条件(如:未成年人使用共享单车),事故发生原因是责任方认定和维权赔偿过程中的关键点。

词团(2):共享单车行业发展对策。

词团(2)包括“电子围栏”“爆发式增长”“交通负担”“乱停乱放”“征信平台”“违章处罚”“免押金”“商业模式”“盈利模式”“无桩停车”“信用体系”“监督”12个关键词,该词团主要是针对共享单车存在的问题给出的对策建议。单车乱停乱放是共享单车行业面临的最为严峻的挑战,爆发式的增长加重了城市交通负担,这需要企业和政府协同共治。对于企业而言,在技术方面要不断开拓创新,以技术手段破解单车乱局,全面推广电子围栏技术;在商业运营模式方面,单车企业要积极与征信平台合作,打破以征收押金来解决信任问题的模式,推行信用免押,对违法失信者进行信用惩戒,对诚实守信用户进行免押激励。除此之外,政府要加强监督,对违章违法行为严厉处罚,提高失信成本,积极在全社会范围内建设信用体系。

词团(3):用户行为缺乏约束。

词团(3)由“智能化”“文明素质”“投诉”“诚信”“处罚”“蓄意破坏”“私占单车”“公共素质”“管理方案”“盗损”“公共服务管理”11个关键词组成。在样本新闻报道中,有相当多的媒体都重点报道了共享单车的偷盗,蓄意破坏,非法私占问题,这是用户行为缺乏约束的体现。一方面,这反映出社会诚信的缺失,公众文化素质水平有待进一步提升;另一方面,也反映出政府和企业对用户行为缺乏强有力的监管,管理方案尚不完善,必须要加大处罚力度,同时企业要辅之以智能化的技术手段。

词团(4):共享单车企业粗放式经营。

词团(4)包含了“大数据”“饱和”“低碳”“精细化运营”“暂停投放”“野蛮生长”“僵尸车”“抢占市场”“押金难退”“信用”“监管”“挤占道路”“随骑随停”“收缴”“黑名单”“无序投放”“信用分”“规范化”“规范停车”“盲目扩张”20个关键词,该词团中的关键词主要描述的是共享单车企业粗放式经营的问题。由于共享单车行业入门门槛低,所以行业中聚集了大量的竞争者,企业为抢占市场份额,盲目扩张规模,无序投放单车,只是一味地注重投放量,而忽视了企业经营管理的质量。面对共享单车野蛮生长的局面,政府无疑要加强监管力度,将共享单车接入信用体系;单车企业在下半场经营中应该放缓投放速度,转而运用精细化运营模式,规范化的经营企业,完善并积极推行信用分制度,与政府共建信息互通的“黑名单”机制。

3.6 报道态度分析

新闻报道的态度有正面、负面和中立之分,但一般不会明确的表达支持或反对的态度,只是在行文之中,或是某些话语的引用中,给读者一定的倾向性[6]。

因此,本文通过对全部61篇新闻报道样本进行研读,统计得出中立报道共有54篇,另有7篇报道表达出了明确的积极态度,样本之中并未有媒体表明消极立场。由此可见,虽然共享单车的发展道路并非一帆风顺,各方面都存在着不少问题,但公众并未完全否定这一新生事物的发展,更多的媒体都持谨慎观望态度,客观地反映共享单车的发展现状。

4 结语

本文以CNKI中国重要报纸全文数据庫中2017年有关于共享单车的新闻报道作为数据来源,对其进行构造周抽样,抽取出61篇新闻报道作为研究对象。通过采用文献计量方法对新闻报道进行分析,可以看出在最近一年来,媒体行业对共享单车有极高的关注度,诸如《北京商报》《南方日报》等报社都有持续性地追踪报道。在内容上,这些报道主要聚焦于共享单车行业发展存在的问题及相应对策方案,反映了共享单车的发展困境绝非是普通的技术问题或城市管理问题,更不能简单地将单车乱停乱放、偷窃损坏问题归因于公民本身素质不高。从根本上看,共享单车的发展是一个复杂的社会技术问题,受到经济、技术、组织和社会-文化等多重因素的影响和制约。

参考文献

[1] 任学宾.信息传播中内容分析的三种抽样方法[J].图书情报知识,1999(3).

[2] 邱均平,王曰芬.文献计量内容分析法[M].国家图书馆出版社, 2008.

[3] 钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008(5).

[4] 李艳红,梁毓琪,郝晓玲.上海自贸区国内外关注力分布研究——基于新闻报道和期刊文献的视角[J].中国管理科学, 2014,22(S1).

[5] 钟伟金,李佳,杨兴菊.共词分析法研究(三)[J].情报杂志, 2008(7).

[6] 余丰民.中国民办高等教育新闻报道计量研究[J].高教发展与评估,2014,30(1).

①基金项目:广东省大学生创新创业训练计划项目资金支持(1055917096)。

猜你喜欢
共词分析文献计量共享单车
我国医学数字图书馆研究的文献计量分析
国内外智库研究态势知识图谱对比分析
基于德温特数据库的关键共性技术分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
“共享单车”是一门好生意吗
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析