基于新闻大数据的珠海城市形象研究

2021-09-10 04:13王艺锦黄尔淮李大琳高俊晗逄昊彧
交通科技与管理 2021年19期
关键词:自然语言处理城市形象新闻

王艺锦 黄尔淮 李大琳 高俊晗 逄昊彧

摘 要:城市形象是城市的各要素作用于社会公众并使社会公众形成对某城市认知的印象总和。大众媒体是观察这种认知的有效手段,但媒体的数据量大且有效数据密度低,传统数据分析方法难以有效分析。大数据时代的到来为我们提供很多新的数据分析方法,本文以互联网新闻报道为基础,使用Scrapy框架爬取珠海市2019-2020年23 936条新闻数据,通过自然语言处理方法对数据进行分词和语义分析,进行文本信息挖掘,分析珠海城市形象。数据分析表明:(1)珠海的经济水平逐年提升,城市形象往经济型发展。(2)珠海的城市形象在往创新型城市靠拢。

关键词:珠海;城市形象;新闻;大数据;自然语言处理

1 背景

1.1 珠海简介

珠海,是中国最早设立的经济特区之一,也是全国唯一以整体城市景观入选“全国旅游胜地四十佳”的城市,大湾区重要节点城市。

1.2 城市形象的概念

城市形象是社會大众对城市的总体印象和评价,这种总体印象包括城市硬件和软件两个部分: 硬件指的是看得见的外在的城市景观等,主要靠城市本身的建筑来体现; 软件指内在的文化精神和无形资产,与城市居民这个主体有关。

塑造独特城市文化形象,充分发挥城市功能,从根本上改变目前城市建设雷同化、一般化的倾向,推动城市全面发展,创建名牌城市,是我国城市化进程中的重要课题之一。

目前主流的城市形象分析方式是通过分析GDP、地理标志、人口流动等指标来确定城市形象,这种方式更多的是从设计者的角度进行观察,而不能充分体现公众对城市形象的认知。因此,本文采取对新闻文本挖掘的方式,从大数据的角度,结合城市建设、在媒体中的曝光度,来观察珠海近年来的城市形象。

1.3 自然语言处理

自然语言处理( Natural Language Processing, NLP)以语言为对象,基于本体词典、词频统计、上下文语义分析等方式对待处理语料进行分词,从而实现利用计算机技术来分析、理解和处理自然语言。因而特别适合于对新闻文本的分析和处理。

2 基于新闻大数据的珠海城市形象分析

本部分通过网络爬虫的方式收集了2019、2020年关于珠海在主流媒体(新浪新闻、人民网、珠海网)中的相关新闻数据23 936条。使用Jieba分词工具,通过统计不同关键词出现的次数以及计算TF-IDF的关键词重要性分析,结合对比两个年份的关键词排行情况,观察在媒体中热词的变化,并与官方发布的数据进行一致性或关联性分析,从而实现珠海城市形象分析。

2.1 Top10年度热词排行

如图1所示,2019年Top10热词分别为发展、企业、澳门、建设、城市、大湾、横琴、创新、粤港澳、旅游。2020年Top10为公司、股份、发展、项目、企业、建设、交易、横琴、股东、工作。根据这些关键词可以看出珠海目前正处于一个成长中的状态。企业、公司更受关注,珠海目前展现出来的是一个以经济建设为主的城市形象。

对比珠海市统计局发布的珠海GDP数据,如表1所示。珠海的GDP增速与我国整体GDP增速基本一致。从新闻大数据中获得的结论与官方统计结论基本一致。

2.2 珠海新闻关键词变化情况

为了观察大众对珠海关注点的变化情况,我们选择了珠海的地标建筑、经济发展、建设等关键词来对比。如图2所示。

在2019年的统计排行中“发展”共出现了14 797次,排名第一。在2020年出现了7 347次,排名第三。2020年前2名的是“公司”(18 237次)和“股份”(8 071次)。说明大众对珠海发展的关注更加具体化了。

“港珠澳大桥”近年来作为珠海市的地标之一,在媒体中的曝光度很高。2019年出现的次数为4 885次,排名为第18。说明港珠澳大桥还不是大众关注的主要焦点。

此外,“横琴”这个词2019年排第7,

2020年排第8。2019年4月9日,中华人民共和国国家发展和改革委员会印发《横琴国际休闲旅游岛建设方案》并实施。横琴作为一个包含了经济、旅游、城市建设的整体概念,成为区域性城市形象发展的代表。

同样,对比官方数据,珠海房价的房价常驻人口近五年都稳步增长,说明珠海的整体经济发展平稳,“港珠澳大桥”、“横琴”开发区等现象级热点对珠海经济的整体发展起到一定的助力作用。

3 结论

本文通过对关键词进行词频统计分析对新闻大数据进行文本挖掘,为自然语言处理在新闻传播领域的应用做出一些探索。从新闻大数据中挖掘出的客观信息,与许多实际情况相符,这也间接肯定了本方法的有效性。就本文的研究发现而言,能够丰富城市形象相关理论研究,从大数据的角度作为一个观察者去研究城市形象,加快城市建设的步伐。

由前文的分析观察可知,珠海属于经济发展协同创新型的城市。对比近年来珠海市国民经济,无论是从民生、人口、经济都与我们通过媒体新闻数据反映出的结果相一致。

参考文献:

[1]王莉.我国城市形象管理研究述评[J].城市发展研究,2012(7):145-147.

[2]黄合水,彭丽霞.基于新闻大数据的中国城市时尚形象研究[J].厦门大学学报,2019(4):131-140.

[3]冯丙奇.城市媒体事件与城市形象传播——媒体关系视野下的节事活动分析[J].现代传播,2012,34(7):18-21.

[4]黄合水,彭丽霞.全国各省市的媒体镜像——基于网络新闻大数据[M].厦门:厦门大学出版社,2018:165.

[5]陈映.城市形象的媒体建构——概念分析与理论框架[J].新闻界,2009(5):103-104.

猜你喜欢
自然语言处理城市形象新闻
新媒体传播下地铁广告中的城市形象建构
蒙古族传统纹样对地域城市形象塑造的意义
微电影中城市形象的植入与传播策略研究
微电影中城市形象的植入与传播策略研究
基于组合分类算法的源代码注释质量评估方法
“互联网+”时代新闻采访教学的困境与出路
新闻版权合理使用制度的反思与重构
解构口语化新闻的语言特征
面向机器人导航的汉语路径自然语言组块分析方法研究
汉哈机器翻译中的文字转换技术研究