大数据看两会
——百分点数据新闻的探索

2017-05-12 03:30陈旭管编辑整理
中国传媒科技 2017年3期
关键词:中国日报新华社新闻报道

本刊记者|陈旭管 编辑整理

大数据看两会
——百分点数据新闻的探索

本刊记者|陈旭管 编辑整理

编者按:今年“两会”期间,民生、互联网、文化、创业、环保、人工智能等热门议题广受关注。两会新闻滚动刷屏,哪个话题被提及最多?如何从中读懂中国未来?大数据有奇招!

数据新闻报道分为四个环节:对原始数据的收集,对数据的分析和过滤,将数据可视化,形成具体的新闻报道。在数据收集方面,百分点通过舆情系统,全面覆盖网媒,及时抓取信息,准确分析语义,配合舆情分析模块,深度理解群众对热点的讨论态度。其中网络舆情数据抓取方法如下:

监测方法:相关的新闻、论坛、贴吧、微博、微信历史数据在限定的时间段内进行爬取;通过文本分词、数据预处理,利用tfidf模型计算每个词语的权重,形成词语的热度;对相关信息进行聚类或分类并判断其正面、中性或负面情感。

监测周期:过去半年。

统计指标:声量(关注度)、话题热度、话题情感等。

最后形成数据可视化报告,分析两会热词和群众讨论的声量走向。

从2016年起,百分点公司支撑新华社有关部门关于“两会”大数据新闻报道的需求,依托百分点公司的舆情系统和文本分析系统,为新华社有关部门提供稳定、可靠的大数据技术支撑,开展“大数据看两会”系列专题建设。系列报道及可视化产品在新华社“两微一端”平台落地。

在2017年新华社与百分点合作的“大数据看两会”新闻报道中,主要盘点了2014至2017年两会热点话题,并针对以下维度做了分析:

①历年两会期间的话题关注榜; ②历年男性、女性、不同年龄、不同职业群体的关注点,以及所属地域划分;③历年两会期间点赞(浏览)数最多的报道,被哪些群体热议?

2017年两会,百分点公司还与人民日报中央厨房、中国日报等媒体合作推出专题。

百分点舆情系统监测于2017年3月1日至9日对新华网、人民网、网易、新浪网、今日头条、搜狐网、新浪微博等全网数据,进行分析解读,通过解读发现如下舆情趋势:

①发展是根本,也是两会最重要的话题。

②北京新浪微博用户讨论两会的参与度再创新高,达24.1%,较2016年上升约12%。广东、上海、山东、江苏仍是两会讨论的活跃地区。

③分析各地区人群对两会热点关注的差异。

党和国家领导人参加团组审议和讨论的情况,是外界重点关注的话题。在与中国日报合作的两会专题中,百分点公司首先根据相关议题关键字进行数据收集,其次通过运用模型算法,文本分析系统识别非结构化文本,还针对领导人参加团组会议的舆情进行情感分析,话题和口碑检测等业务。

百分点公司与人民日报社、新华社、中国日报等央媒的合作主要包括两会前收集数据,预测热点话题,到通过舆情系统、模型算法、文本分析系统支撑两会专题报道。从这些合作中可以看出数据新闻已经成为媒体行业的迫切需求,也是媒体转型发展的趋势。对媒体机构而言,大数据技术已经渗透到新闻报道的各个环节,包括:挖掘新闻热点;追踪事件提升新闻报道质量;利用数据可视化表达创新新闻报道形态;实施精准用户画像;量化建立媒体平台的传播力指标并评估传播效果;利用分布式计算、机器学习等多种手段,分析用户使用特点和规律等等。

猜你喜欢
中国日报新华社新闻报道
漫画
“她时代”新闻报道中的“时代精神”呈现
论新闻报道中的流行语
党的十九届四中全会公报
浅析如何在新闻报道中彰显以人为本
应用“8K+5G”技术创新国庆阅兵报道——新华社的实践与思考
新媒体不当新闻报道的影响
《中国日报》:中国成第一大“电子竞技”市场
《中国日报》欧洲版荣获英国“最佳国际报纸奖”