吴新丽 高金 赵立永
摘 要:当下,数据已经成为数字经济时代的关键生产要素,大数据技术的发展,对新闻生产和传播产生了巨大影响。本文通过介绍新华网在2020年两会期间利用新华睿思大数据策划并创作的一系列数据立意、形式新颖的新聞产品, 探讨大数据对新闻生产尤其是重大主题报道中的创新赋能问题,对大数据时代下,媒体如何利用大数据和人工智能技术进行创意策划、生产和传播具有重要指导意义。
关键词:新华睿思;大数据;人工智能;重大报道;智慧媒体
中图分类号:G237 文献标识码:A
本文著录格式:吴新丽,高金,赵立永.新华睿思大数据赋能重大主题报道创新——以2020年全国两会为例[J].中国传媒科技,2020(6):19-23.
当前,传媒行业的数字化转型正在快速推进,大数据、人工智能、AR、VR等技术助推传媒行业在重构新闻理念、改变盈利模式、提升传播效果等方面发生着近乎颠覆性的变化。今年,在特殊的疫情环境下,新华网通过新华睿思大数据技术“智能芯”赋能全国两会报道,推出了一批业内独创、媒体首发、数据立意、形式新锐的大数据创意产品,持续探索主流媒体在重大主题报道方面的创新表达。
1.以科技的姿态看两会,大数据“势不可挡”
借势科技、拥抱科技、融合科技,主流媒体面对迭新的互联网技术,如何守正出新、科技扬帆?
1.1科技赋能让重大主题报道“生动”起来
重大主题报道是媒体履行职责使命的重要出口,也是“互联网+”时代下考验新闻机构融合发展能力的主要场景。面对当前不断革新的传播技术与不断变化的媒体格局,如何提高新闻舆论的传播力、引导力、影响力、公信力,在重大主题报道中发出具有媒体特色、国家意志的时代强音,是新闻媒体不断努力的方向。
以今年全国两会为例,在今年疫情防控常态化的特殊背景下,全国两会的媒体报道任务在时间和空间上与往年有很大不同,也正是因为这种“不同”进一步催化主流媒体尝试探索更多的创新表达方式和路径。两会期间,大数据实时热点追踪、AI智能交互式报道、AR增强现实报道、“5G+全息+访谈”等硬核“黑科技”报道模式融入会议议程,给观众带来全新的“沉浸式”“互动式”的新闻体验。
1.2大数据思维成就重大主题报道“新思路”
科技之力所带来的不仅仅是令人眼花缭乱的技术革新,更重要的是全新的视野和思路。新华网以自身的新华睿思大数据技术“智能芯”为源动力,在尝试融媒报道和数据新闻方面走出了“智能视野”和“数据社交”的坚定步伐。目光所不及之处,记忆所不能之处,思维所不够之处,声音所不达之处,即为大数据。尤其在国家大数据战略实施与数字中国建设的政策背景下,大数据技术在新闻行业中呈现出“势不可挡”的发展态势。
从传媒的角度来看,一方面,大数据以数据价值赋予了新闻更为深层次的内容价值,其在趋势、预判、规律等方面的“运算”为重大主题报道带来了全新的看点和解读;另一方面,在媒介融合上,大数据既可以成为融媒内容生产的“工厂”,又可以成为整合数据资源、打破媒体壁垒的数据中台。从这个意义上讲,大数据技术以及其影响下的大数据思维为当下新闻事业带来了无可比拟的核心竞争力。
2.新华睿思“智能芯”赋能两会报道
新华睿思“智能芯”立足于“新基建”的数据中心、人工智能等核心领域,专注于神经网络学习、数据挖掘、计算机视觉等AI技术前沿,持续钻研技术创新和算法优化,技术路线从数据中台向AI中台演进,储备的各项数据挖掘算法和模型近百项。在今年两会期间,新华睿思大数据为《两会调查》《AI热力榜》《睿思有画说》《小睿看会》《大数记》等新华网特色报道产品和栏目提供了强大的技术和分析支撑,以下是在这些特色报道产品中应用到的新华睿思大数据的部分分析技术。
2.1热点话题挖掘
热点话题挖掘引擎在Kmeans++模型基础上,通过优化全局动态最优K值选择策略,提升聚类质心选择的效率,采用6-sigma标准差去噪,降低了极小簇对聚类过程及结果的影响。同时,结合大数据处理技术,利用物理学中的冷却定律原理,在单篇文本热点计算基础上,构建了基于加权对数变换的话题(簇)的热度评估模型,实现了大规模数据集上的热点话题快速发展和提取。[1]
2.2增量式事件演化分析
增量式事件演化分析引擎采用增量式话题检测和跟踪技术,结合时间窗算法、语义分析和统计分析等方法,构建文本智能特征选择和具有自学习能力的话题模型,实现动态话题检测和跟踪,解决话题演变过程中的质心漂移问题。该技术能够从海量数据中萃取出话题相关报道的演化发展态势,并结合排序、合并等数据处理机制,实现对持续性信息流的热点检测、追踪及分析。[2]
2.3信息时空传播分析
信息时空传播分析引擎结合大数据、语义分析技术,通过分析信息之间的语义相似度、信息之间的转发关系、连接关系及引用关系,抽取信息在时间、空间上的传播特征,建立信息时空传播分析模型,发现信息在时间、空间上的传播路径,实时构建信息传播的拓扑结构,结合复杂网络挖掘技术,实现信息传播关键路径识别、关键节点识别、及不同信息传播速度及广度的比较分析,发现信息在时间、空间中的传播规律,及有效阻断信息在时间、空间中传播的方法和策略。[3]
2.4网民情绪深度感知
网民情绪深度感知计算引擎以深度挖掘、人工智能技术为基础,并结合自然语言处理的语义分析技术,通过分析网友评论、情绪词和表情符号的潜在语义关联,以TensorFlow的Keras深度學习框架为基础,通过改进双向长短期记忆层、注意力机制等神经网络模型,构建基于表情符号的网民情绪感知模型,实现从海量的互联网评论数据中提取网民情绪特征,并从语义层面解析网民行为承载的情绪,实现网民情绪智能研判。[4]
3.新华睿思推出大数据“产品包”,科技之力加持两会报道
两会期间,新华睿思推出大数据“产品包”,打造了一批业内独创、媒体首发、数据立意、形式新锐的大数据新闻产品,体现了大数据新闻产品的强大“吸睛力”和“生命力”。
3.1《睿思有画说》——情景联想、数据记忆,打造最具特色的两会“画卷”
《睿思有画说》是基于新华睿思“WESTEG”多元(闭环)大数据分析模型,独家打造的“大数据+沉浸式长图”的H5样态产品,有效地体现了大数据赋能新闻报道中所激发出的独特的艺术魅力和科学精神。
数据景深、沉浸体验,丰富报道形态的表现力。《睿思有画说》融合了各地的人文地理景观和标志性建筑,通过“一镜到底”场景实时展现各地的热力值和重点话题,用情景联想和数据记忆强化了数据的表现力,打破了数据传播过程中“碎片化”困局,打造了画中有景,画中有“话”的报道形态。产品上线不到一日,在新华网客户端的访问量快速突破千万,用户平均访问时高达3分26秒。产品形态创新吸睛,内容吸引力凸显。
数据细分、精准匹配,提升内容选择的智能化。海量信息的匹配和筛选是大数据技术在新闻领域的重要作用,《睿思有画说》成功将这一能力进一步深化,借助新华睿思大数据时空传播分析技术优势,实现时间维度和地理维度上的双重突破。新华睿思通过将全国两会千万级信息进行数据细分、精准匹配,最终在《睿思有画说》产品中实现了智能化选题命中、标准化热度计算和持续性数据更新。一“卷”在手,全国各地的两会热点尽收囊中。
3.2《小睿看会》——数据深探、多样呈现,激发传播新动能
《小睿看会》系列立足新华睿思大数据产品家族中的数媒智慧分析平台,是在“智慧媒体”概念上的应用延伸。通过大数据“智能选题”技术评估两会话题热度,以新华睿思卡通形象“小睿”的数字化视角,先后针对政协开幕、政府工作报告、民法典草案等展开“RIS·读网全媒信息追踪体系”下的数字化报道,创新展示了两会新气象、传递了中国好声音。《小睿看会》以政治意识领路、以技术手臂掘金,深探数字规律下的社会情感、人民情义,激发了传播新动能,累计发刊七期,仅在自有平台新华网客户端总阅读量超1000万。
3.3《大数记》——两会时间轴上的数据“流动”涓涓入人心
《大数记》是新华睿思首次将数据与新闻产品“无缝对接”的新尝试,产品充分利用数据的敏感性、真实性和精准度,以时间轴的形式实时展示两会期间热门话题的更替,以数据的持续看传播趋势、以数据的跳跃看传播规律。《大数记》贯彻两会全程,动态滚动式呈现时事热点和数据演化,数据的流动性在产品中显露无疑,成为网民观会“指南”,完美展现了新闻严谨和数据美学的结合。
3.4《2020两会调查》《AI热力榜》——数据社交、智能互动,打造数字时代社交新生态
数据来源于生活,重大主题报道中的数据更是来源于社情民心,借助大数据技术,主流媒体认真打造数字化时代社交新生态。新华睿思《2020两会调查》《AI热力榜》两款产品即是立足于此,以数据打通民生、民心通道,读懂读透老百姓的心里话,帮助老百姓读懂读透政府想说的话。
两会召开前夕,《2020两会调查》栏目的筹备工作已然展开,利用新华睿思数据云图分析平台独有的网络热点挖掘技术及情绪感知模型,通过对2019两会后截至2020两会召开前的一年多海量数据进行数据挖掘和分析,筛选出网民最关心的20个大项100多个热点话题(涵盖国际、社会、经济、民生等多个领域),读懂读透老百姓的心里话,数据共鸣与数据共情效应大大增加了产品的互动属性。
此外,新华睿思还针对发布的新闻数据,依据网络数据的传播特性及不同信源的传播特点,构建了独有的“AI热度计算模型”,跨信源多维度分析出话题时空传播热度,打造了两会调查期间的AI热力榜。产品巧妙设计AI热力榜机器人(小AI)浮动于新华网两会报道专题页面,方便用户时时点击,其智能语音播报功能彰显了两会报道的服务属性,帮助老百姓读懂读透政府想说的话。
4.重大主题报道中大数据智能应用的启示
大数据智能应用对于新闻报道以及重大主题报道来讲,是时代赋予传媒行业的新机遇和新标签,重塑流程、重塑机制、重塑内容、重塑格局……大数据的新闻潜力不断被激发,媒体的数据潜能也不断被挖掘。这种双向的“成全”和“推动”对新闻从业人员提出了更高的要求,也带给我们一些启示。
4.1新技术与新创意将是重大主题宣传报道的新常态
未来,新技术仍将在快速迭代中对重大主题的宣传报道产生重要影响。比如,5G技术作为基础通信技术,将提供更宽的带宽、更快的网速、更好的体验,如全程感知、全员参与及全息采集。它与4K、AI、VR、AR等高新技术的联动融合,将为新闻内容的生产、分发、呈现等带来新的变化和体验。与区块链技术的结合不仅将从根本上改变新闻的生产机制和传播机制,还将给假新闻、谣言等网络乱象找到更好的解决办法。
4.2数据的挖掘处理加工能力将成为媒体的核心竞争力
“5G时代,媒体不再是直接生产内容的主体,而是进行创新数据的挖掘处理,进而创新媒体产品生产模式的引导者。”[5] 数据的挖掘处理能力将是今后媒体的竞争力所在。新华睿思强有力的信息存储平台、更智能的信息识别和采集系统、更人性化的可视化技术,都将为新华网的报道创新不断提供强力支持。机器人写作、传感器新闻等模式也将被更广泛地应用。而在技术不断发展的过程中,还需探索如何用主流价值导向驾驭数据和算法,打造包括重大主题宣传报道在内的爆款产品,从而全面提高舆论引导能力。