关于新闻视频主题识别与跟踪的研究

2016-12-13 08:09:11关莉莉
山西青年 2016年23期
关键词:新闻节目新闻报道聚类

关莉莉

吉林电视台,吉林 长春 130021



关于新闻视频主题识别与跟踪的研究

关莉莉

吉林电视台,吉林 长春 130021

伴随着通信技术和多媒体的飞速发展,人们能够用于表达、传递和存储信息的手段也越来越多,与此同时人们每天需要接触的信息数量也正呈爆炸式增长,因此在新闻领域当中研究关于自动识别、分析以及检测追踪新闻视频的方式方法具有极其重要的现实意义。本文将以此为基础,简要探究关于新闻视频主题的识别与跟踪。

新闻视频主题;识别;跟踪

通常情况下,一套完整的新闻节目是由若干个新闻单元组合而成,因此人们在分析新闻视频内容之前,首先需要做的就是按照新闻数据之间的关联程度,将完成的新闻节目还原成若干新闻单元的初始形式;之后将新闻视频新闻报道基于语义特征进行切分。而本文则主要探究的是以自然语言和文本形式为主的新闻视频报道,并在此基础上着重围绕新闻视频主题的识别与跟踪进行简要分析论述。

一、主题识别与跟踪的简要概述

美国国防高级研究计划署最早提出了识别和跟踪主题这一概念,也就是说彻底抛弃传统的人工干预操作,完全使用自动化模式用于对新闻数据流及其主题进行合理判断[1]。最初识别和跟踪主题的目的主要适用于寻找主体之间的一致性,利用系统对两件事之间的界进行自动判断,故而区分出出现的新事件以及再现的旧事件。后期随着科学技术的不断发展进步,识别和跟踪主题也得到了深入细化,被分为了如表1所示的五个任务。

表1 识别和跟踪主题的五大任务

二、切分新闻报道

所谓切分新闻报道具体来说就是指将从同一个信息源当中获得的语言信息流分割成为若干个不同的新闻报道。由于新闻专线当中的文本信息流,从本质上来说就是呈现出单个报道形式,因此只有在处理来自广播、电视等传统媒体音频数据的过程当中才会涉及切分新闻报道[2]。通常情况下,若干条不同的新闻报道组合在一起构成一段完整的新闻节目,但是通过观察可知,几乎没有任何新闻节目会用分隔标记用以区分不同的报道。好比说人们常常能够在某一篇报道当中发现商业广告的存在等等。而需要被切分的语料或数据,有可能是音频记录,也有可能是利用语音识别功能后将音频记录转化形成的文字记录。

三、识别新事件

所谓的识别新事件,其根本目标就于能够发现以往从未出现过或是从未被讨论过的新闻主题,有可能是地震、海啸,有可能是发射导弹、卫星,也有可能是某个八卦娱乐新闻等等。通常情况下此类新闻主题还兼具用于识别主题系统的测试功能,这主要是由于识别新闻主题系统的重要基础就是对每一个新闻报道当中是否讨论新话题进行判断。现阶段人们习惯使用向量或分布概率的形式用以识别新事件。具体来说就是指在概括每一篇新闻报道时都会借助于向量或分布概率形式,其最终形成的集合表示新闻主题的所有特征,而一旦出现新报道,将会比较以往报道的所有特征集合与现在新闻报道的特征集合,并且将其作为判断新主题是否参与讨论的重要依据[3]。也有部分研究人员认为利用单纯的比较文本相似性方法很难完成调整参数、提高系统性能的任务,因此还需要寻找其他方法。

四、识别新闻视频主题

识别新闻视频主题指的就是通过对新闻视频进行深度识别,最终将主题内容归拢到与之相对应的主题库当中,结合实际情况可以适当建立全新的新闻主题。从本质上看,识别新闻视频主题几乎和无指导的聚类研究一模一样,即面对新闻视频的主题数量、出现时间等系统无法进行预测,只能有限的向前看。通常意义上的聚类等同于将全局信息也就是整个新闻数据集合进行聚类,但识别视频新闻主题时则是使用增量方法完成聚类。这也正意味着,只能向前看到有限的文本、报道才能进入最终的决策环节。作为一种增量式的聚类,人们习惯于将识别新闻视频主题分成两个阶段:第一个阶段为识别新事件是否出现;第二个阶段为对于新闻视频中出现的主题归拢至相应的主题库当中。显而易见,在第一个阶段当中,就是识别新事件的发生。识别新闻视频主题其实也是将识别新事件进行自然的扩展[4]。但是,二者之间存在明显的区别,即在第一个阶段当中系统只负责在新闻视频当中识别出主题,若这一任务无法得到有效落实将会引发严重的后果;而在第二个阶段当中需要将新闻视频中的主题进行识别并且归入到主题库当中,即使无法在视频当中识别出主题也并不会引发严重后果。

五、跟踪新闻视频主题

跟踪新闻视频主题具体来说就是在给出某一主题当中的一个或几个新闻报道视频,之后将输入进的相关新闻报道与新闻视频主题进行有机整合。在此过程中首先需要给出一组样本报道,通过训练最终得到一个主题模型,然后在后续跟踪报道的新闻视频当中识别出所有与目标主题有关的新闻视频。由此我们可以看出,跟踪新闻视频主题与通过查询例子和过滤信息的相关研究有着异曲同工之妙但是在目前跟踪新闻视频主题当中之后很少的已知训练正例,并且与新闻主题有关的新闻视频通常会集中出现在某一段特定的时间段。值得注意的是,在跟踪新闻视频主题的过程当中训练使用的视频数量,测试语料、使用语言质量等均会对追踪任务产生不同程度的影响。随着科学技术水平的不断提高,跟踪新闻视频主题的系统也得到了相应的发展,即使在某些特定领域当中也可以得以运用。相信再经过几年的发展,跟踪新闻视频主题的正确率将会得到进一步提升。

六、结论

总而言之,本文通过从切分新闻报道、识别新事件、识别新闻视频主题以及追踪新闻视频主题等几个方面进行简要分析,帮助人们对新闻视频主题的识别追踪产生一个大致的了解,但是由于当前在相关方面的研究少之又少,因此本文还有许多不足之处,还需得到进一步的完善和研究。

[1]吴玲达,文军,陈丹雯,袁志民.新闻视频主题识别与跟踪技术研究综述[J].计算机科学,2015,06:5-10.

[2]文军,吴玲达,曾璞,栾悉道.关于新闻视频主题识别与跟踪分析研究[J].软件学报,2016,11:2971-2984.

[3]朱旭东.关于新闻视频主题识别与跟踪的研究[D].西安电子科技大学,2015.

[4]王卫威.新闻视频中识别与跟踪主题的技术研究[D].国防科学技术大学,2015.

TP

A

猜你喜欢
新闻节目新闻报道聚类
浅析如何在新闻报道中彰显以人为本
活力(2019年15期)2019-09-25 07:22:10
新闻节目中主持人的“可为”与“不可为”
新闻传播(2018年8期)2018-12-06 09:03:00
地方电视台如何办好新闻节目
新闻传播(2018年11期)2018-08-29 08:15:30
基于DBSACN聚类算法的XML文档聚类
电子测试(2017年15期)2017-12-18 07:19:27
如何做好电视新闻节目编排
新闻传播(2016年10期)2016-09-26 12:15:03
基于改进的遗传算法的模糊聚类算法
深化“走转改”在新闻报道中践行群众路线
新闻传播(2015年21期)2015-07-18 11:14:22
如何让新闻报道鲜活起来
新闻传播(2015年9期)2015-07-18 11:04:11
方言新闻节目探索
新闻传播(2015年9期)2015-07-18 11:04:11
新闻报道要求真实的细节描写
新闻传播(2015年13期)2015-07-18 11:00:41