□ 刘海兰 李海彬 罗一宇
新闻核心稿件数据的综合应用经验与技术探讨
□ 刘海兰 李海彬 罗一宇
笔者结合自己多年的文稿数据库开发应用经验,介绍在现有技术条件下,如何通过数据分析和挖掘,使新闻稿件数据得到有效利用和发挥更大的效能,并通过实际案例进行了说明。
文稿系统;数据挖掘;互联网应用;WebService接口
广西电视台新闻中心文稿处理系统存储的稿件跨度从1996年至2016年,全部新闻稿件量累计近200万条。在大数据时代,数据的重要性不言而喻,怎样通过技术手段将它们有效利用起来,发挥更大的效能,是新闻技术人员需要思考和解决的问题。
大部分电视台的文稿处理系统一般只提供记者写稿、编辑选稿、领导审稿、稿件查询等与节目稿件制作相关的功能,而新闻中心的文稿处理系统除了前面提到的这些基本功能外,仍在不断地针对这个系统进行升级和扩展。围绕各个稿件库的可用字段进行充分挖掘,在尽量不增加采编人员工作量的情况下,利用原有数据加入了一些实用的功能模块:
打分和工分统计:值班主任在每档新闻节目录播完成后,在节目串编单中给每条片子打分,月末统计各记者当月播发稿件量和总分,作为量化奖金的依据。
通讯员稿件管理:在录用稿件时,“录稿”存储过程检测稿件是否有外单位通讯员参与,如有则导出一份稿件到“通讯员稿费库”,并根据通讯员名字对应到“通讯员信息库”,调取他的单位、通讯地址、银行账号等信息,自动生成稿费发放清单。
传央视稿件管理:由外联人员从各个新闻稿件库中,选择央视可能需要的稿件,并导出一份稿件到“预送央视稿件库”,之后结合视频上传央视供稿平台,在央视录用后标注在哪个栏目播出。这个稿件库为记者提供查询、统计功能,使他们知道自己的片子是否被央视录用,年度统计结果也作为评测工作量和奖励的依据。
短信收发管理:通过“内部通讯录库”里的姓名和手机号码,可以在系统中直接向指定人员发送手机短信;记者可以将新闻稿件通过短信发回文稿系统数据库,并直接对应到记者稿件库(根据手机号码绑定)。
通过对文稿原始数据进行的内容分析和关联性分析,寻找隐藏在数据中的知识,挖掘其价值,再辅以技术手段进行合理利用,可以实现系统功能的扩展。
在针对新闻稿件的互联网应用方面,目前我们建立了两个网站系统,均采用B/S结构、C#开发,运行在支持动态网页和网页局部刷新技术的ASP.NET 2.0平台。根据它们面向的对象群体和使用功能的不同,采用的技术方案也有所区别。
(一)远程文稿系统
远程文稿系统的使用人员是新闻中心本部门的工作人员,以及一些地市台的通讯员,不对公众开放。它是局域网文稿处理系统在互联网的延伸,自身不带数据库,在网页中呈现的内容源自内部的文稿数据库,稿件数据是实时的,如图1。
图1
远程文稿系统在网络安全防护上,使用硬件防火墙,只开放WWW端口,定期对服务器打补丁。另外,除了账号密码进行登录身份认证外,我们还多加了一级安全防护:手机短信验证。在完成身份认证后,系统调取认证用户在“内部通讯录”中存储的手机号,并向这个手机号发送6位数字的随机验证码。
通过远程文稿系统,记者、地市台通讯员可以方便地在外地将稿件传回新闻中心总部,并可以通过系统查询所需的新闻资料,明显提升了新闻工作效率。
(二)已播稿件查询系统
这个系统的应用群体是同行业的新闻工作者,如地市台的同行、各厅局单位特约记者站的通讯员。与远程文稿系统不同,已播稿件查询系统的网页内容虽然也源自新闻文稿数据库,但并不是实时获取的,并且只能查看新闻中心各栏目已播发新闻的文字内容,如图2。我们开发了一个自动定时更新软件,根据设定的时间(凌晨2∶00),自动从文稿数据库的“播出总库表”将当天播发的稿件资料推送到已播稿件查询系统的本地数据库中。
图2
已播稿件查询系统可以让合作单位的通讯员查询我台新闻播发稿件,便于他们收集整理新闻资料,统计本单位提供新闻数据量,制作年度报表。
在高清数字电视的时代,非编网络化制播系统开始取代原来的磁带机对编,而非编网络化制播系统通常都与文稿系统配合使用,但是非编厂商配套提供的文稿系统却不一定满足新闻工作的需要,主要有三方面的问题:工作流程问题、功能问题、使用习惯问题。
在不使用非编厂商配套文稿的情况下,可以通过接口实现文稿系统与非编网的融合,在与第三方系统对接时,Web Service是最常用的技术。
Web Service是一种构建应用程序的普遍模型,可以在任何支持网络通信的操作系统中实施运行。Web Service是一个应用组件,它极具逻辑性地为其他应用程序提供数据与服务。在构建和使用Web Service时,主要用到以下几个关键的技术和规则:1.XML:描述数据的标准方法;2.SOAP:表示信息交换的协议;3.WSDL:Web服务描述语言;4.UDDI(Universal Description,Discovery and Integration):通用描述、发现与集成,它是一种独立于平台的,基于XML语言的用于在互联网上描述商务的协议。
下面分别介绍新闻中心的文稿系统与北京捷成的苹果高清非编制播系统、与北京大洋的高清非编制播系统通过Web Servicer技术进行对接的融合方案。
(一)与捷成高清苹果非编制播系统融合方案
图3是新闻中心文稿处理系统与捷成苹果非编制播系统对接的业务流程图。
图3
由于苹果非编软件运行平台为MAC操作系统,所以方案中采用的是双文稿系统方案,双方各有一套自己的文稿系统(以下简称“捷成文稿”和“新闻文稿”),通过双方开发的Web Service接口进行数据同步、消息收发。双方约定的工作流程如下:
1.新建稿件和非编项目。记者登录苹果非编工作站,通过“捷成文稿”新建一个Final cut项目,同时录入稿件。2.记者提交稿件和半成品。记者使用Final cut粗编,完成后在“捷成文稿”中提交,捷成后台调度系统调用Finalcut完成素材打包,同时调用“新闻文稿”的Web Service接口向其发送稿件。3.串联单稿件同步。栏目责编在“新闻文稿”中浏览记者原稿并根据栏目需要选用,之后各级审稿流程在“新闻文稿”走完。稿件至串联单稿件库后,“新闻文稿”调用“捷成文稿”的Web Service接口,将本方串联单稿件发送过去。4.素材精编及配音合成。后期编辑选中“捷成文稿”串联单的某条稿件,启动苹果非编软件Finalcut,打开与稿件对应的记者素材进行精编、过字幕,之后由播音员在非编网内完成配音。5.领导审片、送播。领导在苹果工作站中观看完成的节目视频,审核通过后,提交送至播出服务器待播。
(二)与大洋高清非编制播系统融合方案
在与大洋非编制播系统进行对接的方案中,仅使用新闻中心原有的文稿处理系统,主要原因是大洋公司的非编软件是运行在W indows平台的,“新闻文稿”可以运行在大洋非编网中。
但相对于与捷成非编的对接方案,新闻中心决定采用全新的业务制作流程,新闻文稿与大洋非编之间的对接更为复杂,在生产制作域的每一个环节中,都分布着双方的接口,如图4。
图4
根据新闻业务制作流程为对方提供接口,并制定了公用服务接口IceService及其规范。
接口采用Web Service提供服务,以约定的XML结构填充入参及返回结果,各系统向IceService发送请求,返回IceService的处理结果。IceService只担负路由的功能,具体实现由服务插件完成。在delphi中看到的接口函数如下:
function invoke(const XmlData∶WideString)∶WideString;stdcall;
调用说明:按IceService规范将入参生成XML字符串并存储在Xm lData变量,调用Invoke(XmlData),返回的也是IceService结构的XML字符串,之后根据MessageType进行不同的解码,得到所需数据。
本文分享了笔者的一些经验和做法。通过对新闻稿件数据分析和挖掘,笔者试图在数据中找到有价值的信息,并运用技术手段将这些信息资源整合和共享,达到拓宽信息资源应用领域,实现最大化挖掘信息价值的目标。
(作者单位:广西电视台)