“一体化”理念下历史数据开发和管理新思路

2012-09-25 04:33肖红慧陈琼
中国传媒科技 2012年23期
关键词:历史数据资源库一体化

文 | 肖红慧 陈琼

在全媒体时代,在迫切需要科学地、系统地搭建适应采编和管理一线应用的“全媒体信息采集平台”的今天,如何构建起基于“一体化”管理理念的、全媒体的历史数据平台,是摆在历史数据编辑工作者面前的新课题。以下,就此问题,结合南方报业传媒集团的业务实践,从报业集团历史数据挖掘、开发、管理和利用,谈谈我们看法,以期探讨出一种历史数据平台管理和渠道管理的新模式。

图一 历史数据资源管理发展的三个阶段

图二 历史数据管理的传统程序

历史数据生产、收集和利用的新路径及新流程

对历史数据的生产、集纳和利用来说,建立一个科学的、系统的、快捷的流程十分重要,它关系到历史数据的生产标准、利用渠道和数据安全性等诸方面的实质性因素的考量,流程设计得好、科学性强,就能实现生产和管理上的节能高效,更有利于发展。

纵观传媒集团历史数据资源的管理历史,我们可以看到经历了三个代表性的阶段(见图一):其一是以“手工剪报、人工资料管理”为特征的第一阶段,其二是基于信息化和电子化管理的第二阶段,以建立历史资料全文检索库和图片库等数据库为特点,其三是目前正在大张旗鼓进行的全媒体数据资源建设和管理的第三阶段,以“多媒体数据的融合与应用、一体化平台管理”为主要需求。这三个阶段的发展和变迁,让我们看到历史资料和数据的生产、加工和开发、管理利用,是一个与时俱进的动态的发展和管理过程,每每传媒技术发展到一个新阶段,传媒集团对历史资料和数据的生产和管理,就面临着新挑战和新问题。创新工作模式,建立历史数据生产、集纳和利用的新路径及新流程,在传媒集团全力以赴向全媒体战略转型的今天,可以说是 “时不我待”了。如图1所示。

过去,南方报业传媒集团对历史数据收集和利用,也有一套适应当时信息化生产和管理环境的流程(见图二):程序一:先将见报稿件进行版面反解后生成数字报,并形成符合入库格式要求的文本数据:程序二:将上一步骤加工整理过的文本数据,由数据整合专员完成相关的整理、校对和标引后入库;程序三:将入库文件经过一次或二次加工,并放到信息服务平台展示,为内部用户提供全文检索、信息专题等数据资源服务。同时,针对图片的历史资料和数据的生产及管理,另开辟一个专属流程:即基于图片库系统实现新华社图片和集团部分报系图片统一管理,在同一系统内集纳见报和未见报图片,为集团用户提供浏览检索和跨报取图等服务。如图2所示。

从实践经验来看,过去我们采用这种生产流程进行历史数据收集和生产,其优势在于,由专业的信息编辑人员对见报数据进行二次加工,数据的整理、校对和标引的质量较高。但运用这种流程模式,数据加工的工作作为常态,工作量大,需要投入的数据加工和标引的专业人员多,建设成本高,此为劣势。与此同时,集团旗下的各系列报刊出于自身发展的需要,纷纷另立门户进行自己专属的数据库建设,逐渐形成了集团主数据库之外的多个分散的数据库,使数据库建设出现了严重的重复和浪费,消耗了大量的人力物力,造成信息资源生产、管理上的混乱。受这二方面因素的制约,历史数据开发和管理的“一体化”管理理念的引入,成为促进历史数据收集和生产大发展的有利选择。

如何在“一体化”管理理念下,走出历史数据开发和管理的新路子?基于南方报业传媒集团建设统一的数据资源存储平台和全媒体资源库的框架下,数据生产的专业需求和数据流通渠道发生了变化,统一的历史数据生产和管理,成为对应集团一体化采编平台建设的主要需求。由此,我们提出了在实现数据加工标准化和专业化的前提下,数据生产对集团各系列报刊进行放权的新思路,即以“授权生产、统一渠道、集中管理”的办法,实现集团范围内全媒体数据资源的“一体化”整合和利用。

图三 新思路下的程序

图四 历史数据的管理制度架构图

在这个新的思路下,历史数据资源的生产、收集和利用的流程缩短了,各系列报刊在出报出刊的过程中生成的见报数据,直接在统一全媒体资源库平台上进行整理,无需再投入人力物力进行二次整理。其基本流程(见图三)是:程序一:采用一体化平台的系列报刊生产的数据可直接与全媒体资源库平台对接,见报的成品数据在全媒体内容生产平台进行版面签样后可自动生成数字报,各类数据(包括图文视频等)按稿件来源及用途定期自动归档入进入全媒体资源库;程序二:在数据进入全媒体资源库后,通过数据预处理功能对数据进行稿件查重、稿签检测及自动抽取、自动分类、自动关联等技术处理,再由各系列报刊配合进行人工检校,保证了入库数据的标准化和高质量;程序三:各系列报刊直接在全媒体资源库平台上进行各类稿件二次加工编辑、混编及审批,加工后的稿件可有多种用途:可直接生成数据产品、可再次流向一体化平台二次利用、可进入全媒体资源库的资源服务系统提供各种数据服务。与此同时,在全媒体一体化平台与全媒体资源库无缝衔接后,尚未采用一体化平台的系列报刊,可参照全媒体资源库的建设标准将成品数据导入全媒体资源库,引入新流程。如图3所示。

在新的流程下,原来从事历史数据整理、标引和加工的信息编辑人员,工作角色发生了变化,由生产职能转向管理职能,主要负责提出和建立全集团采编数据的生产标准和质量标准,同时基于在全媒体一体化平台与全媒体资源库两平台,对历史数据的质量和流向进行管理和监控。这一做法,既节省了人力物力,又有利于集团内部采编业务、历史数据管理业务的协同发展。

历史数据的管理制度建立脚点的新思维和新模式

历史数据的管理模式,也随着历史数据生产流程的改变而发生变化,传媒业发展到今天,也要求历史数据管理有适应全媒体一体化平台的新思维和新模式:一方面,随着集团全媒体转型战略的实施,全媒体内容生产逐渐涵盖文本、图片、视音频等各种数据类型,但原有数据库的建设,数据类型分散,无法对全媒体数据资源进行统一管理,难以形成历史数据的统一备份存储和利用,缺乏业务协同能力,无法适应全媒体业务发展;另一方面,伴随着历史数据的生产、集纳和利用的新流程的运用,历史数据的管理制度的创新,也成了需要直面的问题,因为好的生产流程,还要有好的管理制度来“保驾护航”。

因此,如何巧借全媒体资源库建设的契机,适时调整和创新历史数据的管理模式和制度规范,以配套的、富有针对性的数据专业管理制度和业务标准带动集团范围内的业务协同建设,是我们要解决的重要问题。我们管理制度的新思维和新模式,具体体现在服务管理规范、信息内容分类标准数据、生产格式标准和项目实施标准等四个方面(见图4所示):

(一)、服务管理上的新规范:目前本集团各子媒及各分部间的网络配合不甚顺畅,各种硬件设施也参差不齐,历史数据的入库模式和入库规范管理,过去一直缺乏统一的标准,造成“有数据、难联通,有平台,难共享”的困境。可以说,这种各自为政、“信息孤岛”式的建设模式,已成为发展的制肘。在“一体化平台”的发展思路下,从战略的高度,以集团统一整合资源的管理模式,通过制定新的历史数据服务规范,方能进入建立一个适应发展的全媒体历史信息数据平台。因此,我们建设了一套统一的历史数据服务管理规范,自上而下,对集团历史数据的管理方式、技术准备、硬件配套以及人员素质提出相关标准及要求,有效地解决了由各种差异和管理混乱带来的种种问题,从而提高历史数据的整理和利用效率,降低历史数据开发和管理工作难度,实现节能高效。

(二)信息内容分类标准的新要求:实现各系列报内容整合、数据集中管理和利用的一个大前提,就是要在全集团范围内统一信息内容分类标准。在“一体化平台”的发展思路下,从历史数据生产和聚合的层面来说,统一信息内容分类标准是不可逾越的“硬性要求”。在制定信息内容分类标准时,应高度重视在内容形式上支持全媒体业务特性,即可实现对文字、图片、图表、音视频、手机彩信、户外媒体等产品属性的统一管理。基于分类标准的自动分类技术的运用,将大大节省数据标引分类的时间和人力,同时,在信息内容分类的基础上进行全媒体数据产品的开发,也就有了一个聚合的、联通的平台基础。

(三)数据生产格式标准的新落点:传媒业发展到不同的阶段,历史资料和数据的生产格式标准都随需求变化而变化。在全媒体发展的框架下,数据生产格式的标准,也有一个新落点,那就是标准的、专业的“全媒体历史数据”的生产和存储。我们的方法是:集团层面建设“一体化平台”和“全媒体资源库平台”,旗下各系列报按其业务发展需要使用这二个平台,并根据信息管理部门的要求,以及按照上述数据产品生产和服务的规范,完成本报本刊本网的历史数据的生产。集团信息管理部门则对各二级单位的输入数据提出专业化和规范化的要求,包括文字、图片、图表、版面、音频视频、手机彩信等入库标准格式,以及命名规范、入库制度等。甚至对“资源库数据输出到全媒体一体化平台、”“同一稿件文字、图片和音频视频关联”这些环节也做出相应的规范。

(四)项目实施标准的新目标:全媒体资源库系统的实施,有赖于规范化管理的支撑。我们从协同管理的目标出发,进行全媒体资源库相关项目的统筹规划,以利于实现信息统一表达、统一标准、统一渠道和统一平台。在实施过程中需执行信息规划标准化、应用系统接口的标准化、应用系统实施方法标准化,比如“系统数据交换和业务接口标准性”、“平台可扩展性”以及“数据生命周期的管理”等,都以标准化为实现目标。

我们深知,“一体化平台”理念下历史数据开发和管理,也有一个动态发展的过程。当前,随着信息化建设的迅速发展,传媒集团对各种新媒体技术应用日趋成熟,并逐步向标准化、平台化和一体化迈进。在传媒集团向全媒体战略转型的背景下,实现传媒集团各项关键业务的信息化协同发展,以及各种技术平台和信息资源的融合应用,是促进传媒集团发展的大趋势。

猜你喜欢
历史数据资源库一体化
幼儿园课程资源库建设之浅见
基于设备PF性能曲线和设备历史数据实现CBM的一个应用模型探讨
基于故障历史数据和BP神经网络的接地选线方案研究
健身气功开放课程资源库建设研究
数控加工专业资源库建设中存在问题及对策
基于Hadoop技术实现银行历史数据线上化研究
用好细节材料 提高课堂实效
基于共享资源库的混合式教学考核模式研究
中高职一体化课程体系建设的探索与实践
克里米亚完成入俄“一体化”