■文/殷圣忠 朱 颖
媒体融合发展下多媒体采编系统技术建设方案
■文/殷圣忠 朱颖
随着媒体融合时代的到来,传统媒体固有的信息传播方式已经被互联网所颠覆,互联网不仅是新闻传播的手段,更成为获取新闻的一种重要途径。原有新闻采编发系统受其所固有的封闭性限制,已难以满足媒体融合时代信息传播模式下的面向公众开放交互、以数据服务为核心、即时采编发等需求;另一方面,面向互联网下的多类型多维度海量数据管理、即时分发、深度挖掘,也对新闻采编发系统在可靠性、安全性、扩展性方面提出了更高的要求。
媒体融合;采编;建设方案
中国新闻社原有新闻采编发系统基于信息管理系统框架构建,面向新闻采编流程,实现了新闻采编发自动化作业和全程监控管理,极大提高了新闻采编发效率,探索出了一条行之有效的、规范的信息采编流程。
新闻采编发系统作为媒体转型融合的技术支撑平台,应将传统媒体和新媒体传播通道有效结合、资源共享、集中处理,从而衍生出更加符合受众需求的信息产品。同时需要看到,通过多年实践,新闻采编发业务模型、流程已经形成,新平台构建中需要在总体上延续原有运行模式,针对媒体融合特点,合理重构采编流程,设计符合互联网思维的、满足国内外业务部门需求的、支持媒体融合发展的多媒体采编大平台。
2.1建设需求
综合考虑媒体融合应用和未来发展需求,新多媒体采编系统在保持原有业务模型、数据和采编发基本功能不变的基础上,主要建设目标如下:
为记者、编辑构建在线投稿、移动办公平台,支持媒体融合下业务发展格局和业务流程,并充分考虑与原有应用系统的无缝连接;
统一管理分布在不同区域的数据资源,实现智能分析,资源共享,支持大数据新闻辅助编辑;实时监控系统运行状态、数据业务流程,实现智能高效的运维管理;负载能力高、可扩展性强,为各类应用提供即时响应。
2.2系统架构设计
新一代多媒体采编发大平台采用“五横两纵”的多层应用架构设计,安全保障体系与标准规范体系贯穿整个系统,基本架构如图1所示。
表现层是系统和用户间的桥梁,为记者、编辑、管理人员提供了交互良好的操作界面,为用户提供信息展示交互、授权下载、查询检索、分析报表等功能;应用服务层是系统的核心层,采用面向服务的体系结构(SOA),为各类应用提供包括统一身份认证、在线投稿、移动采编、文字图片编辑、公共稿库管理、成品稿库及发布服务、稿件统计、监控预警等核心服务支持;接口层完成应用服务层与数据存储层之间的通信和接口转换,确保各类应用对共享数据资源的统一访问;数据存储层采用关系型数据库和全文数据库相结合的方式,建立了新闻资源的公共稿库,实现对资源数据的汇聚、存储和管理,采用全文检索实现对关系数据中数据资源的全文索引创建;支撑环境层主要包含操作系统、应用中间件和防毒软件等软件环境,以及服务器、存储、交换机等硬件环境部分。
安全保障体系纵向贯穿整个层面,从支撑环境层到表现层都进行安全管理,保障系统安全运行;标准规范体系在各层建设统一接口规范,包括文件存储规范、XML文件格式规范、数据完整性一致性要求、统一身份认证系统与第三方应用系统的接口规范等。
2.3系统主要技术特点
基于分层架构构建应用系统,各层相互独立,前后台分离,既保证系统良好的可扩展性、易用性,又保证系统核心数据安全。
综合多种安全技术进行分区、分层防护,建立安全高效的网络安全体系。
统一具体标准和规范,便于海量数据管理和监控系统的智能化。
采用非关系数据库和智能处理技术,有效提升系统的大数据应用能力。
新多媒体采编系统实现了整体架构与业务需求接轨,同时在主要环节上引入了关键技术,有效提高系统工作性能。
3.1采用可伸缩线性扩展系统架构,便于扩展和管理
综合考虑系统当前性能以及扩展需求,系统硬件平台采用集群和网络存储模式,并综合采用纵向扩展(Scale-up)和横向扩展 (Scale-out)两种方式进行系统扩展。后台服务器集群根据访问群与承载功能的不同进行分区部署和冗余备份,当系统压力增大需要扩展时,可在原有集群组中加入新的服务器;存储平台采用网络连接存储(NAS)及存储区域网络(SAN)混合存储方式,NAS存储主要存储业务应用非格式化数据,SAN存储主要用于存储数据库核心数据。需要扩展时,SAN存储采用Scale-up方式扩充,NAS存储采用Scale-out方式扩充。
3.2综合缓存加速、读写分离、按需存储、组播等多种手段,提升大数据处理能力
为满足多用户并发、海量多媒体信息快速检索访问的需求,系统在设计时针对影响系统性能的各个环节进行优化,综合利用多种技术手段提升用户交互的响应速度。
在数据服务上,采用缓存加速技术,实现海量多媒体信息快速访问。为提高请求的处理效率,采用Apache + Squid方案提升系统的抗负载能力。Apache响应静态请求,应用服务器响应动态请求。
在数据库结构上,采用ORACLE数据库集群技术来实现读写分离,通过主从数据库的读写分离,有效减轻数据库压力,进一步提高了数据库的工作效率,改善用户体验。
在访问模式上,利用异步JavaScript 和XML技术(Ajax)来实现数据的按需获取,以减轻系统整体负担。Ajax相当于在用户和服务器上加一个中间层,使用户操作与服务器响应异步化,用户处的Ajax完成一部分数据验证和数据处理工作,仅将必须的新数据申请发给服务器,从而减轻服务器负担、减少用户等待时间。
在网络传输上,采用组播技术来实现集群服务器间的数据同步,优化网络环境。组播技术不仅控制网络流量、消除流量冗余,而且降低服务器和交换机的负担,有效提升面向互联网的分布式应用性能。
3.3灵活运用内容管理、数据检索和文本挖掘技术,支持大数据条件下的新闻辅助编辑
分析海量数据来挖掘数据表象之下的真相获取“数据新闻”,已成为当前一种重要的新闻生产方式,媒体融合下新闻采编系统的内容管理是一个集人、过程与技术于一体的“技术—社会”工程,将各种非结构化或半结构化的数据资源进行采集、管理、利用、传递和增值,并有机集成到结构化数据库中,让不同部门、不同需求的用户都能流畅使用,以实现真正高效的内容管理服务。
数据检索技术帮助使用者快速定位所需内容。按照搜索方法可分为全文搜索、上下文搜索等。面对海量的内容数据和并发检索压力,新采编系统综合采用智能化信息检索技术、自然语言查询、多媒体信息检索技术等来实现智能检索。
在新闻编辑审核过程中,采用文本挖掘技术,对海量数据进行有效的分析处理,包括了信息抽取、信息检索、自然语言处理和数据挖掘。利用内容语义分析、统计等各种智能手段,实现了自动分类、常识校对、文本相似性检索、信息过滤、自然语言检索等,在大规模的异构文本资源中提取出符合用户需求的简洁、精炼、可理解的数据信息。
推动传统媒体和新兴媒体融合发展是一项复杂的系统工程,多媒体采编系统的建设是媒体融合的基础。我们应当实时关注和把握技术发展趋势,坚持先进技术为支撑、内容建设为根本,结合媒体应用实际,找到新技术在媒体融合中的应用切入点,探索传统媒体与新兴媒体在内容、渠道、平台、经营、管理等方面的深度融合。在中国新闻社多媒体采编系统项目的建设过程中,我们初步探讨并重构了多媒体采编资源共享,完善了系统内部标准、流程和要求,强化了互联网思维和一体化发展理念,进行了相应的内容建设、人才建设和机制建设,为立体多样、融合发展的现代化传播体系构建了坚实的基础。
(作者单位:中国新闻社技术部)
G203
A