胡 涛
(深圳广播电影电视集团,广东 深圳 518026)
基于云架构的深圳广电融合媒体数据中心设计
胡 涛
(深圳广播电影电视集团,广东 深圳 518026)
基于融合新闻生产制播平台业务需要,设计了融合媒体数据中心。通过应用云计算、IP集群存储等技术,将广电全台网完全架构在私有云上,突破了系统规模的限制,实现了通用硬件和专业软件的分离、办公生产一体化、融合生产全时化,提升了新闻生产效率、产能、共享能力。最后,对融合媒体数据中心在混合云、全台网演进、云安全、统一运维与监控等方面进行了展望。
全媒体;云计算;媒体数据中心
融合新闻中心项目是深广电集团由传统媒体向融合媒体转型的标志项目,调研、论证、建设长达6年,涉及机制、流程、技术等多方面创新和变革,第一期工程于2015年5月正式投入使用。项目总投资近1.8亿,其中工艺系统设备投资预算1.1亿,建筑总面积为4 300 m2。为了实现全媒体业务流程变革和技术支撑升级的项目目标,深圳广电和成都索贝公司、华为公司联合研发并实施基于云架构、全IP化的融合媒体数据中心。
传统媒体的舆论引导能力面临挑战,互联网已经成为舆论斗争的主战场;另一方面,传统媒体的盈利模式面临挑战,电视广告收入增幅几乎零增长,广告平均价格大幅度下降。形势的变化,要求广电技术系统建设从“网络化、文件化、高清化”改造逐步转向“用户导向,服务导向”的流程改造和模式创新。因此,融合媒体数据中心建设不仅要满足节目部门对内容生产平台的需求,而且还要适应传统媒体和新兴媒体融合发展的趋势。
1.1 全媒体云计算与全IP化
20世纪90年代以来,深圳广电集团(含原深圳电视台)电视内容生产平台依次经历了编辑工具数字化、生产系统网络化、内容生产平台云化三个阶段,IP化则贯穿其中。总体而言,编辑工具数字化提高了节目制作水平和效率,提升节目生产过程的管控能力;生产系统网络化逐步消除业务孤岛,节目制播的运作效率和资源共享的能力进一步提升。为了应对新媒体竞争以及自身融合发展需要,深圳广电内容生产平台利用融合新闻中心项目建设的契机开始进入全IP和云计算时代。
1)电视生产业务系统全流程IP化探索
在传统媒体与新媒体融合的过程中,内容生产平台整体架构向全IP融合架构演进成为业界一致的认识,这一演进过程可以称为内容生产网络的全IP化。生产系统全流程IP化实际上是采、编、播、存各个节点采用IP协议实现互联互通,并在线路传输、实现协调控制、完善网络应用等三个层面完成IP化改造。2005年元旦,深圳广电上线全台网,为进一步提高生产效率和降低成本,开始逐步对内容生产体系全业务流程进行IP化改造。深圳广电全台网的全IP化改造主要包括信号和信令的IP化、业务流程的文件化、生产管理的信息化等方面。
2)内容生产制作平台的私有云实践
云计算是通过互联网提供各种计算服务和存储服务,包括基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaA)等服务模式。云计算的部署模式包括私有云、社区云、公有云、混合云。文献[1]提出多媒体云和云多媒体来研究多媒体云计算。在云中进行多媒体信息处理带来了巨大的挑战,包括多媒体和服务异构性、QoS异构性、网络异构性、设备异构性。云计算不仅有助于工作效率、降低运营成本,还可以促进内容资源整合、发展创新业务,为内容生产提供良好的技术基础。从中国国际广播电台、央视新址、北京电视台、凤凰卫视在广电云平台的实践来看,云计算技术在广电应用的优势主要体现在有效降低用户的使用终端成本[2]、优化技术调配运维和促进业务运营[3]、业务实现敏捷,实现“全媒体、全时空”的高效业务运营[4]。
1.2 深广电全台网的发展
深圳广电集团全台网经过10年发展,电视内容生产网络的资产规模增长4倍,直播时长增长26倍,为了满足不断发展的内容生产业务的需求,深圳广电不断优化和改造全台网。
2004年,深圳广电率先于全国建成全台网络化制作播出系统,实现采、编、播文件化交互和网络化传输播出。但由于全台网原有设计和当时技术限制,系统之间普遍通过单点连接,媒体资源共享性较差;中央节点负担重,形成“瓶颈”,一旦发生故障,则全网受到影响。
2010年开始,深圳广电的基于双总线架构的主干平台投入使用,建立以主干为总线、其他系统向主干注册服务的模式,应用层面通过统一检索平台实现元数据检索和调用。这些项目建设实现了高标清素材级(文稿、串联单、成品和素材)互相调用,实现了异地异构系统间的协同工作,构建了标准化的集团内部接口服务;但是在松散耦合系统中,子系统都是服务提供者,被动地被外界调用;除媒资、播出和收录向外提供较多服务之外,其他子系统间缺乏统一的业务流程驱动,导致业务量极少,特别是网台互动实际应用不多。
随着业务压力的日益增大,设备使用年限的逐年增加,故障发生频率越来越高,2011年前4个月时间内,设备故障率已经达到2010年全年故障数量的77%,其中故障主要集中在存储故障、关键服务器故障、单点故障等方面。
深圳广电内容生产网的发展主要面临3个方面的挑战:
1)生产系统“烟囱式”发展,资源无法有效利用;系统安全防护需要进一步加强;面对不断增加的业务需求,需要进行系统性的整体规划。
2)新媒体迅猛发展,网台互动依然是“两张皮”。
3)如何做好标清资产的再利用。在深广电高清化过程中,原有5个标清制播网络价值数千万的标清设备、系统(授权)再利用问题。
1.3 深广电融合媒体数据中心需求分析
经过持续调查与研究,深圳广电希望通过业务流程变革和技术支撑升级来应对上述挑战。一方面,优化现有流程,改善资源共享的效率和安全性,完善新闻流程的一体化设计;应对未来全媒体环境下的业务生产,重构传统媒体与新兴媒体融合的生产流程;另一方面,面对不断扩张的业务需求,建立更具弹性,横向扩展性更强的IP化、分布式基础架构;面对内部业务生产建立媒体私有云,针对全媒体的生产环境,结合公有云服务建立“混合云”。
2013年,融合新闻中心开始建设。系统包含5个生产业务系统、2个生产辅助系统,系统平台包含160多个子功能模块,支持电视、微博、微信、App等平台的新闻生产与发布。项目采用全IP化、私有云技术、IP分布式存储,实现90%后台计算资源的虚拟化,采用桌面虚拟化、流媒体技术实现视频简编业务。深圳广电在建设全媒体融合新闻中心过程中,积极探索和实践云计算技术在融合新闻生产平台中的应用。其中,融合新闻中心媒体数据中心在IAAS层、终端层,混合云等方面进行了云计算的探索。
2013年,深圳广电、系统集成厂商、硬件厂商建立联合实验室,联合实验室主要测试项目包括服务器虚拟化、分布式存储两大类共16项。通过9个多月的测试和完善,基本确认现有技术设备和系统可以支持融合媒体数据中心的内容资源全IP化、业务能力平台化、生产系统云化等3个设计目标。参考互联网数据中心(Internet Data Center)平台架构,融合新闻中心项目提出并建设了“媒体数据中心(Media Data Center,MDC)”。融合媒体数据中心(MDC)是融合新闻中心技术平台的一部分,为融合新闻中心新闻运作与指挥平台(NRP)、全媒体汇聚平台、融合生产平台、全媒体发布平台提供媒体处理、业务支撑、公共服务、IT基础架构、传统媒体基础架构等资源,同时接收云管理平台、统一监控中心的管理和监控。
2.1 基础设施层设计
MDC基础设施层主要包括分布式IP存储设计、虚拟计算资源设计、网络及安全设计等部分,重点实现:1)为上层业务系统提供可靠、安全、高效、可扩展性强的存储资源、计算资源和网络资源;2)要求MDC在不改变系统结构、仅增加硬件资源的前提下可支持接入新的业务,即可扩展到全台网。
1)分布式IP存储设计
传统广电生产系统的存储采用FC+IP的双网架构,很重要的原因是带宽、延迟和抖动等方面的QoS(服务水平保障)要求[1]。项目组通过联合实验室测试验证了分布式IP集群存储可以满足业务要求。因此,系统整体存储架构采用在线、归档一体化设计,通过分级存储方式实现对媒体文件以及其他非媒体文件的管理,能在系统生命周期的各个阶段实现动态扩展和均衡。根据业务需求,存储系统需要支持全媒体汇聚、内容交换、融合生产、发布,并支持在线和归档需求。媒体数据中心存储业务类型分为在线存储、归档存储和应急存储三类。逻辑上将在线存储和归档存储融设计为一套存储系统,即在线/归档存储,一共包含22个P节点(Performance node)和7个C节点(Capacity node),统一对外提供服务,存储内部采用存储分层的办法,实现素材在归档存储空间(7个C节点)和在线存储空间(22个P节点)之间的数据迁移。剩余的3个C节点存储组成一套应急存储,用于支撑系统最小规模业务数据量(一期设计支持20个高清站点的在线新闻制作)。
分布式IP集群存储支持扩容至40 Pbyte,随着存储节点的增加,容量和带宽均呈线性增长。在线存储(2个子域)上可以同时损坏的节点数或硬盘数量为4个。归档存储域上可以同时损坏的节点数或硬盘数量为2个。应急存储上可以损坏的节点数为1个,可以同时损坏的硬盘数为2个。当主存储不可用的情况下,切换至3节点的应急存储,保障核心业务不中断。
2)计算资源设计
根据业务需求,融合新闻中心计算资源总计需要6类共310台服务器资源,其中290台通过服务器虚拟化提供,7%的计算资源采用物理服务器提供,例如演播室类服务器所在网络比较独立,安全性和松耦合要求较强。SDI收录类服务器因专业设备(板卡等)无法通过服务器虚拟化提供。D类视频渲染类服务器还涉及GPU虚拟化,主要采用GPU直通共享模式。
计算资源虚拟化部分根据业务需求和安全等级划分3个区域:MDC服务器虚拟化、DMZ区服务器虚拟化、流媒体编辑桌面虚拟化。3个MDC区刀箱中,包含全宽显卡刀片10块,每个刀片有显卡2张,用于合成虚拟机的渲染使用。通过外挂2台IP SAN存储作为虚拟化共享存储,用来存放虚拟服务器的OS、数据库实例卷、索引文件卷、IP收录缓存卷。2台虚拟化共享存储实现负载均衡、互为主备,通过同步远程复制功能,保持数据同步。MDC区虚拟化平台满足250台服务器的虚拟化。
DMZ区虚拟化平台和桌面虚拟化分别采用计算+存储一体机刀框。所用刀片既提供计算资源,又提供虚拟化共享存储。通过分布式存储系统将刀片自带SAS硬盘做成存储池,为虚拟机或虚拟桌面提供OS存储。DMZ区虚拟化平台满足80台服务器的虚拟化。桌面虚拟化支持200个桌面的虚拟化。
3)网络及安全设计
融合新闻中心网络拓扑设计如图1所示。
图1 融合新闻中心网络拓扑图
媒体数据中心采用分布式数据中心的模式,即目前融合新闻中心的媒体数据中心和未来建设的媒体数据中心在不同的物理位置,但在逻辑上是同一个媒体数据中心。媒体数据中心部署1对堆叠数据中心交换机,虚拟化资源池、服务服务器资源池、分布式存储资源和图文包装系统均接入数据中心交换机。部署2套互为主备应用负载均衡器,实现业务系统的负载均衡。部署1对数据中心防火墙,用于外部访问的安全隔离。
终端接入区包括专用生产终端、生产办公一体化终端、在线包装终端、离线包装终端。专用生产终端指高码编辑工作站、高码审片工作站、配音工作站,这部分终端直通数据中心访问业务,不能访问互联网和办公网;生产办公一体化终端指低码编辑工作站、流媒体编辑工作站,这部分终端需要访问互联网和办公网,访问生产业务必须经过数据中心防火墙。在线包装终端不能访问互联网和办公网;离线包装终端能够访问互联网和办公网,访问生产业务必须经过数据中心防火墙。
外部安全交换区是互联网、集团下属新媒体网络接入电视生产网的中转交换区域。融合新闻中心各业务系统需要和互联网、集团下属新媒体网络进行业务交互的,在外部交换区实施部署相关安全措施。
办公边界安全交换区是办公网络接入电视生产网的中转交换区。融合新闻中心各业务系统需要和办公网络进行业务交互的,在外部交换区实施部署相关安全措施。
2.2 平台层设计
融合新闻中心平台层为上层业务系统提供媒体处理服务、业务支撑服务、全媒体内容库服务、数据库与中间件服务。
1)媒体处理服务
媒体处理服务提供对媒体文件的内容处理的公共服务,供上层业务系统调用。可支持对各种媒体文件处理:渲染服务、技审服务、转码服务、迁移分发服务、语音转文本服务、流媒体服务。各类媒体处理服务器采用集群模式,由任务管理器统一调度。集群内包含多台相同功能的媒体处理服务器对同一任务分片并行处理或多任务并行处理,既能提高业务的处理性能,又能实现业务高可用。
2)业务支撑服务
可以提供流程管理、安全认证、协同工作等基础公共服务。系统需提供统一的接入技术协议标准,具备系统应用服务统一管理能力和调度能力。主要包括:统一认证/登录服务、统一时钟服务、访问控制服务、工作流引擎服务、消息服务、统一代码应用。
3)全媒体内容库服务
全媒体内容库服务实现元数据管理、空间管理、内容检索、内容分布式管理等功能,包括以下模块:内容汇聚、内容组织、内容处理、内容检索呈现。全媒体内容库汇聚内容包括视频网站、合作媒体、社交网络、用户分享、制作网稿件、制作网素材和节目以及收录素材等,包含视频、音频、图片、文字、Flash等多种类型。内容库的视频文件经过智能语音识别、转场识别等多种智能处理引擎,自动生成素材相关的元数据信息。所有资源汇聚后分类展现,统一搜索,自动汇聚元数据资源,增加标签功能需求。
4)数据库与中间件服务
融合新闻中心项目将数据库与中间件设计成一个公共服务平台,整合数据库和中间件需求,实现统一数据库和中间件平台,满足上层业务系统的需求。数据库平台采用主、备、第三备多层防护架构,实现数据库的高可用。同时使用统一数据库平台为不同的上层业务提供数据库调用服务。数据库中间件实现的3层架构,做到系统主体业务及数据体系和应用系统的框架无关性,系统灵活构成3层C/S结构,或B/S结构,最大程度减轻用户数据访问对系统的维护负担,提高系统访问安全性和对具体业务的支持能力。
2.3 业务层部署设计
融合新闻中心业务层包括全媒体汇聚平台、融合生产平台、全媒体发布与互动平台、新闻指挥与运作平台。上层业务层依托MDC基础设施层和平台层为最终用户提供服务。业务层部署设计主要如下:
1)服务器部署方式
虚拟化服务器部署:除演播室业务和SDI收录业务外,所有业务均部署在虚拟化服务器上,包括IP收录业务、融合生产业务、新媒体发布与互动业务、新闻指挥与运作业务、DMZ区接口业务、后台管理业务。
物理服务器部署:演播室业务、SDI收录业务。
2)高可用部署
负载均衡方式:所有B/S类业务,包括文稿、新闻指挥、全媒体发布等均采用多个资源池由负载均衡器调度的方式部署,其中任何一个资源发生故障不影响整体业务的运行。
集群方式:媒体处理业务如合成、转码、迁移,流媒体等业务采用集群方式部署,多个资源池由MPC统一调度管理,实现在任何一个资源不可用的情况下,可以自动调度其他资源。
主备热备方式:播出服务器、播出控制工作站等业务采用主备热备的方式部署,当主业务出现故障时,自动切换至备业务。
3)极端情况下的业务可持续性设计——编辑工作站分布式备份
在MDC存储、计算资源、网络均不可用的极端情况下,如何仅仅利用编辑工作站完成新闻制作,是融合新闻中心业务部署的关键点。融合新闻中心采用编辑工作站分布式备份的方式实现极端情况下的新闻制作和播出业务。在日常新闻制作过程中,将各个制作环节的数据如上载、配音、粗编、精编、审片的数据自动备份到预定的编辑工作站的本地硬盘上。当新闻制作模块因发生极端故障不可用时,利用预定备份工作站的备份数据,启用本地编辑、本地合成、本地审片模式,完成新闻制作。新闻制作完成后将成品节目下载到蓝光盘,并将蓝光盘送演播室播出。
2.4 基于云架构的媒体数据中心实现
传统全台网各业务系统采用烟囱式的建设,形成各自独立的网络孤岛,造成资源不能有效整合和共享,系统扩展性差。基于云架构的媒体数据中心实现资源的整合和系统的平台化,有利于提高资源利用率、降低成本、提高系统部署敏捷性[3]。
融合新闻中心私有云架构如图2所示,包括IaaS层、PaaS层、SaaS层和云管理平台。融合媒体数据中心采用32个节点的IP分布式存储,总容量1.5 Pbyte;400个服务器虚机(总计 2 000 个VCPU、3.5 Tbyte VMemory、100 Tbyte VStore、80个VGPU),实现90%后台应用服务器计算资源虚拟化;前端支持100个高码高清站点、100个代理高清编辑站点,以及100个桌面虚拟化工作站对生产域提供上网和办公业务,对办公域提供流媒体简编业务。
图2 融合新闻中心私有云架构
深圳广电融合新闻中心全媒体云平台是在全媒体汇聚、共平台生产、多渠道发布的一体化业务基础上,集合全媒体采、编、播、存、管的所有环节,提供一个长期不间断运行、高可靠性、高处理能力、可扩展性强的多业务支撑平台。融合媒体数据中心是业务支撑系统的基础,MDC按照分布式架构设计,本次完成第一个节点,随着业务的发展建设后续节点。
3.1 私有云和公有云
深圳广电融合新闻中心项目(一期)多媒体云平台是一个私有云平台。随着未来高清业务发展,需要更多存储,现有资源池即使不断扩容,但是维护海量存储资源池和同样数量级灾备系统的投资非常大。未来可以考虑通过低廉的公有云租用减少人力和设备支出,例如IP收录、舆情监控、全媒体汇聚等业务可以向公有云扩展延伸。同时,对于具有公众访问意义的内容可以扩展到公有云上,为用户快速搜索、访问和视频资源挖掘提供便利。
3.2 全台网的云平台演进
随着媒体云架构成功应用于融合新闻中心项目,深圳广电后续将其逐步应用于全台网其他新闻栏目、电视节目以及离线制作类节目,甚至是广播频率等,同时考虑到各业务板块的独立性,需要在一体化的计算资源池、存储资源池上分业务独立部署,同时保持隔离和互通。现有的云计算vDC虚拟化数据中心技术已经能够支持这类需求。
3.3 媒体云的安全体系
现有媒体云设计了较为完善的冗余备份和安全防范体系,保障系统高可靠和端到端的安全,具有全面的多层次安全防护,无单一崩溃点,应急手段较为丰富,应急播出不对正常播出频道产生影响[5-7]。从上线运行情况来看,这些设计还要在实际运行中加以检验和完善;同时融合生产对于办公、互联网、生产网络一体化的要求越来越紧迫。
3.4 媒体云的运维与监控
媒体云管理平台需要有集中统一的系统监控体系,且能扩展升级到更高层次的IT服务管理或BSM业务服务管理体系。目前深圳广电融合媒体数据中心采用Fusion Sphere自带的Fusion Manager云管理软件,负责全系统云架构下硬件和软件资源的操作维护管理、用户业务的自动化运维;采用捷成世纪IT基础架构监控,实现对硬件等基础架构日常运行状态监控;采用索贝业务系统监控软件,对业务系统关键进程和性能等进行了相关监控。深圳广电未来将继续探索多平台监控向统一运维监控的演进。
[1] 朱文武.多媒体云计算[J].电子产品世界,2011,18(9):18-23.
[2] 周毅,杨淮,袁敏,等.广电云体系研究与实现[J].电视技术,2012,36(20):5-12.
[3] 芮浩.基于云架构的北京网络广播电视台建设[J].电视技术,2014,38(6):31-33.
[4] 王建新.凤凰卫视创新平台应对全媒体挑战[J].电视技术,2014,38(18):16-18.
[5] 周毅,杨淮,袁敏,等.广电云体系研究与实现[J].电视技术,2012,36(20):5-12.
[6] 董全武.电视工艺系统的全媒体云架构设计[J].现代电视技术,2014(9):67-69.
[7] 周毅,王力劭.“云计算”与多媒体综合业务制播平台[J].中国传媒科技,2011(6):24-31.
Design of Media Data Center Based on Cloud Architecture in Shenzhen Media Group
HU Tao
(ShenzhenMediaGroup,GuangdongShenzhen518026,China)
To meet omnimedia news production system’s need, the media data center in the Shenzhen media group is designed. Based on cloud computing technology and IP cluster storage technology, a private cloud platform is constructed for supporting production and broadcasting system. The solutions can realize the separation of general hardware and software, and improve the platform of news production effectiveness and sharing ability. Finally, the development of the media data center about the hybrid cloud, the whole network evolution, the security of the media cloud, unified maintenance and monitoring, etc, are discussed.
omnimedia; cloud computing; media data center
TN948
A
10.16280/j.videoe.2015.18.014
2015-06-10
【本文献信息】胡涛.基于云架构的深圳广电融合媒体数据中心设计[J].电视技术,2015,39(18).
胡 涛(1977— ),高级工程师,博士,主要研究方向为广电工程、全台网、新媒体运营与管理、媒体云、数据库与知识库等。
责任编辑:任健男