农鑫
【摘 要】借助“一带一路”、“互联网+”的春风及建设中国—东盟信息港的浪潮,广西广电行业迎来了机遇与挑战。大数据、云计算技术,不仅促进了广电行业的自身发展,带动了广西广电融合媒体产业,同时也能为各级政企单位提供行业大数据云计算解决方案,助力广西东盟信息化及“一带一路”信息建设。
【关键词】大数据;云计算;广电;创新
【中图分类号】TP311.13;TN943.6【文献标识码】A【文章编号】1674-0688(2017)05-0061-03
1 大数据、云计算发展的背景
“大数据”第一次进行政府工作报告:2014年3月5日,李克强总理在第十二届人大会第二次会议上做政府工作报告指出:“要设立新兴产业创业创新平台,在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展。”“大数据”上升至国家战略:2015年12月16日,习近平主席在第二届世界互联网大会开幕式上发表主旨演讲时指出:“‘十三五时期,中国将大力实施网络强国战略、国家大数据战略、互联网+行动计划,发展积极向上的网络文化,拓展网络经济空间,促进互联网和经济社会融合发展。”2016年,“十三五”规划纲要中指出,实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。
广西“大数据”发展目标:中国—东盟信息港开放发展战略中提出:大力推进北斗导航、大数据、电子商务、互联网金融、智慧城市等新一代信息技术重点产业,加速形成以广西为支点,面向东盟、服务西南中南的通信网络体系和信息枢纽,建成中国—东盟“信息丝绸之路。
“一带一路”、“互联网+”及中国—东盟信息港的建设,都把大力发展大数据云计算作为新的经济增长的动能。构建中国—东盟信息港人文交流平台,给广电行业带来了机遇与挑战。熟练地运用大数据云计算技术,成为广电行业从业人员必备的技能。
2 大数据在广电行业自身的应用创新
2.1 大数据发展的必要性
最早基于C/S(Client/Server)、B/S(Browser/Server)架构的传统数据库系统,处理的都是能用二維表来逻辑表达结构化数据。随着互联网及信息化技术的发展,产生了海量的办公文档、文本、图片、XML、HTML、各类报表、图像和音频、视频信息数据。这些数据格式不统一,我们称之为非结构化数据。统计技术的发展,使全样本数据统计较随机分析法(抽样调查)能更全面、客观地反映问题。海量、来源广泛、格式多样的数据的采集、存储、管理、分析形成了新一代信息技术即大数据技术。
大数据分析系统一般包括大数据采集与预处理、大数据存储与管理、大数据计算模式与系统、大数据分析挖掘系统几个过程。基于分布式系统基础架构,大数据处理存储和计算节点均采用分布式处理。存储资源节点通常是成百上千的服务器集群,每台服务器使用通用硬件设备,可按需扩展,价格低廉。而独立算节点,实现了高性能并行数据处理服务,保障数据处理的效率。
2.2 广西广电大数据平台助力用户行为大数据分析
2.2.1 广西广电网络用户量大,业务多
根据广西广播电视信息网络股份有限公司发布的《2017年第一季度经营数据披露公告》,公司现有有线电视用户数量为522.26万户,其是高清交互电视用户数量为259.06万户。宽带业务(居民用户数)用户数量为158.58万户。拥有大规模有线电视用户、高清交互用户、宽带用户的广西广电网络用户分析系统,大数据平台整体划分为Hadoop平台、大数据应用、平台管理、调度管理四大组成部分进行用户收视行为分析、收视广告精准投放、用户上网行为分析等。
2.2.2 打破数据壁垒,跨系统数据融合
广西广电网络用户分析系统需要展现终端实时抓取的用户行为如直播、点播、时移、回看、增值业务用户数,而这些数据在不同职能部门的系统中,比如业务支撑系统(BOSS)、资产资源管理系统(GIS)、视频点播系统(VOD)、客户服务(CRM)、财务(NC)。因此,信息孤岛打通,需要将来自不同数据集的数据收集、整理、清洗、转换后,将数据加载到数据集市中。
2.2.3 物联网及公共服务的需求,需要大数据平台,采集分析多源数据
随着广电网络用户功能扩充,数据的采集需从机顶盒、内置机顶盒电视一体机扩充至机顶盒可物联应用设备(如空气、温度采集、可穿戴设备、家居摄像头及其他智能家居设备)。而这些设备的采集规则及格式均不同。
“十三五”规划纲要中指出:全面推进重点领域大数据的高效采集、有效整合,深化政府数据和社会数据关联分析、融合利用,提高宏观调控、市场监管、社会治理和公共服务的精准性和有效性。广西广电网络作为提供公共服务的企业,能提供数据统一共享交换平台,实现了跨部门数据资源的共享共用,这得益于广西广电网络自主研发能力及数据技术的发展。
2.2.4 用户画像提升大数据分析的维度
根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型,用户画像可洞察需求预测趋势、对分类用户进行精准营销推送及个性化定制服务。用户画像建立的过程就是不断地生成新的标签的过程,数据挖掘中实现用户多维度聚合析和关联标签化。生成的标签一般分为4种:{1}用户基本属性标签(从不同的基本信息系统关联得到,这些是静态生成的),比如性别、年龄、职业、学历、籍贯、婚姻、收入、房产等信息。{2}通过基础信息按照一定的算法、规则推算出的标签,比如根据出生日期推算出星座、生肖、性格等。{3}根据用户行为来判读推理出标签,例如用户购买了奢侈用品,就会被贴上高收入、高端等标签。{4}数据挖掘建模计算出相应标签,例如多个综合指标对用户进行聚类分析,划分不同用户群体;流失预测模型输出流失概率得分,根据流失概率得分的高低,划分为高流失用户、中流失用户、低流失用户、不流失用户等标签。
3 云计算助力广电行业,服务各行各业
云计算是通过互联网或专有网络配置的计算资源(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。云计算具有快速、弹性、持续和自动化的扩展性,以及开放的接口、稳定、安全、可靠等特点。云计算提供3个层次的服务:基础设施即服务(IaaS)、平台即服务(PaaS)及软件即服务(SaaS)。
3.1 发挥广电网络优势,构建广电混合云,为政企提供高效私属云平台服务
广西广电网络拥有“区—市—县—乡—村”五级贯通的网络结构及服务体系,目前网络及服务覆盖广西1 126个乡镇和1万多个行政村。构建广西广电混合云平台可为广西区内政企(政务、金融、教育医疗、工业、大中型企业等)提供快速部署、按需扩展的私有云定制服务。“广电私有/专属云”模式,较以往集团行业数据中心方案,省去了各级数据中心硬件采购、部属时间,使扩容变得更高效、便捷。各级数据中心之间,运用广电专有线可高速互联,安全级别高。同时,在各数据分中心可任意划分不同的VLAN,实现分级分域数据及安全管理,实现业务及服务差异化。数据中心统一云化,有利于各级部门按需划拨存储、计算、网络资源,统一进行运维管理,降低了运营成本。数据中心统一云化,有利于大数据分析,缩短了数据读取时间,提升了运算速度。
3.2 广西广电混合云平台公有云平台应用,助力中小企业实现“互联网+”
广电公有云平台可实现多租户管理,针对中小企业可按需申请,弹性扩容,申请公有云平台工具、大数据、安全及存储、计算、网络资源。中小企业通过购买服务方式,省去建立数据机房的空间及时间成本,同时还能以低廉的价格使用到专业行业工具。例如,互联网+广电小微企业等,可以在云平台上购买存储、网络、计算資源,同时还可以使用具有云编辑、云合成和云渲染功能的专业视频工具。有利于本土原创音乐、视频、直播等互联网企业快速搭建运营平台,促进本土新兴广电企业的发展。新兴的互联网+企业还包括电子商务企业、手机APP应用服务提供商、游戏机构、创客创业基地等。
3.3 广西广电混合云平台架构与第三方SAAS层软件商合作
云计算平台提供开放接口,可以和第三方软件产品集成、兼容,便于构建产业联盟,共同针对行业需求进行定制化开发,发挥广电运营商在网络、存储、计算资源中的优势。
3.4 基于云平台的机顶盒应用发展
电视机顶盒的用户端通常是以家庭为单位的,作为人机交互界面的EPG(Electronic Program Guide,电视开机指南界面)平台,加入智能家居等物联网设备后,备受家庭用户的青睐。目前,EPG平台可实现海量视频点播、广电机顶盒电子商务平台交易、个性化开机界面定制等功能。应用了云计算大数据技术后,支撑“EPG平台”+的“PaaS+SaaS②云架构”,可实现“平台+物联网+大数据分析”应用定制开发。手机、摄像头及其他智能家居设备作为EPG大数据平台的采集端,可在云平台上实现信息汇聚、信息共享及大数据分析。
目前,较为成功的EPG云平台应用就是云视频会议系统。广西广电网络具有网络优势,能实现低带宽下稳定、清晰的跨区域的视频、语音通信,投资省、部署快、安装调试简单。全区“区—市—县—乡—村”五级云视频会议模式还可应用于教育、医疗、法律援助、社会综合治理等领域。
4 综述
广西广电网络运用大数据、云计算技术致力发展“互联网+广电”,从技术创新、应用创新的角度在中国—东盟信息港及“一带一路”信息化道路上谋求发展。大数据、云计算技术既要支撑广电自身企业运营,又要开放标准化的平台与应用服务商合作,创新技术服务模式,增强企业竞争力,服务政府及大中小型企业。
参 考 文 献
[1]涂钧,刘波,杨林.支撑精确管理的有线电视综合数据平台的开发和应用[J].有线电视技术,2016(8).
[2]小蚊子数据分析.用户画像就是贴标签[EB/OL].http://
www.shichangbu.com/article-26318-1.html,2016-
01-28.
[3]牛树海.“互联网+”开放合作[M].北京:中国人事出版社,2017.
[4]王秀琼,韩淼.李克强的“大数据观”[EB/OL].http://news.xinhuanet.com/photo/2015-02/17/c_127506615.htm,2015-02-17.
[5]维克托迈尔·舍恩伯格,肯尼斯·库克耶.大数据时代[M].杭州:浙江人民出版社,2012.
[6]怀特.Hadoop权威指南(修订版)[M].第3版.南京:东南大学出版社,2014.
[责任编辑:钟声贤]