张 丁
(中国联合网络通信有限公司 广东省分公司,广东 广州 510000)
电信运营商大数据变现关键技术环节研究
张丁
(中国联合网络通信有限公司 广东省分公司,广东 广州 510000)
目前,数据资产对各个行业的商业价值愈发重要,引发了社会各产业的产业改革。然而,我国的电信运营商在大数据资源上具有较好的发展优势,若关键技术变革得当,将成为国内首个通过大数据应用改革成功的产业。文章对电信运营商在进行大数据变现的关键技术环节进行了分析。
电信运营商;大数据变现;关键技术环节
在大数据时代的环境下,全球的各行各业均在向大数据应用的方向发展,而作为拥有无数用户资料和通信的庞大数据资源库为依托的电信运营商,在这一方面已经具有得天独厚的优势。合理应用并做好关键技术的处理工作,会在很大程度上提高电信运营商在市场上的影响力。电信运营商若能够将自身具有的庞大数据充分发挥作用,一定能够对电信运营商带来不可估量的商业价值。
1.1 特征和含义
大数据指的是从众多渠道所收集起来的庞大数据信息,其具有极强的时效性。大数据所包含的数据量非常庞大,计量单位最低从PB开始(1PB=1 000TB),同时具有较高的多样性,其内容可包含音频、图片等各种用户信息,这也给相关行业对大数据的变现增加了难度,往往大数据所包含的内容非常多,在有效数据的收集方面极为困难。把如此庞大的信息资源进行整合,将其中有效的资料提取出来,是行业最大程度发挥大数据资源作用的关键所在。
1.2 分析方法
大数据的分析方法对于该方面的应用价值起到非常重要的影响,往往起到了决定数据是否存在利用价值的作用。常见的分析方法有4种,第一种是可视化分析法,这种方法能够非常显著地突出大数据的实用价值,是最能够让客户接受相关资料的方法;第二种是数据探讨法,这种方法的主要分析原理就是通过对数据整合,是该方面理论核心的最佳方法;第三种是预测法,在所有大数据分析方法中这种方法是整个应用领域中最为有效的分析方法,通过搭建分析系统,在把数据整合到系统中,从而达到对数据的预测作用。第四种是语义引擎法,由于大数据的多样在运用中需要通过这种方法来达到提料数据、进行系统整合的目的。然而这一方法需要较为先进的人工智能技术才能得以实现。总而言之,若要实现大数据的应用就必须通过各种方法来保证数据的质量与价值,具体运营情况如图1所示。
图1 大数据运营图
2.1 收集与整合
通常情况下的电信经营模式都是以处理用户的费用清单、业务订购等为主要经营方面。然后把大批与客户相关文件数据集中载入到数据抽取、转换、装载(Extract-Transform-Load,ETL)数据仓库,这种方法完全不符合整合接入毫秒级的网络侧海量信令与位置数据的要求。因此,必须采用更为先进的技术,即以Hadoop为核心搭建两个端口间互相传输数据的管理平台。可以采用X 86平台,两个端口间互相传输数据从而达到支撑ETL和主库外汇总计算的目的,另外应对搭建的Hadoop平台进行整合优化,从而使数据能够快速增长。
在以往BSS,CRM和ERP等采集数据平台的基础上,实现对OMC/设备、参数等数据进行集中采集与管理,利用Gn口收集数据相关整合成xDR,另外对音频、位置采用A口或MC口信令得以实现。
2.2 存储与处理
在以往使用的电信架构中,业务管理点(Service Management Point,SMP)数据库与大规模并行处理系统(Massively Parallel Processing,MPP)数据库等电信构架具有时效高、成本低、使用性能高等许多优点,其能够满足多数业务的需求。然而与数据模型相关业务不可直接应对非结构化数据的问题导致这些构架不适合在大数据环境使用。另外,SMP数据库需要较高的成本与内有良好的线性扩展能力等原因已经很少使用数据仓库中。MPP数据库则可与Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)混搭组合使用,通过非关系数据编程使用灵活与具有较强的分布式系统扩展的特点来掩盖成本造价高的不足,进行混合组合搭建。而NoSQL数据库则直接放弃了与数据库中一些繁琐的关联步骤、事务处理等类似的功能,只保留了简便的键值来进行对数据的存储工作,从而达到扩展与高数据处理的性能。通过加入NoSQL技术,将所有文字类数据全部收集在RDBS里,用于阅读的数据统一归类到NoSQL数据库内,而总数据库主要工作室写操作,其他数据库用于读操作,采用写读分开管理的方式能够有效地提高大数据处理能力。
2.3 实时数据处理
在进行实时数据处理过程中所采用的互联网营销特别强调因先进行分析用户的网络行为数据而后进行相关营销。相关部门首先在收集、保存和处理环节上通过采用分布式技术降低时延外,另外还引入相关网络技术与大容量数据库,从而达到加快处理速度与缓存速度的目的。S to RM是一种简单、高效、可靠的开源分布式实时计算系统,能够进行大量数据的出料。Spark Streaming是在Spark的基础上研发的开源流处理器,通过采用批量管理的方式进行一部分数据的处理。以上两种计算处理技术能用在营销、推广、服务以及其他相关管理方面。内存数据库主要工作原理是通过把数据载入到RAM中完成计算与查询,全面发挥数据库的CPU性能,让客户使用起来更方便。
目前,我国使用手机的人数已超过12亿,另外有3亿的人在使用不可移动电话,2亿人在使用宽带。科学技术的不断进步,进一步推进了互联网的发展,这也使得电信运营商网络数据的不断增加。并且经过多年的累积,其信息、资料的价值得到提高,比移动互联网的数据、信息更具有存在意义。在信息化发达的今天,大量的网络信息、资料是运营商的巨大财富。与其他网络相比,电信运营商大数据运用的优势较大。例如:人们在办理电信网络时,需保留其身份信息,而人们在使用电信网络时,其虚拟信息会通过智能化管道得以保存下来。这就使得运营商在获取人们真实的信息、资料的同时,还获有其虚拟资料。运营商通过这些数据资料,能充分了解人们的网络需求,从而设置出人们需要的电信互联网功能。
电信运营商的大数据运用优点主要体现在以下几个方面:(1)获取的资料全面具体。使用电信网络的人非常多,这就确保了数据、资料的广阔与多样。电信运营商不仅拥有人们的真实资料、信息、数据,并且能掌握人们的使用情况、使用地点等信息。其数据十分庞大。(2)获取的资料、数据可多次使用。网络通信的好处是能长久地保存数据,并在以后需要的时候再拿出来使用。(3)运营商对数据的运用准确到位。运营商通过这些数据资料,能充分了解人们的网络需求,从而设置出人们需要的电信互联网功能。
随着时代的不断发展,大数据应用必将成为时代发展的主流,电信运营商对于大数据运用具有先天优势,对于电信运营商而言,这必将是一个无比重要的机会,能够掀起电信行业发展的又一波高潮。若电信运营商能够首先把握机会,完成对大数据的相关改革,就有可能在市场竞争中起到主导作用。通过大数据来对电信运营商进行相关改革建设已经成为未来其发展创新的主要手段。另外,对于大数据的相关处理是完成大数据变现的重中之重,在进行资产变现过程之中仍有许多问题需要解决。比如保障数据安全、用户资料加密识别等问题。当前仍然没有一项单独的技术能够满足电信运营商完成所有数据的整合、处理与存储等相关需求。然而将Hadoop,MPP,流计算,NoSQL和内存数据库等许多先进技术在大数据环境下相结合从而达到对大数据的整理是当前主要的应用手段,文章针对这些方面作出了合理介绍,以提供参考。
[1]黄勇军,冯明,丁圣勇,等,电信运营商大数据发展策略探讨[J].电信科学,2013(23):6-11.
[2]王珊,王会举,覃雄派,等.架构大数据:挑战、现状与展望[J].计算机学报,2011(10):46-48.
[3]沈拓.电信运营商的互联网战略[J]中国新通信,2011(16):35-40.
Study on the key technology segment of telecom operators' big data realization
Zhang Ding
(Guangdong Branch of China United Network Communications Corporation, Guangzhou 510000, China)
At present, the commercial value of data assets is becoming increasingly important to various industries, which has led to the industrial reform of various social industries. However, China's telecom operators have better development advantage in large data resources, if the key technology changes properly, it will be the frst sucessful domestic industry through reforming big data application. The key technology segment of big data realization of telecom operators is analyzed in this paper.
telecom operators; big data realization; key technology segment
张丁(1977— ),男,山东菏泽,硕士,中级工程师;研究方向:通信,大数据。