王晓军
在2019年的下半年,中国移动将把5G带到公众面前。5G带来的是什么?相比4G而言,5G大大提升了用户体验。同时也将会提升连接数据的密度,以及峰值的速率移动性。在5G的环境下,人们的日常生活也将会有更大的改善。
在3G时代,人们利用3G在互联网中浏览文本信息和图片信息。到了4G时代人,们已经开始大量地浏览视频,并进行视频的通信。而在5G时代,人们就拥有了更大的带宽和更高的流量,可以利用5G从事更多的事情,比如说VR或者远程的教育、医疗等。
5G以成为当今技术发展的热点之一,而5G会促进物联网等技术不断落地和实施。根据2018年3月份的GSMA数据,中国现有的M2M节点数约有2.49亿,预测到2025年,全球的M2M的节点将达到250亿。
目前,中国的M2M物联网终端数量已占全球的45%,我们发现当今的物联网还是处于起步初期,但是在未来物联网终端的量级规模,将超过现有的移动通信用户数量。
人们一直都在谈论大数据的“大”,但是大数据在增大的同时,也给我们带来很多新的挑战。5G是一个高带宽、高流量的应用场景,它给用户带来的是更快的速度和更新的业务体验,以及更大的业务承载量。从运营的角度来看,5G也是一把双刃剑。因为随着数据量不断增加,处理数据的速度也要加快,对敏捷性和延迟的要求也随之提高。
以现在的大数据技术可以很好地解决数据在开放环境下的存取和弹性等问题。但是在某些特定的场景下,利用大数据开源技术可能也无法解决。以电信运营商领域举例,在计费场景下,当数据量增加时我们利用大数据技术处理计费话单会遇到更多新的挑战。
我们在某个运营商的全国集中计费系统上看到,该运营商在承载了1.2亿用户时,每天的日话单文件数量达到了64亿个之多。我们看到当系统繁忙时所处理的文件数量,已达到每秒9284个。在这种模式下面,每个计费话单文件只有几K或者几十K,而运营商只能等128K的缓存存满后,再写到数据磁盘中,但是在这种场景下应用无法接受等待的时间。所以我们考虑,如何在系统处理海量小文件时省略等待的时间。我们尝试将Hbase写入处理流程中,但是由于寫入的时长并不统一,导致我们的应用在运行时出现抖动。经过不断的技术研讨,同时结合思特奇多年研的发分布式内存数据库的相关技术,最终实现了海量小文件密集计算文件系统。
传统的磁盘阵烈不能解决快速扩展的问题,但是HDFS和Hbase可以解决文件存取工作,可是这两个系统无法处理整个计费处理过程中的关联关系。在进行计费批价账户处理时,我们需要知道应用是否对每一个计费文件都进行过处理,但是哪些应用处理过哪些文件,在后续的场景中应当利用什么应用继续进行处理?我们将这种关联关系定义在业务的原数据场景下,包括系统信息、文件信息、租户信息,用户关联关系信息等。当出现这种关联关系时,我们发现HDFS+Hbase无法建立。所以我们通过分布式的内存数据库将原数据进行管理,形成分布式文件系统,快速适应海量文件处理过程。
当写入Hbase时,会出现一到两毫秒的间隔。而我们的要求是在两秒钟内将一个话单文件写入到磁盘系统上中,同时完成对话单文件计费批价的处理过程,在这种情况下我们将分布式的内存数据库,以前端缓存的方式来提高文件写入效率。当出现前端海量应用并发时,前端应用可以随着业务处理压力的要求进行弹性伸缩。在这种情况下,一旦后端的原数据系统出现节点故障,前端应用具备不断重连的能力。
如何在大数据的环境下,更好地给客户推荐我们的业务?在运营商的场景中,运营商每年都会面临用户离网和推荐新业务的挑战。我们通过大数据和人工智能技术来构建智能策略推荐平台,该平台实现了对传统营销推荐的转化。在几年前,当用户收到的短信或网页弹出界面业务推荐时,后端的处理方式首先会锁定一个用户群,然后对该用户群的用户行为特征,以及相应的用户特点进行分析。通过分析我们得到一些数据,通过自己的经验总结出需要给用户推荐什么业务。但是这种推荐方式的实时性非常低,而且用户的感受度和转化率也非常低。
当我们用了人工智能和大数据技术以后,我们可以对运营商的现有用户的网络行为数据进行追踪,来进一步查询企业内部行为的相关信息。经过深度学习和自然语言对数据进行处理后,我们可以提取用户的兴趣点,并对相应的用户进行精细画像分析,同时结合沉淀的内容库和用户的营销策略进行实时的内容推送,在推送过程中结合算法匹配,组合“话术”来吸引用户对营销业务感兴趣。而且我们可以结合人工智能技术预测用户的渠道意向,引导用户到信任的渠道进行业务办理,因为运营商的业务有很多办理渠道,而这些渠道我们都可以通过人工智能技术,来预测用户的倾向性,制定最佳的引流策略。
(根据演讲内容整理,未经本人审核)