通信行为分析的大数据处理策略的研究

2020-07-27 14:56杨婧玮
博鳌观察 2020年4期
关键词:可视化流量用户

杨婧玮

内容摘要 随着互联网技术的深度发展,物联网及大数据技术随着“互联网+”的理念已经逐渐蔓延在人们生活的方方面面。可以利用大数据技术,将用户的通信行为进行识别和分析,将用户的行为习惯及变化规律进行研究,并针对性地满足用户的需求。文章对用户行为进行大数据技术层次的研究,有利于更好地掌握用户需求的变化趋势。

关键字 通信行为分析 大数据处理策略 用户需求

1 引言

当前,移动端设备已经成为人们生活的基本需求,随着“互联网+”概念的兴起,我国网民群体的规模变得越来越大,运营商需要对用户通信行为进行分析,并进行相应改革。为了减少在传统电信行业中对用户行为发掘过程的不稳定性及资源浪费,可以利用当下物联网大数据技术,对日益增长、数据庞大的用户进行行为习惯及需求的深度挖掘,以对用户展开个性化的服务。

2 大数据相关概念及相关技术简介

2.1 大數据概述

计算机互联网技术发展至今,已经拥有了海量的用户,越来越多的领域都依托于互联网技术而发展,这也导致了互联网拥有着海量的数据。这些数据中包含着各类价值,是一种虚拟资源,就如同石油和煤矿对人类的作用,对这些海量数据的开采也将为人类世界带来前所未有的便利和价值,为此大数据技术应运而生[1]。大数据技术将庞大且复杂的数据流进行挖掘和分析,并对这些数据中的规律进行深层探索,发掘出有效、准确、多样的用户信息。

2.2 大数据技术用户分析系统平台

大数据需要依托处理平台来进行数据处理,在用户通信分析上,可以使用Hadoop分布式系统。该系统自出现到现在十余年中经过不断地改进和完善,已经拥有了强大的功能,具有强大的生态,各级组件或者系统分工明确。Hadoop系统在开发方面并不需要按部就班地将底层细节进行大规模的投入研发,而是可以直接简化开发过程,先模块化底层细节,研究人员就可以将精力投入在上层开发上,大大提高了开发效率[2]。同时,在传统的分布式开发过程中由于容量庞大导致在数据运行方面发生存储器失效、网络连接中断、数据丢失等问题,而Hadoop系统则可以将一份数据存储在多个地方,称为“复制因子”,减小了故障发生率。Hadoop系统也可以通过叠加设备、扩展集群的方式提高系统的运算及存储性能,非常方便。

2.3 Hadoop平台的构成

Hadoop平台的构成较为复杂,具有资源管理系统、分布式文件系统、数据储藏系统、分布式列存数据库、分布式协作服务、数据同步工具等多系统或组件,其中最为关键的两个部分是分布式文件系统(HDFS)和分布式计算框架(MapReduce)。Hadoop框架最基础的就是HDFS,简单来说就是一类将平台所有文件进行存储的一类结构。而在数据的处理过程中则是依靠MapReduce来进行,该引擎是将map函数和reduce函数共同对由main函数输入的数据进行转换和缩小,最后通过main函数将处理之后的文件输出。其他的结构或者系统都各自在HDFS和MapReduce的基础上运行[3]。

3 对客户行为的分析要点

3.1 掌握客户的群体构成

不同阶层、年龄、性别、职业的客户之间有着不同的行为习惯和能力。例如,在消费方面,学生对书籍、文具等类型的商品购买率较高,而消费水平通常并不是很高,但是收入水平较高的高管就会对职场中对自己有利的商品或者办公用具有着较高水平的消费和购买率。所以,掌握用户群体有利于分析和判断他们在各方面的行为习惯,同时给予他们更智能便捷的服务。

3.2 记录顾客的使用地

商家通过对用户所在地进行法律要求范围内的定位,一般情况下会利用GPS或者基站等方式。定位功能主要在于当移动端使用者遇到了紧急情况但是却无法说清自己所处的位置的时候,方便援救者及时进行救援采取措施,另外,在用户的移动设备丢失之后,可以通过定位功能来找到设备所在位置。定位功能将分配信号的问题大大简化,实现了信号资源的合理分配。

3.3 描述用户使用习惯

用户在客户端访问互联网时,需要知道用户对某软件或应用的使用率,通过用户对某应用的使用习惯获取用户的爱好,或者根据用户访问互联网的时间段、地点等信息分析出用户的出入场所、爱好,根据这些分析推出一定的服务措施。例如,用户喜欢出入某书城或者图书馆,就可以针对此为该客户推荐书籍应用和小说服务。

4 基于大数据的用户行为分析探究

4.1 通信用户分析的大数据系统功能要求

在大数据分析平台上,采集收纳大量数据之后,平台系统要从IP、端口等方面将用户的通信行为进行统计,并且要能够还原及重组TCP、UDP等协议,并且平台需要有应对大量数据的能力,因为用户信息量大,实时产生的数据非常多,且类型复杂、结构不明确,所以要有快速处理能力。最后则是对用户通信行为的查找、统计和分析,将用户使用的网络协议、互联网使用的侧重点进行统计并分析其规律和习惯,对目标用户的通信行为信息进行查找,这样方便从用户的行为中理顺其网络关系。

4.2 大数据处理系统的框架

用户通信行为分析系统,就是将用户使用互联网所产生的流量信息进行探针式采集并分析,利用分析结果对用户对互联网的使用情况进行采集和监控。在其对数据的操作过程中,一般使用TCP/IP协议分析、Hadoop技术等手段,通过可视化系统呈现数据。

4.3 大数据处理系统的结构

首先要对数据进行高效地采集,可以利用各类服务反馈、服务情况等信息,建立高效的数据采集系统。采集数据之后,要经过互联网协议分析才可以进行真正的数据分析,因为互联网中存在很多交互协议,所以要进行解构重组和分析,建立TCP/IP的分析系统。当对互联网协议的分析结束后就可以建立筛选系统,将值得利用的信息进行分组,如使用手机的高峰段、用户浏览率较高的网站等,并将这些有用的信息存储在寄存器中,同时将这些数据进行统计,建立数据库系统。最后一项系统也是最为重要的系统,即数据分析报表系统,该系统可以将数据库中的信息分析并筛选,在用户的IP、账号、流量使用时间段方面将业务方面的流量和历史数据进行检测和检查,可以将现阶段的用户爱好和网络热点进行排序,提供报表。

4.4 可视化平台建设

可视化平台的建立是为了将用户的流量和位置趋势和轨迹进行直观的表达。在用户位置方面,为了可以更好地将用户的爱好和习惯进行精准的描绘,可视化平台将会根据用户的位置、时间点等数据,绘制出轨迹图,利用轨迹图可以更加方便地进行服务决策。例如,某健身应用在客户使用中将会发起询问位置的请求,然后就会调用其后台地图来记录用户锻炼或者跑步的路径。在用户的流量方面,利用大数据平台分析后将会利用可视化平台进行用户流量使用时的数据变化,绘制出与时间相关的趋势图,以及业务方面的流量使用情况图。一般情况下,对于流量的可视化可分为每日流量散点图、每小时流量环形图、月流量使用走势图,以方便分析用户的业务喜好。

5 结语

在此对大数据技术平台及大数据在分析用户通信行为方面进行了相关阐述。在移动互联网的快速发展中,为了应对不断增长的用户量及流量所带来的庞大数据,将结构复杂、类型多样、内容丰富的信息进行有效的分析处理,解决当下用户的实际需求,方便网络更好地提出服务措施,大数据技术系统将会被广泛地应用于对用户通信行为的分析中。随着大数据技术的进一步深入使用,人们的生活将会步入更加智能的时代,用户在大数据技术中将受益无穷。

【参考文献】

[1]于泽川.基于大数据的用户精准定位与行为分析[D].北京:北京邮电大学,2019.

[2]肖朔晨.基于多源数据的移动通信用户行为识别及个性化推荐研究[D].北京:北京邮电大学,2018.

[3]马冬旸.通信行为分析的大数据处理策略的研究[D].长春:吉林大学,2017.

猜你喜欢
可视化流量用户
基于CiteSpace的足三里穴研究可视化分析
冰墩墩背后的流量密码
基于Power BI的油田注水运行动态分析与可视化展示
张晓明:流量决定胜负!三大流量高地裂变无限可能!
寻找书业新流量
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
关注用户
关注用户
关注用户