以投资效益为导向的网络投资模型研究

2019-12-10 03:59许建新王宝俊中讯邮电咨询设计院有限公司广东分公司广东广州510627
邮电设计技术 2019年11期
关键词:网络流量解构单价

许建新,董 冰,王宝俊(中讯邮电咨询设计院有限公司广东分公司,广东广州 510627)

1 研究背景

近几年的网络大建设和收入天花板的出现,使投资对收入的驱动越发减弱。如何能最大化发挥投资对收入增长的拉动作用,是移动网络规划和建设需重点关注的问题。

本文尝试在对收入解构、成本模块化和覆盖区域分类的基础上,将网络投资与对增量收入的拉动和存量收入的维持等进行分析建模,形成一套可直接反映投资效益的模型。

2 用户收入解构

2.1 用户情况分析

2.1.1 用户分类

中国联通为了扭转弱势运营商的局面,以混合所有制改革试点为契机,加快业务模式创新优化改革。与互联网公司进行战略合作推出B2I 号卡产品,以此赢得差异化竞争优势,获取生存空间。

B2I 产品受到年轻用户的青睐,发展迅速。但由于B2I 产品普遍资费较低且多为重流量用户,随着用户规模的扩大,网络单价流量也将快速拉低。在对基站投资效益测算时,原有的收入预测方法无法适应当前实际情况,采用用户一刀切的方法,容易造成收入预测偏高,从而造成投资回收期测算失真。

基于此,可依据用户建档时间进行用户划分,即将建档时间为当年的用户定义为增量用户,其余为存量用户。

2.1.2 存量/增量用户消费行为

通过对不同类型的用户账单进行数据挖掘分析,构建用户画像模型及其网络行为特征,以网络流量单价为着力点进行深入研究,精确解构基站出账收入,为后续运营发展提供有力的数据支撑。

图1为南方联通部分地(市)的用户消费行为对比图,从图1 可以看出,增量用户人均出账收入(ARPU)普遍低于存量用户,而人均月消耗流量(DOU)则显著高于存量用户,且各地(市)之间亦存在较大差异。

图1 部分地(市)用户ARPU值和DOU值

2.1.3 增量用户发展情况

中国联通通过与腾讯、阿里巴巴等为代表的互联网企业进行优势互补战略合作,推出了一系列资费低廉的高流量号卡产品,由此吸引了一大批年轻人入网,尤其是校园、工业园和厂园等区域,为中国联通4G用户规模的告诉增长做出了巨大贡献。

提取南方联通部分地(市)用户账单进行大数据分析,增量用户数/收入/数据流量占比如图2 所示,可以发现,用户数占比略高于收入占比,说明增量用户ARPU 值较低,而流量占比则显著高于用户数占比,从侧面验证了增量用户的高流量特性。

图2 某地(市)增量用户占比图

2.2 基站分类

为了与增量/存量用户形成匹配对应关系,以及为后续网络建设提供精确的数据指导,可依据基站建设年份的不同,将当年建设基站定义为新建基站,往年建设基站定义为存量基站。

2.2.1 存量/新建基站

存量基站代表当前已经形成的网络规模,主要用以保障用户的基本通信需求,维系用户的正常使用;增量基站则用以完善广度覆盖和加强深度覆盖,意在大力度保障用户,不断提高的业务需求,并通过更高质量的网络来抢夺通信市场。

基站的建设年份不同会导致投资成本存在差异,同时对存量基站和新建基站的部署区域进行挖掘,更有利于后续的成本解构。

2.2.2 价值区域内外新建基站情况

以广东联通某部分地(市)为例,分析当年新建基站的分布可知,价值区域内的新建比例仍高于价值区域外,且不同地(市)间存在一定差异,说明投资比重依然侧重价值区域(见图3)。

图3 某地(市)新增基站价值区域占比图

2.3 基站级收入解构过程及结果

2.3.1 收入解构目的

明晰收入基本构成,细化增量、存量用户差异,通过对基站/用户进行多源多维度分析,建立相应的数学模型以评估投资效益,为后续网络建设提供精准的数据指导。

基站收入解构是一个多维度的网络建设后评估过程,与传统的基站收入估算相比涉及的因素多且复杂。以用户和基站角度为评价出发点,根据用户是否属于存量用户以及基站是否属于新建等因素考虑,借助大数据分析工具,结合多源多维度数据,对基站收入的基本构成进行解析,所涉及的关键模块如图4 所示。

图4 基站级收入解构框图

2.3.2 收入解构难点

以往对于现网基站收入的评估,一般将该地(市)的出账收入直接除以总基站数目,此时得到的基站收入实际上为统计状态下的平均值,而没有考虑不同基站因为所处场景及资源禀赋等因素带来的差异。之所以无法进一步细化,一定程度上在于数据采集等网络运营管理系统的发展跟不上网络建设的步伐,随着增量市场的逐步萎缩,高效益精细化投资显得尤为重要。

随着运维等数据采集系统的上线和大数据的发展,对于基站内用户使用网络流量的情况可进行监控和跟踪。借助用户详单,可计算得到每个用户在驻留基站使用的总流量情况。只需要知道流量价格,便可以得到基站出账收入。现有条件下,并无实际可用且切合实际的流量价格计算算法,这是收入解构过程中的一大难点。

2.3.3 流量价格测算

2.3.3.1 传统算法

目前针对流量单价的测算,不同分公司有不同的方法,较为普遍的方法是在扣除月租基础费和彩铃等增值费用后,依据话务量和数据流量的比例进行折算分摊计算。例如将通话时长按照50 kbit/s 进行折算,并依据该地(市)2G/3G 网络话务占比,对话务折算流量按比例分摊至2G/3G 网络,最后再汇总计算各地(市)流量单价。这种方法虽然较为简单,但无法反映真实的业务单价,且地(市)之间缺少应有的差异性,无法呈现数据流量价格随时间动态变化趋势。

2.3.3.2 多元线性回归算法

在用户账单中影响出账收入的最主要的因素是通话时长和总使用流量,而总使用流量按照网络可分为2G 网络流量、3G 网络流量和4G 网络流量。因此可将其和通话时长作为自变量实行基于多元线性回归的业务量单价预测,则第i个用户的回归模型可写为

式中:

Yi——第i个用户的当月出账收入

Xi,1——通话时长

Xi,2、Xi,3、Xi,4——2G、3G、4G网络流量

α——语音单价

β0——常数项

β1、β2及β3——对应网络的流量单价

εi——随机残差

由于用户使用套餐不同,对应的固定支出(如月租或来电显示等)也不同,而在预测网络建设投资回收期时一般按照业务量计算收益。为了弱化固定支出的影响,令β0始终为零,此时用户当月出账收入仅与业务量有关,且为线性叠加关系。残差εi服从均值为零的正态分布,且对于所有的应变量Yi具有相同方差。

在求解线性回归系数时,其基本原则在于使得经过线性回归后的应变量与原始数据之间的均方误差最小,即存在

采用最小二乘法可计算得到上述回归系数。

为了验证多元线性回归的准确性,采用归属地为某地(市)的B2I产品中的腾讯大王卡2017 年2 月账单作为测试对象,其主要原因在于腾讯大王卡计费简单。该卡接听免费,主叫0.1 元/min,腾讯系应用业务免流量费,省内套外流量在不足10 MB 时按0.1 元/MB收取,超过10 MB 则触发1 元日租包,即10~500 MB 免流量费,可叠加多个流量日租包。因此,可将语音通话费用直接去除,然后进行多元线性回归,可得回归模型为:

其中流量单位为GB。

事实上该卡套餐外收费流量最低为2 元/GB,且4G网络流量占比93.0%,人均使用流量为15.94 GB,流量费用为47.5元(含19元月租在内),可粗略计算得到套餐内4G 网络流量单价约为3.2 元/GB,与估计值1.5元/GB相差悬殊。

2.3.3.3 聚类最小二乘算法

多元线性回归算法输出效果受奇异点分布影响较大,对于4G 网络流量单价估计过低,难以反映真实情况。在此背景下,提出了一种基于历史趋势数据的最小二乘算法对各地(市)单月语音单价及流量单价进行联合估计。

根据中国联通现行套餐政策,老用户套餐保持不变,流量优惠基本只有新入网用户才能享受。另外语音单价总体上变化不大,半年之内保持平稳,而流量单价则每月都呈现出较大变化,尤其是高流量B2I 产品的推出。

基于上述假设针对单个地(市)可设语音单位为α min/s,2016年7月至2017年2月全网流量单价为βi分/MB(1 ≤i≤7),那么根据2016 年7 月该地(市)账单统计结果可得如下方程:

式中:

1) 浙江段“十三五”期计划建设三级航道整治工程,其中杭州段“四改三”34 km和二通道新开挖段26.4 km,航道整治后全线达到三级航道标准。

Y1——该地(市)2017 年7 月出账用户收入之和(min)

X1,1——通话时长之和(s)

X1,2——总使用流量之和(MB)。

同理可得2016 年8 月至2017 年2 月方程,最后得到的方程组如下:

将式(5)改写为矩阵方程可得:

式中:

Y及∅均为列向量Y=[Y1,Y2,…,Y7]T,∅=[α,β1,β2,…,β7]T,系数X为7行8列的矩阵,第1列为逐月通话时长[X1,1,X2,1,…,X7,1]T,而后7 列则为逐月数据总流量组成的对角阵

利用最小二乘算法求解矩阵方程(6),可得

式中:

X+——矩阵X的伪逆矩阵。

值得注意的是,上述方程组联合求解时有可能出现与实际值相差较大的情形,此时需要对用户按照人均流量、人均通话时长及出账收入等维度进一步做聚类分析,并将异常点剔除,而后对每一类用户单独求解,最后再对语音单价加权综合计算。

依据语音通话单价,可根据用户月度账单上的总出账收入和总通话时长计算得到相应的流量收入。通过求解方程,可知语音单价α,设Dn,1、Dn,2、Dn,3、Dn,4分别为第n个用户当月总通话时长及2G/3G/4G 网络使用流量,则第n个用户流量收入为:

对于用户而言,2G/3G/4G 网络流量单价并无差别,因此可利用上式计算得到的单用户流量收入及月度账单数据中的2G/3G/4G 网络流量进一步测算2G 网络流量收入。该用户2G/3G/4G网络出账收入分别为:

流量价格为所有用户单网络流量收入之和除以该地(市)单网络流量之和即可,汇总某地(市)所有出账用户,统计平均得2G/3G/4G网络业务单价:

根据上述过程,可分别对存量用户和增量用户进行数据流量测算,从而使得出账收入更加细化和精准化,作为后续收入解构的基础。

2.3.3.4 部分地(市)流量价格测算结果

采用聚类最小二乘算法对部分地(市)过去一年的业务量单价进行测算,可以看出,2G 网络流量单价最高,原因在于2G网络流量用户以2G终端为主,该部分用户所用套餐多为2G/3G 时代老套餐,套外流量最高可达0.3 元/MB,因此其流量单价最高。另一方面,2G 终端用户对于数据流量需求较小,而4G 终端用户4G 流量驻留比高达90%以上。说明2G 网络流量单价虽高,但受制于体量,对于全网数据流量单价影响有限。经济发达的地(市)的语音单价较低,原因在于该类地区3G/4G套餐比例较高,对应的优惠力度大,而经济欠发达地(市)则依旧存在不少2G套餐,且通话需求更为强烈。

存量用户数据流量单价显著高于增量用户,且4G网络流量单价总体上呈现出逐月下降趋势。说明随着“提速降费”政策的大力执行以及市场竞争的加剧,数据流量的资费下调得到了落实,为广大用户提供了实惠。另外2018 年1 月受春节因素影响,人均语音通话时长较平时显著提高,数据流量并未成比例上升,导致2018 年1 月出账收入增大,而语音单价则与往月持平,从而导致数据流量单价在2018 年1 月有所上涨,2018年2月开始出现回落。

2.3.4 基站级收入解构步骤

借助第2.3.3 条可计算得到各地(市)增量用户和存量用户的4G 网络数据流量单价,而4G 网络无法承载传统语音,且VoLTE 并未进入实质性商用过程,因此只需要将基站当月消耗流量乘以对应的单价即可得到出账收入(见图5)。

图5 基站出账收入结构

2.3.4.1 用户—基站使用流量映射表

在计算单个用户在各基站使用流量时,需要用到用户数据业务详单表、工参表和用户账单表。具体处理时,首先将4G 工参表与数据详单表通过关键字段EGCI即小区标识进行关联,可筛选出4G 网络基站,如图6所示。而后通过数据详单表与用户账单表借助用户编号这一唯一标识匹配,得到增量/存量用户在增量/新建基站每一次数据业务流量使用情况,将其汇总便可得到各用户在某基站月使用总流量,从而得到用户—基站使用流量映射表。

2.3.4.2 基站当月出账收入

图6 用户—基站使用流量各数据源关联图

依据存量/增量用户流量单价p1,4G/p2,4G,以及用户i在基站m使用流量Ti,m,可得该基站当月收入为:

图7给出了基站收入解构步骤。

图7 基站收入解构步骤图

2.3.5 基站级收入解构结果

以某地(市)为例,价值区域内/外单基站存量用户占比分别为74%和68%,区域外增量用户扩散显著。价值区域外新建基站增量用户单站使用流量最高,增量用户驻留基站数目(移动性)高于存量用户(见表1)。

表1 某地(市)价值区域内外单站收入解构典型值

3 成本解构

3.1 成本解构目的

分析基站成本组成、细化不同类型基站成本间的差异,通过参考往期工程造价和最新招标价格,对存量基站和新建基站的成本进行模块化分析,为构建网络投资效益匹配模型提供精准指导。

为便于效益评估,基站成本主要分为建设成本和运维成本2 个部分,其中建设成本主要包括基站设备天馈以及电源配套的投资,而运维成本则体现为租金和电费。成本解构的整体示意如图8所示。

图8 基站成本解构整体示意图

3.2 成本模块化

按照通用原则,从基站设备天馈、电源和配套3个维度,对建设成本进行模块化解构,整体示意图如图9所示。

图9 建设成本模块化整体示意图

3.3 基站成本模块化

基站成本主要包括主设备、天馈线、施工费和其他费用,其中设备成本区分主设备新建/扩容区域;以某地(市)为例,价值区域的基站综合造价为11.37 万元,外围区域的基站综合造价为10.73 万元。具体的模块化细分过程如图10所示。

3.4 电源配套成本模块化

通过细分电源的配电方式获取模块化的电源标准价,配套成本则根据机房和架设物的不同获取模块化的配套标准价;根据价值区域内外不同的电源和配套比例,对某地(市)历史数据进行汇总分析可知,价值区域的自建站点的电源综合造价为10.1 万元,外围区域的自建站点的基站综合造价为11.6 万元。电源配套的细分模块如表2所示。

图10 基站成本模块化示意图

表2 电源配套成本模块

3.5 运营成本模块化

根据中国联通自有产权站点的运营数据和铁塔产权的租金数据,对中国联通自有产权站点和铁塔产权站点进行分类测算;以某地(市)为例,自有产权站点为29%,铁塔产权站点为71%,则具体的价值区域内外运营成本如表3所示。

表3 运营成本模块

4 构建投资效益匹配模型

4.1 模型构建思路

通过对本地网现网数据进行分析,寻找投资与收入之间的关系拐点,其核心思想是“收入-成本>0”。

其中,从单站维度进行模型构建时,该站的收入需大于成本才能满足建设准入门槛;从区域维度考虑时,可选取一片区域(例如价值区域),对站点的收入/成本的值进行从大到小排序,然后分别对收入和成本进行累计求和,寻找收入与成本之间的关系拐点,当△(收入-成本)=0时,区域投资趋于饱和。

4.2 模型构建过程

通过收入和成本构建单站效益评估模型,并在单站的基础上构建区域效益评估模型(见图11)。

图11 区域效益评估模型

4.3 新建站点实际测算

以广东省某地(市)为例,当年建设站点中价值区域内站点比例为65%,建设完成后全网价值区域内站点比例将达到70%。

对当年建设站点的投资效益进行测算,全网共有63%的站点满足网络投资匹配模型,其中价值区域内的网络投资满足匹配模型的比例为73%,价值区域外的网络投资满足匹配模型的比例为41%。

针对不满足网络投资匹配模型的站点,需要重点关注投资精准性和低效益整治,尤其针对价值区域外不满足投资效益的站点,应尽量把控建设节奏,可结合市场承诺和投资回收期逐步提升覆盖效果。

4.4 新建站点区域效益评估

以广东省某地(市)为例,按照前述的用户解构分析,对2018 年价值区域进行投资效益测算,当站点建设比例达到88%时投资收益拐点出现(见图12)。

图12 某市价值区域站点投资效益评估

5 结束语

本研究与市场部门深入对接,从目前市场收入结构进行分析,对增量收入的构成和存量收入的构成进行解构,并对网络投资基于深度覆盖提升区域、广度覆盖扩展区域等进行分类,进而将网络投资与对增量收入的拉动和存量收入的维持等进行对接建模,形成测算模型,用于网络投资合理性的分析和后评价。

猜你喜欢
网络流量解构单价
基于多元高斯分布的网络流量异常识别方法
大数据驱动和分析的舰船通信网络流量智能估计
还原
解构“剧本杀”
如何求单价
嘟嘟熊家的百货商店(二十四)——单价是多少
算单价
于强 保持真实,从生活中解构设计之美
彭涛形而上的现世解构
AVB网络流量整形帧模型端到端延迟计算