基于灰色模型的端口短信预测和垃圾短信治理研究*

2021-05-28 05:07杨光永王雷曾剑秋
移动通信 2021年3期
关键词:点对点商业广告短信

杨光永,王雷,曾剑秋

(1.北京邮电大学经济管理学院,北京 100876;2.桂林电子科技大学商学院,广西 桂林 541004)

0 引言

端口短信是手机短信重要组成部分,在商业广告、通知提醒等场景应用广泛,近几年来,端口短信逐年上升并大大超过了点对点短信的数量。从12321垃圾短信举报平台公布的数据来看,端口类短信举报也大大超过了点对点短信举报,而在垃圾短信举报中,商业广告类短信占大多数,为此,加强端口类短信和商业广告类短信之间的研究对垃圾短信息治理有重要意义。

当前国外内对于垃圾短信治理研究多集中在事中或事后阶段,主要是技术上的关键词过滤、信息分类和法律规范处罚等手段[1-2],对事前的防范举措不多,缺乏前瞻性和预测性工作,垃圾短信治理策略不够完整,一定程度上影响了垃圾短信息治理的效果。通过借助合适的理论模型,利用掌握的历史短信息数据对之后一段时期的数据进行预测,把握短信息的发展趋势,明确垃圾短信息治理的方向和重点领域,具有较强的理论价值和现实意义。端口短信作为当前手机短信最主要组成部分,也是垃圾短信的重要源头,对其进行趋势发展预测研究就显得尤为重要。

灰色模型(Grey Model)主要针对“小样本”、“贫信息”等不确定性问题展开研究,通过提取有价值的信息部分挖掘内在规律,预测发展趋势[3],该模型是学者邓聚龙教授于1982年在国际上首先提出,经过几十年的发展,灰色预测理论已经在工业、农业、社会、经济、能源、交通、石油等众多领域得到应用,成功地解决了生产、生活和科学研究中的大量实际问题。短信息具有明显的“信息量”不多,具有典型的“小样本”、“贫信息”等不确定性问题特点,可以借用灰色模型来进行分析预测未来走势。目前学术界运用灰色模型进行垃圾短信息治理的相关理论研究较少,缺乏对垃圾短信息治理的前瞻性和预测性研究。根据近年来的端口短信息和垃圾短信息举报的有关数据,结合端口短信息同垃圾短信息的相关性分析,基于灰色模型对端口短信息未来发展趋势进行剖析和预测,进而能更好地明确垃圾短信息的治理的重点和方向[4-5]。

1 短信息和垃圾短信数据分析

1.1 短信息变化和发展情况

根据工业和信息化部公布的2014-2017年点对点和端口短信业务量,近几年来的移动短信业务量种点对点短信业务量降低,端口短信量提升迅速,见表1:

表1 2014年至2017年移动短信情况表

近年来点对点短信业务量的逐渐萎缩,跟微信、微博等OTT(Over The Top)平台短信息的替代作用分不开。微信、微博的社交属性更强,信息互动功能更多,用户体验更好,更为流行时髦,之前熟人、朋友之间大量的短信聊天、短信拜年等从手机短信逐渐转移到更为方便的微信、微博平台上来;其次是通信成本的原因,由于手机短信按次或套餐进行收费,而OTT短信息是基于网络流量化,每条短信通信成本可忽略不计;同时近年来,由于手机实名制的全面落实,对通过点对点发送垃圾短信形成了有效惩戒,一定程度上降低了点对点短信发送量。

由于手机短信的到达率高,推广性好(只需要知道手机号码就可以发送短信),在点对点短信发送量呈不断下降趋势时,端口短信发送量上升态势却十分明显。一方面由于近年来各类App、网站等都需要服务登录和身份认证,产生了大量的短信;另一方面端口短信在商业营销上有独特的优势,不像微信、微博的信息发送和阅读基本局限于熟人朋友圈,企业只要得到用户的手机号码就可以发送营销广告类短信,而且端口短信资费也非常便宜,是很多大中型商家推广业务或推销产品的理想选择。

1.2 垃圾短信举报情况

从工业和信息化部和12321举报中心有关工作报告数据看出,在受理举报的垃圾短息中,端口举报数和商业广告类垃圾短信呈上升趋势,尤其是2017年以来趋势明显。这主要是受手机实名制的影响和对违法违规短信的打击力度加强,当前对垃圾短信治理重点在端口号和商业广告短信息(见表2),根据12321网络不良与垃圾信息举报中心相关报告,近年来垃圾短信息内容所属类型主要分布在金融保险业推销、零售业推销、电信业务宣传、教育培训、房地产推销和餐饮业推销等,这些是垃圾端口治理的重要行业和领域。

表2 近年垃圾短信举报情况统计表

图1是近年来端口垃圾短信举报数和商业广告类短信举报数的散点图,总体而言,端口类垃圾短信举报数和商业广告类垃圾短信都呈上升趋势。根据当前短信营销特点和实际情况,商业广告类短信主要由商业营销类端口发送,可以初步判断,端口垃圾短信和商业广告类垃圾短信两者具有很强的正相关性。

图1 端口垃圾短信举报数和商业广告类短信举报数的散点图

利用SPSS.22软件做端口垃圾短信举报数和商业广告类短信举报数的双变量相关分析,结果如表3、表4所示:

表3 端口垃圾短信举报和商业广告类短信举报描述统计

表4 端口垃圾短信举报和商业广告类短信举报相关性分析

可以看出,Pearson相关系数是0.931,在0.01的显著性明显,可以推断端口垃圾短信举报数和商业广告类短信举报数之间确实存在明显的正相关。

2 端口短信息灰色模型分析

2.1 模型建立

灰色模型是基于人们对系统演化不确定性特征的认识,运用序列算子对原始数据进行生成、处理,挖掘系统演化规律,建立灰色模型,对系统未来状态做出科学的定量预测。基于灰色模型理论的预测法主要包括数列预测、灾变预测、系统预测、拓扑预测等,本文选用的灰色模型预测法为数列预测,即通过一定的时间序列和相应的数据来预测事物的发展趋势,模型分析过程一般为序列生成、搭建灰色微分模型、构建数据矩阵、模型求解和检验等步骤[6-7]。

(1)序列生成。假设x(0)(1)、x(0)(2)、…、x(0)(M)作为预测对象的原始信息或数据,对它们进行一次生成处理,常用累加生成算子方法,即

(2)建立灰微分方程,构造数据矩阵。用微分方程来表述新数列的变化趋势:其中,a和b为辨识参数。辨识参数通过最小二乘法拟合得到:

其中Y为列向量:B为构造数据矩阵:

(4)模型检验和预测:采取相对误差检验法,并预测下几个数据。

2.2 模型应用

为检验灰色模型预测效果,采用2014-2017年手机端口短信数据,分别为4 108,4 268.9,4 492.7,5 311.8,目前对2018年、2019年的端口短信量没有官方公布,但可以通过模型可以进行预测。

(1)序列生成:

对x(0)作一次累加生成x(1)=(4 108,8 376.9,12 869.6,18 181.4);

对x(1)作紧邻均值生成z(1)=(6 242.45,10 623.25,155 25.5)。

(2)计算系数a和b:由前得知,,通过计算得a=-0.113 426,b=3 466.465 520。

(3)确定模型和GM(1,1)的求解:

时间响应式整理得:x(1)(t+1)=34669.5e0.113426t-30561.5。

求X(1)的模拟值x(1)和其还原值x(0):

x(1)(1)=4108,x(1)(2)=8272.1,x(1)(3)=12936.4,x(1)(4)=18160.9;

因此:X(1)=(4 108,8 272.1,12 936.4,18 160.9),

X(0)=(4 108,4 164.1,4 664.3,5 224.5)。

(4)检验误差:

灰色模型相对误差表如表5所示:

表5 灰色模型相对误差表

计算得平均相对误差为2.64%。对模型精度检验时,最常用的是相对误差检验指标,当相对误差a≤0.01时,表示模型等级为好;当0.01≤a≤0.05时,表示模型精度为合格;当0.05≤a≤0.1时,表示模型精度勉强合格;当0.1≤a时,表示模型不合格。从表5的相对误差值和平均相对误差值来看,该模型的精度等级为合格,可以进行下一步预测。

(5)预测:x(0)(5)=5852,x(0)(6)=6554.9,x(0)(7)=7342.2x。

通过测算,接下来三年端口短信的数量分别为5 852亿条、6 554.9亿条和7 342.2亿条,通过预测,端口短信的数量上升势头明显,同当前市场的发展态势相吻合。

2.3 结果分析

由预测数据可以看出,端口短信的数量提升势头明显,逐渐成为移动短信市场中的最重要组成部分,点对点的信息量将日益萎缩,预测平均相对误差较低,预测效果良好。通过对端口短信的预测和同垃圾短信的相关性分析,能够使我们把垃圾短信治理的重点和方向转移到商业类端口短信上。

3 端口短信和垃圾短信治理

当前的端口短信发送内容主要为通知类(含公益类)、触发类(比如验证码)和商业营销类,垃圾短信绝大部分是从商业营销类端口发送的,短信内容经常为“发票、办证、保险、诚招、抽奖、代+办、代办、折扣、优惠”等关键词。对端口垃圾短信的治理首先要把严格区分不同种类的端口,明确通知类短信端口、触发类短信端口和营销类短信端口各种的功能和定位,同时把监管的重点转移到营销类短信端口上来,可从以下几个步骤来判断该营销类短信端口是否为垃圾短信端口,进而采取警告通报、整改、关停等手段,达到垃圾短信精准治理的效果。

步骤1:对商业类短信端口进行汇总。

步骤2:建立垃圾短信过滤模版(内容关键字),模版可根据实际情况不断完善更新。

步骤3:根据历史投诉总量(比如近三个月有无被投诉过的历史)、12321平台投诉、超业务范围内容关键字筛选,将其确定为疑似垃圾短信端口,没有此类现象的可暂时判定为正常短信端口。

步骤4:根据疑似垃圾短信端口,针对入网时间短、信誉度较差的公司定性为垃圾短信端口,采取一定的惩戒措施。

步骤5:对内容关键字筛选的垃圾短信结果,可适当进行复核,根据实际情况排除一些关键字筛选结果中的垃圾端口。

4 结论与启示

对垃圾短信的预测和有针对性的治理是提高治理效果的重要保证,通过基于灰色模型分析,端口短信息数量将继续呈现升高态势,端口垃圾短信举报也将逐渐增加,端口短信已成为手机垃圾短信治理的主阵地。通信管理部门要对垃圾短信息治理工作重点转移到端口短信中来,在对端口好的具体管理工作中,要对通知类、触发类、营销类等各类端口号码做好分类分级,尤其重点做好营销类端口的监测,持续进行健康度、信用度分析。充分运用大数据技术,对违法诈骗短信严防死守,对商业广告等灰色性质的短信要做好引导和区分,不断降低垃圾短信息对信息用户的骚扰。对出现问题的端口号码要根据不同程度影响或危害及时警告、惩罚、封闭相应的端口号[8],同时要牢牢坚持手机实名制,不断压缩对点对点垃圾短信的生存空间。

随着互联网、5G和人工智能技术的快速发展,短信行业应用场景将快速普及,端口短信量持续增长,企业对移动信息服务的需求范围越来越广,端口类短信市场发展空间将更加广阔,短信息中端口短信息比例持续上升。通信管理和运行部门在加大对端口号的监管的同时加强对商业广告信息发送的规范和引导,更好地满足信息消费需求,保障信息消费者的权益。垃圾短信息是一个动态的发展过程,对垃圾短信息的监测也是一个动态的应对过程。通过对垃圾短信息数据科学分析,做好预测和事前管理工作,找出其中的规律,防患于未然,从而更有针对性更有效地治理好垃圾短信息。

猜你喜欢
点对点商业广告短信
“点对点”帮2万名农民工返岗
多模态批评话语视阈下的性别歧视研究——以一则商业广告的图像构建为例
道歉短信
OptiX155622H设备点对点以太网透传业务故障分析
遏制拜物主义刻不容缓——解析中国商业广告的文化特性
代发短信
论中西方电视商业广告比较
便携式点对点可见光通信终端的实验研究
点对点红外通讯装置的设计
商业广告摄影关键技术探微