2013年底,我国4G牌照的发放加快了移动互联网的发展。截至2014年6月,我国移动智能终端用户数占全球30%,CNNIC统计的移动互联网用户数为5.27亿,占网民总数的83.4%,占移动用户数的41.8%,我国智能手机网民占手机网民比例达91.1%。据CNNIC发布的中国移动互联网调查研究报告显示,智能终端日均使用时长平均2.5小时,我国每天上网4小时以上的手机网民比例达36.4%,其中每天实时在线的手机比例为21.8%。
我国移动宽带用户占移动用户之比在2013年末为32.7%,到2014年10月底上升到42.2%,几乎每月增加一个百分点。按照Akamai的报告,我国2014年Q3的移动平均连接速度和峰值移动平均连接速度分别为4.5Mb/s和12.5Mb/s,与世界最高水平15.2Mb/s和108Mb/s相比有很大差距,也可以说未来将有很大的发展空间。根据思科公司统计,2013年全球移动数据流量增长了81%,预计到2018年还将较2013年增长11倍,其中半数流量卸载到WiFi。2014年上半年与2013年同期相比,我国移动数据流量增加93.2%。我国户均移动互联网接入流量2013年底为139MB/月,为同期全球水平529MB的1/3,2014年10月我国户均移动互联网接入流量为192MB/月,同比增长50%,其中手机上网流量占比提升至86%。预计到2020年月均流量将达4.9GB,与预测的全球平均水平5.3GB相比,差距已大大缩小。
阿里公司基于支付宝的3亿实名用户中,有1.9亿在线钱包活跃用户,日常交易达4 500万笔,其单日数据产生量超过50TB。阿里移动端月活跃用户1.63亿,移动交易额占总交易额的比例也从去年同期的10.7%上升到2014年6月底的27.4%。来自无线业务的收入较去年同期增691%,占比已经高达12%。百度每天要处理60亿次搜索请求,比谷歌多一倍,日新增800TB,目前存储网页数近1万亿,数据总量达到EB,百度的移动营收占比从去年底的20%增加到2014年6月的30%,到2014年6月底,使用手机搜索的用户占手机用户的77%,与去年同期相比移动搜索增加48%,到2014年10月,百度移动搜索的流量已超过了PC搜索的流量。腾讯日新增200~300TB数据量,数据总存储量100PB。现有QQ的月活跃用户8.2亿,每天发送150亿条信息,其中手机QQ的月活跃用户5.42亿,每天发100亿条信息,微信活跃用户4.68亿,每天发送90亿条消息,可见在腾讯每日的流量中移动数据已经占主导。
在移动数据的应用中,近年移动视频发展很快,我国网民中使用移动视频业务的比例从2010年底的21.9%增加到2014年6月底的55.7%。使用手机游戏的用户占手机用户比例在2014年6月达到47.8%。可穿戴终端的出现,将移动互联网与物联网结合,既增加了联网的移动终端数,又显著增大了移动数据流量,例如谷歌眼镜的摄像头为500万像素,可拍和播720p的视频,可存储空间为12GB,能与Google云存储同步。又如BaiduEye有摄像头、激光红外发射器、送受话器,借助音控和手势圈定物品,利用蓝牙通过智能手机将视频或图像连到云端,在后台完成搜索识别和分析,解释的结果通过语音反馈给用户,相当于佩戴者第三只眼,实现所见即所得。基于地图的移动应用和移动医疗保健服务也是移动数据新的增长点。按照Gartner公司估计,未来2~5年将有越来越多的面向产业的移动互联网应用,例如移动销售订单与库存自动化、移动销售机会管理、移动事务智能处理、企业文件同步与共享、企业移动应用商厦等。
电信运营商是移动数据的传送者。据StatCounter公司2013年6月报告,全球移动互联网流量占互联网流量的14%,其中亚洲比例更高,占到22.9%,而在2010年这一比例仅为4.5%。有互联网女皇之称的Mary Meeker在《2013互联网趋势报告》中指出,全球移动设备贡献的互联网流量份额将年增1.5倍,预计到2014年底将增至30%。
电信运营商也是移动数据的生产者。中国联通从SGSN与GGSN间以分光方式获取移动用户上网IP地址、时长、上网记录和基站流量,2013年每秒收集用户上网记录83万条,对应年数据量3.6PB。中国电信一个中等规模的本地网每天3G用户上网记录就达到TB级,上海电信每分钟8万条位置更新信息。中国移动从移动终端上报的异常事件记录中采集数据,还从基站和交换机通过分光方式采集数据,2013年每天记录话单数据10TB、信令数据100TB、上网日志500TB,累计数据存量80PB,年增50%。
电信运营商还是移动数据的使用者。通过对用户手机的通话、短信和空间位置等信息进行处理,运营商可提取用户通信行为的时空规则性和重复性,有针对性地开发业务和优化资费模式及套餐余量置换方案,实现定向精确的终端营销和个性化内容业务推荐。以用户的体验视觉实时跟踪网络性能,记录接收信号强度(RSSI)、用户位置等信息,快速预测用户移动行为,并获取当前小区及下一个切换小区的信息,对待切换到的小区为用户预留资源,实现快速切换,准确掌握每个基站的动态流量和忙闲,为精确规划站址和决策扩容、优化网络性能、实现异构网宏微协同提供依据。运营商动态跟踪手机用户的位置和运动速度,获得精准的车流和行人实况,支撑交通规划和流量疏导。另外,依据手机用户的地域分布,运营商可实时提供人口密集情况,有利于城市主管部门对突发事件的预警,长期的统计结果还可用于城市规划。三大电信运营商都着力建设大数据分析系统。中国联通建立了用户上网大数据分析系统,利用收集的用户上网记录解决用户透明消费问题, 并使用其中的数据做客户的精细化营销,同时准确掌握每个基站的实时流量和忙闲,为网络扩容和提高质量提供依据。中国移动建立网络资源的大数据系统,改进对用户专线提供的速度。建立微营销大数据分析系统,实现定向精确营销、差异化的合作伙伴后向能力保障和智慧城市管理。中国电信利用大数据支撑智能管道,通过感知优化流量使得网络畅通,还利用大数据分析中小企业用户通讯行为,对企业诚信和经济能力进行评价,降低金融机构的风险。
按照Chetan Sharma咨询公司2013年预测,到2022年全球移动产业的收入中移动数据与OTT的收入将占到70%,话音收入约占15%,其余15%为平板电脑收入、手机收入和基础设施收入。可以预计,从现在起电信运营商不但要从话音经营转到流量经营,还需要考虑从流量经营转到数据经营,从数据中挖掘价值,并更精细地服务用户。
移动大数据的压力首先反映在网络宽带化方面,4G的发展已经加快,我国2014年1~10月,4G用户新增近6 000万。国际上关于5G的标准化研究在加速,韩国和日本已经明确2020年5G商用的时间表。在研究5G需求时,希望将用户体验速率从4G时的1.2Mb/s提升到5G的1Gb/s,需要新增移动通信带宽数百MHz,增加新频段势在必行。数GHz的频段甚至数十GHz的频段都在考虑之中,当然传播条件更好和建网成本更低的700MHz“数字红利”频段更受青睐,但将这一原分配给广播电视用的频段部分调整给移动通信用的设想实现起来面临体制障碍。
移动互联网的安全问题甚至比桌面互联网更严重。大量移动互联网用户的增加导致了移动终端设备越来越多样,这也意味着管理起来将更加困难。移动终端因功耗等限制,无法像PC(个人计算机)那样内置功能强大的防火墙。移动终端相比PC涉及的用户身份信息多,具有定位能力且可被跟踪,移动支付还涉及银行账号,移动终端发生安全问题将比PC严重得多。据统计,2013年移动互联网新增恶意程序样本较2012年增长3.3倍。据360安全中心报告,2014年上半年,标记骚扰电话号码8 330万次,拦截垃圾短信385.6亿条,拦截伪基站短信12.38亿次。安卓移动操作系统尽管已经使用了针对应用软件的签名系统,但黑客仍然能使用匿名的数字证书来签署他们的病毒并发放。安卓4.0版本中内置的无线通信接入密码远程备份功能可被用来定位用户,苹果公司的手机云计划能够读取用户在手机云中所存的信息。再如,基于智能终端的移动支付方便了用户,但传统的账号+密码+短信的身份验证方式存在安全风险,手机卡可能被复制,验证短信有可能被劫持,支付指令在传输中也可能被篡改。据腾讯公司介绍,目前中国6.32亿的网民,3.32亿用移动支付。有31.8%用户都受到过钓鱼、木马网站的影响,2014年环比2013年我国移动支付因网络安全的经济损失增长了400%。受美国标准委员会NIST批准,美国家安全局(NSA)和加密公司RSA达成了价值超过1千万美元的协议,在移动终端所用的加密技术中放置后门,使NSA通过随机数生成算法Bsafe的后门程序破解各种加密数据。可见,移动互联网的安全问题是当前网络安全面临的一个重要挑战。虽然上述安全问题是针对用户终端的,但运营商收集大数据的云平台也会成为被攻击的目标,其安全防护能力尤为重要。
移动大数据挖掘的应用需要有法可依。目前,电信运营商的大数据挖掘仅是初步的,主要是基于日志数据而为,是面向运营商自身的服务,事实上运营商掌握的大数据内容很丰富,社会价值也很大,但目前运营商对这些数据挖掘的应用领域十分谨慎。对用户所产生的通话内容数据是禁止读取的,即便对日志数据的挖掘可以导出群体行为,但应屏蔽用户个体的隐私。总之,目前数据所有权限不清,要区别个人数据与隐私,前者强调归属于本人的可识别性,后者强调与公共事务无关的私密性。大数据的挖掘与利用需要有法可依,我国需要尽快制定“网络安全法”、“隐私保护法”与“信息公开法”,要在保护隐私的前提下鼓励对日志数据的挖掘,提倡数据共享又要防止数据被滥用。