基于智能手机终端信息的大数据应用研究

2016-02-21 13:44:17袁琦中国信息通信研究院泰尔终端实验室主任工程师高级工程师
信息通信技术与政策 2016年4期
关键词:大数据

袁琦 中国信息通信研究院泰尔终端实验室主任工程师,高级工程师



基于智能手机终端信息的大数据应用研究

袁琦中国信息通信研究院泰尔终端实验室主任工程师,高级工程师

摘要:对基于智能手机终端信息的大数据应用进行了研究。首先梳理了智能手机终端的信息类型,分析了智能手机终端信息带来的大数据应用现状,然后对有关大数据开放与共享带来的问题进行了研究,并提出了有关发展建议。

关键词:智能手机终端;大数据;开放与共享

1 智能手机终端信息分析

1.1智能手机终端与功能手机终端的区别

智能手机终端通常是具有操作系统,使用宽带无线移动通信技术实现互联网接入,能够通过下载、安装应用软件和数字内容为用户提供服务的移动终端产品。

与功能手机终端相比,智能手机除具备功能手机的通话、短彩信等基本通讯应用外,因具有独立的操作系统,可以由用户自行安装软件、游戏等第三方服务商提供的程序,通过此类程序来不断对手机的功能进行扩充。同时,因其具备高速接入网络的能力,可通过3G/Wi-Fi等无线接入技术方便地接入到互联网,使得浏览、即时通讯、电子商务等多种业务应用能够在智能手机上得到很好的支持,因此智能手机信息相较于功能手机信息更加丰富多样,不但涉及通讯录、通话短信等常规个人信息及通讯内容,智能手机不断扩展的第三方业务应用还将产生诸如虚拟身份账号信息、社交媒体数据、浏览记录、业务信息等各种新的信息数据。

此外,智能手机终端通过与传感器、摄像头、录音、蓝牙、RFID、GPS等多种技术相集成,能够充当照相机、电视机、录音机、信用卡、游戏机、电子书、导航仪等各种角色,智能手机获取信息的手段也更加多样。

与PC相比,智能手机终端与用户身份的关联性更强,智能手机用户与MSISDN、IMSI等具有身份属性的号码相捆绑,并具有独占性和随身性的特点。此外,智能手机通过蜂窝移动网络、WLAN网络、GPS传感等方式还可获得位置信息。由于与用户身份的强关联性,智能手机用户一切行为所产生的信息数据(包括位置信息、上网轨迹、购物记录等)都与用户本人密切相关。这些信息数据可通过智能手机被电信运营商、应用平台提供商及浏览器提供商等第三方采集、留存、挖掘与分析,并利用这些信息数据为用户提供实时、个性化的业务。

1.2智能手机终端信息的归类梳理与分析

1.2.1智能手机终端信息类型

智能手机终端信息类型可以分类如下:(1)个人信息

●用户基本资料

有些用户会在手机终端中会存储用户的姓名、住址、工作单位等,以文本的形式存储在手机终端的文件里。另外用户为了使用移动互联网业务的需要,在使用业务前会填写用户的姓名、住址、工作单位等基本资料,存储在业务提供商的业务服务器的数据库里。

●通讯录:手机号码簿、联系人列表

手机号码簿和联系人列表等通讯录功能是手机终端的基本功能,以文本的形式存储在手机终端的文件里。

●虚拟身份信息:账号、昵称等

账号、昵称等虚拟身份信息是随着智能手机终端不断扩展的移动互联网业务应用后产生的新信息数据。用户在业务客户端软件输入账号、昵称等后,开始使用移动互联网业务。账号、昵称等数据存储在业务提供商的业务服务器的数据库里。

(2)通信内容

智能手机终端内存储与通信内容有关信息,如通话记录、短/彩信消息、即时通信内容、视频、照片等等。

●通话记录

智能手机终端以纯文本格式存储用户的短、彩信内容,同时会记录语音通话的起止时间与通信时长。

●短/彩信

智能终端以纯文本格式存储用户的短/彩信内容,同时会记录短、彩信的发送时间与接收时间。短/彩信内容在一定时间段内也存储在运营商的业务服务器中。

●邮件

智能手机终端通过邮件客户端,能够存储用户的邮件内容,发送和接收时间。邮件信息内容在一定时间段内也存储在业务服务提供商的业务服务器中。

●即时通信

智能手机通过即时通信客户端,能够存储用户的即时消息内容,如消息文本、照片、视频、语音片段等。即时通信内容在一定时间段内也存储在业务服务提供商的业务服务器中。

(3)设备信息

●手机设备信息

——手机号码

手机的MSISDN号即手机号码,是运营商唯一标识一个用户的号码,通常只存储在运营商侧。对于预付费用户,用户在办理入网的时候运营商就把用户的手机号码和用户的真是身份(如身份证号等)绑定在了一起。对于后付费用户,运营商将手机号码用于为该用户进行计费。

运营商使用用户的手机号码在运营商的计费、营帐等系统中来记录用户使用业务的信息,并记录计费信息。手机号码属于用户的隐私信息,不应该由运营商泄露给第三方。

——IMSI号

IMSI号是国际移动用户识别码,存储在SIM/ USIM中,是唯一的识别一个SIM/USIM的号码。在移动终端每次开机注册网络的时候,要发送明文的IMSI,用于与网络的身份认证与秘钥协商。IMSI号也存储在网络侧,用于每次网络对用户的身份认证。

IMSI是用户的隐私信息,除了第一次的开机认证,其他情况下都不能发送明文的IMSI到网络中,而是以TMSI(临时移动用户识别码)来代替IMSI来执行身份认证的过程。TMSI每次都会变化,从而减少了网络攻击者截获IMSI的可能性。

——IMEI号

IMEI号是国际移动设备识别码,每个手机的IMEI号是全球唯一的,拿到IMEI号就能查到该手机很多重要信息,比如硬件信息、操作系统、所属国别等。

IMEI是手机设备信息中最重要的信息,通常情况下应该不能在网络上传输,IMEI号会存储在手机中。在一些应用中,比如DM业务中,如果DM服务器要求手机上报IMEI号,则手机会将IMEI号上报到所对应的DM服务器。

——硬件型号、操作系统及版本

硬件型号、操作系统及版本信息存储在手机中。相同的,在终端管理业务,手机可以向终端管理服务器上报这些信息。

——IP地址

如果智能手机终端通过蜂窝移动网络接入互联网,由运营商侧的GGSN存储和分配手机的IP地址。如果智能手机终端通过蜂窝移动网络接入互联网,由认证服务器分配IP地址。

●网络设备信息

——蜂窝移动网络设备信息:基站号(CellID)

基站号(Cell ID)是指移动用户所在的蜂窝小区号。由蜂窝移动网络通过获取移动客户所在的蜂窝小区号,并将此蜂窝小区对应的位置信息作为智能手机所处的位置。基站号(CellID)在手机和基站之间的空口信令中进行交互。

——WLAN网络设备信息:Wi-Fi路由器MAC地址

手机在连接Wi-Fi网络的时候,会获取到路由器的MAC地址。很多智能手机(iPhone、Android),会向服务器上报手机目前的位置信息、路由器的MAC地址。服务器获得这些信息后,逐渐累积数据,就可以获得一个大的关于Wi-Fi路由器位置的数据库,以后每次手机路过该路由器,上报路由器的MAC地址,即使手机不开启GPS定位功能,服务器也会知道手机的位置信息。

●位置信息

根据定位技术,位置信息分为两种:GPS定位信息和CellID信息。对于支持这两种定位技术的手机,会将获得的位置信息传送到请求位置信息的服务器。

●用户行为和业务信息

——用户行为轨迹:Cookies访问记录、网购记录等

Cookie是存储在用户浏览器中的用户个人信息,一般包括用户名、密码、网购的商品信息等。当用户下次需要输入用户名、密码,或者访问该网站选购商品是,浏览器会将Cookie发送给网站服务器,用户就不必输入用户名、密码直接登录了。Cookies访问记录反映了用户的上网行为轨迹,留存在用户的浏览器和业务服务器里。

网购记录反映了用户上网购买商品的过程,一般留存在智能手机的客户端和业务服务器里。

——服务使用情况:套餐定制情况、订购关系、账户余额等

对于电信业务,以上用户服务使用情况的数据都存储在运营商侧,用户在订购业务的时候会生成这些计费信息,存储在运营商的计费系统中。对于互联网业务,用户的业务使用情况都在业务服务器上存储。

1.2.2智能手机终端信息获取方式

(1)从智能手机终端侧获取

从智能手机的应用软件行为层面获得用户的相关信息。2010年10月,美国杜克大学等对30款Android应用进行分析,发现其中2/3通过分享用户地理定位数据或信息的方式侵犯用户隐私,半数应用未经用户允许将用户地理定位信息发送给广告网络或数据分析公司。在研究中还发现一些特殊目的的木马程序,可以监听获取用户通话、短信、GPS位置、听筒录音、摄像头数据等信息,如被敌对势力或非法分子利用,将会产生严重影响。另外我院通过对应用软件安全进行测试,智能手机的应用软件还能获取IMSI、IMEI号等。

另外,在安卓操作系统手机拨号键盘处输入以下各机型对应的命令,点拨号,然后选择“手机信息”,能查看手机的如基站CELLID、LAC等GSM信息。通过基站的CELLID,附近CELLID、LAC、信号强度等信息反查推算就能精确到十几米级地确定你的位置。在苹果操作系统手机中也能取得基站的CellID。

(2)从运营商网络侧获取

运营商有独特的优势,可以结合自己网络得到用户和网络更多的信息,如基站ID等信息。随着移动互联网业务开放的发展趋势,运营商逐渐将通信网络的网络和业务能力及相关信息向开发者或业务提供商开放,开发者或业务提供商从运营商网络侧获取用户和网络更多的信息,创新出丰富的移动互联网业务和应用。

(3)从业务平台侧获取

移动互联网业务开放平台侧存在有大量的用户信息、业务信息和能力,包括短信、彩信、GIS、天气预报、邮箱、语音、视频、即时消息等。在移动互联网行业内已经形成了几个开放平台阵营,有代表性的有Google、App Store应用商店、Facebook、腾讯、新浪、百度、淘宝等,从不同业务提供商的业务平台侧获取的不同开放信息和能力。这些开放平台通过开放自身资源并整合互联网资源,聚拢了一大批的开发者、中小软件公司,创造了大量的应用,推动了移动互联网产业的兴盛繁荣。

2 智能手机终端信息带来的大数据应用现状

移动互联网和智能手机终端的快速发展,微信、微博、移动社交、电子商务等各类应用平台化趋势明显,将大数据应用带入新的征程。由于用户的行为和信息在智能手机和业务平台上存留或被获取的途径越来越多,同时各种网络和业务平台的开放性导致数据流动性增加,因此催生出很多直接为消费者喜爱和服务的大数据应用,一个个极具竞争力的大数据商业生态圈正在形成。

2.1典型的大数据应用

通过基于智能手机终端信息的有效数据整合,目前形成的典型大数据应用主要包括定向广告、个性推荐或营销和基于定位的综合服务等。

(1)定向广告

随着广告技术和大数据处理能力的提升,新型的、以用户行为跟踪进行定向广告的新型广告模式日益受到重视。大数据在驱动网络广告向更精准的方向前进,定向广告成为推动移动互联网行业大数据发展的重要力量。从海量数据信息中挖掘出用户感兴趣的信息,并把这些信息推送给用户。在美国,定向广告服务已占到全部网络广告市场的30%,在中国,精准广告和营销平台也将在2013年逐步进入商业化应用。

(2)个性推荐或营销

个性化推荐或营销已经成为我国大数据应用领域最主要的应用之一。个性推荐或营销应用基于推荐引擎技术平台,更多地依赖海量的数据,从而更精准地找到用户。

个性化推荐或营销将会根据来自不同平台的数据作进一步挖掘和分析,主要利用基于内容、基于用户行为以及基于社交关系网络三种方法,找到这些数据相对应的人群,再将这些群体进行个性化的分析、总结,为用户推荐其喜欢的商品、内容或服务,从而提供更好的、更具个性化的推荐或营销服务。

根据网站上每位用户的浏览和访问历史挖掘其个性化兴趣偏好,从而向不同的用户展示他们各自可能需要的商品、内容或服务。例如百分点公司其消费偏好平台目前已经有超过1.4亿网购消费者的消费偏好,超过200亿个消费偏好标签,合作伙伴则包括了凡客诚品、库巴网、唯品会、芒果网等。另外国内最大的门户新浪最近推出了新版的首页,最显著的变化,就是增加了一个“猜你喜欢”的栏目。新浪通过对微博上海量数据进行收集、挖掘,然后给每个用户推荐个性化的新闻。

(3)基于定位的服务

智能手机设备的一大特性就是基于定位的服务,手机定位服务是一种基于手机物理位置的计算机定位程序。除了GPS导航、个性化天气预报、手机位置查询等常见应用外,手机位置服务还在社交媒体上得到了广泛应用,如微信中的公众账号和微博的地理定位功能。手机位置服务的另一项重要功能是推送服务,即通过确定移动用户的地理位置,业务服务商向目标用户推介精准化的信息和服务。

2.2大数据开放和合作模式

电信运营商形成的大数据信息类型主要为设备信息、通信内容、用户行为信息和业务信息,通过数据整合形成用户信息、地理信息、网络信息和业务信息等大数据信息。

互联网平台或业务服务商形成的大数据信息类型主要为个人信息、通信内容、用户行为和业务信息,通过数据整合形成用户信息、业务信息和社交信息等大数据信息。

大数据信息开放和合作有两种模式:

(1)提供方将自身具有优势的信息通过有偿或交换的方式开放给另一方使用。例如拥有丰富个人信息资源的社交、电商公司纷纷通过挖掘信息价值,创新自身业务模式,并向第三方开放相关数据,提供数据支撑。淘宝数据魔方、百度游戏营销平台等,均通过对用户行为的分析,建立用户行为数据库,向平台上的第三方输出数据,提供决策支持。

(2)提供方将自身所能提供的业务能力、资源等,按照规范要求进行封装成开放API,应用通过调用开放API,由应用本身对数据信息能力进行聚合。例如Google在开放API方面的是开拓者和领导者,将搜索、地图、社会关系等信息开放给第三方开发者。百度通过向第三方开发者开放地图、搜索数据等核心资源,实现与合作方的流量共享。

3 有关问题分析

随着移动互联网的快速发展,基于智能手机终端信息的大数据应用日益丰富,大数据信息开放和共享所引发的问题如下:

(1)大数据信息开放和共享存在部门和企业之间的利益矛盾

在国外,大数据在农业研究、金融市场、气象预报、交通管理、新闻报道等方面已经应用得很广泛。例如沃尔玛基于每个月网购的数量判断客户购买物品时的喜好,优化商品柜台的排列,销量猛增;印第安纳大学学者从成千上万的留言中把微博分成6种心情,从中算出的道琼斯指数,准确率高达87%。

我国的一些部门和机构拥有大数据,由于存在部门和企业之间的垄断和商业利益矛盾,数据开放程度低,形成众多信息孤岛,尚未建立大数据信息开放和共享机制,因此各部门和企业之间的大数据信息难以共享,导致大数据信息不完整或大数据建设重复投资。

(2)大数据信息开放和共享加大用户隐私泄露安全风险

由于数据保护和隐私保护方面的制度不完善,缺乏对互联网应用提供商和互联网企业的监管,用户隐私信息惨遭泄露和恶意盗取,让用户蒙受经济损失的安全事件层出不穷。大数据信息开放意味着有价值的个人信息资源不仅仅局限在传统的电信运营商手中,这些信息会被越来越多的互联网应用提供商所利用和掌握,因此大大增加了用户隐私安全的风险。

2011年,全球最大的社交网站Facebook身陷“泄露门”,被指向广告商等第三方机构开放一个“后门”,允许它们访问用户资料、照片、聊天记录和其他隐私数据。Facebook实际是各种依赖私人信息的应用软件的集合,隐私问题一直贯穿着Facebook的发展历程,其间有两次重大危机就是因为隐私的问题而引起的。因此业务能力开放是一把双刃剑,一方面促进应用创新,另一方面加重了用户对隐私泄露的担忧。

(3)大数据信息开放和共享引发侵犯知识产权

大数据信息开放和共享在给企业和用户带来各种便利的同时,也会引起一系列知识产权问题。首先,一些企业或用户通过大数据信息开放和共享途径非法获取并传播信息,例如批量下载并私自传播视频分享网站的视频。因此造成业务提供上、应用开发者和用户构成的多级信息传播渠道,最终导致知识产权所有者权益受到严重侵害。最后,部分业务提供商通过非法调用的方式获得一些未经授权的内容,例如一些仅限于内部分享的图片;另外业务平台提供商为第三方应用提供开放的API接口,但是对接口上调用的内容缺乏知识产权审查。

(4)网络数据信息开放增加通信网络基础设施安全威胁

对于运营商而言,在大数据信息开放和合作模式下,一方面可以实现从传统的管道型、传送型服务转向实现创造性、应用型聚合信息服务,利用所拥有的客户资源、网络资源信息实现不同程度、不同侧重的开放模式;另一方面,伴随着业务信息开放,业务模式、业务行为、网络和平台资源调用、业务流量、路由不确定性加大,给电信运营商业务系统和网络基础设施的运营管理带来巨大挑战。同时,网络数据信息开放在一定程度上打破了原有的封闭电信业务系统,电信运营商需要将一部分基础网络资源和业务信息向业务提供商进行开放,有可能遭到恶意破坏和非法使用,因此如何把握业务开放的程度,如何对业务提供商进行管理都给电信运营商带来很大挑战。

4 有关建议

(1)积极促进基于智能手机终端信息的大数据挖掘和应用产业

大数据挖掘和应用产业将创造规模更大的信息服务市场,带动形成新的经济增长点。政府应积极推进大数据产业发展,完善大数据产业生态链,整合产业链中的优势资源,建设大数据产业基地;在政务服务、民生服务、城市管理、重点行业应用等领域开展大数据示范应用,以示范应用引领产业发展;在海量数据存储、数据预处理、新型数据挖掘分析、大数据关键设备等领域突破一批关键技术,形成具有自主知识产权的标准和规范;设立国家大数据产业发展专项,对大数据产品和解决方案市场化推广、大数据应用示范工程等重点项目,优先给予资金支持。

(2)加快建立大数据信息开放和共享的分级安全机制

建立大数据信息开放和共享的分级安全制度,建立一个良性发展的数据共享生态系统。大数据信息开放和共享的重要方式即通过数据信息或API开放接口调用信息资源。随着业务形式的多元化发展,越来越多地涉及到安全隐私的资源会在业务过程中被调用,如果使用单一的安全保障手段则无法满足业务发展的需求,因此需要根据业务的安全等级对数据信息接口权限进行分级规定,从而在业务调用过程中提供相应的安全保障手段。

(3)加强智能手机终端的个人信息保护安全评测

为促进移动互联网产业链的健康发展,应当构建一个安全可信的移动互联网生态环境,促进移动互联网各个环节的开放发展,营造安全可信的产业环境,加强智能终端入网检测中操作系统和应用软件的评测管理工作。由第三方检测机构实现对操作系统和应用软件的安全评测,保证操作系统和应用软件的安全。

Studyonbig data applicationbasedonsmart phone message

YUANQi

Abstract:This paper is about the research for big data application based on smart mobile phones information. It firstly introduces information type based on smart mobile phones, and analyzes the situation of big data application based on this information, then the problems resulted from opening and sharing of big data are researched, and some development suggestions are put forward.

Keywords:smart mobile phones; big data; opening and sharing

收稿日期:(2016-03-20)

猜你喜欢
大数据
基于在线教育的大数据研究
中国市场(2016年36期)2016-10-19 04:41:16
“互联网+”农产品物流业的大数据策略研究
中国市场(2016年36期)2016-10-19 03:31:48
基于大数据的小微电商授信评估研究
中国市场(2016年35期)2016-10-19 01:30:59
大数据时代新闻的新变化探究
商(2016年27期)2016-10-17 06:26:00
浅谈大数据在出版业的应用
今传媒(2016年9期)2016-10-15 23:35:12
“互联网+”对传统图书出版的影响和推动作用
今传媒(2016年9期)2016-10-15 22:09:11
大数据环境下基于移动客户端的传统媒体转型思路
新闻世界(2016年10期)2016-10-11 20:13:53
基于大数据背景下的智慧城市建设研究
科技视界(2016年20期)2016-09-29 10:53:22
数据+舆情:南方报业创新转型提高服务能力的探索
中国记者(2016年6期)2016-08-26 12:36:20