崔婧
如今,百度地图通过线上、线下的打通让越来越多的用户实现了移动互联网化的便捷生活。
百度LBS技术总监顾维灏带领的团队几乎只用了一天时间就开发出了景区热力地图产品,百度地图的用户通过这个地图可以直观的看到13座城市的118个商业区和景区的实时人气状况。春节迁徙地图、爱心地图的开发速度也是如此。
由于从创意到产品开发时间极短,百度LBS团队也遇到不少困难,尤其是春节期间产品上线导致大家不得不放弃休假而不停加班。
结果自然是令人满意的,而顾维灏他们的底气来自百度地图的大数据基础。这些数据则来自于用户使用百度地图应用所传送来的定位请求。百度LBS技术团队通过对请求信息进行辨认设备和定位位置变化来分析处理全样数据,用大数据来体现社会行为轨迹。
数据是最好的佐证。百度地图有着接近超过2亿用户,拥有国内领先的数百万商户数据、数十家数据合作伙伴,数据覆盖了国内400余座城市、千余个区县,容纳近4000万地标信息,涵盖全国420万道路里程,拥有近400座城市的卫星图,日均用户定位请求超过35亿次。艾瑞咨询高级分析师王影认为,百度的这三款基于大数据的地图产品,可以作为参考为相关政府部门提供服务,同时也可以为企业和个人提供参考,具有很大的社会价值。
事实上,大数据早已是全球IT巨头布局的重点,他们一直坚持在大数据方面进行探索和投入,2月18日,微软宣布投资三家中国云计算和大数据公司。第二天,IBM宣布与AT&T在大数据分析领域展开合作。
不过,这种投入对于老百姓始终还有些距离。当然,线下生活所涉及的数据繁冗复杂,很难通过大数据进行完美的复刻,是一个重要的原因。
然而人们在互联网上的一切行为都会留下数据,通过对这些数据的分析,就能够得到消费习惯、职业、喜好甚至性格等信息。互联网交互数据占比越来越大,约为大数据总容量的85%。
在中国目前的互联网环境中,真正具有PB级大数据实力的公司只有BAT三家巨头而已。阿里巴巴的数据特征更多表现在商业领域,是商业行为产生的最后一环,突出信用数据、交易信息等,腾讯更擅长的关系数据、社交数据等多是涉及个人的“隐私”,更多服务于其自身产品;百度则更接近百姓需求,百度搜索光PC端每天就响应近50亿次搜索请求,百度地图日均定位请求超过35亿次。
如今,百度地图通过线上、线下的打通让越来越多的用户实现了移动互联网化的便捷生活。“大数据的真正价值是我们能在数据里发现知识,发现信息。”顾维灏说,百度LBS部门会在百度大数据分析基础上,挖掘LBS特有数据和特有知识,如挖掘POI知识库,挖掘路网信息,挖掘路况预测、智能导航。交通变动只是大数据的一个开始。
百度的尝试
2月14日情人节,百度对外发布全国首个“爱心地图”。在北京、上海、深圳、东莞四地的朋友,通过百度地图搜索“免费安全套(避孕套)、避孕药、计生服务、爱要有一套”等,即可查看身边的计生用品发放点,就近免费领取安全套等计生用品,也可咨询相关计生知识。
这是百度借助自身技术平台,结合公益权威数据,打造爱心地图的首次创新尝试。但这并不是百度地图第一次进行这样有趣味的大数据全民实验。仅仅在春节期间,其迁徙地图和景区热力地图就把大众的胃口调了个遍。
许多人对百度迁徙地图的第一印象来自央视,春节期间,央视首次启用百度地图定位可视化大数据播报了国内春节人口迁徙情况,展现春节前后人口大迁徙的轨迹与特征。异曲同工的还有景区热力地图,其在春节期间热力放送,人流分布数据以15分钟一次的频率实时更新,北京、天津、上海、重庆四城市成为最热景区。
顾维灏说:“我们分析的是位置的变化,比如你这会在北京使用手机,过了几个小时以后发现你在上海使用手机,这就说明你的位置在这几个小时内在变化。”迁徙图、热力图和爱心地图分别针对春节前后的迁徙大潮、春节期间的市民出行以及情人节三个热门出行时间,又分别对应了远距离迁徙、近距离出行和景区/商圈出行。
这三个地图都体现出了百度依托庞大活跃用户群所积累出的大数据挖掘能力,必须有多部门无障碍配合的协同作战能力,只有顺畅的沟通、合作,才能在一天内完成调动了多方资源,并与百度主线产品实现对接的“不可能的任务”。
为了完成“不可能的任务”,他们提早就做了实验:对北京海淀黄庄地铁站做了分析,通过定位密度反映出人群密度,发现地铁D出口基本上没有什么人走。他们分析中关村的商圈,通过地图可以看到一些购物中心人非常多,一些购物中心的人流量并不是很大,这些数据可以帮助商圈更好配置地资源。
他们还发现通过驾车导航轨迹的挖掘可以帮助用户挖掘出最优出行道路,避开拥堵。比如从百度到国家会议中心有三条路,这三条路的驾驶时间不一样。两条蓝色的路基本驾驶时间约是20分钟,红色的路约是18分钟,这都需要通过对地图数据进行对比分析后得出结论。
百度能做出此类产品,很重要的原因是,百度过去几年大规模地对云计算进行投入,拥有很大的数据中心,有自主设计服务器,能把数以亿级、数以千亿级的数据实时、安全存储下来,在这些基础上建立云计算,有海量数据处理大规模的调度软件。
早在2013年1月,百度就成立深度学习研究院,李彦宏还亲自担任院长,足可见其对大数据的重视非同小可。“大数据和地图结合起来,是特别好的营销方式。”王影说。
百度地图已然成为地图服务领域的领跑者。目前百度地图的市场份额在56%以上,其活跃用户市场份额也大于51%,无论是从和导航、团购等产品的整合度,还是商户规模、开放平台吸引力等方面,百度地图都已经成为一体化的生活服务平台,平台产出的大数据极具现实参考意义。
看得见的应用价值
无疑,这三个地图产品显示出了百度地图实现的差异化内涵,使之拥有了和其他地图软件不一样的差异化运营形态,跳出了过去传统地图软件的简单导航模式,形成了更接地气的生活服务全能形态。而在百度全资收购团购网站糯米网后,将会在很大程度上推动百度整个基于百度地图的O2O进程。endprint
大数据无疑是支撑百度地图成功转变的基础,百度知道、百度经验、百度大数据等产品,都能为百度地图调用。百度知道已解决问题数接近2.5亿。每日帮助人数超过3亿,累计贡献过答案用户超过5千万,已成为越来越多的人在解答工作、生活中大小难题的首选。已成为越来越多的人在解答工作、生活中大小难题的首选。
而在百度收购91无线之后,大大增强了百度地图获得更多用户的能力,百度LBS Open map计划的实施,使得百度地图又增一个优质流量入口。百度LBS开放平台与用户、商户、开发者三者之间的粘度更加紧密。比如,百度地图的用户可以获取合作网站的生活信息,合作网站的用户也能在百度地图下获取生活信息,互相依存。
“百度在对大数据的运用方面,围绕搜索注重研究与实用性结合,在‘数据聚合、‘语义理解、‘深度学习等更接地气的智能响应技术上也站在了国内前沿地位。”
不过在王影看来,即便百度具有很大的优势,目前百度推出的地图产品的实际的用处还看不到,用户的活跃度还看不到。目前还只是找找东西,查查路线而已。
如果百度想成为谷歌一样受到全世界尊重的搜索公司,那么必须要做出令人惊叹的产品。2008年前,谷歌推出了流感疫情地图,把从世界各国卫生组织收集到的流感信息用可视化的方式呈现出来,这样你在出差的时候,就知道是否应该带药品了。
从表面上看,这产品对谷歌商业化产品没有任何拉动作用,但是经过这样的尝试,在两年后,当H1N1病毒肆虐的时候,谷歌已经能将患病高发区整合进自己的地图应用了。
百度地图的大数据将成为百度大数据的一个先驱。李彦宏也希望通过这一接地气的实用大数据模式,逐步从单纯的便民,进化为企业级服务,为各种企业提供可供参考的、量身定制的各种大数据图谱,为其成就大数据时代的核心竞争力。SAP大中华区副总裁张志琦看来,日后政府会有一笔支出用于购买数据,而百度具有的这种公共数据的资源就可以为其所用。
正像IT名博张书乐所言,这将可能形成一个在移动互联网上,以百度地图为纽带的百度联盟,不仅仅将百度的各种应用打通融汇,将来自搜索、问答、音乐甚至是输入法中积累的大数据变成地图的元素,并以及时性、高效性和图形化的特征,逐步实现和各种热门的基于LBS的App服务串联,形成一个百度地图的隐性互联网入口。endprint
中国工业评论2014年5期