追踪网络足迹

2009-05-08 10:02黎世彤
投资与合作 2009年2期
关键词:爬虫监听足迹

黎世彤

谷歌的新登陆系统OpenID有着愈演愈烈的趋势,因为谷歌并不满足以搜索关键字的匹配猜测用户的身份进而投放广告,OpenID的最终目的是要建立一个网络身份证的系统,使得谷歌可以轻松地站在网络世界之巅俯视众生,进而无时无刻、随时随地推送广告。然而,建立网络身份证系统的工程之浩大可能远远不是钱能解决的问题,目前看来谷歌受到了来自雅虎、微软、Facebook等竞争对手的强烈抵制。谷歌的失败并不说明网络身份认证没有价值,被身份认证所追踪的网络足迹还是非常有使用价值甚至商业价值的。

网络足迹的追踪起源于Facebook,而Twitter通过鼓励人们主动上传生活足迹而一夜成名,“人肉搜索”则是典型的透过蛛丝马迹的网络足迹挖黑的行动,可以说网络足迹的追踪已经成为最大的垂直搜索,其发展可能会颠覆现有的网络广告经营模式,直接对谷歌、百度构成强大的威胁。网络足迹搜索应该是以社会媒体Web2.0为搜索对象,并提供简单的分析服务,从初期的社会媒体“灌水”入手,慢慢丰富其整合营销的手段而成为一个互联网的广告公司。网络足迹搜索的形式有以下几种。

博客搜索。无可否认博客早已从“民间智慧”进化到意见领袖甚至大有超越主流媒体专栏的地步,当然,简单地搜寻个人言论意义不大,必须要有一个不同视角的全方位的观察,并辅之以量化的参数来衡量,这个视角可以是一个博客作者、一个热点话题、一个帖子、一个评论、一个被引用的博客内容等等,覆盖了足够多具有代表性的博客搜索就是网络言论的风向标,对于炒作新产品及娱乐八卦有着立竿见影的考核效果。随着博客严肃性的不断提高,基于和针对博客的传播手段会首先成为主流。

深度的个人足迹搜索。事实上有非常多的网页是搜索引擎搜不到的,诸如有知识产权的文章、论文、图书馆的书籍等,还有很多技术暂时无法实现,很多重要的商业信息和个人信用被搜索引擎屏蔽掉,所以专门的深度搜索(俗称人肉搜索)是个杀手级的消费类应用,搜索的对象可以是邮箱、网名、电话等等。

论坛监听。奇虎和大旗都是曾经论坛聚合的先行者,但是除了带来让服务器不堪负重的滚滚流量,始终无法让广告客户买单,因为其论坛内容的低俗导致读者的层次低下而失去广告价值,最终奇虎和大旗都开始转向成为面向广告主的论坛营销公司,提供危机公关或者“灌水”服务。最近它们又因为B2B的尝试不顺利,重回了社会新闻门户的老路。其实有针对性的论坛搜索是个非常有意思的消费类应用,可以让消费者追踪查看自己或者别人的话题、帖子、跟帖等,个中的消费行为很有挖掘商业机会的价值。

社会媒体的监听。大部分Web2.0社区都开放了接口(除了QQ),通过对迷你博客等实时性比较强的网络通信和上传流量较多的行为如网络像册进行监听,可以非常迅速地掌握舆论的导向或找到热点的话题进行相关的插入营销。对于传统的传播来说,量化的热点制造、热点持续和热点升级是非常难得的,而在网络上就非常容易实现了。

网络足迹追踪也存在技术难点。所有的网络足迹追踪都要通过“爬虫”来实现,然而不同于传统搜索引擎,这种垂直搜索并不需要海量的爬虫搜索和索引,只需要针对一些比较大的社区、论坛、博客、媒体就足够了。但即使是这样,技术对于很多有客户并精于网络营销的垂直搜索门户还是一个难题,不过正在出现的“外包爬虫”应当很快能解决这个问题。

猜你喜欢
爬虫监听足迹
党的足迹
基于Python的网络爬虫和反爬虫技术研究
Python反爬虫设计
足迹
基于Scrapy框架的分布式网络爬虫的研究与实现
习近平的外交足迹
谁抢走了低价机票
中国足迹
监听“有”道 ——杰夫(美国)
论秘密监听的立法问题