■ 李若
如何让搜索引擎拥有“生命”?
■ 李若
在许多人看来搜索引擎只是一个检索工具,就像其他冷冰冰的科技产品一样。实际上,搜索引擎正在成为人人依赖的智能助手。它在拥有感知环境和自我学习的能力后,随着岁月流逝将不断地将信息转化为知识,再将知识沉淀为智慧,被赋予“生命”价值。
Online Learnin便是让搜索引擎“活起来”的关键技术,它让搜索引擎拥有更强大的学习能力进而越来越聪明。
理论上来说,一个用户使用搜索引擎越多,搜索引擎就愈发了解这个用户和整体热度变化,推荐精准度会越来越高。根据用户特征不断调整算法提高准确度就是学习过程。在Online Learning技术之前,搜索引擎的学习是离线完成的,定时进行数据模型和排序及推荐算法的更新,但不会做到在用户每一次反馈之后都更新算法。Online Learning则让“学习”更加具有时效性,粒度细化到每个用户。它可以随时根据用户的下载、点击、停留时间、鼠标移动这些行为去理解用户进而动态调整排序和推荐算法,给用户想要的。
在技术上Online Learning只需要对当前用户相关的数据进行计算即可,增量学习的方式节省了计算资源同时增强了时效性,因为它可以一边学习一边预测、推荐和排序,这可以做到对推荐的动态调整进而确保推荐效果。
在这种快速迭代的基础上,Online Learning能够采取比离线预测更为灵活的策略,如Bandit策略,它能够降低信息的冗余,缓解马太效应,给了资源更多更平等的机会,可以说形成一种“百花齐放”的状态,在短时间内迅速定位优质资源。
在百度的搜索引擎结果中,右侧知心中,App助手推荐,多媒体搜索结果中,在线学习系统已被大规模应用,相关测试表明Online Learning可大幅提升推荐点击率和用户满意度。现在你搜索“双层床”右侧不会只出现相关结果,而是根据之前用户搜索类似关键词后的反馈,推荐了小户型装修等服务。
Online Learning即在线机器学习,目前业界只有百度进行了大规模的商业化应用。Yahoo和Google进行了一些尝试,但集中在实验、调研或者论文层面。Online Leaning技术与百度正在深耕的深度学习、百度大脑以及大数据业务有着千丝万缕的联系,接下来必将得到更大的提升和应用机会,据说百度已经在为与之相关的技术已经在申请专利。
好比一个儿童在早期说法、写字、走路都需要有大人刻意训练一样,这时候它并无“在线学习”能力,而是“监督学习”;到了一定阶段它可以根据环境反馈和个人经验自己掌握一些技能,譬如在不断跌倒和骑行过程中自学自行车,下水喝了几次水之后自然习得游泳技术,这时候就是“在线学习”模式。可以说,人脑本身就是一个基于反馈在线学习的系统,Online-learning就是人脑接收环境和外界对于人的“反馈”,以使得人不断调整自己行为的过程,这种学习机制是人类不断自我进步和自我发展的源动力。
今年李彦宏曾对外透露“百度大脑”的智力水平已接近3岁婴儿,我们尚不知道这个项目究竟做了什么看得见的东西,没有科技媒体能够走进这个项目深入了解它。百度对此介绍只有寥寥数字:利用计算机技术模拟人脑。百度大脑还出现在了百度推出的世界首个大数据引擎中,百度大脑发挥的作用就是让大数据引擎能够在数据挖掘的基础上,形成“如何挖掘数据”的学习能力。
现在看来所有技术都是互联互通的,百度大脑与Online Learning相似之处都是让搜索引擎“活起来”,拥有学习能力和智力水平,最终越来越聪明。
近年来越来越多科技巨头开始关注科技与人类和谐共处的问题,苹果让科技与人文和艺术更加紧密的结合,可穿戴设备让科技穿戴或植入人体隐秘存在,Nest则让科技具有感知环境和自我学习能力,百度则是让搜索引擎愈发聪明,理解人,与人自然对话。未来所有这些科技都会融为一体:手机、智能硬件、物联网、互联网服务,无处不在的科技最终让人们感受不到科技的存在,科技与世界已经浑然一体,水乳相融。