你被大数据“监控”了吗?智能推荐云服务解读

2023-03-02 04:41黎坤
电脑报 2023年7期
关键词:跳动字节引擎

黎坤

不知道大家有没有这样的感觉:如果你在抖音里经常看游戏解说,系统就会给你推荐各类游戏解说视频,电商也是如此,搜索了几次“游戏手柄”,然后在主页的推荐列表里就会出现大量的游戏手柄及其周边设备的内容,而这也就是传说中的“个性化推荐算法”。在当今这个信息爆炸的时代,如何从海量的信息中快速地过滤掉无用信息,筛选出用户最感兴趣的内容是当前亟待解决的问题之一,而目前来看,国内在智能推荐算法领域,字节跳动旗下的火山引擎无疑最具代表性。

智能推荐让用户与内容主“双向奔赴”

火山引擎是字节跳动旗下的云服务平台,把字节跳动快速发展过程中积累的增长方法、技术能力和工具,开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长,所以你可以简单粗暴地将火山引擎和阿里云、华为云、AWS等云计算服务列为同一类型。

智能推荐平台是火山引擎多个特色功能的其中之一,来源于字节跳动推荐中台,有成百上千算法工程师专门在优化推荐算法。从可靠性来看,火山引擎支撑着字节跳动旗下包括今日头条、抖音、飞书等应用,结果是毋庸置疑的成熟,而且通过火山引擎对外输出给B端客户时,用的是跟抖音今日头条同一套引擎和同一套架构。

以跨境电商为例,考虑到出海企业都要做本地化运营,不同国家或地区的用户偏好非常大。同样一个产品,卖给欧美用户可能更注重品牌,卖给东南亚用户可能更注重性价比,如果商家通过人工分类的方式来进行推荐,效率无疑会非常低,并且很难做到长时间的维系,但是通过智能推荐算法就能很好地解决精细化运营的问题。

而且海外买量和拉新的成本明显比国内高,如果没一个好的推荐算法为客户匹配相关产品,可能他买一件就不会再回头了,无法实现客户留存和复购的目的。并且电商也同样会遭遇“二八效应”,也就是店铺里八成的流量都会被两成的产品带走,对中长尾商品和新品的友好度较低,智能推荐算法就能在保持热度产品推荐力度的同时,适当增加新品的曝光度,提升用户的新鲜感。

算法是智能推荐的根基

智能推荐功能其实有不少云服务供应商在做,除了火山引擎之外还有华为云、腾讯云、阿里云等。从操作逻辑来看,用户需要先将用户信息、商品信息和用户行为接入到火山引擎之中,相对于其他云服务来说,火山引擎支持历史/增量数据质量校验,支持指标为数据统计信息、分布信息、拼接率统计、归因率统计、业务指标统计,以及支持数据质量阈值配置与告警,灵活性很高。

推荐服务包含召回、排序、业务干预三个主要流程。首先是召回,通常分为基于内容召回、基于协同过滤召回、基于模型召回,也就是火山引擎在接入数据后会把相关的数据回收,为下一步排序做准备。一般情况下会同时使用多种召回方式,并通过加权整合结果,并配合业务规则对召回结果集进行筛选、去重等操作。

排序可以分为粗排、精排两种类型。当排序候选集数量较大,比如达到数千甚至数万条目时,通常先通过粗排,降低候选集数量,再通过精排进一步优化候选集。

如果候选集数量不大时就可以直接使用精排。这个排序的方式可以自定义,也可以根据火山引擎的黑盒模型来自动排,以视频内容为例,可以选择评论率和点击率的乘数作为系数,火山推荐服务排序策略支持粗排/精排分别配置,且均支持多路组合。

业务干预就是对结果集提出筛选、去重、打散、置顶、降权等干预需求,也就是可以按用户的实际需求来自定义化。而推荐系统的最终效果要在实际落地应用里进行验证,推荐系统常见的业务指标以电商为例,有CTR(点击通过率)、CVR(转化率)、GMV(成交金额)等,以内容为例就是CTR(点击通过率)、阅读时长、点赞率、收藏率、分享率、评论率等。一般客户会使用AB实验,也就是将流量按是否通过智能推荐区分来进行对比,火山引擎就支持自动AB实验功能,不需要用戶单独再创建实例来进行对比。

总体来说,火山引擎在开放性、行业定制、数据安全和隐私问题方面都有相关部署,在业内已算是相当成熟的方案。

AB对照测试是火山引擎的一大特点

猜你喜欢
跳动字节引擎
No.8 字节跳动将推出独立出口电商APP
跳动的音符
跳动的声音
No.10 “字节跳动手机”要来了?
咚,咚,咚,心脏在跳动
蓝谷: “涉蓝”新引擎
简谈MC7字节码
无形的引擎
基于Cocos2d引擎的PuzzleGame开发
打造稳定跳动的“心脏”