TikTok 算法的真正价值

2020-10-29 05:40刘集
电脑报 2020年39期
关键词:图谱社群算法

刘集

突破了传统社群惯性思维

TikTok陷入风口浪尖,未来显然还不明晰,在股权、营运权、源码与资料的分配下各方利益都僵持不下。如果说TikTok 的算法会影响国家安全,想必能让程序员笑掉大牙,熟悉机器学习的人不相信 TikTok 真的发展出什么独门秘技,是硅谷无法破解或模仿的。

然而同时 TikTok 的成就也摆在眼前,它是从中国崛起走向世界网络服务中的优秀“作品”。不仅席卷美国,在印度、中东、东南亚都以奇迹般的速度发展。TikTok 是过去 10 年第一个新的全球社群媒体,突破了由 YouTube、脸书、Instagram 等美国上一代社群媒体的控制。

通常来说,媒体要打入陌生的文化圈非常困难,有着五千年华夏历史的中国本身也不是强势的文化输出国。TikTok的成功,靠什么?

尤金·卫曾在亚马逊、Flipboard 与 Hulu 带领过产品团队。同时他也是电影导演,因此对于媒体常有独到见解。最近他写了两篇文章分析 TikTok 的优势,分别是《TikTok 与分类帽》(TikTok and the Sorting Hat)与《像算法一样的看》(Seeing like an Algorithm)。

他指出社群媒体最重要的资料叫兴趣图谱(interest graph)。也就是用户的喜好。知道用户喜欢看什么,平台才能推送适合的内容,以及适合的广告。

然而传统社群媒体都是通过间接的资料建立兴趣图谱:社交图谱(social graph)。传统平台鼓励用户加好友、点赞、追踪等,建立社交关系。接着平台再根据社交关系推论用户的兴趣:你的朋友都喜欢这个,你可能也喜欢?比如当下的微信,就是从聊天开始慢慢扩展出平台化的社群功能。

这种做法至少有四个问题。第一,不精确。例如许多人追踪一些微博大V,可能是想看科技评论,但博主有时也会聊小孩、教育,对他们来说就是不需要的信息。

第二, 無法规模化(scale)。可规模化是指量体增加仍维持同样的品质。可是在传统社群媒体上,当朋友与追踪对象突破数百,甚至数千人时,动态墙就变得一团混乱。小学同学、同事、父母、应酬上只聊过一次的朋友、不认识的意见领袖等,全部的言论挤在一起,这得花多大力气才能区分开啊。

第三, 导致一些群体的对立和骂仗。有一本书叫《同温层时代的生存指南》,其中解释过,传统社群媒体笃信自由主义,认为平台应该容纳多元化的想法、语言。现实却是人类无法处理这么多信息,意见不统一就陷入了口水仗。

第四, 不公平。先行者在传统社群媒体有优势。平台为了鼓励创作者累积追踪者,会优先导引流量给那些已经累积许多追踪者的人。这导致贫者益贫,富者益富。新人难以追上先行者,长期以往,就没有兴趣在平台上发表创作了。

最坏的结果是用户流失,如果遇到新的技术出来,这个平台可能垮得很快。用户觉得平台上的内容太乱、没有趣、充满对立与愤怒,于是一个一个地离开了。

TikTok 的计划经济

社交是个大命题,现在互联网厂商和用户都知道流量为王,TikTok的核心在于由“中央计算”来决定流量的去向,每一个用户看到的推荐内容都由算法决定。

TikTok 的算法几乎不考虑社交图谱,而是完全偏重用户的使用行为。只要你的影片能吸引一小批人驻足,算法就会推荐给其他可能感兴趣的人,这解决了传统社交的问题。

首先,算法分配更公平。TikTok 会根据用户的停留时间,用户是否按爱心、浏览创作者首页、点击音乐来源或标签等行为来判断用户的兴趣,这让新加入的内容创作者更有机会突围。

其次,可以规模化。每个人看到的推荐都不一样,也不会各种内容挤在一起。就像《哈利·波特》中的学院制分配,将学生分到不同学院,但是学习又能在一起。用户在 TikTok 上也吵不起来,因为不知道彼此看了什么内容。

最后, 算法推荐更精确。TikTok 直接建立兴趣图谱,避开了社交图谱内含的杂讯。而且显然这种方法在全球都适用。

然而,可能有用户会问,为何 TikTok 的算法特别精确?欧美的互联网巨擘难道程序基建不比我们强?算法本身不特别,关键在于字节对于后台数据的大量分析。

自给自足的内循环

TikTok 原名 Musical.ly,是一个在美国青少年之中蹿红的小社群媒体,特别适合制作歌唱影片。后来字节跳动并购了Musical.ly,将之改名为 TikTok,并串接了字节跳动的招牌算法。同时字节跳动开始为 TikTok 狂打广告,据说在 2018 年就花了 10 亿美元广告费,第一批用户由此建立。

TikTok早期的短视频资料除了自身策划,主要源于自由创作者

有了种子用户,TikTok开始收集资料,其资料主要是自给自足的——完全来自APP内。

TikTok可能从交友平台学来这样的设计:左滑没兴趣,右滑喜欢。相较之下,传统社群媒体则采取无限滑动(infinite scroll)机制,让用户可以不断地往下滑。

但是TikTok用起来也有一些比较麻烦的地方,用户要一直用手滑动,确实比较累,还容易得腱鞘炎。然而却让算法能取得更清楚的资讯,知道每一个动作对应的影片。相反的,脸书、Instagram 等的画面中随时都有至少两则内容,算法很难判断用户是为了哪一则内容停留。

另一个例子是传统社群媒体不允许按“不赞”(downvote)。但 TikTok 的设计已经内含了不满意的讯号——只要你停留时间够短,就是表示没兴趣。

从TikTok还可以取得其他资讯,例如用户可以点击唱片图标,连接至其他使用同一则音乐的影片。用户可以点击爱心或创作者头像,显示你格外有兴趣。创作者上传影片时会下标签(tag)。TikTok 的算法也會判断影片中的内容,诸如物件、人物、性别、表情、影片长度、滤镜效果等,当然 TikTok 也知道观众的喜好资料。

所以综上所述,TikTok 最大的创新并不是算法,而是整个产品围绕算法做的需求设计。业内人士称之为算法友善(algorithm-friendly)设计。这跟一般的使用者友善(user-friendly)略为不同,就好像算法也化身为团队成员。

TikTok 抛弃了社交图谱的打法,创造了自给自足的资料回馈圈(feedback loop)。用这些资料训练算法,用户就能看到真正有兴趣的内容。而越多用户使用 TikTok,就有越多创作者在此博求关注。

社群媒体是双边平台:一边是观众,另一边是创作者。TikTok 不只研究观众的兴趣,也研究如何刺激创作者生产内容。

被低估的创作平台

TikTok 创造了创意性的网络效应(the network effect of creativity),但没有详细解释。不过身为创作者,我们可以观察到几个特色。

首先,TikTok 提供易上手的创作工具,让用户可以快速地制作短片,并加上各种效果,满足了视频制作者的需求。

其次,TikTok 提供各种范本(template)。创作者都知道,创意的核心是抄袭,咳咳,应该说致敬。TikTok 上有许多人翻唱同一首歌、跳同一支舞或是用同一个梗,就是一种创意模仿。

而 TikTok 也鼓励用户和用户之间的互动,让创作者能轻松引用同一首音乐,也可以做双人舞或者分屏拼接(duet)。

两次, TikTok 提供数据。TikTok 会显示当前热门的关键字、标签,引导创作者做相关的影片。这一点也蛮有计划经济色彩。

最后,TikTok 创造了一种互相连接、开放分享的文化。在算法之下,适者生存。创作者无法仰赖追踪者数,必须时时观察 TikTok 上的流行,察觉算法的偏好,并参与社群之中。而最快的方式就是合作、创意模仿。

TikTok 指出了一条路,让算法居于核心,用设计来喂养算法。这个做法最终能规模化地掌握每一个人的个别兴趣,而且不需要经过社交图谱。这个设计概念不只适用影片或娱乐——字节跳动第一个算法作品是新闻APP今日头条,未来也会出现在任何需要算法的产业,至少包括电商、课程、交友等。例如笔者就很希望有一个针对自己兴趣,推荐科技文章的APP。相信在未来,各行各业都会出现采用 TikTok 模式或算法友善设计的挑战者。

猜你喜欢
图谱社群算法
基于CiteSpace的我国文化“走出去”研究的知识图谱分析(2001-2020)
社群新玩法:分层和快闪
营销的最短路径
Travellng thg World Full—time for Rree
社群短命七宗罪
图表
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
最精确人类大脑图谱出炉