电商平台TikTok的算法怎样?其原理是什么?
关于 TikTok 算法的深度剖析
在当今的数字世界中,流行短视频应用 TikTok(抖音海外版)可谓是独树一帜,吸引了全球海量用户的沉浸其中,而这背后的关键因素之一便是其强大的算法。根据 Sensor Tower 的数据显示,今年 5 月,抖音和 TikTok 的全球下载量已突破 20 亿次,仅在美国,TikTok 就坐拥 1 亿用户。如此庞大的用户基数,为 TikTok 训练出成熟的推荐模型提供了坚实基础,这样由现实数据构成的数据集,确实是其他公司难以仿效的。
TikTok 公司的高管近期向美国媒体透露了其“杀手级”算法的运作原理,包括如何借助机器学习最大限度地提升用户参与度,以及如何突破“信息茧房”的束缚。TikTok 的算法能够为用户推荐下一个要看的视频,这一强大功能助力该应用获得了巨额人气以及数百亿美元的估值。由于美国方面的压力,字节跳动不得不准备出售 TikTok 美国业务,而算法成为了潜在交易的焦点之一。TikTok 高管在与记者的电话会议上表示,他们正在公开有关算法和数据操作的细节,以消除关于公司的各种不实传言和误解。
TikTok 高管为记者提供了一次虚拟之旅,带领他们参观了位于洛杉矶的新“透明中心”。该中心将为人们展示计算机模块的区域,这些模块展示了 TikTok 的算法和数据操作是如何运行的。
TikTok 的算法利用机器学习来确定用户最有可能参与的内容,并为他们提供更多相关内容,方法是找到相似的视频,或者找到有相似用户偏好的人喜欢的视频。当用户首次打开 TikTok 时,他们会看到 8 个热门视频,涵盖了不同的趋势、音乐和主题。此后,算法会继续根据用户观看或参与的视频以及用户正在进行的行为,为用户提供 8 个更新的视频。
该算法会根据视频信息(可能包括字幕、标签或声音等细节)识别与用户观看的视频相似的视频。它还会考虑用户设备和账户设置,包括语言偏好、国家/地区设置和设备类型等数据。
当 TikTok 收集了足够多的用户数据后,应用就能根据相似用户的喜好来描绘用户的偏好,并将他们分组到“集群”中。同时,它还会根据类似的主题将视频分组,比如“篮球”或“兔子”等。
通过机器学习,TikTok 的算法可以根据用户与其他用户集群、他们对内容的喜爱程度接近程度向用户提供视频。TikTok 的逻辑旨在避免可能让用户感到厌烦的冗余内容,比如看到多个具有相同音乐的视频或来自同一创作者的多个视频。
TikTok 承认,其如此高效地锁定用户偏好,意味着算法可能会产生“信息茧房”,强化用户现有的偏好,而不是向他们展示更多样化的内容,拓宽他们的视野,或者提供他们不感兴趣的内容。TikTok 表示,他们正在研究“信息茧房”,包括其持续时间以及用户如何遇到它们,以便在必要时更好地打破它们。由于“信息茧房”会强化阴谋论、恶作剧和其他错误信息,TikTok 的产品和政策团队会研究哪些账户和视频信息(主题、标签、字幕等)可能与错误信息有关。
与错误信息相关的视频或创作者会被发送到公司的全球内容审查员那里,以便 TikTok 可以在上述内容在推荐页面上推送给用户之前进行管理。
TikTok 还介绍了公司在数据、隐私和安全方面的最新举措。公司表示,它试图在事件发生之前对其平台上的事件进行分类和预防,通过在问题蔓延之前检测问题的模式。
TikTok 负责美国公共政策的副总裁迈克尔·贝克曼(Michael Beckerman)表示:“尽管我们才成立两年,但却有着长远的目标。我们没有机会在互联网的黄金年代成长,那时科技公司不会做错任何事。我们成长在科技狂潮的时代,人们对平台、它们如何审核内容以及它们的算法如何工作都持怀疑态度。”
TikTok 首席安全官罗兰·克劳蒂埃(Roland Cloutier)表示,计划在年底前在美国招聘 100 多名数据、安全和隐私专家。他还表示,该公司将在华盛顿特区建立一个监测、反应和调查反应中心,以积极检测和实时应对危急事件。
贝克曼表示,TikTok 的透明度努力是为了将公司定位为硅谷的领导者。他说:“我们希望占据领导地位,更多地展示这款应用的工作原理。对我们来说,我们是新来者,我们想要这样做,因为我们没有什么可隐瞒的。我们与立法者交谈和会面的次数越多,他们对我们的产品就越了解,感觉越满意。”
TikTok 算法的独特之处与影响
据相关研究和专业人士评价,TikTok 的算法具有其独特性和强大影响力。Bondy Valdovinos Kaye 表示,如果没有这套算法,TikTok 就不会是现在的 TikTok。而 Sabba Keynejad 则指出,还没有哪家公司能在推荐系统上真正赶上 TikTok 的水平,尽管从算法层面来说,TikTok 使用的是一套业界标准的架构,但每次点击都会揭示用户的喜好,这为 TikTok 提供了更多有关用户喜好的有用信息,且 TikTok 拥有庞大的用户基数。Nikita Aggarwal 也认为,TikTok 可以以 YouTube 这样的长视频平台无法想象的规模测试用户的兴趣。
TikTok 可以每小时为用户提供上百个不超过一分钟的短视频。Eugene Wei 认为,只需要几秒钟的反馈,就可以记录对视频的感受,而且由于 TikTok 是全屏应用,可以假定用户对视频的任何行为都反映了他们对视频的看法。
TikTok 算法的机制剖析
以下是关于 TikTok 算法机制的具体内容:
首先,TikTok 算法类似抖音,流量分配是去中心化的。在 Instagram 上,如果没有粉丝,发的内容可能就没人看和点赞,但在 TikTok 不一样,只要发视频,不论好坏,都会有一定的浏览量。行内称为流量池,TikTok 的算法会给每个视频 100-1000 的流量,之后会根据视频表现给予第二波流量池 1000+,以此类推,所以视频内容一定要足够好且吸引人。
其次,TikTok 的流量池有不同等级,不同权重的账号有不同的流量池。抖音流量池的评判标准包括点赞数、评论数、转发数和完播率。即使是刚申请的账号 0 粉丝,发任何视频也会有 300 左右的浏览量。只要有优质内容,就有机会成为大号,所以要保持好心态,坚持发布。
最后,当 TikTok 给第一波流量池后,会根据这波流量池(0-1k 播放量)来判断内容是否受欢迎,如果答案是肯定的,就会给予第二波流量池(5k 播放量),接着是第三波流量池(1w-10w 流量),这里要遵循一个指标:播放量(完播率)>点赞量>评论量>转发量(老外很喜欢点赞)。同时还要注意“挖坟”的概念,即之前发的视频可能因为某些原因突然火了。但如果有一条流量少的视频,不要轻易删除,因为可能会有后续潜力。而且如果有一条视频违规,TikTok 可能会降权。