TikTok的算法究竟是怎样的?
关于 TikTok 算法的深度剖析
在当今的社交媒体领域,TikTok(抖音海外版)可谓是一颗耀眼的明星,吸引着全球数亿用户沉浸其中,而这很大程度上要归功于其独特的算法。根据 Sensor Tower 的数据,仅在今年 5 月,抖音和 TikTok 全球下载量就突破了 20 亿次,其中仅在美国,TikTok 就坐拥 1 亿用户。基于如此庞大的用户数据,TikTok 已然训练出了极为成熟的推荐模型,这样由海量现实数据构成的数据集,确实是其他公司难以仿效的。
TikTok 公司的高层近日向美国媒体透露了其“杀手级”算法的工作原理,包括如何借助机器学习将用户参与度最大化,以及如何突破“信息茧房”的束缚。TikTok 的算法能够为用户推荐下一个要看的视频,这一强大功能助力该应用收获了超高人气以及数百亿美元的估值。然而,迫于美国方面的压力,字节跳动不得不准备出售 TikTok 美国业务,而算法无疑成为了潜在交易的焦点之一。
TikTok 高管在与记者的电话会议上表示,他们正在披露关于算法和数据操作的细节,旨在消除关于公司的各种谣言和误解。他们还为记者提供了一次虚拟之旅,带领记者参观其位于洛杉矶的全新“透明中心”,该中心将展示计算机模块,用于呈现 TikTok 的算法和数据操作的运作方式。
TikTok 算法的具体运作机制
TikTok 的算法运用机器学习来确定用户最可能感兴趣的内容,并为他们提供更多此类内容,其方法是找到相似的视频,或者找到有相似用户偏好的人所喜欢的视频。当用户首次开启 TikTok 时,他们会看到 8 个热门视频,涵盖不同的趋势、音乐和主题。此后,算法会根据用户观看或参与的视频以及用户正在进行的行为,为用户提供 8 个更新的视频。
该算法会依据视频信息(可能包括字幕、标签或声音等细节)识别与用户已观看视频相似的视频。同时,它也会考虑用户设备和账户设置,如语言偏好、国家/地区设置和设备类型等数据。
当 TikTok 收集到足够多的用户数据后,应用就能够根据相似用户的喜好来描绘用户的偏好,并将他们分组到“集群”中。同时,它还会根据类似的主题将视频分组,比如“篮球”或“兔子”等。
TikTok 算法的独特之处与影响
通过机器学习,TikTok 的算法可以根据用户与其他用户集群的接近程度以及他们对内容的喜好程度为用户提供视频。TikTok 的逻辑旨在避免可能让用户感到厌烦的冗余内容,如看到多个具有相同音乐或来自同一创作者的多个视频。TikTok 承认,其算法能够如此有效地锁定用户的偏好,意味着可能会产生“信息茧房”,强化用户现有的偏好,而非向他们展示更多样化的内容以拓宽视野或提供他们不感兴趣的内容。
TikTok 表示正在研究“信息茧房”,包括其持续时间以及用户如何遇到等,以便在必要时更好地打破。由于“信息茧房”可能会强化阴谋论、恶作剧和其他错误信息,TikTok 的产品和政策团队会研究哪些账户和视频信息(如主题、标签、字幕等)可能与错误信息有关。
TikTok 还介绍了公司在数据、隐私和安全方面的最新举措。公司表示会尝试在事件发生前对平台上的事件进行分类和预防,通过在问题蔓延前检测问题模式来实现。
TikTok 算法的竞争优势与未来发展
TikTok 负责美国公共政策的副总裁迈克尔·贝克曼表示,尽管公司成立仅两年,但却有着长远的目标。他们成长在科技狂潮的时代,人们对平台、其内容审核以及算法工作方式都持怀疑态度。TikTok 首席安全官罗兰·克劳蒂埃表示,计划在年底前在美国招聘 100 多名数据、安全和隐私专家,并将在华盛顿特区建立一个监测、反应和调查反应中心,以积极检测和实时应对危急事件。贝克曼称,TikTok 的透明度努力是为了将公司定位为硅谷的领导者,希望展示应用的工作原理,以赢得用户的信任。
业界专家对 TikTok 算法也有诸多评价。有研究人员认为,如果没有这套算法,TikTok 就不会是今天的 TikTok。还有人指出,虽然从算法层面看,TikTok 使用的是业界标准架构,但每次点击都能揭示用户喜好,为 TikTok 提供了更多有用信息,且其庞大的用户基数是关键。此外,TikTok 可以以超短时间为用户提供大量短视频,这是其他平台难以比拟的优势。
总之,TikTok 算法凭借其独特性和强大功能,在社交媒体领域占据了重要地位,未来其发展也值得持续关注。