今日头条绿色版
我们分析Frederator的访问速率,发现整个生命周期内累计访问次数与前48小时内订阅用户访问百分比呈指数关系。
基于这个观察,我们稍微深挖了一下,发现用这个速率规律去预测一个视频是否会成功,可以做到92%的准确率。其实,还存在一个更直接的相关性:72小时内访问的订阅用户百分比,与视频整个生命周期的累计被访问次数之间。
这两个图以及相关系数充分说明访问次数和访问速率对视频和频道有着直接而重要的影响。除此之外,我们还有证据证明这个规律反过来也成立。差劲的访问速率不但影响这个视频本身,还影响其上一个和下一个视频。
下图说明如果Frederator上一个视频48小时内访问速率比较糟糕(少于5%的订阅用户访问),那么接下来上传的视频也会受其影响。
也可能是因为上一个视频表现糟糕,所以访问你的频道次数就会减少,自然地就导致更少的订阅用户以原生的方式访问到。不管到底“为什么”,结果反正就是酱紫。
另一个负速率对新上传视频的影响就是:有证据表明这还会伤害到你的整个视频库。下面的第一张图是视频上传48小时内就访问的订阅用户7天平均百分比(译者注:这7天上传了若干个视频,纪录每个视频上传后48小时就访问的订阅用户百分比,然后取这些百分比的平均值)与频道总访问次数(译者注:反应了整个视频库的效果)的关系。第二张图是某一天访问视频的总体订阅用户百分比与当日的总体访问次数之间的关系。
这些图标都说明一件事:一旦新上传视频和整个视频库的访问用户百分比走低,那么频道的总体访问次数也会走低。对于我们来说的启示是:YouTube算法更看重那些能够吸引到核心观众的频道,而惩罚那些不能吸引其核心观众的。
访问停留
另一个算法非常看重的指标就是访问停留(View Duration)。
访问停留就是用户会花多长时间停留在单个视频页面。这个变量的权重很高,我们的数据中能看到一个明显的引爆点。Frederator其中一个频道,前30天内,平均访问时长8分钟的视频,比平均5分钟的要多350%的访问量。下图表明,Frederator的一个频道的视频访问量,与平均访问停留时长的关系。
我们还发现,访问停留时长越长,视频表现越好。下面这张图是七天内访问停留时长少于5分钟的视频(1),介于五分钟到十分钟的(5), 十分钟以上的(10)分别与访问量的关系。
下面这张图也是一个意思,不过从7天拉长到整个生命周期内了。
基于这些发现,我们可以得出一个简单的结论:发布长视频可以提高访问效果。Frederator有一个关于儿童乐园的频道,每周会上传三到四个不同长度(3分钟,10分钟,30分钟。70分钟)的视频,我们发现每个视频发布后的48小时内,70分钟视频的访问次数远远超过其他长度的视频,哪怕是重发一些炒剩饭的旧视频。除此之外,70分钟的视频和其他版本的视频有相同的平均访问停留时长。
于是,我们建议公司每周就只上传70分钟长度的视频就好了。就用了这个策略,频道日均访问量增长了50万,而过去6周里我们上传的视频个数却减少了75%。好了好了,我知道你受刺激了,不要崇拜哥。
破解今日推荐视频
YouTube的算法设计时关注的是频道效果而不是单个视频效果。但是它要利用单个视频来提高频道效果。
算法结合了单个视频的特定数据和频道的聚合数据来决定推荐哪个视频。最终目标仍然是为频道聚拢其目标观众。
YouTube这么做是因为:
1. 让用户常常回访YouTube平台
2. 让用户在平台停留越久越好
下面有三张图表来证明这则理论是成立的。
第一张图是48小时内访问的订阅者比例与7天内总访问量之间的关系。这张图说明,如果开始有大量用户从你的视频开始的平台会话,那么你的视频就会获得很大的访问量。到达一个阈值之后,就会呈指数级增长。
第二个图是频道内日均访问量与5日内访问的订阅用户百分比的关系。
这意味着如果能一直让大量用户从你开始访问YouTube(近5天内平均来看),那么算法就会将用户每日访问向你整个频道视频库倾斜。
最后一幅图是日均访问的订阅用户百分比与5天内访问的订阅用户百分比之间的关系。
我们相信这一切都表明,频道效果的连贯性与访问量之间存在相关性,访问量又表现在订阅用户访问百分比,YouTube就会因此把流量倾斜给你。
假如说你有一个游戏频道,10万个订阅用户,你每天上传6个视频,每个视频有5%的订阅用户访问。你的每个视频的平均访问订阅用户会稳定在区区5%。这意味你会每天产生30%的订阅用户访问次数(3万/天,60万/月)。现在假设你有1百万订阅用户,那么每日访问次数在30万,每月在600万。
我们认为这一段数学运算是不会骗人的。这意味YouTube在根据一些指标选择一些频道进行推荐,然后只要算法帮这个频道提高访问量。
但,壮士请留步,以上还仅仅是理论上的分析!
破解今日推荐视频
抖音在发布页面上已经这么清楚的告诉了所有人,加话题能使得视频被更多人看到。
如此明确的建议之下,「加话题有机会大涨流量」这本不该是什么秘密。然而奇怪的是,甚少有人去认真对待话题的添加。
在发布视频的时候添加话题,是否真的能提高视频的播放量?
在一些抖音头部账号里面,已经可以发现添加的话题数量越多,视频的平均点赞量越高。
当然「刘思瑶nice」这个随便用来举例的账号,添加了话题的视频比没有添加的优势并不算太大,还远非最优化的状态。
破解今日推荐视频
而且不仅是抖音,只要是自媒体的推送系统,往往都比较依赖于话题这个东西。我也对小红书的话题做过研究,在小红书上面话题对于推送量的影响比抖音还要更大。
那怎么去添加话题呢?下次发布抖音视频的时候,随便点几个抖音推荐的话题去添加?
不好意思。若是这么简单粗暴的操作,十有八九会使得推送量反而降低:
怎么情况突然反过来了?
其实很容易理解——既然添加合适的话题,可以把视频推送到更精准的用户群体进而提高推送量,那么反过来,如果选择添加上去的话题不尽如人意,自然也可以拉低推送量。
既然大多人还完全没意识到话题的重要性,那么他们选择话题的方式可想是非常随意的。最终反而使得流量下降并不奇怪。
什么样的话题是适合添加的呢?不难想象,核心条件包括但必然不限于:
1) 话题受众人群和视频受众人群高度重合,否则会错误推送给对视频不感兴趣的人,拉低视频整体质量指标
2) 话题受众人群的体量较大,也即总播放次数高,否则哪怕视频质量再高也无处可推送
如何高效找到符合上述两个条件的话题,也是一门学问。首先需要抓取海量的数据,之后在这海量数据下进行检索匹配、分析话题共现,是最起码应具备的条件:
听上去已经有些复杂了么?但前面提到的这两步,只是最最基础的。
只做这两步,也即精准的添加相关且热门的话题之后,尽管是能够提高推送量,有切实的操作价值,但从我这边收集的各种统计数字来看,恐怕也提升不了太多,不用期望一下子就见到极其可观的增长。
毕竟文章为了易于大众理解,写到的结论只是平均数这般中学程度的知识。但后面把提升工作真正落到实处,背后需要的知识储备还多得多。
通常来说,理论研究的步骤是:
1)看书,了解推荐系统的基础原理
2)通过统计手段,总结部分表面的事实情况。除了单纯的统计方法,也应当使用到深度学习等手段
4)通过不断提出假说再进行验证,设法总结所有本质的事实情况。这个阶段除了对数据挖掘与分析能力的进一步要求,逻辑能力也会成为一个门槛
第二、第三步骤是可以交替进行的,但第一步骤一定是所有研究的基础,第四步骤也往往是最后真正的研究重点。
就如同,有时我们会见到同一个账号下几乎一样的两个视频,一个表现平平,另一个却爆火了,两者之间差了百倍千倍的点赞量,这是为什么呢?在了解基础原理以后,才有机会知道其中一个视频没有进入「召回」是这类现象的最常见解释。倘若缺乏了常识,那么再全面的数据、再牢靠的逻辑也是无法帮助我们找到真相的。
与研究推送系统些许接近的搜索引擎优化的领域,因为一些行业大背景的原因,许多人跳过了第一第二步,即没有夯实基础、也没有建立起科学系统的分析方法,就直接去阅读百度专利想要一步登天。殊不知这样顶多看到整个体系之中的零星碎片,绝不是值得提倡的做法。
文章至此为止,只是话题这一种操作手段的其中一个探索方向罢了。冰山之一角。我尽管只是逐渐在挖掘这座冰山的一个个角落,但太多人甚至还没意识到自己面对的是座庞大的冰山。
未来若有机会,会再写写抖音上面,除了话题以外其它不为人知的重要地方。
破解今日推荐视频
Matt Gielen是Frederator Networks的前副总裁, 主管编程和观众开发。
Matt所管的团队是世界上最大的动画制作网络公司,Frederator网络频道。
他还带领团队制作和编程了Frederator Networks自己的YouTube运营频道:Channel Frederator,The Leaderboard,Cinematica。
你还可以在twitter上关注他@mattgielen。
最初看到这篇文章是@fengyoung 在Facebook上分享的,觉得题目很有意思就看了一遍,看完后感觉很有启发,遂决定翻译一下让更多人看到。
这篇文章给我的启发有三方面:
1. 从YouTube平台的算法设计人员角度,设计繁多的推荐算法,是为了提高频道的观看时长,而提高频道的观看时长又是为了让用户能够经常访问平台。这是一种双赢的思维,说白了:谁能帮平台留住用户,平台就重点扶持他。
破解今日推荐视频
这里我们打算破解YouTube的算法,然后重建一个。用了15个信号量,以及我们估计的权重,来重新构建打分算法。信号量列举如下:
下面这些图是这些信号量实际产生的效果。
下面这张图更详细一些。
知道你还是很好奇,那下面就揭晓我们模拟出来的各种权重:
然而但是but,我们也没有其他数据了,所以我们也不敢肯定在计算相关性时该用哪种回归方式,也只敢说大多数信号和算法之间很相关,而已。也正因为如此,我们对YouTube算法一直热情不减。
破解今日推荐视频
既然点赞率在大部分情况下对于播放量几乎毫无影响,那么可想而知,诸如完播率在内的其它视频质量指标很可能在一部分情况下,对播放量的影响也会有限。
这就回到了前面提到的观点——推送量同时取决于视频质量,以及视频被推送到哪些人群。
尽管在发布视频的时候,抖音已经通过视频里面的画面和文案,初步的自动分析了视频可以往什么样的人群会去推送,但仍然远非完美。
诸如星座类型的内容,大多年轻女性都是多少感兴趣的,哪怕跨领域往美妆的用户群体去推送也勉强可以。但与此同时,和星座同样是主要基于出生时间的八字,看似和星座挺像,但对应用户群体却主要是中老年人,通常不应当把星座内容推送到对八字感兴趣的用户那边去。
像是上面这般的道理,主要是基于常识的,然而常识这种东西又恰恰是现在所谓的「人工智能」所不具备的。所以,视频到底推送向什么样的人群,还是需要借助发布者进一步的人工纠正。