Youtube 算法规则

Youtube 算法规则,第1张

在Google工程师Paul Covington,Jay Adams和Emre Sargin发表的这份 研究论文中 ,他们分解了用于对YouTube推荐视频进行排名的信号:

前三个信号是您可以直接影响的唯一信号。其余部分取决于您频道之外的因素,以便个性化推荐。

这些Google工程师甚至声称,他们的最终排名目标“通常 是预期的每次观看观看时间的简单函数。 按点击率排名通常会宣传用户未完成的欺骗性视频(“点击诱饵”),而观看时间可以更好地吸引用户参与。”

有人可能会认为这意味着优化点击率会让您受到YouTube的惩罚,但这是一个巨大的误解。

YouTube只会惩罚诱饵和切换策略-点击前的承诺过多,而点击后的内容令人失望。点击率仍然像以往一样重要。毕竟,如果不先获得点击,就无法为YouTube带来大量观看时间。

您甚至可以在 YouTube Studios中 看到这些优先级:YouTube的新分析仪表板。

最多可以在5秒内总结出最出色的YouTube频道或系列:

另一方面,许多YouTube频道很难吸引人,因为他们将YouTube频道视为上传所有视频内容的地方,而不是一个连续的视频系列的首页。

保持一致性的YouTube频道能够 持续 增加其订阅者人数和观看人数,因为它使人们更容易决定观看更多内容并订阅其频道。

“我们的盛宴”频道体现了我们正在谈论的那种一致性-名人吃食物-具有多个系列,这些系列本质上是同一前提的变体。

较新的YouTube频道不能依靠推荐引擎来获得所有观看次数。

毕竟,推荐内容主要取决于观看者过去观看和与您的视频互动的方式。YouTube需要数据来作为推荐的依据,没有人观看您的视频就没有数据。因此,请采取所有通常的措施来宣传您的视频,例如:

但最重要的是,着眼于 YouTube SEO 并 吸引更多的订阅者 ,这不仅是为了长期 获取 视频观看次数,而且还因为用户反复在平台上消费以及用户订阅的内容是YouTube算法用于提出个性化建议。

在工程师中,工程师注意到“最重要的信号是那些描述 用户之前与商品本身和其他类似商品互动的信息 ……例如,考虑用户过去的历史以及上传了被评分视频的频道用户从该频道观看了许多视频?用户最后一次观看有关该主题的视频是什么时候?”

如果您可以让新用户点击其中一个视频后继续观看更多内容,则可以增加在下次打开YouTube时向他们推荐视频的机会。

我们已经确定,点击率仍然很重要,YouTube优先考虑观看时间只是针对低质量点击诱饵的一种对策。

环顾YouTube,您会发现视频缩略图上不乏表情丰富的面孔。

Netflix所做的一项 关于平台上艺术品性能的研究表明,“情感是传达复杂细微差别的有效方法。众所周知,人类必须对面孔做出硬性回应-我们已经看到这在所有媒介上都是一致的。但重要的是要注意, 情绪复杂的面孔胜过坚忍或良性的表情。

Netflix也注意到的最早趋势之一,值得发扬到自己的缩略图,它是当图像包含3个以上的人时,它赢得别人的倾向就下降了。

三分法则是实现“ 黄金分割率” 的简化方法,研究表明,这种方法可以 最大程度地减少 大脑处理图像 所需的时间 。

该图像构图准则建议您将兴趣点放置在图像的中心,而不是图像的中心。

根据 Sandvine 的2019年研究,YouTube现在占互联网上所有移动流量的37%。这也意味着相当一部分观众会在移动设备上观看您的视频。

4鼓励观众点击后留下

让人们观看您的视频是一回事。让他们从头到尾真正观看视频是另一回事。

幸运的是,通过在视频创建过程中建立此目标,可以提高视频的完成率(并获得更多的观看时间):

从头开始,并在视频介绍中加入一个“钩子”

转录您的视频,以便人们可以观看静音

根据您的分析调整视频的长度(观看者在下车之前实际拍到多远?)

请勿过长地使用同一张镜头,否则可能会让观看者感到厌烦(这就是为什么跳跳剪辑在YouTube上很受欢迎的原因)

如果您的视频很长,请在片刻间撒些片刻,以便在观众开始徘徊时重新吸引观众的注意力

5鼓励您在频道上疯狂观看

您还可以通过采用涉及视频消耗和一致性的策略来优化频道级别的观看时间。

除了为您的YouTube频道提供专门的前提条件(这可能是最重要的因素)之外,您还可以通过以下其他方法使观看者更轻松地观看更多内容:

使用插卡和结束卡手动推荐相关视频

每当您共享时,都链接到播放列表中的视频,以便用户观看的下一个视频始终是您自己的视频

开发从缩略图到视频本身的一致格式-如果观众喜欢您的其中一个视频,那么他们应该能够正确地假设他们会喜欢您的其他视频。

将特定的号召性用语甚至是其他视频中的场景整合到观众中,直接“吸引”观众,以消费更多内容。

随着YouTube算法的变化,一件事保持不变

多年来,YouTube的算法发生了很大变化,每次都使创作者和品牌争先恐后,想知道为什么他们曾经依赖的方法不再有效。

但是,即使YouTube算法不断发展,但请记住,该平台的目标仍然不变:吸引更多的人在YouTube上观看和观看更多视频。那与您的没什么不同。

这本书2018年就出版了,不得不说,中文译名着实有点“标题党”,仿佛读完就能从中得到一套打造爆款视频的秘籍心法。然鹅,正如很多人读后对本书发出的戏谑评价,这本书更像是一本《YouTube热门视频简介》或者《油管发展史/故事会/观光指南》一类。

所以读这本书前,不妨就带着看科普的心态,了解油管历史上都有过哪些爆款视频,以及这些爆款视频是如何流行的。同时,本书的作者凯文 · 阿洛卡是YouTube文化和流行趋势部门的负责人,从平台(局内人)视角提供的一些洞察,尤其是关于教育类视频的分享,是非常有意思的。

几点洞察:

• 依托于人类旺盛的好奇心,how to(如何) 类视频通过强目的性的搜索入口源源不断的获得消费关注;

• 而另一种好奇心衍生物——解释类(科普)视频,如果是发问式的标题,如果还做的特别生动有趣,对人亦有难以抗拒的吸引力;

• 病毒视频往往与创意或内容品质无关,制造互动(评论、分享和模仿)才是。如何制造有意义的互动点,是视频创作者必须掌握的一项必备技能。

1、How to 类视频不可忽视的流量源泉:搜索

一个叫布伊的人凭借一条《如何打领带——双温莎结》在油管上竟然可以达到日均4万次的浏览量。背后的原因是, 超过一半的浏览量都是使用关键词搜索的用户贡献 。

什么是How to (如何)类视频?简单的说就是方法类、教程类视频。而且这类视频半衰期极长,即使过去很长时间,依然能维持较高的热度,甚至是逆袭式的消费曲线。何谓半衰期?指我们所获得的收益随时间衰减的速度,半衰期长的事件,其影响会持续较久。

凯文说,YouTube上用户花在“教育”类视频的时间是“宠物和动物”的10倍。这个数据似乎有点反常识,这背后体现出,那些能 帮助人们解决生活中一些反复出现的最基本问题 的视频,其实有着非常大的消费潜力和生命力。每天数以百万计的YouTube搜索关键词当中包含了“如何”。

这些用户自发的行为也让YouTube不单单是消遣娱乐,同时变成了获取知识的资源库。结果是,“每当我们需要帮助,每当我们在生活中遇到搞不定的事,总有一款YouTube视频适合你。”

而国内目前承担相同功能角色的产品,哔哩哔哩、知乎、小红书各自都能满足部分,但是还没有一个足够丰富的视频网站,哔哩哔哩有最大的可能性。当然,在看到消费的趋势之后,视频平台显然已经在拥抱多元化,针对教育类视频开发特色的产品功能,创作者也迎来了前所未有的机会。

那么How to类视频,如何从众多同质视频中脱颖而出,获取流量青睐呢?这便非常考验创作者的脚本能力,能否在短短的几分钟内控制好视频节奏,用户看一遍就能学会。当然,标题要包含用户想要查找的核心关键词,为了在搜索排序上占优势,封面也要做的漂亮,让人有点击欲望。

2、解释类视频作者的本质:常识魔术师

除了教程类视频,还有一种和好奇心紧密相关的教育视频类型——解释类视频(或者叫做科普类视频)。如果说前者回答的是一个具体场景的具体问题,提问者带着强目的性而来,希望在短时间内得到解决,不达目的不罢休;后者回答的则是一些关乎身边常识的直观表达,这些主题可能没那么急迫需要得到解答,但也让人们深陷其中,难以摆脱对答案“一窥究竟”的心理。

“布朗和莫菲特与我们生命中遇到的好老师具备相同的素质:他们让学习基本抽象概念的过程变得生动有趣。”

向波老师,四川省广元中学高中化学老师,也是抖音知识类作者,2018年在抖音上传《恋爱中的化学》即获超2000万播放量,在短时间内,向波老师抖音粉丝上涨至600万。他讲化学的角度独特,不是一上来就讲知识,而是先从生活找到和化学的连接点,恋爱、护肤、手机、放屁,用这些勾起学生的兴趣,再恰到好处的引出化学知识,引得满堂哄笑,讲课风格深受学生欢迎。

和“科学来了”频道非常相似的一个国内的短视频IP、抖音知名科普达人“地球村讲解员”,科普关于地球的一切。在抖音上已经坐拥1205w粉丝。第一条视频 《现行的世界地图 有太多假象》 2018年7月一经发出就成了爆款,获得180w点赞,借助三维动画形式,颠覆常识,让人看完发出一声“原来如此”。后面的内容大多也都是一些自然、地理、人文冷知识,什么《海底藏着什么》,《金字塔怎么造》,看似无用,选题却正好卡在好奇点上。很多人在评论区留言从第一条一口气刷到最后。

19年6月突然火起来的B站up主我是何同学一条 《5G到底有多快?》 ,成为红极一时的现象级视频。今年疫情期间,回形针PaperClip发布了一条视频 《 关于新冠肺炎的一切 》 , 用10分18秒解释了这场打乱了数十亿人正常生活的新型冠状病毒肺炎,究竟是如何发生、传播和感染的,在抖音获得了282w点赞。还有已经今年B站火起来的半佛仙人,巫师财经都是一种定位。

---

当然,凯文也指出,解释类视频之所以成功,并不只是因为揭开了某个谜题,而在于为观众创造了一次互动机会。观众不仅喜欢包含谜题、视觉或听觉测试的视频,还喜欢能够制造互动的视频,如流行文化事件(比如,裙子的颜色),或者令人讶异的科学事实。

3、如何制造有意义的互动点,成为创作者

并不是说一个视频浏览量足够大,就能称之为病毒视频。病毒视频的特征在于,它必须是通过偶然的、无组织的人际或者网际网络,在很短的时间内达到流行的视频。

短时间内达到流行的关键,往往与创意或内容品质无关,而在于它是否能够最大限度地激发观众参与互动(评论、分享、模仿等等),可以说,在视频时代,制造互动,才能创造潮流。

如今,视频制作技术已经很发达了,一个视频的价值不再取决于它的技术含量,而是它能对我们的生活产生什么样的影响,让观众之间产生什么程度的互动。 在制作视频时,创作者首先要考虑的便是如何鼓励观众之间进行互动,其他因素都得往后靠。

那么什么样的内容能引发用户的互动? 表达自我个性、传递复杂情感、建立社会联系、加入互联网新潮流, 都有这个可能。

再提最近大火的罗翔老师,罗翔老师的B站走红,就是表达一种对老师上课风格的喜爱。所谓 “快速破圈的神话” 实际上并不存在,冰冻三尺非一日之寒,所有的轻而易举实际上都是蛰伏蓄力已久。事实上,在平台一夜成名之前,就有大量的UGC作者把罗翔老师的课程片段剪辑搬运到了B站,讲课风格圈粉已久。

而罗翔老师“虽迟但到”的铁粉——法外狂徒张三,则更是成了B站用户们自娱自乐的素材起点。不仅有大量以张三名字注册的账号,还衍生出了“三三来迟、开门见三、好惨一张三……”等社区语言,成为一种B站独特的草根文化。

在有392万播放量的“张三史上最惨的一集”中,B站网友“迫害张三”模仿周星驰《唐伯虎点秋香》中的名对,总结了张三悲惨遭遇的冰山一角:一日二狗咬张三四五六口送去医院竟打七八九针假疫苗十分悲惨。

有时,视频内容引发的观众与观众之间、观众与创作者之间的互动,比视频的内容本身更重要。

YouTube推荐系统的三大难点:

· 一是规模太大,简单的推荐算法在如此大规模数据量上可能是失效的;

· 二是实效性,即新数据不断产生,需要将其良好的呈现给用户,以平衡旧有的好内容以及新内容;

· 三是噪音问题,用户行为与视频描述均有噪音,并且只能获得充满噪音的用户隐含反馈,而不能直接获取用户满意度。

图1YouTube基于深度学习推荐系统架构图

本文呈现的推荐系统解决方案分为两个部分:

· 一个是备选生成(Candidate Generation),其目标是初选结果,从海量数据中选择出符合其个人需求偏好的百级别数据;

· 一个则是排序(Ranking),通过更加丰富的用户,视频乃至场景信息,对结果进行精细化排序,得到呈现给用户的备选。

备选生成阶段,将推荐系统定义为一个多分类器,其职责是确定某个用户,在某个场景与时间下,将从系统的视频中选择消费哪一个视频。具体的方法是,将用户与视频全部转化为Embedding描述,即一个向量,最终用户消费某个视频的概率通过如下方式计算得到:

而构建用户与视频的Embedding,则是通过训练而来。将用户观看视频/搜索记录/其它信息如年龄性别等作为输入特征,部分稀疏特征首先进行Embedding化,中间为数层ReLU,最终一层用SoftMax进行分类。 换句话讲,是将用户与场景信息作为输入,预估用户下一个要看的视频,也就是将用户分到具体某一个视频作为其类别。 用户与视频的Eembedding,则是神经网络最后一层的对应矩阵。这种方法除了能利用用户行为信息外,其它信息例如设备,地理位置,性别等也可以作为输入,这是神经网络相对于普通MF类算法的优势之一。

图2YouTube推荐备选生成阶段架构

备选生成的下一个阶段是排序。其网络结构跟备选生成阶段类似,将所有排序模型中的信息输入后,进入多层ReLU,最终进行优化的是一个加权逻辑回归损失函数,观看时间作为阳性样本权重。在这一层,也可以看到其推荐“代理问题”的转化:由点击行为预估转为了以观看时长为权重的点击行为预估,这样更佳贴近Youtube的产品优化方向。与备选生成阶段另一个不同在于,排序模块需要考量的特征要多得多:

· “场景”类特征,例如用户可能在某个地方某个时间愿意观看某一条视频,但是在别的地方别的时间则不会;

· 曝光信息:用户观看了某界面,但是并未在其上进行 *** 作,那么随之应进行已呈现内容降级;

· 备选生成层输出:排序需要将各种备选结果联合起来;

· 更丰富的用户信息:例如用户最近的一次搜索词,用户最近观看的同一个主题下的视频数量,用户上一次观看同主题视频的时间,用户所使用的语言等;

图3YouTube推荐排序阶段架构

除了整体设计与系统架构以外,本篇论文中陈述了很多“选择”,这些选择更多的是“艺术”而不完全属于技术范畴。这些选择往往是很多技术人员关注不多的点,但在笔者看来,这些都蕴含着YouTube技术与产品人员深入的思考与判断。

“Example Age” 特征

对于YouTube产品层来讲,鼓励内容产生毫无疑问是至关重要的,所以推荐系统也希望对用户上传的新内容的有所偏好。然而幸运的是,即使损失一部分相关性,视频的消费者也偏好新内容。也就是说,新内容的价值可以良好的通过其带来的吸引力呈现出来,并不需要平台刻意而为之。

由于系统使用一个时间窗口的训练样本进行训练,如果没有视频的上传时间信息,那么模型会认为这个时间窗口内用户对视频的偏好是稳定的,然而事实远非如此。将视频的上传时间加入到特征集合后,预估更加准确,尤其是视频刚上传阶段的强烈便好被成功捕捉到。

图4无时间特征预估/有时间特征预估/真实情况 三者对比

优化目标选择

图5优化对象的选择

算法系统的设计首先要明确优化对象,这不仅仅涉及到损失函数的形式,同样也是评判系统成功与否的标准。YouTube是视频平台,更是富含“价值”的长视频平台,其观看行为比点击行为意义更大。(当然,笔者认为没有任何一个简单指标可以完全代表一个产品)

“正样本”定义

图6何为正样本的设计选择

训练数据来源

图7关于训练数据来源的设计抉择

训练数据应该只来源于推荐界面的曝光吗?YouTube认为不然。如果只考虑推荐界面曝光,则无法对用户便好进行 探索 ,更加无法捕捉用户偏好的变化,因为用户偏好的变化往往首先会对应着搜索与浏览行为。所以YouTube将各个界面例如搜索,导航等用户行为全部纳入其中。

训练数据窗口

图8 训练数据收集方式的设计选择

Youtube将所有用户等而视之,每个用户收集一定量的样本。而不是惯常可见的直接收集一个时间窗口内的所有用户行为,作为训练样本。这样的好处是避免系统收到少数行为过多用户的影响,使得系统更多的为大众设计。这样的设计理念与近期阿里Gai Kun的论文中评测方法(用户AUC)设计有异曲同工之妙。

用户行为序列处理

图9用户行为序列信息处理的设计选择

在系统中,用户往往会顺着一个检索结果页或者用户发布者浏览页进行顺序观看,如果系统捕捉到了用户看了检索界面的前三个结果,那么预估用户将看第四个结果就会很容易。但是这样真的好吗?将检索结果页面或者用户发布视频界面直接作为推荐结果呈现给用户是并不友好的--抢了别的界面应该干的活嘛。所以此处YouTube对用户行为序列做了处理,在模型输入中选择放弃用户行为的序列信息,将其打散成词袋Embedding,即使这样的信息有利于模型的离线训练效果。

预估对象的选择

图10关于预估对象的设计选择

用户的行为往往是有顺序的,用户在系统中“热身”后,在一个频道下面,往往先看大众喜欢的热门,然后逐步找到自己的兴趣点,聚焦看一块内容。那么,训练数据则应该收集用户前段时间行为,预估此后的行为。而不是收集时间前后段的行为,预估中间时间段的用户行为。这样模型更加接近用户习惯。

除此之外,Youtube根据系统设计了对应的实验,结果非常简单:深度网络层数越高,效果越好。

YouTube的推荐系统,已经为其贡献了70%的用户播放时长,搜索与导航在PC时代的主导地位在移动时代已经完全被颠覆掉。希望大家在其中学到一些东西。笔者水平所限,若有错误不当之处,敬请指正。

另外,个人用TensorFlow模拟Youtube的推荐系统,做了一个简单实现。其实就是一个多分类器外加一个单分类器,远谈不上成熟,可以供大家参考。

>

我个人平时经常看Youtube,一般都是看娱乐,教育类的视频。

如果按照我的浏览履历,一般给我推送的视频,应该都是与此相关。

但是,Youtube不知为何,直到现在还偶尔推送一些关于政治类的视频。

刚刚来日本那会儿,被标题吸引,看过一些辱华视频,但是后来发现这些讽刺视频,大多非常缺乏逻辑,以及真正的对中国的了解。

完全是为了辱骂而辱骂,耍一些文字游戏,拿一些完全站不住脚的论据,在那儿反复讲述。看了后,都觉得自己的智商被侮辱了。

在评论区留言,指出视频的无知,结果反而会被评论区的那些崇洋媚外的人所辱骂,最后反而惹了自己一肚子气。

所以后来,我就删除了旧账号。注册新账号,凡是关于政治类内容,全部屏蔽。

但是Youtube的推送算法,依然偶尔推送给我相关的内容。

我猜测,是不是Youtube可以从我看视频的内容中推测出我是中国人,然后就把那些视频默认的推荐给我。

而Youtube的算法又计算出,在海外的华人中,有一定比例的人是热衷于看此类视频的,所以导致,他就会把这一类相关视频,按照比例不定期的投放给所有华人,这样我就莫名其妙的被推送了这类视频。

现在我一旦发现有此类视频推荐,就会直接点举报,并且选择不关心此类视频。

Youtube因为会更具客户的反馈来优化人工智能算法,所以当自己非常厌恶或者不喜欢相关视频的时候,一定要选择不关心以及举报。

只有越来越多的人进行举报,或者选择不关心,才可以让这一类人无法从Youtube频道赚取到利益,从而断了这些人做此类视频的念头。

就好比,打击猎杀野生动物,获取皮毛的罪犯,只指望警察去抓,是不可能杜绝的。

只有通过让人们不再去购买皮毛,从而让皮毛市场无利可图,这样才可能让那些罪犯放弃去捕杀野生动物。

>

以上就是关于Youtube 算法规则全部的内容,包括:Youtube 算法规则、YouTube上的“知识盛宴” | 读书笔记、「干货」YouTube 基于深度神经网络推荐系统剖析等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9505277.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)