抖音带货直播间赛马排名的底层算法

抖音带货直播间赛马排名的底层算法

5天涨粉50万,摸透抖音算法,涨粉就是这么快!

1条抖音视频1000万播放,300万赞,涨粉90万,带你吃透抖音算法!

10天搞定100万粉丝,不黑不吹,抖音算法就是这么神奇!

直播首播破千人在线,遵循抖音算法,直播就这么简单!

第一天首播GMV破百万,玩转抖音算法,带货分分钟破百万!

…………

额……以上纯属杜撰,如有雷同纯属巧合。

作为抖音的底层逻辑算法,自从推出之后,就被人津津乐道,并且在运营圈里传的神乎其神,而且说是抖音的赚钱利器,没有人可以参透抖音的算法,今天我们就聊一聊被众多抖音玩家传的神乎其神的“推荐算法”!

据字节内部工作人员透露,推荐算法的真正逻辑一直封存于黑盒之中,真正摸透这套算法规则的人,在字节内部也不会超过五指之数。

可以这么说,截止目前为止,外部任何关于抖音算法的论断都是推测,都是基于经验或逻辑的推理!

不同的是,这些推测接近真相的距离。

2021年4月8日,抖音电商首届生态大会在广州举行。抖音电商总裁康泽宇在主题演讲中,首次阐释了“兴趣电商”概念,即一种基于人们对美好生活的向往,满足用户潜在购物兴趣,提升消费者生活品质的电商。他表示,抖音有良好的内容生态,众多优质创作者,多元化用户和较为成熟的兴趣推荐技术,有很大机会做好兴趣电商。

兴趣电商的核心是,主动帮助用户发现他潜在的需求。通过抖音成熟的兴趣推荐系统,根据用户的兴趣行为等不断的挖掘用户的潜在需求,激发用户的购物需求,从而实现电商闭环。

由此可以看出,抖音是基于推荐系统,不断的把内容通过推荐系统推送到目标人群面前,实现交互和测试,最终实现流量价值变现。

那么什么是推荐系统呢?维基百科这样解释道:推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。也就是说,推荐系统能够将用户可能感兴趣或者潜在的有用信息推荐给用户,实现用户的停留、互动和转化。

推荐系统的运行原理:

抖音带货直播间赛马排名的底层算法

为了简便起见,我们先将推荐系统当做一个黑盒,这个黑盒的输入的数据集包含:内容的信息,内容之间的相关性信息,用户的信息以及用户对内容的偏好信息等,推荐系统根据输入的信息进行相应的匹配运算,然后将内容推荐给感兴趣或者潜在的目标用户。推荐算法包含几种:基于内容推荐、基于用户推荐、协同过滤推荐、初始流量池推荐、热点推荐以及叠加推荐等。

一、协同过滤推荐算法:

协同过滤算法是抖音的最基础的底层推荐算法,首先我们先来了解一下协同过滤推荐算法的定义以及运行逻辑:

协同过滤算法,根据维基百科上的定义:“协同过滤是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的,进而帮助别人筛选信息,其中回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪录也相当重要。”维基百科上的定义过于生硬,我现在举个例子方便大家去理解:现在我们假设一个场景,假如你平时很喜欢刷剧,偶尔会遇到剧荒的时候,虽然每天都有很多新出的美剧和韩剧,但是你不确定哪一部适合你的口味,而你又不想花大量的时间在刷剧上,这时你会选择询问和你口味相同的朋友,哪一部剧值得推荐,从而花最少的时间成本选出了适合自己口味的电视剧,这就是协同过滤的核心思想。

协同过滤算法不同于传统的基于内容的推荐算法,传统的基于内容的推荐算法,是根据内容的属性、标题关键词等信息得出内容之间的关联性,然后通过用户对这些属性和关键词的喜好程度的记录将相关性大的内容推荐给用户,而协同过滤算法是直接分析用户对内容的喜好记录,然后在用户群体中寻找和这个用户有着相似兴趣喜好的其他用户,然后综合分析这些用户对某一特定内容的评价和行为,最后得出推荐系统为指定用户对某一特定内容喜好程度的预测。

二、协同过滤系统的实现

协同过滤系统主要有三个步骤,首先获取用户群体对某一特定内容的喜好记录,然后找到与特定用户相似的其他用户,最后得出推荐预测。下面详细说明一下具体的每一步是如何实现的,这样我们也就会知道了抖音平台给你推送流量的底层逻辑。

第一步:获取用户群体的喜好记录

获取用户群体的喜好记录是协同过滤算法的第一步,也是最基础的一步,推荐系统输入之一就是用户的喜好记录,所以不管你的推荐系统算法做得有多好,如果没有第一步,那么最后面的推荐结果就是扯淡。

那么系统如何获取用户的喜好信息的呢?其实所有用的行为都会被系统所记录,所以系统是通过搜集用户的行为数据来获取用户的喜好信息的,那么用户的行为数据是怎么分类的呢?

1、根据反馈的明确性分类

①显性反馈的行为:用户对内容有明确的行为动作,比如:点赞、关注、评论、转发、购买等

②隐性反馈的行为:用户对内容没有进行明确的行为动作,但是也同样被平台所记录,比如:浏览时长,停留时长,浏览记录等

2、根据反馈的正向性分类

①正反馈行为:用户的行为表示倾向于用户喜欢此内容,比如:点赞、关注、正向评论,长时间停留等

②负反馈行为:用户的行为表示用户不喜欢此内容,比如:拉黑、点击不感兴趣、负向评论,短时间停留等

系统搜集到用户的喜好信息之后,这样就会形成一个反应不同用户对不同内容喜好程度的二维矩阵,矩阵里面的值代表用户对不同内容的喜好程度,如图所示:

抖音带货直播间赛马排名的底层算法

第二步:找到与特定用户相似的其他用户

系统搜集到用户的喜好信息后,会根据这些信息计算每两个不同用户之间的喜好的相似程度,然后对指定用户推荐。系统会把上面相似二维矩阵的每一行抽取出来,作为每个对应用户的行向量,而该行向量其实就是对应着每个用户对不同内容的喜好程度,接着计算每两个行向量之间的相似度。其实就是在计算对应用户间的相似评价值。当然,也可以把列向量抽取出来,对应着不同用户对该内容的喜好程度,然后计算内容之间的相似度。常见的计算方法有欧几里得距离,余弦相似度以及皮尔森相关系数,具体的计算方法,我们就不展开讲了,这是算法工程师的事情。

那么计算出了每个用户或者每个内容的相似度之后,就可以进行推荐了,但是推荐的重要过程就是找出用户-内容的邻居,那么就要给用户-内容找邻居,找到相似度最近的两个用户-内容,那么用的到方法是K临近值以及基于阀值的邻居原则。

第三步:基于邻居原则进行推荐

当得到指定用户或者内容的邻居后,我们就可以利用这些数据信息为用户进行推荐了,那么推荐的方式有三种:基于用户的协同过滤推荐,基于内容的协同过滤推荐以及基于模型的协同过滤推荐。下面我们一一拆解一下:

A.基于用户的协同过滤推荐

基于用户的协同过滤推荐是根据用户对不同内容的喜好程度找到他的邻居用户,然后将这些邻居喜欢的内容排序推荐给指定的用户,下面举一个例子来具体说明一下:将用户A作为指定用户,根据他在平台的用户行为,系统可以得出他对不同内容的喜好程度,利用这些信息找到和他有相同喜好程度的用户C,所以用户C就是用户A的邻居,所以将用户C喜欢的内容4推荐给用户A,而用户B和用户A喜好程度没有用户C和用户A的喜好程度强烈,所以把用户C 喜欢的内容作为首要推荐给用户A

抖音带货直播间赛马排名的底层算法
抖音带货直播间赛马排名的底层算法

B.基于内容的协同过滤推荐

基于内容的协同过滤推荐与基于用户的协同过滤推荐区别在于,它是通过计算内容项之间的相似性,而非计算用户间的相似度来得到指定用户的推荐列表,首先利用所有用户对内容的喜好程度,来计算内容间的相似度,然后利用指定用户的历史喜好信息,得出一个相似内容的排序列表进行推荐。举个例子说明一下:现有4个用户分别是用户A、用户B、用户C、用户D,内容也有四个,分别是内容1、内容2、内容3、内容4,根据这4个用户的喜好记录,喜欢内容2的用户大部分也喜欢内容4,说明内容2和内容4是邻居,而指定用户A也喜欢内容2,那么基于内容协同过滤算法预测用户A大概率喜欢内容4,所以把内容4推荐给用户A。

抖音带货直播间赛马排名的底层算法
抖音带货直播间赛马排名的底层算法

C.基于模型的协同过滤推荐

基于模型的协同过滤推荐是目前比较流行的过滤推荐算法,基于模型的协同过滤推荐算法利用了机器学习的方法,利用用户和喜好内容间的历史数据进行学习和建模,预测出用户和未知内容间的喜好关系,最后找出喜好程度最高 内容推荐给指定用户,它的复杂程度一般较高,因为对模型进行训练和评估需要花费大量的时间和精力。

协同过滤算法是抖音平台最基础的推荐机制,同时在实践中也被其他平台广泛的应用,但是也存在很多缺点和不足:

1、冷启动问题

①在系统建立初期,未搜集到足够的信息,协同过滤算法不能为指定用户找到合适的邻居,无法做出精准的推荐

②当新用户或者新内容刚进入平台时,平台没有任何关于这个用户和内容的历史信息,那么系统也无法进行有效推荐

2、数据不全问题

实际情况下,用户很少会对每个内容项都会做出行为评分,所以有些数据是缺失,从而降低了系统的计算效率,同时有些用户的错误数据也会降低系统的推荐准确性。

3、性能不足问题

随着系统内的用户数量和内容数量不断增加,计算用户或者内容间的相似度时,计算复杂度会大大增加,导致计算机系统的性能不断降低

4、流行性偏向问题

推荐系统会更偏向于向用户推荐比较流行和热门的内容,因为评分数量多覆盖面广。而对于一些冷门内容,推荐系统无法做出良好的推荐

三、抖音推荐系统的其他推荐机制

为了克服协同过滤系统的缺点,平台内同时又增加了很多其他的推荐方式,比如:

1、流量池推荐算法

为了克服冷启动问题,系统会对一个新用户或者新内容使用流量池推荐算法。当一个新用户或者新内容刚刚进入平台,由于系统对于其历史数据统计不全,那么系统会使用流量池推荐算法,即当注册一个新用户或者新增一个新内容时,系统会把这个新的用户或者新的内容放到一个100-500的流量池内,进行测试和学习,收集用户-内容的行为,从而对这个用户-内容进行建模打标。

2、叠加推荐算法

一个新内容在初始流量池内,系统会根据初始流量池内的用户行为及数据反馈,决定是否将这个内容放到下一个流量池内,如果新内容在初始流量池内,用户反馈数据良好,那么系统会推荐更多类似用户给到这个内容,如果初始流量池反馈不好,那么系统就会停止推荐

3、热点算法

①为了克服流行偏向问题,系统不仅会把热门流行性内容推荐给你,不管你喜欢还是不喜欢。比如:李易峰嫖娼,俄罗斯攻打乌克兰等,系统还会不定时的推荐冷门内容给你,来测试冷门内容的数据反馈。

②节日热点内容

比如春节刷到拜年,五一刷到旅游。这类热点内容抖音也会强行推荐给你,因为系统判断你大概率会喜欢。

4、“挖坟”算法

“挖坟”算法指的是抖音平台机器会定期的把以前发过的内容再重新扫一遍,挖掘出高质量内容,再重新推荐一遍,或者你的账号已经发布了很多垂直类的内容,标签已经变的很精准,系统可以为你匹配更多精准用户。所以,优质内容+精准用户,老作品重新火爆起来就不意外了。

四、抖音平台独有特性

现在我们了解了抖音的多种推荐机制,同时由于多种推荐机制的共同运行,抖音形成了平台独特的运行环境,同时也形成了平台的独有特性:

1、成瘾化

兴趣推荐算法会让人沉浸在虚幻的美好里面,活在信息茧房里,所以有很多人感觉刷抖音的时候,时间是过的最快的,而且每次抖音推送的内容都是自己喜欢的内容,但是一个人长时间看同一种类型的内容时,也会生腻,于是热点算法和协同过滤算法不断的推出新的内容,不断地给用户新的刺激,增加用户新的兴趣点,让人进一步上瘾。

2、去中心化

在抖音平台上,用户和内容是连在一起的,所有的推流,审核基本全部都有平台自己完成,基本没有人工干预,人工只有在三种情况下才会介入审核:①机器审核为疑似违规内容,人工会介入进行二次审核,②内容被大量的人为举报,③内容数据越来越爆,有一种大火的趋势,除了以上这三种情况外,剩下的一切,全部交给算法和用户行为,不管你是什么学历,不管你是不是网红明星,到抖音平台上,全部一视同仁,只要你的内容和产品能够打动用户,让用户产生平台需要的行为数据,那么平台就会源源不断的给你推送流量。这也为很多平凡人在抖音上逆袭提供了无限的可能。

3、数据指标化

抖音流量的推荐系统毕竟是机器,机器是没有任何情感和感性判断力的,机器是否给你的内容或者直播间推流,唯一的评判标准就是直播间或者内容所产生的数据指标,而数据指标是由用户的行为决定的,只要我们让用户做足了行为数据,在赛马过程中,我们能够赛过同行的数据指标,那么我们就能触发平台的持续推流。这也是憋单、马扁、高反、鱼塘等直播间玩法所利用的漏洞,通过满足平台数据指标快速打爆直播间。

IPM具体的指标包括浅层数据和深层数据里面权重比较高的指标,比方说浅层数据里面的停留和转粉,深层数据里面的千次、GMV还有OPM等,直播间实时诞生用户行为,系统对数据的收集计算同样也是分秒级的,如果让我们做到每分钟级的数据优化递增,是非常难的,但是我们设定一个最小的时间块是5分钟,因为平台通过数据统计计算排名,然后再通过排名进行回传分配流量,会有一点时间的延迟,而且现在官方罗盘数据也是按照5分钟进行统计的,所以我们设定5分钟为一个时间块,我们做IPM数据递增的时候也是关注每5分钟的IPM数据递增。所以我们要根据直播间实时的5分钟IPM数据的走向去做相应的主播话术调整、货品排品调整,如果发现数据下降,那我们应该去做相应的补数据动作,因为想要直播间有持续的推流,那么你就要保证直播间IPM指标平稳或者递增,如果出现下降,那么推流也会下降。

数据来源:飞瓜智投,数据已获客户授权并脱敏处理

扫一扫 微信咨询

联系我们 青瓜传媒 服务项目

商务合作 联系我们

本文来自投稿,不代表青瓜传媒立场,如若转载,请注明出处:https://www.opp2.com/328632.html

企业微信
运营大叔公众号