今日头条的火爆,推动了“智能推荐”的定义。此后,基于内容的产品和人性化的算法逐渐从产品卖点转变为标准配置。
有了“深度学习”、“互联网大数据”等流行词汇和定义,商品的水平瞬间提升了很多。各种强烈推荐的算法,不仅是产品研发的日常任务,也是产品运营的日常任务。作为一个产品运营,我们必须深入算法,参与算法的设计方案,不断的用融合内容“调试”算法,让商品强烈推荐的算法逐步完善,最后和自己的内容融合。
以新闻产品为例,结合我之前从零开始积累产品用户的工作经验,梳理出PM必须掌握的基本算法专业知识和实际 *** 作。
算法的发展趋势
情报推荐不是一个产品刚公布就可以拿的。无论是基于用户个人行为的人性化,还是基于内容相似度的人性化,都是基于大量的用户和内容。产品发布之初,双方的数据信息普遍不完整,无法进行智能推荐。
所以在商品发展趋势的前期,强烈建议内容一般采用更收敛的“热度算法”。说白了就是优先考虑网络热点的内容,并强力推荐给用户。虽然无法保证根据每个用户的兴趣爱好和习惯进行精准的强推荐,但可以覆盖绝大多数的内容需求,启动成本远低于智能推荐算法。
因此,强烈建议在发布前期使用热度算法完成冷启动,只有积累到一定数量级后,才能慢慢进行智能推荐算法。
加热算法
1。热算法的基本概念
必须掌握的是,热度算法也必须不断改进和完善。基本概念是:
新闻热度得分=用户互动引起的初始热度得分–随时间衰减的热度得分
Score=S0S(用户)-S(时间)
新闻进入数据库后,系统软件授予一个初始热度值,新闻进入强烈推荐目录进行排列;在新闻不断被用户点击阅读、收藏分享的情况下,这种用户的个人行为被视为帮助新闻增加人气,系统软件必须给每条新闻一个人气值;另外,新闻是一个时效性很强的内容,所以新闻发布后,热度必然随着新闻越来越老而下降。
新闻的热度在这种算法的综合作用下不断变化,强烈推荐目录的排列也不断变化。
2。初始加热不应该是一致的
上述算法对每个入库的新闻条目授予相同的流行度值,但实际应用后很难实现。比如游戏娱乐类型的普及程度远高于文化艺术类型本身;或突发重大灾害或安全事故;或者夏季奥运会期间,体育文化类型的认知度突然上升;这时候,如果每条新闻都给同样的热度,就无法迎合具体。
解决方法是将初始热量设置为独立变量:
(1)根据新闻类型,赋予新闻不同的初始热度,让用户认知度高的类型获得更高的初始热度得分,进而获得大量曝光。
例如:
(2)对于大事件的报道,如何让它进库会有更高的热度。大家选择流行语搭配的方法。
即监督提取大中型新闻网站的今日头条、Twitter热点、竞争对手的今日头条,并将这些新闻的关键词维护升级到热门词典;当每条新闻进入数据库时,让新闻的关键词匹配热门词典。匹配度越高,初始热分就越高。
之后,当一个大事件发生时,Twitter和portal的竞相报道会造成热词的集中,所有与这个热词相匹配的新闻,即报道同一恶性事件的新闻,都会获得较高的初始热度得分。
3。用户个人行为的次标准不是固定的,不会改变
解决了新闻进入数据库的初始得分后,接下来就是新闻流行度得分的变化。首先要确立用户的哪些个人行为会提升新闻的知名度,然后对这种个人行为给予一定的评级标准。
例如,对于一条新闻,用户可以点击阅读(点击)、收藏(收藏)、分享(分享)和评论这四种个人行为,每个人都可以针对不同的个人行为授予结果,从而获得新闻用户的即时个人行为:
S(用户)=1*点击5*赞10*评论20*分享
在这里,对不同的个人行为给予的分数是1、5、10、20,但这个值不能一成不变;用户业务规模小,各种恶性事件就小。这时候必须提高每一次恶性事件的个人行为评分,以提高用户个人行为的受欢迎程度。当用户的业务规模增大时,个人行为点要逐渐减少,所以在做内容营销时,要不断调整个人行为点。
自然也有偷懒的方法,就是把用户运营规模考虑进去,计算固定数量用户的个人行为积分,即:
s(用户)=(1*点击5*收藏10*评论20*分享)/dau*n(固定数量)
这保证了在不同规模的用户 *** 作下,由用户个体行为引起的个体行为在子基础上是稳定的。
4。热量随时间的衰减不是线性的
因为新闻的时效性很强,已经发布的新闻的热度值必然随着时间的推移而衰减,发展趋势应该是衰减越来越快,直至接近零热度。也就是说,如果一条新闻一直处于靠前的位置,那么随着时间的变化,它一定会被越来越多的用户保留。
规定强烈推荐给用户的新闻必须在24小时内。所以从理论上来说,衰减算法必须保证新闻的热度在24小时后衰减到很低的水平。如果是线性衰减,当某条新闻突然有很多用户阅读文章,得到一个高热度分时图,很可能会持续很长时间排名靠前,让用户觉得内容升级太慢。
参考哥白尼制冷基本定律,时间衰减因子应该是对数函数:
T(时间)=e^(k*(t1–t0))
其中T0是新闻发布时间,T1是当前时间。
因为热度的发展趋势是无止境趋近于零热度的结果,最终的新闻热度算法也调整为:
Score=(S0(类型)S(用户))/T(时间)
5。其他影响因素
很多新闻产品会给用户“喜欢”、“踩”或者“不要强烈推荐这个类目”的选择,不仅适用于智能推荐,对热度算法也有一定的作用。
新闻推送会导致大量打开,估计热度的时候必须去除相关危害。这样的元素会对热度算法造成伤害,所以还是要在热度算法发布后进行“调试”。
建议将所有调整指标值做成匹配项,如初始热度评分、个人行为恶性事件评分、衰减因子等。,让商品和商家可以立即调整和认证实际效果,以达到最佳的情况。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)