推荐系统的主要推荐方法

推荐系统的主要推荐方法,第1张

基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机 器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。在基于内容的推荐系统中,项目或对象是通过相关的特征的属性来定义,系统基于用户评价对象 的特征,学习用户的兴趣,考察用户资料与待预测项目的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、神经网络和基于向量的表示方法等。 基于内容的用户资料是需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化。

基于内容推荐方法的优点是:1)不需要其它用户的数据,没有冷开始问题和稀疏问题。2)能为具有特殊兴趣爱好的用户进行推荐。3)能推荐新的或不是很流行的项目,没有新项目问题。4)通过列出推荐项目的内容特征,可以解释为什么推荐那些项目。5)已有比较好的技术,如关于分类学习方面的技术已相当成熟。

缺点是要求内容能容易抽取成有意义的特征,要求特征内容有良好的结构性,并且用户的口味必须能够用内容特征形式来表达,不能显式地得到其它用户的判断情况。 协同过滤推荐 (Collaborative Filtering Recommendation)技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术,利用用户的历史喜好信息计算用户之间的距离,然后 利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优 点是对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影。

协同过滤是基于这样的假设:为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用 户。其基本思想非常易于理解,在日常生活中,我们往往会利用好朋友的推荐来进行一些选择。协同过滤正是把这一思想运用到电子商务推荐系统中来,基于其他用 户对某一内容的评价来向目标用户进行推荐。

基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的,而且是自动的即用户获得的推荐是系统从购买模式或浏览行为等隐式获得的,不需要用户努力地找到适合自己兴趣的推荐信息,如填写一些调查表格等。

和基于内容的过滤方法相比,协同过滤具有如下的优点:1) 能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等。2) 共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、个人品味)进行过滤。3) 有推荐新信息的能力。可以发现内容上完全不相似的信息,用户对推荐信息的内容事先是预料不到的。这也是协同过滤和基于内容的过滤一个较大的差别,基于内容的过滤推荐很多都是用户本来就熟悉的内容,而协同过滤可以发现用户潜在的但自己尚未发现的兴趣偏好。4) 能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度。

虽然协同过滤作为一种典型的推荐技术有其相当的应用,但协同过滤仍有许多的问题需要解决。最典型的问题有稀疏问题(Sparsity)和可扩展问题(Scalability)。 基于关联规则的推荐 (Association Rule-based Recommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零 售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,其直观的意义就是用户在购 买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。

算法的第一步关联规则的发现最为关键且最耗时,是算法的瓶颈,但可以离线进行。其次,商品名称的同义性问题也是关联规则的一个难点。 由于各种推荐方法都有优缺点,所以在实际中,组合推荐(Hybrid Recommendation)经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法 去产生一个推荐预测结果,然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法,但在某一具体问题中并不见得都有效,组合推荐一个最重要原则就是通 过组合后要能避免或弥补各自推荐技术的弱点。

在组合方式上,有研究人员提出了七种组合思路:1)加权(Weight):加权多种推荐技术结果。2)变换(Switch):根据问题背景和实际情况或要求决定变换采用不同的推荐技术。3)混合(Mixed):同时采用多种推荐技术给出多种推荐结果为用户提供参考。4)特征组合(Feature combination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。5)层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐。6)特征扩充(Feature augmentation):一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。7)元级别(Meta-level):用一种推荐方法产生的模型作为另一种推荐方法的输入。

网络时代大多都是依靠各种数据算法而运行的,也有不少的数据算法是从发展中不断衍生的,大家最为熟悉的就是大数据。人人都处于大数据时代,只要使用网络必然就接触过大数据,因为它实际上就渗透在我们生活的每个角落。随着信息发展从而衍生了各种数据算法,那么大数据又是如何运用在我们的生活中呢?

一、各类商品的及时推荐

大数据应用在我们生活中最突出的表现就是当我们在浏览商品时,总会惊讶的发现前几天想买的东西出现在首页推荐,刚跟朋友吐槽的东西出现在动态首位。各种大数据可谓是无微不至,小到商品推荐,大到各软件的同时推送。商品的推荐大多是通过整合个人几日内的浏览物品,以及搜索关键词进行推荐的,通过整合数据从而精准推送,能够增加消费者的购买率。因为当时消费者正在搜索这类物品,及时的推送就促成了交易。大数据算法不仅是为消费者提供便利,更是令卖家也有了生存之道。

二、手机作为载体获取信息

大数据的算法数据除了根据用户的搜索获取关键词之外,也会以手机作为载体获取界面以外的信息。每个软件在下载的时候,已经默认了软件获取手机的一部分后台权限,比如软件能读取手机的储存信息,录音功能以及拍照功能,各大软件有了这等权限之后,就能在使用者神不知鬼不觉的情况下获取更为有用的信息

要说各大电商平台的算法是依据消费者的搜索和购买逐渐形成的话,那么其余软件则会通过聆听的方式,建立数据库。人们在聊天,听音乐或者看视频都被其他软件“监控”,因为他们是以手机作为主体去获取信息的,有些软件即便手动关掉了后台,他们还会自启动,所以大数据时代下人们的信息更加透明,尤其对于各软件而言更是如此。

三、数据库的作用

各种数据算法的根本是为了让使用者有更好的体验感,所以它需要建立专属个人的数据库,以此作为基础数据,进行行为想法的分析。当我们开通一个新账号时,所浏览的东西全然不同,没有任何规律,这其实就是大数据在建立数据库的过程。后台根据新用户的停留时间以及浏览习惯,搜索习惯从而形成专属于新用户的界面,如果没有这类数据库的话,大数据算法将无法契合个人。

当我们在使用各种软件的时候,其实就是在被试探,刷视频时长时间停留在某个视频,购物时经常查看某个价格区间的物品,那么下次打开软件时推送的就会依照上一次的使用习惯进行推送。所以大数据时代为人们增添了不少便利,更是成为了大家的及时雨。

事实上你每次搜衣服和浏览衣服的时候都会留下痕迹,而衣服款式价格都有明确标记的,它根据你最近频繁搜索的纪录分析你在找什么,然后在数据库里面找和你要求很相近并且好评率高的东西推荐给你。所以上淘宝买衣服建议先搜索然后等第二天它的推荐再买,不合适就再搜。不然好容易后悔啊啊啊


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9917763.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存