很多产品想要加入推荐系统模块,最简单的就是做内容相似推荐,虽然技术简单但是效果却很好,对于增加用户粘性、提升用户留存有较多的效果,甚至很多产品后来加入了很多推荐模块之后,还是发现导流效果最好的依然是内容的相似推荐。
比如看完了一片《Python怎样读取MySQL》之后,在相似推荐中看到了一片题目为《Python *** 作MySQL的效果优化》的文章,很自然的就像多深入了解一下,于是就点进去看一看,那么对于整个网站来说,就会降低跳出率,增加用户的留存,是一个很好的用户体验。
实现一个内容相似推荐的方案比较简单,大体上包含以下步骤:
1、获取内容数据,比如标题、关键字、分类、甚至全文本;
一般文档、数据等内容都存储于mysql,可以使用python/java等语言直接读取mysql导出到文件txt格式,或者直接用shell的mysql -e sql > datatxt的方式导出。
一般情况下,全文本内容太散,不会作为候选字段,但是有些视频之类的实体,因为标题和简介文字太少,如果有详情全文本的话,也可以加入候选数据字段。
2、对内容数据做中文分词;
如果是python语言,可以使用“结巴分词”,地址为: >
以上就是关于获取产生Cadence工艺库的tf文件都需要走什么样的流程全部的内容,包括:获取产生Cadence工艺库的tf文件都需要走什么样的流程、文本表征:SoW、BoW、TF-IDF、Hash Trick、doc2vec、DBoW、DM、sql2000的触发器怎么写等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)