欢迎分享,转载请注明来源:内存溢出
技术googlepr值算法
Google的成功代表了PageRank算法值得特别关注。PageRank算法是少数公开的排序算法之一PageRank算法对数学的要求很高,但是可以做一些简单的陈述来分析其对网络环境的危害。百度搜索引擎的其他排名算法也很有可能得到与PageRank算法相同的结果,虽然没有公布它们之间的所有相关信息。HITS算法是另一种基于链接的排名算法,与PageRank算法有很大不同。下面的意译总结了链接对于百度搜索引擎的使用价值。“百度搜索引擎根据网页之间的连接分析,可以判断一个网页是关于什么的,也可以判断它是否非常重要,是否值得被收录到排序目录中。百度搜索引擎在整个排序过程中不考虑连接元素,而是应用一个基于关键词高频词的公式,计算潜在搭配文本文档中以客户为管理中心查看的关键词高频词。例如,当搜索“生物学”时,该模块很可能会返回到文本文档的标题、头和顶部以及文章的正文,或者该短语在URL中出现的所有网页。这种排名算法很可能无法判断什么是关于“生物”最权威的网页,而只能判断哪个网页与“生物”相关的词最多而PageRank算法可以根据连接结构来区分哪个是最权威的网页——哪个位于排名的最前面,也就是链接数量最多的网页。这使得模块有可能返回到一个真正权威的网页,而不是一个类似于“生物”课程安排的网页。1998年,谷歌PageRank算法的设计者和创始人布林和佩奇发表了其中的关键部分。然后,在1999年,他们与莫特瓦尼和Winogriad进行了更详细的讨论。直到2004年,该算法仍在使用,只是作为一个更大的算法集的一部分,该算法集选取100个指标值来判断网页是否与客户的观看相关,并对其进行排序。谷歌官网声明:“尽管许多技术工程师都在努力进一步完善谷歌的各个领域,但PageRank算法仍然是互联网搜索者的基础技术。”以下是PageRank算法的两个基本核心概念:人链是一个非常好的考虑目标网页整体必要性的指标值。来自关键网页的人链比来自一级和二级网页的人链更能显示这个网页的必要性。讨论了PageRank算法。这里用谷歌网站等领域常用的“投票”一词代替原来“随意游泳”的意思。在一个简单的基于连接的投票系统软件中,它可以为每个网页投票,并允许网页平分其选票,然后为连接的网页投票。最后,通过统计和分析每个网页的最终票数,可以制作出一个排名系统软件。在这里的整个过程中,链接多的网站可以获得更高的票数。殊不知,这种简单的投票系统软件并不能说明问题。例如,如果一个流行的目录页面有许多链接,它将获得许多投票,但这个页面只有一票,可以平均分配到它所连接的整体目标页面,这个整体目标页面很可能包含有用的内容。重复整个投票过程,使得每个网页在前一轮中获得的选票被分配到其整体目标网页。遗憾的是,当投票系统软件卡在循环系统中,或者碰到没有链接的网页时,整个投票过程就无法反复进行了。对于此事,布林和佩奇明确提出了解决方案,即在每一次投票中,网页购买一部分选票,但并不是所有发给它的链接都是整体目标网页。他们提出节省15%的投票,这样在每一次投票中,只有85%的投票会平均分配给整体目标页面,15%的投票会平均分配给系统软件中的所有URL。数学算法的应用可以合理地完成这个投票系统软件。重复整个投票过程,直到所有网页的票数保持稳定,也就是在新一轮投票中,网页的票数变化不大,然后PageRank算法就出来了。PageRank算法有调整算法和调整算法两种,调整后的算法有显著的不同。实际 *** 作中,Google可能会选择PageRank调整算法。第一个调整算法是由Lifantsel在2000年明确提出的,它创建了基于网址的PageRank的投票统计分析,而不是对单个网页进行投票统计分析。第二种调整算法是由Page、Brin、Motwain和Winograd在1999年明确提出的,即一个网站的主页被自动授予较高的票数。看起来Google另外选择了这两种调整算法,可能与基于网页的标准算法紧密结合,也可能完全取代,但这些都只是猜测。
赞
(0)
打赏
微信扫一扫
支付宝扫一扫
2. 用Ubuntu Server架设基于独立硬盘的Windows文件共享和FTP服务器(配置工作)
上一篇
2022-05-04
Exchange 2013 创建DAG失败 提示”必须为该属性提供值”
下一篇
2022-05-04
评论列表(0条)