搜索引擎的工作过程大体可以分为三个阶段:1.对网页进行抓取建库,搜索引擎蜘蛛通过抓取页面上的链接访问其他网页,将获得的HTML代码存入数据库。2.预处理,索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,为后面排名程序使用时做准备。3.给搜索结果进行排名,用户输入关键词后,排名程序调用索引库数据,计算数据和关键词的相关性,然后按照一定格式生成搜索结果页面。
欢迎分享,转载请注明来源:内存溢出
搜索引擎的工作过程大体可以分为三个阶段:1.对网页进行抓取建库,搜索引擎蜘蛛通过抓取页面上的链接访问其他网页,将获得的HTML代码存入数据库。2.预处理,索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,为后面排名程序使用时做准备。3.给搜索结果进行排名,用户输入关键词后,排名程序调用索引库数据,计算数据和关键词的相关性,然后按照一定格式生成搜索结果页面。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)