搜索引擎的工作过程大体可以分为三个阶段:1.对网页进行抓取建库,搜索引擎蜘蛛通过抓取页面上的链接访问其他网页,将获得的HTML代码存入数据库。2.预处理,索引程序对抓取来的页面数据进行文字提取、中文分词、索引等处理,为后面排名程序使用时做准备。3.给搜索结果进行排名,用户输入关键词后,排名程序调用索引库数据,计算数据和关键词的相关性,然后按照一定格式生成搜索结果页面。
搜索引擎建数据库的目的是为了整合数据,把所有的数据包整合并创建,作用是方便查找数据时能更快,所有的数据库都是以此为目的。数据库是指长期储存在计算机内、有组织、可共享的大量数据的集合。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)