搜索引擎“蜘蛛”是指什么？_软件运维

1.spider对一个网站服务器造成的访问压力如何？

答：uspider会自动根据服务器的负载能力调节访问密度。在连续访问一段时间后，、spider会暂停一会，以防止增大服务器的访问压力。所以在一般情下，对您网站的服务器不会造成过大压力。

2.为什么spider不停的抓取我的网站？

答：对于您网站上新产生的或者持续更新的页面，spider会持续抓取。此外，您也可以检查网站访问日志中spider的访问是否正常，以防止有人恶意冒充spider来频繁抓取您的网站。

3.我不想我的网站被spider访问，我该怎么做？

答：spider遵守互联网robots协议。您可以利用robots.txt文件完全禁止spider访问您的网站，或者禁止spider访问您网站上的部分文件。

4.为什么我的网站已经加了robots.txt，还能在百度搜索出来？

答：因为搜索引擎索引数据库的更新需要时间。虽然spider已经停止访问您网站上的网页，但百度搜索引擎数据库中已经建立的网页索引信息，可能需要二至四周才会清除。另外也请检查您的robots配置是否正确。

5.我希望我的网站内容被百度索引但不被保存快照，我该怎么做？

答：spider遵守互联网meta robots协议。您可以利用网页meta的设置，使百度显示只对该网页建索引，但并不在搜索结果中显示该网页的快照。

和robots的更新一样，因为搜索引擎索引数据库的更新需要时间，所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照，但百度搜索引擎数据库中如果已经建立了网页索引信息，可能需要二至四周才会在线上生效。

6.Baiduspider多长时间之后会重新抓取我的网页？

答：百度搜索引擎每周更新，网页视重要性有不同的更新率，频率在几天至一月之间，Baiduspider会重新访问和更新一个网页。

7.Baiduspider抓取造成的带宽堵塞？

答：Baiduspider的正常抓取并不会造成您网站的带宽堵塞，造成此现象可能是由于有人冒充baidu的spider恶意抓取。如果您发现有名为Baiduspider的agent抓取并且造成带宽堵塞，请尽快和我们联系。您可以将信息反馈至百度网页投诉中心，如果能够提供您网站该时段的访问日志将更加有利于我们的分析。

1、将您的产品做百度推广

2、将您的产品做一个网站，然后百度搜索可以出现出来

3、做百度关键字优化

搜索引擎是一组程序，这个程序模拟人的行为去上网，然后打开网页，把网页里的信息保存到自己的电脑上，然后提取网页里的链接，再次打开，然后再次把网页内容保存下来，因为互联网上的网页都是交叉连接的，所以这个程序就会无限的循环下去，这就好像是一只蜘蛛在一个网上不停的爬行一样，所以我们叫这种程序为爬虫程序，也叫蜘蛛程序，通常我们说的百度蜘蛛就是指这种程序。

百度在把所有他认为有用的信息都保存下来之后按照一定的规则去排序好之后供人家检索，这样我们就可以检索到互联网上基本所有的信息了（并不是全部，有很多蜘蛛爬取不到的），这里我们要注意一个问题，我们在互联网上制造一个网页之后百度是通过其它网页上的链接访问到你这个网页的，如果互联网的其它网页上没有你这个新网页的地址（链接）那么百度的蜘蛛就无法访问到你的网页，当然也就不会收录到百度的数据库中，在用户检索的时候当然也就不会出现在排名结果中，因为你的网页是一个孤岛，外面没有任何通到这里的通道，这种情况很多时候出现在一些公司网站上，他们以为做了一个网站放到服务器上自己可以打开就可以了，并不知道自己的网站其实是孤岛，并不属于互联网的一部分。

前面说到了一个前提，想要让自己的网页出现在百度的搜索结果中，那必然需要百度收录自己的网页，如果百度没有收录自己的网页，那当然是无论怎么样搜索都是搜索不到的，想要检测自己的网页是否被百度收录可以把这个页面的地址直接放到百度上搜索一下试试，如果出现了结果，那说明已经收录，如果没有出现结果，就说明没有收录。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/11314244.html

搜索引擎“蜘蛛”是指什么？

发表评论

评论列表（0条）