文/小明同学
什么叫网站地形图网站地图,也称为站点地图,也是一个详细的文档,列出了您网站上任何网页的详细地址。一般来说可以分为两种,一种是针对百度搜索引擎的,一种是针对客户的。前者帮助百度搜索引擎更好的收录你的网站,后者帮助客户更快的了解你网站的整体结构,快速的找到自己想要的。本文主要关注前者。
站点地图格式一般有三种格式,txt,xml,html。大多数情况下,基本都是使用xml格式。百度搜索和谷歌都应用xml格式。下面简要解释三种格式。
txt格式这种格式很简单,一般较少选用,例子如下:
http://liuxianan.com/http://liuxianan.com/link.htmlhttp://liuxianan.com/msgboard.html常见问题:
其中包括:
一个站点地图文件不能包含超过50,000个URL,图像大小不能超过10MB。如果你的站点地图超过了这个限制,请把它分成几个小的站点地图。这种限制标准有助于保证你的网站服务器不容易因为呈现大文件而超重。网站提交的网站地图文件数量必须少于50,000个。
从下面百度搜索百度站长工具抄袭的几类QA:
问:我提交的报告期是什么意思?
答:百度搜索蜘蛛会参照设定的周期时间抓取Sitemap文件,所以 请根据Sitemap文件内容的升级(比如增加新的url)来设定。一定要注意,如果url不会改变,只是会升级url匹配的网页内容(比如社区论坛的发帖页面会有新的回复内容),这里就不会 升级。Sitemap专用工具无法处理页面更新问题。
问:Sitemap提交后,多久能被百度搜索解决?
答:A:Sitemap数据信息提交后,百度搜索1小时内刚开始解决。在后续的生产调度抓取中,如果你的sitemap适合etag,人们会更频繁的抓取sitemap文件,然后及时处理内容升级;不然要爬很久。
问:所有提交的Sitemap会被搜索引擎抓取并收录到百度吗?
答:百度搜索不保证所有提交的数据都会被百度抓取收录。百度收录与网页质量有关吗?
问:我可以缩小我的站点地图吗?他们需要用gzip来还原吗?
答:是的。请应用gzip来减少站点地图。无论是否缩小,Sitemap都应该低于10MB(10,485,759字节)。
问:在XML格式的Sitemap中,“优先级”提醒会影响我的页面在百度搜索中的排名吗?
答:不容易。sitemap中的优先级提醒,只是表明这个网站相对于自己网站上其他网站的必要性,并不危及网页在百度搜索中的排名。
问:网址在Sitemap中的位置对其应用有影响吗?
答:不容易。网址在Sitemap中的位置不会对百度搜索的识别或应用方法造成伤害。
问:Sitemap中上传的网址可以包含中文吗?
答:因为格式转换的难题,建议尽量不要收录中文。
html格式这份总结有待填写。
sitemap数据库索引格式如果要提交很多sitemap文件,可以在sitemap数据库索引文档中列出,然后提交数据库索引文档。
由于这个我基本不可能采纳,我也不想搞科研,有兴趣的话在这里参考一下。
怎么制作网站地形图可以用一些第三方的专用工具来制作,也可以写一个简单的网络爬虫来爬自己的网站。如果网站内容比较简单,也可以马上查数据库,放在一起。
因为信息发布时我要自动升级网站地形图,还有各种二级域名,很多第三方专用工具都满足不了,不如我自己改造。方法是先把发现的 个链接放入一个组合中,然后把所有的列表网页连接起来,识别网页,把列表网页和博客的所有文章内容分类,最后自己拼凑字符串数组转换成xml文件, 然后放到网站的根目录中。自然不推荐这种做法。
因为还没有寻找到更好的能满足我要求的转换工具,这里就不介绍了。每个人都有一个热烈的欢迎评价是有效的,值得介绍。
递交到百度搜索引擎转化后尽量主动上传到百度搜索引擎,提高被引用的可能性和速度。
百度提交站点地图提交百度站点地图详细地址:http://zhanzhang.baidu.com/linksubmit/index
Google递交站点地图提交Googlesitemap的详细地址(必须先登录Google百度站长工具):https://www.google.com/webmasters
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)