网站地图(站点地图)详细介绍、以及如何制作详…

网站地图(站点地图)详细介绍、以及如何制作详…,第1张

网站地图(站点地图)详细介绍、以及如何制作详…

文/小明同学

什么叫网站地形图

网站地图,也称为站点地图,也是一个详细的文档,列出了您网站上任何网页的详细地址。一般来说可以分为两种,一种是针对百度搜索引擎的,一种是针对客户的。前者帮助百度搜索引擎更好的收录你的网站,后者帮助客户更快的了解你网站的整体结构,快速的找到自己想要的。本文主要关注前者。

站点地图格式

一般有三种格式,txt,xml,html。大多数情况下,基本都是使用xml格式。百度搜索和谷歌都应用xml格式。下面简要解释三种格式。

txt格式

这种格式很简单,一般较少选用,例子如下:

http://liuxianan.com/http://liuxianan.com/link.htmlhttp://liuxianan.com/msgboard.html

常见问题:

  • 文档的每一列都需要有一个URL。URL中不能有换行。

  • 不要包含除URL列表以外的所有信息。

    一定要写详细的网址,包括http。

    每个文本文件的最大数量可以包括50,000个URL,并且应该小于10MB(10,485,760字节)。如果网站包含超过50,000个URL,您可以将列表剪切成几个文本文件,然后分别添加每个文档。

    文本文件应采用UTF-8号或GBK号。

    xml格式 实例sitemap.xml如下:

    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://liuxianan.com/</loc> <lastmod>2016-09-06T00:00:1608:00</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> <url> <loc>http://liuxianan.com/link.html</loc> <lastmod>2016-09-06T00:00:1608:00</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset>

    其中包括:

  • Loc表示详细的URL,可选项目,长度不能超过256字节。

  • lastmod表示该页面的最后修改时间,必须是ISO-8601时间格式。其实什么样的格式不清楚?按照我的理解,总之应该算是:yyyy-MM-ddTHH:mm:ss08:00,最终面上的08:00应该表示是东八区;

    changefreq表示升级频率。可选值:始终、每小时、每天、每周、每月、每年和从不。

    priority用于指定该链接相对于其他链接的所有权比例,可选值为0.0-1.0。一般来说,网站首页是1.0,然后二级、三级网页的页面依次递减。目前还不清楚这个特性实际上有多重要。

    以上四项中,除了loc是可选的,其他三项都不是必须的,但是最好都写出来。

    一个站点地图文件不能包含超过50,000个URL,图像大小不能超过10MB。如果你的站点地图超过了这个限制,请把它分成几个小的站点地图。这种限制标准有助于保证你的网站服务不容易因为呈现大文件而超重。网站提交的网站地图文件数量必须少于50,000个。

    从下面百度搜索百度站长工具抄袭的几类QA:

    问:我提交的报告期是什么意思?

    答:百度搜索蜘蛛会参照设定的周期时间抓取Sitemap文件,所以 请根据Sitemap文件内容的升级(比如增加新的url)来设定。一定要注意,如果url不会改变,只是会升级url匹配的网页内容(比如社区论坛的发帖页面会有新的回复内容),这里就不会 升级。Sitemap专用工具无法处理页面更新问题。

    问:Sitemap提交后,多久能被百度搜索解决?

    答:A:Sitemap数据信息提交后,百度搜索1小时内刚开始解决。在后续的生产调度抓取中,如果你的sitemap适合etag,人们会更频繁的抓取sitemap文件,然后及时处理内容升级;不然要爬很久。

    问:所有提交的Sitemap会被搜索引擎抓取并收录到百度吗?

    答:百度搜索不保证所有提交的数据都会被百度抓取收录。百度收录与网页质量有关吗?

    问:我可以缩小我的站点地图吗?他们需要用gzip来还原吗?

    答:是的。请应用gzip来减少站点地图。无论是否缩小,Sitemap都应该低于10MB(10,485,759字节)。

    问:在XML格式的Sitemap中,“优先级”提醒会影响我的页面在百度搜索中的排名吗?

    答:不容易。sitemap中的优先级提醒,只是表明这个网站相对于自己网站上其他网站的必要性,并不危及网页在百度搜索中的排名。

    问:网址在Sitemap中的位置对其应用有影响吗?

    答:不容易。网址在Sitemap中的位置不会对百度搜索的识别或应用方法造成伤害。

    问:Sitemap中上传的网址可以包含中文吗?

    答:因为格式转换的难题,建议尽量不要收录中文。

    html格式

    这份总结有待填写。

    sitemap数据库索引格式

    如果要提交很多sitemap文件,可以在sitemap数据库索引文档中列出,然后提交数据库索引文档。

    由于这个我基本不可能采纳,我也不想搞科研,有兴趣的话在这里参考一下。

    怎么制作网站地形图

    可以用一些第三方的专用工具来制作,也可以写一个简单的网络爬虫来爬自己的网站。如果网站内容比较简单,也可以马上查数据库,放在一起。

    因为信息发布时我要自动升级网站地形图,还有各种二级域名,很多第三方专用工具都满足不了,不如我自己改造。方法是先把发现的 个链接放入一个组合中,然后把所有的列表网页连接起来,识别网页,把列表网页和博客的所有文章内容分类,最后自己拼凑字符串数组转换成xml文件, 然后放到网站的根目录中。自然不推荐这种做法。

    因为还没有寻找到更好的能满足我要求的转换工具,这里就不介绍了。每个人都有一个热烈的欢迎评价是有效的,值得介绍。

    递交到百度搜索引擎

    转化后尽量主动上传到百度搜索引擎,提高被引用的可能性和速度。

    百度提交站点地图

    提交百度站点地图详细地址:http://zhanzhang.baidu.com/linksubmit/index

    Google递交站点地图

    提交Googlesitemap的详细地址(必须先登录Google百度站长工具):https://www.google.com/webmasters

    欢迎分享,转载请注明来源:内存溢出

    原文地址: http://outofmemory.cn/zz/764221.html

    (0)
    打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
    上一篇 2022-05-01
    下一篇 2022-05-01

    发表评论

    登录后才能评论

    评论列表(0条)

    保存