客户提出一个问题:每个人都有一个中英文3000行的网页,快照显示没有细节。根据百度站长的工具模拟,是抓取的(注:这位同学指的是抓取诊断工具:http://ZhanZhang.Baidu.com/crawltools/index),文字显示没有细节。会不会对网站伤害很大?
百度搜索技术工程师进入互动问答:
第一个难题:百度搜索中网页内容的大小有限制吗?
答:对内容文字没有限制,但对源代码大小有一定的杀伤。如果太长,前面的部分会被拿走。所以源代码越简单越好。
第二个问题:如果快照显示网页不详细,是否说明BaiduSpider没有详细收录网页?
答:不会,快照的创建涉及到很多阶段,不详细展示的原因也有很多,不能简单的认为不详细。
【/s2/】第三个问题:应用服务平台无法详细展示刮痧工具,所以能感觉到没有详细收录吗?
答:不,该工具只显示前200K。大家在设计解决工具的时候都在网页上做过调查。一般来说,展示前100K就够了。
第四个难题:百度搜索有没有规定网页上不允许出现哪些特殊符号?[/s2/]
答:没有这种限制。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)