http://example.com&应该允许http://example.com/,但是
http://example.com/anything和http://example.com/someendpoint.aspx应该被阻止。
此外,如果我允许某些查询字符串传递到主页,那将是很好的
http://example.com?okparam=true
但不是
http://example.com?anythingbutokparam=true
User-Agent: *disallow: /*Allow: /?okparam=Allow: /$
诀窍是使用$来标记URL的结尾。
总结以上是内存溢出为你收集整理的网页抓取工具 – 如何设置一个仅允许站点默认页面的robot.txt全部内容,希望文章能够帮你解决网页抓取工具 – 如何设置一个仅允许站点默认页面的robot.txt所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)