linux – wget递归下载,但我不想关注所有链接

linux – wget递归下载,但我不想关注所有链接,第1张

概述我正在尝试使用wget镜像一个网站,但我不想下载大量文件,所以我使用wget的–reject选项来保存所有文件.但是wget仍然会下载所有文件,然后如果它与我的拒绝选项匹配则删除该文件. 有没有办法告诉wget如果匹配某些shell通配符不遵循某些链接?如果wget无法做到这一点,是否有其他常见的linux命令可以做到这一点? 您也可以尝试 HTTrack,IMO,更灵活,更直观的包含/排除逻辑. 我正在尝试使用wget镜像一个网站,但我不想下载大量文件,所以我使用wget的–reject选项来保存所有文件.但是wget仍然会下载所有文件,然后如果它与我的拒绝选项匹配则删除该文件.

有没有办法告诉wget如果匹配某些shell通配符不遵循某些链接?如果wget无法做到这一点,是否有其他常见的linux命令可以做到这一点?

解决方法 您也可以尝试 HTTrack,IMO,更灵活,更直观的包含/排除逻辑.这样的东西……
httrack "https://example.com" -O ExampleMirrorDirectory \"-*" \"+https://example.com/images/*" \"-*.swf"

规则将按顺序应用,并将覆盖以前的规则……

>排除一切
>但包括https://example.com/images/ *>但排除以swf结尾的任何内容

总结

以上是内存溢出为你收集整理的linux – wget递归下载,但我不想关注所有链接全部内容,希望文章能够帮你解决linux – wget递归下载,但我不想关注所有链接所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/1045171.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-24
下一篇 2022-05-24

发表评论

登录后才能评论

评论列表(0条)

保存