基本上,您可以使用Jsoup做到这一点:
document doc = Jsoup.connect("http://rabotalux.com.ua/vacancy/4f4f800c8bc1597dc6fc7aff").get(); Elements links = doc.select("link"); Elements scripts = doc.select("script"); for (Element element : links) { System.out.println(element.absUrl("href")); } for (Element element : scripts) { System.out.println(element.absUrl("src")); }
等等,包括图片和所有相关资源。
但是, 如果您的站点使用javascript创建了一些元素,则Jsoup将跳过它,因为它无法执行javascript
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)