下载html时将jsoup屏蔽为浏览器

下载html时将jsoup屏蔽为浏览器,第1张

概述是否有可能掩盖 Jsoup.connect("http://xyz.com").get().html(); 作为浏览器调用该网站? 我尝试构建一个壁纸下载工具,并在从服务器下载页面时遇到问题. 如果我下载页面,比如使用Firefox,将其上传到我的服务器,它会正确下载… 我认为它必须是一些基于浏览器的脚本预防,它不允许你自动解析页面… 尝试根据请求设置 User-Agent header.例如: 是否有可能掩盖

Jsoup.connect("http://xyz.com").get().@R_403_6832@();

作为浏览器调用该网站?

我尝试构建一个壁纸下载工具,并在从服务器下载页面时遇到问题.

如果我下载页面,比如使用firefox,将其上传到我的服务器,它会正确下载…

我认为它必须是一些基于浏览器的脚本预防,它不允许你自动解析页面…

解决方法 尝试根据请求设置 User-Agent header.例如:

String ua = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_8) AppleWebKit/534.30 (K@R_403_6832@,like Gecko) Chrome/12.0.742.122 Safari/534.30";Jsoup.connect("http://example.com").userAgent(ua).get().@R_403_6832@();
总结

以上是内存溢出为你收集整理的下载html时将jsoup屏蔽为浏览器全部内容,希望文章能够帮你解决下载html时将jsoup屏蔽为浏览器所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1069583.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-26
下一篇 2022-05-26

发表评论

登录后才能评论

评论列表(0条)

保存