java语言获取网页标签中的内容

java语言获取网页标签中的内容,第1张

新浪的那个天气的值是通过js动态加载的,原始html页面是<div id="SI_Weather_Wrap" class="now-wea-wrap clearfix"></div> 。

而jsoup只是对html进行解析,所以是找不到js动态生成的哪些信息的。

jsoup(>

Document doc = Jsoupconnect(“你的网址”)get();

//或者 Document doc = JsoupparseBodyFragment("html文档");

Element td= docselect("td ")first();

Elements span = tdselect("span");

String txt = spanget(7)text()

File input = new File("/tmp/inputhtml");

Document doc = Jsoupparse(input, "UTF-8", "IP");

看看这个代码,调用 doctext() 方法即可。

以上就是关于java语言获取网页标签中的内容全部的内容,包括:java语言获取网页标签中的内容、java获取网页内容中所有的<a>标签的href属性指向的地址,并在屏幕打印出来 即是查找href=和>之间的数据、如何使用jsoup在网页中抓取下列values=318内的有整段汉字等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9301708.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-26
下一篇 2023-04-26

发表评论

登录后才能评论

评论列表(0条)

保存