java jsoup解析html的问题

java jsoup解析html的问题,第1张

假设html变量就是html文档,select的函数用法和jquery通用

Document doc = Jsoupparse(html);

Elements es = docselect("a");

for(Element e : es){

//链接(a的href属性,别的属性也是用这个获取)

eattr("href");

//文本

etext()

}

其实你这个问题说简单也简单,说麻烦也麻烦,首先拼真实的url时,它是通过一个js方法实现的,只要用java代码模拟这个过程就OK了。

麻烦的是你这个URL中含有中文 ,传入时会乱码,导致查询结果为空。

不知道,我说的对不对,我们可以讨论一下。

1你贴的python代码,缩进有问题。

请自己重新确定代码缩进是正常的,且贴出来正常的代码给我们看。

2请确保:

你代码中所处理的内容,的确是你所截图贴出来的内容 -> 程序抓取出来的内容,有时候未必和你查看网页源码看到的内容是一样的。

3你的beautifulSoup使用的方式,就不太对。

下面的是我写了一部分的代码

public class NewsItemBiz {

private static String url = ">

以上就是关于java jsoup解析html的问题全部的内容,包括:java jsoup解析html的问题、使用jsoup解析html网页时,如果一个标签<a href=“javascript:getSearch(10)">[2]</a>怎么解析到这个href、我利用jsoup解析一个html网页,但是有的地方网页里面有,但是我解析的时候却没有得到等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9521748.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存