假设html变量就是html文档,select的函数用法和jquery通用
Document doc = Jsoupparse(html);
Elements es = docselect("a");
for(Element e : es){
//链接(a的href属性,别的属性也是用这个获取)
eattr("href");
//文本
etext()
}
其实你这个问题说简单也简单,说麻烦也麻烦,首先拼真实的url时,它是通过一个js方法实现的,只要用java代码模拟这个过程就OK了。
麻烦的是你这个URL中含有中文 ,传入时会乱码,导致查询结果为空。
不知道,我说的对不对,我们可以讨论一下。
1你贴的python代码,缩进有问题。
请自己重新确定代码缩进是正常的,且贴出来正常的代码给我们看。
2请确保:
你代码中所处理的内容,的确是你所截图贴出来的内容 -> 程序抓取出来的内容,有时候未必和你查看网页源码看到的内容是一样的。
3你的beautifulSoup使用的方式,就不太对。
下面的是我写了一部分的代码
public class NewsItemBiz {
private static String url = ">
以上就是关于java jsoup解析html的问题全部的内容,包括:java jsoup解析html的问题、使用jsoup解析html网页时,如果一个标签<a href=“javascript:getSearch(10)">[2]</a>怎么解析到这个href、我利用jsoup解析一个html网页,但是有的地方网页里面有,但是我解析的时候却没有得到等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)