第一步:将Jsoup JAR包导入项目
第二步:使用Jsoup API
1, 定位
通过div的属性值,定位到html的div(块),即所需要内容对应的块。
示例代码如下:
<div class="content">
2, 筛选数据
a, 通过标签头,在div中继续筛选数据。可能会找到很多的数据,这里会用到循环。见eg1。
//eg1:解析百度音乐 Document doc = Jsoup.connect("http://list.mp3.baidu.com/top/singer/A.html").get()Element singerListDiv = doc.getElementsByAttributeValue("class", "content").first()Elements links = singerListDiv.getElementsByTag("a") for (Element link: links) {
Jsoup可以解析XML,不过要比较新的版本才支持,你解析XML文档时,调用这个parse方法,Document doc=Jsoup.parse(html, "", Parser.xmlParser()),后面就和解析html一样了,可以调用select选标签等等。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)