Jsoup解析是按照字符串解析的,比如:
Document doc=Jsoupparse(response1Str);这句传入的response1Str就是一个String类型。因此你只需把本地html文件作为文本全读入为一个字符串,然后再用JSoup进一步解析就行了。
有关读入文件,变成字符串,我刚刚答过一个问题,你可参考一下:
>
剩下的代码,就是JSoup用类似CSS选择器的语法,取出你需要的元素,作进一步处理了。
例如:
Elements e2=docgetElementsByTag("input");for(Element e: e2) {
if(eattr("name")equals("formhash")) {
formhashStr=eattr("value");
break;
}
}
Systemoutprintln("formhash="+formhash);
上面这个代码片段是取出具有name属性为formhash的<input>标签,并打印此属性的value值。
建议去JSoup官网了解更详细的API及功能。
总结一下Jsoup提供的方法:
获取元素的有:
getElementById(String id)
getElementsByTag(String tag)
getElementsByClass(String className)
getElementsByAttribute(String key)
siblingElements(), firstElementSibling(), lastElementSibling(); nextElementSibling(), previousElementSibling()
parent(), children(), child(int index)
获取元素数据:
attr(String key) 获取属性
attr(String key, String value) 设置属性
attributes() 获取所有属性
id(), className() and classNames()
text() 获取文字内容
text(String value) 设置文字内容
html() 获取html内容
html(String value) 设置html内容
outerHtml()
data() 获取类似script,style的数据内容
tag() and tagName()
*** 作HTML内容:
append(String html), prepend(String html)
appendText(String text), prependText(String text)
appendElement(String tagName), prependElement(String tagName)
html(String value)
以上就是关于使用Jsoup怎样解析本地的html文件全部的内容,包括:使用Jsoup怎样解析本地的html文件、用jsoup解析网页,取到class标签内容后、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)