自我插件:我刚刚发布了一个新的Java HTML解析器:jsoup。我在这里提到它是因为我认为它会做您所追求的。
它的技巧是使用CSS选择器语法来查找元素,例如:
String html = "<html><head><title>First parse</title></head>" + "<body><p>Parsed HTML into a doc.</p></body></html>";document doc = Jsoup.parse(html);Elements links = doc.select("a");Element head = doc.select("head").first();
有关更多信息,请参见Selector javadoc。
这是一个新项目,因此任何改进的想法都非常欢迎!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)