<li > <div ID="dpdn10" uri="/public/page/part1" > <div > <div > <p > <span ><a href="http://www.example.com/page/ptname.HTML?dv=rfirst" >First</a></span> <span > <a href="#" dndx="dpdn10" >Details: </a> </span> </p> </div> </div> <div ID="dpdn10_content" > <div > <div > <p > <span ><a href="http://www.example.com/page/ptname.HTML?dv=rfirst" >First</a></span> <span ><a href="#" >Details: </a></span> </p> </div> </div> </div> </div> </li>
当我可以假设href值对于上述示例中的两个实例都相同时,我当然可以这样做.
但是,如果它们不相同并且我想提取特定的(第一个或第二个),则此方法会失败.
这让我在Jsoup中搜索允许“嵌套选择”的机制:到目前为止,我已熟悉单级选择,如:
Elements links = doc.select("a[href]"); // a with hrefElements pngs = doc.select("img[src$=.png]"); // img with src ending .pngElement masthead = doc.select("div.masthead").first(); // div with class=masthead
但我找不到多级选择的文档或示例,例如:
Element link= doc.select("div.xpns.div.ptctainer.div.pTitle.p.ptypead.span.rtext");
当然,上面的内容仅用于说明而不是真正的语法.我不知道Jsoup中是否还有这样的东西.
Jsoup中是否存在这种“嵌套选择”?
解决方法 你不能只是’链接’选择功能吗?喜欢:Element link = doc.select("div.xpns").select("div.ptctainer").select("div.pTitle").select("p.ptypead").select("span.rtext");总结
以上是内存溢出为你收集整理的html – 提取内部元素而不循环全部内容,希望文章能够帮你解决html – 提取内部元素而不循环所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)