html – 提取内部元素而不循环

html – 提取内部元素而不循环,第1张

概述如果我循环遍历all并在第一个之后立即中断,则从以下示例 HTML代码中提取href值是直截了当的: <li class="parts partname parts_first"> <div id="dpdn10" uri="/public/page/part1" class="partype partstate"> <div class="ptctainer"> 如果我循环遍历all并在第一个之后立即中断,则从以下示例 HTML代码中提取href值是直截了当的:

<li >    <div ID="dpdn10" uri="/public/page/part1" >      <div >        <div >          <p >            <span ><a href="http://www.example.com/page/ptname.HTML?dv=rfirst" >First</a></span>            <span >              <a href="#" dndx="dpdn10"  >Details: </a>            </span>          </p>        </div>      </div>      <div ID="dpdn10_content" >        <div >          <div >            <p >              <span ><a href="http://www.example.com/page/ptname.HTML?dv=rfirst" >First</a></span>              <span ><a href="#" >Details: </a></span>            </p>          </div>        </div>          </div>    </div>  </li>

当我可以假设href值对于上述示例中的两个实例都相同时,我当然可以这样做.

但是,如果它们不相同并且我想提取特定的(第一个或第二个),则此方法会失败.

这让我在Jsoup中搜索允许“嵌套选择”的机制:到目前为止,我已熟悉单级选择,如:

Elements links = doc.select("a[href]"); // a with hrefElements pngs = doc.select("img[src$=.png]");  // img with src ending .pngElement masthead = doc.select("div.masthead").first();  // div with class=masthead

但我找不到多级选择的文档或示例,例如:

Element link= doc.select("div.xpns.div.ptctainer.div.pTitle.p.ptypead.span.rtext");

当然,上面的内容仅用于说明而不是真正的语法.我不知道Jsoup中是否还有这样的东西.

Jsoup中是否存在这种“嵌套选择”?

解决方法 你不能只是’链接’选择功能吗?喜欢:

Element link = doc.select("div.xpns").select("div.ptctainer").select("div.pTitle").select("p.ptypead").select("span.rtext");
总结

以上是内存溢出为你收集整理的html – 提取内部元素而不循环全部内容,希望文章能够帮你解决html – 提取内部元素而不循环所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1066995.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-26
下一篇 2022-05-26

发表评论

登录后才能评论

评论列表(0条)

保存