XPATH文本内容匹配th内容,获取td的值

XPATH文本内容匹配th内容,获取td的值,第1张

用XPath表达式来定位到对应的<td>元素

//th[span[text()="发布时间"]]/following-sibling::td/span

这个XPath表达式首先选择包含文本“发布时间”的<span>元素的<th>元素,然后使用/following-sibling::td选择这个<th>元素的下一个兄弟元素,即包含发布时间的<td>元素。最后,使用/span选择包含发布时间值的<span>元素。

请注意,这个XPath表达式返回的是一个<span>元素,如果您只需要获取该元素的文本值,可以使用text()函数,例如:

//th[span[text()="发布时间"]]/following-sibling::td/span/text()

这将返回包含发布时间的<span>元素的文本值

很简单,教你一招:

这是你的html文件,我命名为testhtml

然后用xpath匹配:

import lxmletree

html=lxmletreeparse("testhtml")

res=htmlxpath("//a[@heaf='baiducom']")

info=res[0]xpath('string()')

print(info)

运行结果:

1 爬取网站 笔趣阁小说

2 网站地址 >

以上就是关于XPATH文本内容匹配th内容,获取td的值全部的内容,包括:XPATH文本内容匹配th内容,获取td的值、xpath取一个节点下的所有文字、Requests和Xpath笔趣阁小说采集爬取教程等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/10127754.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-05
下一篇 2023-05-05

发表评论

登录后才能评论

评论列表(0条)

保存