通过XPath解析HTML

通过XPath解析HTML,第1张

通过XPath解析HTML

在python中,ElementTidy解析标记汤并生成一个元素树,该树允许使用XPath进行查询:

>>> from elementtidy.TidyHTMLTreeBuilder import TidyHTMLTreeBuilder as TB>>> tb = TB()>>> tb.feed("<p>Hello world")>>> e= tb.close()>>> e.find(".//{http://www.w3.org/1999/xhtml}p")<Element {http://www.w3.org/1999/xhtml}p at 264eb8>


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5645819.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存