Python:“ lxml”与“ html.parser”与“ html5lib”之间的区别与美丽的汤?

Python:“ lxml”与“ html.parser”与“ html5lib”之间的区别与美丽的汤?,第1张

Python:“ lxml”与“ html.parser”与“ html5lib”之间的区别与美丽的汤?

docs 的优缺点汇总表中:

  1. html.parser -

    BeautifulSoup(markup, "html.parser")

    • 优点:包括电池,不错的速度,宽大(从Python 2.7.3和3.2开始)。

    • 缺点:不太宽大(在Python 2.7.3或3.2.2之前)

  2. LXML -

    BeautifulSoup(markup, "lxml")

    • 优点:非常快,宽大

    • 缺点:外部C依赖

  3. html5lib -

    BeautifulSoup(markup, "html5lib")

    • 优点:极为宽松,以与网络浏览器相同的方式解析页面,创建有效的HTML5

    • 缺点:非常慢,外部Python依赖



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5647263.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存