python-3.x – 在Beautiful Soup中找不到lxml_python

概述我正在尝试使用beautifulsoup4来解析一系列用X HTML编写的网页.我假设为了获得最佳结果,我应该与xml解析器配对,而且我所知道的唯一一个由beautifulsoup支持的是lxml. 但是,当我尝试按照beautifuloup文档运行以下内容时： import requestsfrom bs4 import BeautifulSoup r = requests.get(‘he 我正在尝试使用beautifulsoup4来解析一系列用X HTML编写的网页.我假设为了获得最佳结果,我应该与xml解析器配对,而且我所知道的唯一一个由beautifulsoup支持的是lxml.

但是,当我尝试按照beautifuloup文档运行以下内容时：

import requestsfrom bs4 import BeautifulSoup r = requests.get(‘hereiswhereiputmyurl’)soup = BeautifulSoup(r.content,‘xml’)

它会导致以下错误：

FeatureNotFound: Couldn't find a tree builder with the features you    requested: xml. Do you need to install a parser library?

这让我疯狂.我找到了另外两个发布相同问题的用户的记录

这里How to re-install lxml?

和这里
bs4.FeatureNotFound: Couldn’t find a tree builder with the features you requested: lxml. Do you need to install a parser library?

我使用这篇文章(请参阅此行下方的链接)重新安装和更新lxml并更新了美丽的汤,但我仍然收到错误.
Installing lxml,libxml2,libxslt on Windows 8.1

Beautifulsoup正在工作,因为我运行了以下代码,它向我展示了其常用的标记语言墙
汤= BeautifulSoup(r.content,’HTML.parser’)

这是我的规格
windows 8.1
Python 3.5.2
我在Anaconda 3中使用spyder IDe来运行我的代码(诚然,我不太了解)

我确信这是一个初学者会做的混乱,因为正如我之前所说,我的编程经验非常少.

我如何解决这个问题,或者如果它是一个已知的错误,你们会建议我只使用lxml来抓取数据.

解决方法我认为问题是r.content.通常它提供响应的原始内容,不一定是HTML页面,它可以是Json等.
尝试将r.text送入汤中.

soup = BeautifulSoup(r.text,‘lxml’)

更好：

r.enCoding='utf-8'

然后

page = r.textsoup = BeautifulSoup(page,'lxml')

如果要解析xml,可以使用’lxml-xml’作为解析器.

总结

以上是内存溢出为你收集整理的python-3.x – 在Beautiful Soup中找不到lxml全部内容，希望文章能够帮你解决python-3.x – 在Beautiful Soup中找不到lxml所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1196172.html

python-3.x – 在Beautiful Soup中找不到lxml

发表评论

评论列表（0条）