最近学习python爬虫,在分析网页时需要用到的lxml库的etree模块,本人用Python3.8.7,在安装了最新的4.8.0版本lxml后,from lxml import etree导入语句被pycharm标注红色错误,实验多次发现lxml 4.4.0及其以前的版本不存在这个问题,4.4.1以后的版本都有。于是网上一番搜索学习,最后终于大致弄清楚了原因,并初步解决了问题。
首先,并不是所谓的较新版本的lxml没有etree模块了。即使被pycharm标红,但其实程序是可以正常运行的,也可以得到正确结果的,如图:
其次,也不是所谓的etree模块被集成到html子模块里了。在上图中我是直接从lxml导入并正常运行的。当然,如果用from lxml.html import etree来导入,也是可以正常运行的,并且,照样会被标红。打开lxml.html目录下的“__init__.py"文件可以看到,在__all__中并没有etree。
往下再翻一点看看:
也就是说,lxml.html里也是从上一级目录lxml下导入etree的!
在lxml包里可以看到其实有etree模块:
只不过不是以etree.py模块的形式提供的,而是以pyd文件存在的。所以,lxml新版本里仍然是有etree模块的,可以与旧版本一样的导入使用。标红只是pycharm的问题。
当然,如果你和我一样看着标红不顺眼,那可以修改lxml.html目录下的“__init__.py"文件,在__all__中加上etree,如图:
然后用from lxml.html import etree来导入,它就不标红了。
也可以修改lxml目录下的“__init__.py"文件,在文件中加入“from . import etree”导入语句,然后添加__all__,并在其中加上etree,如图:
至此,解决了标红问题,可以照常使用了。
不过,这个解决办法不够完美,在编辑输入etree.后pycharm不能自动给出语法提示。至于如何解决导入pyd文件能不标红,且pycharm中能有语法提示,还望有大佬能不吝赐教!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)