解决lxml报错 : lxml.etree.XMLSyntaxError

解决lxml报错 : lxml.etree.XMLSyntaxError,第1张

from lxmlimport etree

html=etree.parse('test.html',etree.HTMLParser())#指庆塌腔定解析器HTMLParser会誉衫根据文件衫罩修复HTML文件中缺失的如声明信息)

result=html.xpath('/html/head')

print(result)

上一篇: Termux02-安装Python

在termux上安装lxml经常失败,显示 #include <libxml/xmlversion.h>、#include <iconv.h>错误等。

主要原因是安毁吵答装过程中需要从C语言编译lxml,因而需要相关库的文件。

经实验,通过如下步骤可以成功安装

1、纤慧首先安装Clang、python-dev等

2、然后安装相关库文件

3、这时可以尝试安装lxml

4、如果还是碰判出现错误,可以尝试安装Cython

然后再进行第3步。

5、经实际测试,通过以上几个步骤可以成功安装lxml

总有很多原因,需要在非x86平台下跑python。

python的交叉编译网上有不少帖子,讲的都很好,这里就不在多说,放两个链接

http://ljgabc.github.io/2015/04/24/2015-04-24-%E4%BA%A4%E5%8F%89%E7%BC%96%E8%AF%91Python-3-4-2/

http://xiaoxia.org/2013/09/13/python-on-tomato/

lxml这类第三方库,底层采用了C语言写扩展。如果需要lxml在非侍虚纤X86平台上正确运行,那就需要将C语言扩展(xxx.so)编译成对应平台的二进制文件。

一般来说,直接在对应平台上编译安装老仿即可。But,如果对应平台上内存太小、处理器太慢、空间太少或者说根本没有誉激编译器.....(其实就是说的嵌入式)

好吧,还是安心的交叉编译lxml吧

lxml 依赖于 libxml2 、libxslt

首先把它两给编译了,安装一个指定路径 MYPREFIX

脚本里的 MY[xxx] 请指定对应的交叉编译工具

lxml

libxslt

还是先上脚本

/usr/local/bin/python3 是host python,必须和target python的版本一致 ,要不出了事不负责

${MYPREFIX_PYTHON} 是target python 编译安装的根目录

${DESTDIR} 编译的结果文件生成路径

LDFLAGS CC :一般交叉编译都会指定的编译工具或选项

大约就是这样了

在深入了解下

为什么要指定 LINKCC BLDSHARED LDSHARED ,这是啥?

这三个变量来自于 host python的 /usr/local/lib/python3.6/_sysconfigdata_m_XXXXXXXXX.py

在编译 build_ext 的时候,python的主要工具类是 Extension (from distutils.core import setup, Extension) ,这个类可以配置ext们的include/src/宏定义/等等一系列东西,它使用你配置的 CC BLDSHARED 等变量覆盖_sysconfigdata.py里的内容,然后进行编译

LINKCC BLDSHARED LDSHARED 这三个变量会指定链接,动态库链接时使用的编译器默认全都是 gcc ................................ :<

所以在编译lxml时只指定CC是没用的,因为 LDSHARED 还会被使用

推广一下, 以后第三方库交叉编译时可能还需要手动指定 _sysconfigdata.py 中的其他变量

GGGL


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12271839.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存