html=etree.parse('test.html',etree.HTMLParser())#指庆塌腔定解析器HTMLParser会誉衫根据文件衫罩修复HTML文件中缺失的如声明信息)
result=html.xpath('/html/head')
print(result)
上一篇: Termux02-安装Python
在termux上安装lxml经常失败,显示 #include <libxml/xmlversion.h>、#include <iconv.h>错误等。
主要原因是安毁吵答装过程中需要从C语言编译lxml,因而需要相关库的文件。
经实验,通过如下步骤可以成功安装
1、纤慧首先安装Clang、python-dev等
2、然后安装相关库文件
3、这时可以尝试安装lxml
4、如果还是碰判出现错误,可以尝试安装Cython
然后再进行第3步。
5、经实际测试,通过以上几个步骤可以成功安装lxml
总有很多原因,需要在非x86平台下跑python。
python的交叉编译网上有不少帖子,讲的都很好,这里就不在多说,放两个链接
http://ljgabc.github.io/2015/04/24/2015-04-24-%E4%BA%A4%E5%8F%89%E7%BC%96%E8%AF%91Python-3-4-2/
http://xiaoxia.org/2013/09/13/python-on-tomato/
lxml这类第三方库,底层采用了C语言写扩展。如果需要lxml在非侍虚纤X86平台上正确运行,那就需要将C语言扩展(xxx.so)编译成对应平台的二进制文件。
一般来说,直接在对应平台上编译安装老仿即可。But,如果对应平台上内存太小、处理器太慢、空间太少或者说根本没有誉激编译器.....(其实就是说的嵌入式)
好吧,还是安心的交叉编译lxml吧
lxml 依赖于 libxml2 、libxslt
首先把它两给编译了,安装一个指定路径 MYPREFIX
脚本里的 MY[xxx] 请指定对应的交叉编译工具
lxml
libxslt
还是先上脚本
/usr/local/bin/python3 是host python,必须和target python的版本一致 ,要不出了事不负责
${MYPREFIX_PYTHON} 是target python 编译安装的根目录
${DESTDIR} 编译的结果文件生成路径
LDFLAGS CC :一般交叉编译都会指定的编译工具或选项
大约就是这样了
在深入了解下
为什么要指定 LINKCC BLDSHARED LDSHARED ,这是啥?
这三个变量来自于 host python的 /usr/local/lib/python3.6/_sysconfigdata_m_XXXXXXXXX.py
在编译 build_ext 的时候,python的主要工具类是 Extension (from distutils.core import setup, Extension) ,这个类可以配置ext们的include/src/宏定义/等等一系列东西,它使用你配置的 CC BLDSHARED 等变量覆盖_sysconfigdata.py里的内容,然后进行编译
LINKCC BLDSHARED LDSHARED 这三个变量会指定链接,动态库链接时使用的编译器默认全都是 gcc ................................ :<
所以在编译lxml时只指定CC是没用的,因为 LDSHARED 还会被使用
推广一下, 以后第三方库交叉编译时可能还需要手动指定 _sysconfigdata.py 中的其他变量
GGGL
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)