lxml.html.parse
不获取URL。
使用urllib2的方法如下:
>>> from urllib2 import urlopen>>> from lxml.html import parse>>> page = urlopen('http://www.google.com')>>> p = parse(page)>>> p.getroot()<Element html at 1304050>
更新
史蒂文是正确的。
lxml.etree.parse应该接受并加载网址。我错过了。我尝试删除此答案,但不允许这样做。
我撤回了有关不获取URL的声明。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)