python3.7爬虫使用xpath解析,获取的表格数据为什么不全面

python3.7爬虫使用xpath解析,获取的表格数据为什么不全面,第1张

我认为是xpath默认提取xpath第一个tr属性了,xpath 表达式改成'//div[@class="row"]//table//tr[@height="38px" or @height=""]'

xPath 是一种html和xml的查询语言,能在其树状结构中寻找节点。

LXML安装:pip install lxml

——xPath使用-----------------------------------------------------------------------------------

获取文本:

//标签1[@属性1="属性值1"]/标签2[@属性2="属性值2"]//text()

获取属性值

//标签1[@属性1="属性值1"]/标签2[@属性2="属性值2"]//@属性n

eg:-------------------------------------------------------------------

from lxml import html

def parse():

"""将html文件中内容 使用xpath进行提取"""

    #读取文件中的内容

    f =open('/static/indexhtml', 'r', encoding='utf-8')

    s = fread()

    selector = htmlfromstring(s)

# 解析a 标签内容

    a = selectorxpath('//div[@id="container"]/a/text()')

    print(a[0])

# 解析href属性

    alink = selectorxpath('//div[@id="container"]/a/@href')

    print(alink[0])

    fclose()

if __name__=='__main__':

    parse()

1、直接打开selenium的主界面,按照File→New→Class的顺序进行点击。

2、下一步,需要在d出的窗口中设置相关内容并确定创建。

3、这个时候,输入获取元素属性的对应代码。

4、如果没问题,就按照图示启用取得id值的功能。

5、等完成上述 *** 作以后,继续通过对应网页选择图示按钮跳转。

6、这样一来会得到相关结果,即可达到目的了。

以上就是关于python3.7爬虫使用xpath解析,获取的表格数据为什么不全面全部的内容,包括:python3.7爬虫使用xpath解析,获取的表格数据为什么不全面、xPath与html、selenium如何获取已定位元素的属性值等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9747491.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存