Python爬虫怎么循环截取html标签中间的内容?

Python爬虫怎么循环截取html标签中间的内容?,第1张

如果是中间的数据直接就用bs4最简单

from bs4 import BeautifulSoup

#这里是请求过来的额数据处理,提取标签

html = BeautifulSoup(response.text, 'html.parser')

body = html.body       # 获取body部分数据

div = body.find("div",{'id','today'}) #用find去找div标签,id叫 today的标签里面的数据

就可以了

如果要提取标签内容比如value的值

div = body.find("input",id='hidden_title')['value']

html是成树形结构的标签语言,没有循环功能,

如要实现请参考使用javascript脚本语言。

答题不易,互相理解,您的采纳是我前进的动力,

您也可以向我们团队发出请求,会有更专业的人来为您解答。

如果我的回答没能帮助您,请继续追问。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/7307037.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-04
下一篇 2023-04-04

发表评论

登录后才能评论

评论列表(0条)

保存