Python爬虫(二)--获取页面元素的href属性

Python爬虫(二)--获取页面元素的href属性,第1张

概述网页中单一类型数据的全部信息:网页由多种元素组成,一个元素可能有多个属性,例如class,id,name,text,href,value等,本文以提取网页所有超链接信息为实例。相关步骤可参考Python爬虫(一)frombs4importBeautifulSoup#导入架包importrequests#导入架包r=requests.get(' 网页中单一类型数据的全部信息:

网页由多种元素组成,一个元素可能有多个属性,例如class,ID,name,text,href,value等,本文以提取网页所有超链接信息为实例。相关步骤可参考Python爬虫(一)

from bs4 import BeautifulSoup  #导入架包import requests    #导入架包r=requests.get('https://wuhaozhan.net/') #获取目标网址所有信息demo=r.text               #定义所有信息的文本soup=BeautifulSoup(demo,'HTML.parser')   #BeautifulSoup中的方法for link in soup.find_all('a'):      #遍历网页中所有的超链接(a标签)    print(link.get('href'))    #  打印出所有包含href的元素的链接。
总结

以上是内存溢出为你收集整理的Python爬虫(二)--获取页面元素的href属性全部内容,希望文章能够帮你解决Python爬虫(二)--获取页面元素的href属性所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1185804.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存