网页由多种元素组成,一个元素可能有多个属性,例如class,ID,name,text,href,value等,本文以提取网页所有超链接信息为实例。相关步骤可参考Python爬虫(一)
from bs4 import BeautifulSoup #导入架包import requests #导入架包r=requests.get('https://wuhaozhan.net/') #获取目标网址所有信息demo=r.text #定义所有信息的文本soup=BeautifulSoup(demo,'HTML.parser') #BeautifulSoup中的方法for link in soup.find_all('a'): #遍历网页中所有的超链接(a标签) print(link.get('href')) # 打印出所有包含href的元素的链接。
总结 以上是内存溢出为你收集整理的Python爬虫(二)--获取页面元素的href属性全部内容,希望文章能够帮你解决Python爬虫(二)--获取页面元素的href属性所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)