Python爬虫（二）--获取页面元素的href属性_python

概述网页中单一类型数据的全部信息：网页由多种元素组成，一个元素可能有多个属性，例如class,id,name,text,href,value等，本文以提取网页所有超链接信息为实例。相关步骤可参考Python爬虫（一）frombs4importBeautifulSoup#导入架包importrequests#导入架包r=requests.get(' 网页中单一类型数据的全部信息：

网页由多种元素组成，一个元素可能有多个属性，例如class,ID,name,text,href,value等，本文以提取网页所有超链接信息为实例。相关步骤可参考Python爬虫（一）

from bs4 import BeautifulSoup  #导入架包import requests    #导入架包r=requests.get('https://wuhaozhan.net/') #获取目标网址所有信息demo=r.text               #定义所有信息的文本soup=BeautifulSoup(demo,'HTML.parser')   #BeautifulSoup中的方法for link in soup.find_all('a'):      #遍历网页中所有的超链接（a标签）    print(link.get('href'))    #  打印出所有包含href的元素的链接。

总结

以上是内存溢出为你收集整理的Python爬虫（二）--获取页面元素的href属性全部内容，希望文章能够帮你解决Python爬虫（二）--获取页面元素的href属性所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/1185804.html

Python爬虫（二）--获取页面元素的href属性

发表评论

评论列表（0条）