Python模块BeautifulSoup提取锚点href

奥威 • 2022-5-30 • html-js-css • 阅读 20

概述我正在使用BeautifulSoup模块以这种方式从html中选择所有href：def extract_links(html): soup = BeautifulSoup(html) anchors = soup.findAll('a') print anchors links = [] for a in anchors: lin

我正在使用BeautifulSoup模块以这种方式从HTML中选择所有href：

def extract_links(HTML):  soup = BeautifulSoup(HTML)  anchors = soup.findAll('a')  print anchors  links = []  for a in anchors:    links.append(a['href'])  return links

但有时它失败了这个错误信息：

Traceback (most recent call last):file "C:\py\main.py",line 33,in

最佳答案并非所有锚标签都具有href属性.在尝试访问该属性之前,应检查锚是否具有href.
if a.has_key('href')  links.append(a['href'])
在这里查看了一些评论后,我认为这是处理这种情况的最pythonic方式.          总结       
以上是内存溢出为你收集整理的Python模块BeautifulSoup提取锚点href全部内容，希望文章能够帮你解决Python模块BeautifulSoup提取锚点href所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。					
										


					
						欢迎分享，转载请注明来源：内存溢出
原文地址: http://outofmemory.cn/web/1123729.html


			
            
            	            
            
			
								
					
						html– 在相同的表格单元格中垂直和水平居中文本,图像向左浮动
					
					
         				
							
								
							 上一篇
						
						2022-05-30
					
				
												
					
						php–HTML5输入类型电子邮件
					
					
         				
							下一篇 
           						
							
						
						2022-05-30
					
				
							

			
			
				
					
						发表评论
					
										
						
							请登录后评论...
						
						
							
								登录后才能评论
							
							
						
					
									
								 评论列表（0条）



	
		
			
				
			
			
				
					
				
			
			
				
					奥威
					一级用户组
				
				
				
					
						
							334
							文章
						
						
							0
							评论
						
												
							0
							问题
						
						
							0
							回答
						
												
					
				
								
				
					
						

							
							

							
							
								
							

						
					
				
			

						
				最近文章
				
										
						
							物联网卡的你了解多少呢？						
					
										
						
							创造与魔法怎么建服务区						
					
										
						
							润乾报表怎样在tomcat7.0下部署demo应用						
					
										
						
							物联网的技术体系框架（四层）						
					
										
						
							网络游戏开挂与单机游戏开修改器是一个意义吗，还是有什么异同？表示不喜欢玩网游的，不了解开挂的概念，						
					
									
			
					
				
			相关文章
						
								
					
						
							
						
					
					
						
							
								如何提取网页中的图片，网页内容抓取工具介绍							
						
						2022-4-14
					
				
								
					
						
							
						
					
					
						
							
								如何查看icloud备份内容，提取icloud备份文件的详细方法							
						
						2022-4-13
					
				
								
					
						
							
						
					
					
						
							
								如何从图片中提取文字，快速提取文字的两种方法							
						
						2022-4-13
					
				
								
					
						
							
						
					
					
						
							
								如何将图片中的文字提取出来，电脑上提取图片文字方法							
						
						2022-4-13
					
				
								
					
						
							
						
					
					
						
							
								如何提取网页中的图片，提取网页图片素材工具分享							
						
						2022-4-13
					
				
								
					
						
							
						
					
					
						
							
								微信聊天记录怎么导出来，微信聊天记录提取文本简单方法							
						
						2022-4-13
					
				
								
					
						
							
						
					
					
						
							
								如何从图片中提取文字，教你一个最简单的方法立马搞定							
						
						2022-4-13
					
				
								
					
						
							
						
					
					
						
							
								计算误差函数的积分--erf							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								由于找不到msvcp100.dll无法继续执行代码							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								pycharm汉化补丁							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								DeepFaceLab：手动提取高精度脸图，减少抖动！							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								将psd格式批量转换成jpg或png格式（C#自制软件）							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								cloudera cdh6.3 离线安装 经典大数据平台视频教程（含网盘下载地址）							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								for f命令之—Delims和Tokens用法&amp;总结							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Angular 开发NPM第三方包							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								菜鸟requireJS教程---2、基本知识							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Eigen库矩阵运算使用方法							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								从零开始系列之vue全家桶（3）安装使用vuex							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								sklearn							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Webpack实现路由懒加载的三种方式							
						
						2022-4-12
					
				
							
					
		
		
									随机标签
			
				
																				燕雀处堂
		        																																																																																																																																																																				仙族
		        																																turned
		        																																																																																																																																																																																																																																																																																																																																																												机构投资者
		        																																												恩施州
		        																																																																																				泛着
		        																																																																								教育馆
		        																																								hH
		        																																																																																																												膦酸
		        																				状元坊
		        																																																																				strjson
		        																																																																																																																																																																																																																																																																												老年病
		        																酒店设备
		        																底格里斯
		        																																																																																				何塞
		        																																																																																																																																																																那套
		        																																																																																																																																												棒材
		        																																																																																																																																																																																																																时任
		        																																																																																																								三下乡
		        																																																				过细


	

	
		
			
				
			

			
				
				    
						
							网站地图
						
					
					
						
							联系我们
						
					
					
						
							行业动态
						
					
					
						
							专题列表
						
					
					
				
					
				
				
					
						Copyright © 2022 内存溢出 版权所有
						
							湘ICP备2022025235号						
						Powered by
						
							outofmemory.cn
						
					
					
				
			
			
				
					
					
						
						
					
					
						
					
				
			
		
	

























    
    
    
        
            保存