python– 使用BeautifulSoup解析HTML表

起名字的网站 • 2022-6-4 • python • 阅读 40

概述我过去曾使用过BeautifulSoup,但我反对新事物;令人难以置信的通用/最小的HTML表格标记...我的目标是获取每个值和它的标签(每个都在自己的td中)并打印出来......它们可以合并,我不在乎,我只是想制作确保每个标签都应用于正确的值.这是一个示例表：<tbody><tr> <td class='labels'&gt

我过去曾使用过BeautifulSoup,但我反对新事物;令人难以置信的通用/最小的HTML表格标记…我的目标是获取每个值和它的标签(每个都在自己的td中)并打印出来……它们可以合并,我不在乎,我只是想制作确保每个标签都应用于正确的值.这是一个示例表：

我知道如何抓住这些价值……
for td in soup.findAll('table')[0]:  # theres more than one table on the page    print td.renderContents().strip()
但这只给了我……
'Dawn:''07:01''Sunrise:''07:26''Moonrise:''14:29''
我想我可以抓住那些类值“标签”和“site_data”,但我如何确保标签和数据分组正确？最佳答案以下内容应该更简单,更容易理解：
import pprintfrom BeautifulSoup import BeautifulSoup  soup = BeautifulSoup(docTxt)groupedData = []for row in soup.findAll("tr"):    data = {}    allTDs = row.findAll("td")    for x in range(0,len(allTDs)-1,2):        data[allTDs[x].renderContents().strip()] = allTDs[x+1].renderContents().strip()    groupedData.append(data)pprint.pprint(groupedData)
输出：
[{'Dawn:': '07:01','Moonrise:': '14:29','Sunrise:': '07:26'},{'Dusk:': '18:27','Moonset:': '01:55','Sunset:&nbsp;': '18:02'},{'Day length:': '10:36','Daylight:': '11:26','Moon Phase:': 'Waxing Gibbous'}]
          总结       以上是内存溢出为你收集整理的python  – 使用BeautifulSoup解析HTML表全部内容，希望文章能够帮你解决python  – 使用BeautifulSoup解析HTML表所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错，欢迎将内存溢出网站推荐给程序员好友。					
										


					
						欢迎分享，转载请注明来源：内存溢出
原文地址: https://outofmemory.cn/langs/1205897.html


			
            
            	            
            
			
								
					
						python– 使用H.323测试遗留语音邮件系统
					
					
         				
							
								
							 上一篇
						
						2022-06-04
					
				
												
					
						Python的“iter”函数示例给出了TypeError
					
					
         				
							下一篇 
           						
							
						
						2022-06-04
					
				
							

			
			
				
					
						发表评论
					
										
						
							请登录后评论...
						
						
							
								登录后才能评论
							
							
						
					
									
								 评论列表（0条）



	
		
			
				
			
			
				
					
				
			
			
				
					起名字的网站
					一级用户组
				
				
				
					
						
							228
							文章
						
						
							0
							评论
						
												
							0
							问题
						
						
							0
							回答
						
												
					
				
								
				
					
						

							
							

							
							
								
							

						
					
				
			

						
				最近文章
				
										
						
							土味是什么意思						
					
										
						
							满天星有哪几种颜色						
					
										
						
							吃蟹需要哪些工具 吃蟹需要用的工具和讲究						
					
										
						
							水调歌头明月几时有苏轼原文_水调歌头全诗诗句解析						
					
										
						
							mapping文件约束头						
					
									
			
					
				
			相关文章
						
								
					
						
							
						
					
					
						
							
								windbg查找Kernel32.dll基址							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								DVB-subtitle解析流程浅							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								JSON在线解析及格式化校验工具 jsonin.com							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								handlebar JS模板使用笔记							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								代理IP爬取和验证（快代理&amp;西刺代理）							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Webkit之HTML解析							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								在线解析JSON+ AsyncTaskLoader							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Git-第二篇廖雪峰Git教程学习笔记（1）基本命令，版本回退							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Yii2 关于yiidbConnection::open耗时很久的问题							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								error LNK2019: 无法解析的外部符号（编程解决方法）							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								parseInt实例详解							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Cesium原理篇：3D Tiles（2）数据结构							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								js 解析json							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Linux命令——readlink、realpath							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								全能VIP音乐在线解析							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								python 爬取王者荣耀高清壁纸							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								dnsmasq+Stunnel+sniproxy加密代理							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								Bandpass Signals							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								HTML中显示特殊字符，如尖括号“&lt;”,&quot;&gt;&quot;等等							
						
						2022-4-12
					
				
								
					
						
							
						
					
					
						
							
								腾讯、爱奇艺、优酷等vip视频在线解析							
						
						2022-4-12
					
				
							
					
		
		
									随机标签
			
				
																																																																				东易日盛
		        																																销售精英
		        																				压簧
		        																																																																																																																																																																				培正
		        																																																				难解
		        																																																												魔羯座
		        																																																徐本禹
		        																																																																																																																																																				神清
		        																																																																																																				甲士
		        																																								龟龙麟凤
		        																																																																																																																																																																																																				克森
		        																																												保护生态环境
		        																																																																																																																																																																																																												手旗
		        																																																				哈里森
		        																				休假日
		        																																																																																																																																																																																																																																				之策
		        								锋线
		        																																																																																																																																																																																																																																																																																																																																																																																																																																																南苑
		        																																																																				二十五
		        								假冒者


	

	
		
			
				
			

			
				
				    
						
							网站地图
						
					
					
						
							联系我们
						
					
					
						
							行业动态
						
					
					
						
							专题列表
						
					
					
				
					
				
				
					
						Copyright © 2022 内存溢出 版权所有
						
							湘ICP备2022025235号						
						Powered by
						
							outofmemory.cn
						
					
					
				
			
			
				
					
					
						
						
					
					
						
					
				
			
		
	

























    
    
    
        
            保存