美丽汤结果缺少零件

mk103 • 2022-12-17 • 随笔 • 阅读 31

美丽汤结果缺少零件

BeautifulSoup可以使用不同的解析器来处理HTML输入。此处的HTML输入有些破损，并且默认的

HTMLParser

解析器不能很好地处理它。

改用

html5lib

解析器：

>>> len(BeautifulSoup(r.text, 'html').find('td', attrs={'class': 'eelantext'}).find_all('p'))0>>> len(BeautifulSoup(r.text, 'lxml').find('td', attrs={'class': 'eelantext'}).find_all('p'))0>>> len(BeautifulSoup(r.text, 'html5lib').find('td', attrs={'class': 'eelantext'}).find_all('p'))22

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5674319.html

解析输入破损改用零件

打赏

微信扫一扫

支付宝扫一扫

mk103 一级用户组

0 0

仅选择多索引DataFrame的一个索引

上一篇 2022-12-16

读取图像灰度opencv 3.0.0-dev

下一篇 2022-12-16

发表评论

登录后才能评论

美丽汤结果缺少零件

发表评论

评论列表（0条）