如何使用BeautifulSoup从内联样式中提取CSS属性

网上接单 • 2022-12-16 • 随笔 • 阅读 19

您有两种选择-快速，肮脏或正确的方法。快速而肮脏的方式（如果更改标记，则很容易中断）看起来像

>>> from BeautifulSoup import BeautifulSoup>>> import re>>> soup = BeautifulSoup('<html><body><img ) src="notTheRealImage.jpg"/></body></html>')>>> style = soup.find('img')['style']>>> urls = re.findall('url((.*?))', style)>>> urls[u'/theRealImage.jpg']

显然，您必须使用它才能使其与多个

img

标签一起使用。

正确的方法是，建议有人在CSS字符串上使用正则表达式:)会很糟糕，因此使用CSS解析器。cssutils是我刚刚在Google上找到的一个库，可以在PyPi上找到，它看起来可以完成这项工作。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5673841.html

找到方法内联字符串中断

打赏

微信扫一扫

支付宝扫一扫

网上接单一级用户组

0 0

正则表达式匹配-为什么不匹配并返回None？

上一篇 2022-12-16

正在运行setup.py install for fbprophet…错误

下一篇 2022-12-16

发表评论

登录后才能评论

如何使用BeautifulSoup从内联样式中提取CSS属性

发表评论

评论列表（0条）