如何删除BeautifulSoup中的空格

如何删除BeautifulSoup中的空格,第1张

概述我有一堆HTML我正在使用BeautifulSoup进行解析,除了一个小问题之外它一直很顺利.我想将输出保存为单行字符串,以下是我当前的输出: <li><span class="plaincharacterwrap break"> Zazzafooky but one two three! </span></li><li>< 我有一堆HTML我正在使用BeautifulSoup进行解析,除了一个小问题之外它一直很顺利.我想将输出保存为单行字符串,以下是我当前的输出:
<li><span >                    Zazzafooky but one two three!                </span></li><li><span >                    Zazzafooky2                </span></li><li><span >                    Zazzafooky3                </span></li>

理想情况下,我想

<li><span >Zazzafooky but one two three!</span></li><li><span >Zazzafooky2</span></li>

有很多冗余的空白我想摆脱它但是它不一定是使用strip()可移除的,我也不能公然删除所有的空格因为我需要保留文本.我该怎么做?这似乎是一个普遍的问题,正则表达式会有点矫枉过正,但这是唯一的方法吗?

我没有任何< pre>标签所以我可以在那里更有力量.

再次感谢!

解决方法 如果没有正则表达式,您可以执行以下 *** 作:
>>> HTML = """    <li><span >...                     Zazzafooky but one two three!...                 </span></li>... <li><span >...                     Zazzafooky2...                 </span></li>... <li><span >...                     Zazzafooky3...                 </span></li>... """>>> HTML = "".join(line.strip() for line in HTML.split("\n"))>>> HTML'<li><span >Zazzafooky but one two three!</span></li><li><span >Zazzafooky2</span></li><li><span >Zazzafooky3</span></li>'
总结

以上是内存溢出为你收集整理的如何删除BeautifulSoup中的空格全部内容,希望文章能够帮你解决如何删除BeautifulSoup中的空格所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1109162.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-29
下一篇 2022-05-29

发表评论

登录后才能评论

评论列表(0条)

保存