python爬虫 文本含有&nbsp该如何解决

python爬虫 文本含有&nbsp该如何解决,第1张

使用爬虫爬取网页标题时,利用bs4解析p标签的内容后,某些标题里掺杂了 ;字符,该字符并没有以真正的空格显示,而是显示为字符串,所以我使用了replace()方法去除。

原代码:

for it in result3:
    title=it.group("title")
    print(title)

修改后:

for it in result3:
	#通过replace()方法将字符串' '替换成了空字符串''
    title=it.group("title").replace(u' ', u'')
    print(title)

replace(u’需要被替换掉的字符串’, u’想要替换成的字符串’)
END

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/923329.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-16
下一篇 2022-05-16

发表评论

登录后才能评论

评论列表(0条)

保存