python爬虫:解决爬取文字时写入出现的NBSP(空格)现象

python爬虫:解决爬取文字时写入出现的NBSP(空格)现象,第1张

当我们爬取文字存储到txt文本时出现NBSP现在的解决方法。


把空格去掉用str(remove).replace(u'\xa0', '')去解决

电影名称: 肖申克的救赎[NBSP]  
电影名称: 霸王别姬  [NBSP] 
电影名称: 阿甘正传  [NBSP] 
电影名称: 泰坦尼克号  [NBSP] 
电影名称: 这个杀手不太冷  [NBSP] 
电影名称: 美丽人生  [NBSP] 
电影名称: 千与千寻  [NBSP] 
电影名称: 辛德勒的名单  [NBSP] 
电影名称: 盗梦空间  [NBSP] 

 names = item.find('.hd a').text()
    remove = str(names).split('/')[0]
    # 去掉空格的方法
    name = str(remove).replace(u'\xa0', '')
    # print(name)
    file.write(f'电影名称: {name}\n')

 

电影名称: 肖申克的救赎 
电影名称: 霸王别姬 
电影名称: 阿甘正传 
电影名称: 泰坦尼克号 
电影名称: 这个杀手不太冷 
电影名称: 美丽人生 
电影名称: 千与千寻 
电影名称: 辛德勒的名单 
电影名称: 盗梦空间 
电影名称: 忠犬八公的故事 
电影名称: 星际穿越 

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/568589.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-09
下一篇 2022-04-09

发表评论

登录后才能评论

评论列表(0条)

保存