bytes自己创建这些对象:
item['title'] = [t.enpre('utf-8') for t in title]item['link'] = [l.enpre('utf-8') for l in link]item['desc'] = [d.enpre('utf-8') for d in desc]items.append(item)
其中的每个
t.enpre(),
l.enpre()并
d.enpre()调用都会创建一个
bytes字符串。请勿执行此 *** 作,将其保留为JSON格式以将其序列化。
接下来,你将犯其他几个错误。你在不需要的地方编码过多。将其留给
json模块和由调用返回的标准文件对象
open()以处理编码。
你也不需要将
items列表转换为字典;它已经是可以直接进行JSON编码的对象:
class W3SchoolPipeline(object): def __init__(self): self.file = open('w3school_data_utf8.json', 'w', encoding='utf-8') def process_item(self, item, spider): line = json.dumps(item) + 'n' self.file.write(line) return item
我猜你遵循的是一个假定使用Python 2的教程,而你使用的是Python 3。我强烈建议你找到其他教程;它不仅是为过时的Python版本编写的,而且还倡导
line.depre('unipre_escape')它正在教一些极端不良的习惯,这些习惯会导致难以跟踪的错误。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)