好吧,您的确切问题的答案是
coalesce函数。但是,正如已经提到的那样,它根本效率不高,因为它将迫使一个工作人员读取所有数据并顺序写入。
df.coalesce(1).write.format('json').save('myfile.json')
顺便说一句,结果文件不是有效的json文件。它是每行带有json对象的文件。
欢迎分享,转载请注明来源:内存溢出
好吧,您的确切问题的答案是
coalesce函数。但是,正如已经提到的那样,它根本效率不高,因为它将迫使一个工作人员读取所有数据并顺序写入。
df.coalesce(1).write.format('json').save('myfile.json')
顺便说一句,结果文件不是有效的json文件。它是每行带有json对象的文件。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)