您确定 所有 行都至少有2列?您可以尝试类似的方法吗?
sc.textFile("file.csv") .map(lambda line: line.split(",")) .filter(lambda line: len(line)>1) .map(lambda line: (line[0],line[1])) .collect()
或者,您可以打印罪魁祸首(如果有):
sc.textFile("file.csv") .map(lambda line: line.split(",")) .filter(lambda line: len(line)<=1) .collect()
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)