1.然后我们再来看,上一节我们执行的时候设置的job.setNumReduceTasks(5),我们分成了5个分区,那么如果我们设置成4,可以看到上面
会怎么样?
2.设置以后执行可以看到,报错了对吧,报的是io异常,为什么?
因为我们我们如果设置4,但是我们自定义的partitioner中,是需要5的,这个时候去找5,这个分区文件就找不到自然就报错了.
去5分区,写数据的时候,没办法写就报io异常了.
欢迎分享,转载请注明来源:内存溢出
1.然后我们再来看,上一节我们执行的时候设置的job.setNumReduceTasks(5),我们分成了5个分区,那么如果我们设置成4,可以看到上面
会怎么样?
2.设置以后执行可以看到,报错了对吧,报的是io异常,为什么?
因为我们我们如果设置4,但是我们自定义的partitioner中,是需要5的,这个时候去找5,这个分区文件就找不到自然就报错了.
去5分区,写数据的时候,没办法写就报io异常了.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)