hadoop中的MultipleOutputFormat

hadoop中的MultipleOutputFormat,第1张

hadoop中的MultipleOutputFormat

每个化简器使用OutputFormat写入记录。这就是为什么每个reducer会获得一组奇数偶数文件的原因。这是设计使然,每个减速器都可以并行执行写入。

如果只需要单个奇数和单个偶数文件,则需要将mapred.reduce.tasks设置为1。但是性能会受到影响,因为所有映射器都将馈入单个reducer。

另一个选择是更改读取这些文件的过程以接受多个输入文件,或者编写将这些文件合并在一起的单独过程。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5130200.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-17
下一篇 2022-11-17

发表评论

登录后才能评论

评论列表(0条)

保存