hadoop中的MultipleOutputFormat

工具书与文献检索 • 2022-11-17 • 随笔 • 阅读 10

hadoop中的MultipleOutputFormat

每个化简器使用OutputFormat写入记录。这就是为什么每个reducer会获得一组奇数和偶数文件的原因。这是设计使然，每个减速器都可以并行执行写入。

如果只需要单个奇数和单个偶数文件，则需要将mapred.reduce.tasks设置为1。但是性能会受到影响，因为所有映射器都将馈入单个reducer。

另一个选择是更改读取这些文件的过程以接受多个输入文件，或者编写将这些文件合并在一起的单独过程。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5130200.html

文件奇数偶数写入过程

打赏

微信扫一扫

支付宝扫一扫

工具书与文献检索一级用户组

在循环内创建最终变量

上一篇 2022-11-17

启动Firefox并等待其关闭

下一篇 2022-11-17

发表评论

登录后才能评论

评论列表（0条）