这是一篇很棒的博客文章,介绍如何使用层叠和流媒体。 http://www.xcombinator.com/2009/11/18/how-to-use-
cascading-with-hadoop-streaming/
这里的值是您可以将Java(级联查询流)与您在同一应用中的自定义流式 *** 作混合在一起。我发现它比其他方法更不易碎。
注意,级联中的Cascade对象允许您链接多个Flow(通过以上博客,您的Streaming作业将变为MapReduceFlow)。
免责声明:我是Cascading的作者
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)