使用Spring Batch从HDFS读取文件

使用Spring Batch从HDFS读取文件,第1张

使用Spring Batch从HDFS读取文件

FlatFileItemReader
在Spring Batch的适用于任何Spring框架
Resource
的实现:

@Beanpublic FlatFileItemReader<String> itemReader() {    Resource resource; // get (or autowire) resource    return new FlatFileItemReaderBuilder<String>() .resource(resource) // set other reader properties .build();}

因此,如果您设法使一个

Resource
指向HDFS文件的句柄,您就可以完成。

现在,为了拥有HDFS资源,您可以:

  • 将Spring用于Hadoop。一旦配置了HDFS文件系统,您就可以通过以下方式从应用程序上下文中获取资源:
    applicationContext.getResource("hdfs:data.csv");
  • Resource
    使用Hadoop API来实现自己的实现(如Michael Simons的答案所示)。我看到有些人已经在这里做了

希望这可以帮助。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5649894.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存