Flume前提回顾

Flume前提回顾,第1张

Flume前提回顾 Flume进阶使用

前提回顾
flume是以三大部分组成

  • agent:flume 的组成单位,包括了Source,Channel,Sink

  • Source
  1. netcat:官方提供的端口监控组件
  2. exec 用于监控Linux中的命令的(tail-F)
  3. Spooldir:监控一个目录的。如果目录中出现了新的文件,就文件内容采集过来。
  4. taildir:监控多文件,维护offset(支持断点续传 根据计算下载时记载在json中的系统偏移量来实现断点续传)
  5. Kafka

  • Channel
  1. memorychannel:基于内存
  2. filechannel:基于硬盘
  3. Kafka

  • Sink
  1. HDFS
  2. Logger
  3. Kafaka
  4. Hbase
  5. Hive

  • event:是S,C,K中传输时最小的单位 是由(header:属性,body:数据,字节数组形式存在)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4667358.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-06
下一篇 2022-11-06

发表评论

登录后才能评论

评论列表(0条)

保存