目录
一:安装准备
二:安装步骤
三.验证安装与Flume监控端口数据官方案例
Flume是一个分布式、可靠、和高可用的海量日志采集、聚和和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume提供对数据进行简单处理,并写到各种数据接收方(比如文本、HDFS、Hbase等)的能力。
一:安装准备虚拟机上已经安装jdk和hadoop
jdk安装参考:Linux系统CentOS7安装jdk_一个人的牛牛的博客-CSDN博客
hadoop安装参考:Hadoop全分布式的安装--hadoop-2.7.3_一个人的牛牛的博客-CSDN博客
1.1官网地址
http://flume.apache.org/
1.2下载地址
http://archive.apache.org/dist/flume/
或者
https://mirrors.tuna.tsinghua.edu.cn/apache/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz
二:安装步骤2.1将下载好的Flume安装包上传到Linux系统的hadoop01上。
连接工具:MobaXterm_Portable
直接把apache-flume-1.9.0-bin.tar.gz拖到MobaXterm_Portable的框框里就行。
*** 作参考:MobaXterm_Portable的简单使用_一个人的牛牛的博客-CSDN博客
2.2解压安装
新建training文件夹
mkdir /training
进入apache-flume-1.9.0-bin.tar.gz所在的文件夹/tools,执行
tar -zvxf apache-flume-1.9.0-bin.tar.gz -C /training/
2.3配置环境变量
vi ~/.bash_profile
#flume export FLUME_HOME=/training/apache-flume-1.9.0-bin export PATH=$PATH:$FLUME_HOME/bin
2.4环境变量生效
source ~/.bash_profile
2.5修改配置文件
apache-flume-1.9.0-bin/conf下的flume-env.sh.template文件修改为flume-env.sh,并配置flume-env.sh文件。
cp flume-env.sh.template flume-env.sh
进入flume-env.sh文件
vi flume-env.sh
添加
export JAVA_HOME=/training/jdk1.8.0_171三.验证安装与Flume监控端口数据官方案例
3.1安装netcat工具
sudo yum install nc
3.2判断44444端口是否被占用,如果没有被占用,那么这个将不会有输出
sudo netstat -tunlp | grep 44444
3.3创建Flume Agent配置文件netcat-flume-logger.conf
3.3.1在flume目录下创建job文件夹并进入job文件夹;
mkdir job cd job/
3.3.2在job文件夹下创建Flume Agent配置文件netcat-flume-logger.conf;
vi netcat-flume-logger.conf
内容:
#Name the components on this agent # a1代表着我们的agent的命名 # r1、k1、c1 分别代表我们的source sink channel a1.sources = r1 a1.sinks = k1 a1.channels = c1 # Describe/configure the source # 这是source的配置 a1.sources.r1.type = netcat a1.sources.r1.bind = hadoop001 a1.sources.r1.port = 44444 # Describe the sink # sink的配置 a1.sinks.k1.type = logger # Use a channel which buffers events in memory # 这个地方是channel的配置, 使用的是内存作为缓存 a1.channels.c1.type = memory a1.channels.c1.capacity = 1000 a1.channels.c1.transactionCapacity = 100 # Bind the source and sink to the channel # source channel sink三个组件绑定的配置 a1.sources.r1.channels = c1 a1.sinks.k1.channel = c1
3.3.3开启flume监听端口
bin/flume-ng agent -c conf/ -n a1 -f job/netcat-flume-logger.conf -Dflume.root.logger=INFO,console
3.3.4使用netcat工具向本机的44444端口发送内容(在另一个窗口 *** 作)
nc hadoop001 44444
内容:
hello world i like jeffry i love china i am Chinese
3.3.5在Flume监听页面观察接收数据情况
完成!!!!!!!!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)