环境
java环境
hadoop环境
zookeeper和kafka都要装置实现
组件抉择
source
flume1.7退出的taildir类型的source,能够随时监控文件变动、反对断点续传。是支流的source类型。
channel
kafka channel,能将source传入的数据,间接存储到kafka。既保留在磁盘中,进步了可靠性。数据层传输的效率又高。是支流的channel类型
sink
步骤
/usr/local/apache-flume-1.10.0-bin/conf/flume-env.sh.template
文件去掉template后缀- 配置java home
export JAVA_HOME=/usr/local/jdk-11.0.15