Flume + zookeeper + kafka收集Nginx日志

briupacmer

2019-06-28

软件	版本
Centos	3.10.0-862.el7.x86_64
jdk	1.8
zookeeper	3.4.10
kafka	1.1.0
flume	1.6.0

Host	IP
c1	192.168.1.200
c1_1	192.168.1.201
c1_2	192.168.1.202

前置操作

各主机间启动ssh连接

这一步至关重要,如果没有配置成功，会影响到hadoop,kafka集群之间的连接

[hadoop@c1 ~]$ ssh-keygen
[hadoop@c1 ~]$ sudo vim /etc/ssh/sshd_config
    ...
    PubkeyAuthentication yes
    ...
[hadoop@c1 ~]$ systemctl restart sshd
[hadoop@c1 ~]$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys  # ssh 本机
[hadoop@c1 ~]$ sudo vim /etc/hosts  # 添加三台主机对应ip host
    ...
    192.168.1.200 c1
    192.168.1.201 c1_1
    192.168.1.202 c1_2
    ...
[hadoop@c1 ~]$ ssh-copy-id -i  ~/.ssh/id_rsa.pub hadoop@c1_1
[hadoop@c1 ~]$ ssh-copy-id -i  ~/.ssh/id_rsa.pub hadoop@c1_2

其他两台机器重复上面的操作即可.完成后，可以ssh一下各台机子(包括本机)是否还需要密码

安装软件

# 下载jdk1.8+
[hadoop@c1 ~] mkdir -p ~/app/jdk1.8 && tar -zxvf jdk-8u171-linux-x64.tar.gz -C ~/app/jdk1.8
# 下载flume1.6
[hadoop@c1 ~] tar -zxvf apache-flume-1.6.0-bin.tar.gz -C ~/app/
# 下载zookeeper3.4.10
[hadoop@c1 ~] tar -zxvf zookeeper-3.4.10.tar.gz -C ~/app/
# 下载kafka_2.11-1.1.0
[hadoop@c1 ~] tar -xzf kafka_2.11-1.1.0.tgz -C ~/app/
# 环境变量
[hadoop@c1 ~] vim .bash_profile
    ...
    export JAVA_HOME=/home/hadoop/app/jdk1.8.0
    export PATH=$JAVA_HOME/bin:$PATH
    export FLUME_HOME=/home/hadoop/app/flume-1.6.0
    export PATH=$FLUME_HOME/bin:$PATH
    export ZK_HOME=/home/hadoop/app/zookeeper-3.4.10
    export PATH=$ZK_HOME/bin:$PATH
    export KAFKA_HOME=/home/hadoop/app/kafka_2.11-1.1.0
    export PATH=$KAFKA_HOME/bin:$PATH
    ...
[hadoop@c1 ~] source .bash_profile
# 复制软件和环境变量到其他主机
[hadoop@c1 ~]scp -r ~/app hadoop@c1_1:~
[hadoop@c1 ~]scp -r ~/app hadoop@c1_2:~
[hadoop@c1 ~]scp .bash_profile hadoop@c1_1:~
[hadoop@c1 ~]scp .bash_profile hadoop@c1_2:~
# 到其他主机执行source .bash_profile

配置文件

flume配置文件

# vim ${FLUME_HOME}/conf/nginx_kafka.conf
nginx-kafka.sources = r1                                                                                     
nginx-kafka.sinks = k1
nginx-kafka.channels = c1

nginx-kafka.sources.r1.type = exec
nginx-kafka.sources.r1.command = tail -f /home/hadoop/data/access.log
nginx-kafka.sources.r1.shell = /bin/sh -c
# flume1.6 kafka sink 写法
nginx-kafka.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
nginx-kafka.sinks.k1.brokerList = c1:9092
nginx-kafka.sinks.k1.topic= nginxtopic
nginx-kafka.sinks.k1.batchSize=10

nginx-kafka.channels.c1.type = memory
nginx-kafka.sources.r1.channels = c1
nginx-kafka.sinks.k1.channel = c1

zookeeper配置文件

# cp ${ZK_HOME}/conf/zoo_simple.cfg ${ZK_HOME}/conf/zoo.cfg && vim ${ZK_HOME}/conf/zoo.cfg
tickTime=2000
initLimit=10
syncLimit=5
dataDir=/home/hadoop/data/zookeeper
clientPort=2181
# 注意，当前主机的zookeeper server不能设置hostname,必须是0.0.0.0 否则无法连接
server.1=0.0.0.0:2888:3888                                                   
server.2=c1_1:2888:3888
server.3=c1_2:2888:3888

创建zookeeper集群id

echo "1">/home/hadoop/data/zookeeper/myid

其他主机重复相同操作,server.x需要和myid值一致,

kafka配置文件
kafka配置文件需要改动的只有几个
```
# ${KAFKA_HOME}/config/server.properties
broker.id=0
host.name=c1
listeners=PLAINTEXT://192.168.1.200:9092
advertised.listeners=PLAINTEXT://c1:9092
zookeeper.connect=c1:2181,c1_1:2181,c1_2:2181
```
broker.id从0开始且在集群中唯一
listeners需要填上IP
advertised.listeners需要填上hostname
这里我这么设置是没问题的，但是不清楚为啥这么设置
其他主机kafka配置文件同样的操作

编写集群启动脚本

zookeeper集群脚本

# vim start_zookeeper.sh
#!/bin/bash
echo "start zkServer..."
for i in c1 c1_1 c1_2
    do
        ssh hadoop@$i "source ~/.bash_profile;zkServer.sh start"
    done

# vim stop_zookeeper.sh
#!/bin/bash
echo "stop zkServer..."
for i in c1 c1_1 c1_2
    do
        ssh hadoop@$i "source ~/.bash_profile;zkServer.sh stop"             
    done

chmod a+x start_zookeeper.sh stop_zookeeper.sh

kafka集群脚本

# vim start_kafka.sh
#!/bin/sh
echo "start kafka..."
for i in c1 c1_1 c1_2
do
    ssh hadoop@$i "source ~/.bash_profile;kafka-server-start.sh -daemon ${KAFKA_HOME}/config/server.properties &"
    echo "done"                                                             
done

# vim stop_kafka.sh
#!/bin/sh
echo "stop kafka..."
for i in c1 c1_1 c1_2
do
    ssh hadoop@$i "source ~/.bash_profile;kafka-server-stop.sh"            
done

chmod a+x start_kafka.sh stop_kafka.sh

实战

启动程序

# 启动zookeeper
[hadoop@c1 ~]$ ./start_zookeeper.sh
[hadoop@c1 ~]$ zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /home/hadoop/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
# 启动kafka
[hadoop@c1 ~]$ ./start_kafka.sh
[hadoop@c1 ~]$ jps
2953 QuorumPeerMain  # zookeeper 进程
3291 Kafka  #kafka进程
3359 Jps

创建Topic

[hadoop@c1 ~]$ kafka-topics.sh --create --zookeeper c1:2181,c1_1:2181,c1_2:2181 --replication-factor 3 --partitions 1 --topic nginxtopic

检查Topic

[hadoop@c1 ~]$ kafka-topics.sh --zookeeper c1:2181,c1_1:2181,c1_2:2181 --list
nginx

启动消费者

[hadoop@c1 ~]$ kafka-console-consumer.sh --bootstrap-server c1:9092,c1_1:9092,c1_2:9092 -topic nginxtopic --from-beginning

模拟日志

#vim create_log.sh
---
#!/bin/sh
# access.log-xxx 等多个文件是生产环境拖下来的真是日志
cat access.log-*| while read -r line
do
echo $line >> /home/hadoop/logs/access.log
sleep 0.$(($RANDOM%5+1))  # 防止日志写入过快
done

启动flume

新开一个窗口

[hadoop@c1 ~]$ flume-ng agent --conf-file  conf/nginx_kafka.conf -c conf/ --name nginx-kafka -Dflume.root.logger=DEBUG,console

稍等片刻后

flume输出日志

Flume + zookeeper + kafka收集Nginx日志

kafka-console-consume 输出日志

Flume + zookeeper + kafka收集Nginx日志

至此项目已经完全跑起来了~

错误排查及解决

not in the sudoers file. This incident will be reported
没有sudo的操作权限，需要在root权限下编辑/etc/sudoer
```
...
## Allow root to run any commands anywhere 
root    ALL=(ALL)   ALL
hadoop  ALL=(ALL)   ALL
...
```

已经添加过ssh仍需要输入密码

chmod 700 ~/.ssh
chmod 644 ~/.ssh/authorized_keys

zookeeper: It is probably not running
1. 有可能是ssh无法免密访问其他主机
2. 有可能是没有正确的写myid

可以在zookeeper.out 查看详细的错误信息

kafka hadoop flume ssh

briupacmer

0 关注 0 粉丝 0 动态

关注关注

Kafka、Flume、Kinesis更多的流方式支持，包括Twitter、ZeroMQ等

可线性伸缩至超过数百个节点；实现亚秒级延迟处理；可与Spark批处理和交互式处理无缝集成；提供简单的API实现复杂算法；更多的流方式支持，包括Kafka、Flume、Kinesis、Twitter、ZeroMQ等。Spark在接收到实时输入数据流后，将数据

jiaomrswang 2020-06-26

.NET Core下使用Kafka的方法步骤

# 修改每个topic的默认分区参数num.partitions，默认是1，具体合适的取值需要根据服务器配置进程确定，UCloud.ukafka = 3. Segment：partition物理上由多个segment组成，下面2.2和2.3有详细说明。pa

Kafka 2020-09-18

架构师的选择，Pulsar还是Kafka？

最近，我一直在研究Pulsar及其与Kafka的比较。快速搜索将显示两个最著名的开源消息传递系统之间存在当前的"战争"。作为Kafka的用户，我确实对Kafka的某些问题感到困惑，并且我对Pulsar感到非常失望。在本文中，我将重点介绍

yanghuashuiyue 9评论 2020-11-14

Kafka之消费与心跳

导读kafka是一个分布式，分区的，多副本的，多订阅者的消息发布订阅系统，可以用于搜索日志，监控日志，访问日志等。今天小编来领大家一起来学习一下Kafka消费与心跳机制。Kafka提供了非常简单的消费API，使用者只需初始化Kafka的Broker Se

liuxingen 12评论 2020-11-13

刨根问底,Kafka消息中间件到底会不会丢消息

本文转载自微信公众号「爱笑的架构师」，作者雷架。大型互联网公司一般都会要求消息传递最大限度的不丢失，比如用户服务给代金券服务发送一个消息，如果消息丢失会造成用户未收到应得的代金券，最终用户会投诉。为避免上面类似情况的发生，除了做好补偿措施，更应该在系设计的

wangying 2020-11-13

记一次生产 Kafka 挂掉的那几分钟

本文转载自微信公众号「Java极客技术」，作者鸭血粉丝。Hello，大家好，我是阿粉，作为一个后端工程师不经历几次生产事故怎么能成长!阿粉工作几年来，大大小小，重要不重要的事故也经历了不少，有损失几十万的，有对业务毫无影响但是不应该发生的，每一次事故都是一

王谦 15评论 2020-11-03

面试 | 再有人问Kafka，别说你不会！

Kafka 是一个优秀的分布式消息中间件，许多系统中都会使用到 Kafka 来做消息通信。对分布式消息系统的了解和使用几乎成为一个后台开发人员必备的技能。今天就从常见的 Kafka 面试题入手和大家聊聊 Kafka 的那些事儿。生产者负责创建消息，然后将其

huangwei00 10评论 2020-10-14

RabbitMQ七战Kafka，差异立现！

作为一个有丰富经验的微服务系统架构师，经常有人问我，“应该选择RabbitMQ还是Kafka？”。基于某些原因，许多开发者会把这两种技术当做等价的来看待。的确，在一些案例场景下选择RabbitMQ还是Kafka没什么差别，但是这两种技术在底层实现方面是有

shenzhenzsw 2020-10-09

Kafka突然宕机了？稳住，莫慌！

问题要从一次 Kafka 的宕机开始说起。笔者所在的是一家金融科技公司，但公司内部并没有采用在金融支付领域更为流行的 RabbitMQ，而是采用了设计之初就为日志处理而生的 Kafka，所以我一直很好奇 Kafka 的高可用实现和保障。从 Kafka 部

guicaizhou 2020-09-30

监控kafka队列长度

#!df=pd.DataFrame(columnList,columns=["topics","LAG"]). dfResult=df.groupby("topics",as_index=Fals

jiaomrswang 2020-09-23

Kafka都没整明白，还敢去面试？

放眼当下数据为王的时代，深入了解 Apache Kafka 及其常见的部署应用，快速实现数据架构已是大势所趋，刻不容缓。以下分别 Kafka 架构，四大核心 API，典型应用场景，Kafka 代理与消息主题，集群的创建，流 APIs及其处理模式等不同方面展

jyj0 2020-09-21

SAP Data Intelligence里的Kafka Producer和Consumer

新建一个graph，使用典型的生产者-消费者模型：将Data Generator生成的数据交给kafka Producer operator；而Kafka Consumer从kafka producer里读取出data Generator生成的数据，通过T

guicaizhou 2020-09-15

kafka技术题

将向 Kafka topic 发布消息的程序成为 producers.将预订 topics 并消费消息的程序成为 consumer.Kafka 以集群的方式运行，可以由一个或多个服务组成，每个服务叫做一个 broker.producers 通过网络将消息发

hannuotayouxi 2020-08-20

kafka常见面试题

我们举个例子说明下运维中面对的复杂性，我们都知道 kafka 有个 ISR集合，我先说明下这个概念：

yangyutong00 2020-08-09

Windows 安装kafka

直接去 D:\Tool\zookeeper-3.4.14\bin，运行 zkServer.cmd. kafka-topics.bat --create --zookeeper localhost:2181 --replication-factor 1

amwayy 2020-08-03

【kafka】消费组消费主题

当消费组中的消费者数量大于分区数量时，会存在浪费。因为有消费者分配不到partition进行消费。在消费者不饱和的情况下，一个消费者是可以去消费多个分区的数据的。生产者生产投递9条消息，可以9条消息被投递到3不同分区，然后三个分区对应三个不同的消费者进行

yangyutong00 2020-08-01

logstash_output_kafka:Mysql同步Kafka深入详解

实际业务场景中，会遇到基础数据存在Mysql中，实时写入数据量比较大的情景。迁移至kafka是一种比较好的业务选型方案。如果需要同步历史全量数据+实时更新数据，建议使用logstash。实际上，核心logstash的同步原理的掌握，有助于大家理解类似的各种

weikaixxxxxx 2020-08-01

【kafka】生产者投递消息特征（异步发送）

kafka的生产者producer由持有未提交给kafka服务的记录的缓冲区构成一个缓冲区池，于此同时会有一个后台I/O线程来负责将这些记录record转化为请求request，然后将其提交给集群。如果发送完数据之后不对producer进行资源释放clos

PoppyEvan 2020-08-01

【kafka】消费者对应的分配partition分区策略

解决问题：1.实现了负载均衡。现有两个主题topic1、topic2，各自都有三个partition。TopicAndPartition对象，多个主题整体排序[topic1_partition0,topic1_partition1,topic1_parti

guicaizhou 2020-08-01

Kafka基础（八）：高效读写数据

Kafka 的 producer 生产数据，要写入到 log 文件中，写的过程是一直追加到文件末端，为顺序写。官网有数据表明，同样的磁盘，顺序写能到 600M/s，而随机写只有 100K/s。与磁盘的机械机构有关，顺序写之所以快，是因为其省去了大量磁头寻址

PoppyEvan 2020-07-29

安科网

Flume + zookeeper + kafka收集Nginx日志

briupacmer

相关环境

前置操作

各主机间启动ssh连接

安装软件

配置文件

编写集群启动脚本

实战

错误排查及解决

briupacmer

相关推荐

Kafka、Flume、Kinesis更多的流方式支持，包括Twitter、ZeroMQ等

.NET Core下使用Kafka的方法步骤

架构师的选择，Pulsar还是Kafka？

Kafka之消费与心跳

刨根问底,Kafka消息中间件到底会不会丢消息

记一次生产 Kafka 挂掉的那几分钟

面试 | 再有人问Kafka，别说你不会！

RabbitMQ七战Kafka，差异立现！

Kafka突然宕机了？稳住，莫慌！

监控kafka队列长度

Kafka都没整明白，还敢去面试？

SAP Data Intelligence里的Kafka Producer和Consumer

kafka技术题

kafka常见面试题

Windows 安装kafka

【kafka】消费组消费主题

logstash_output_kafka:Mysql同步Kafka深入详解

【kafka】生产者投递消息特征（异步发送）

【kafka】消费者对应的分配partition分区策略

Kafka基础（八）：高效读写数据

briupacmer