CentOS 7.2部署Elasticsearch+Kibana+Zookeeper+Kafka

CentOS 7.2部署Elasticsearch-5.0.1+Kibana-5.0.1+Zookeeper3.4.6+Kafka_2.9.2-0.8.2.1详解。

CentOS 7.2部署Elasticsearch+Kibana+Zookeeper+Kafka

环境准备:
操作系统:centos7.2 x86_64

# uname -a
Linux u04elk03.yaya.corp 3.10.0-327.22.2.el7.x86_64 #1 SMP Thu Jun 23 17:05:11 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
软件包:
jdk-8u102-linux-x64.rpm
kibana-5.0.1-x86_64.rpm
elasticsearch-5.0.1.rpm
kafka版本:2.9.2-0.8.2.1.tgz
zookeeper3.4.6.tar.gz

zook和kafka集群:
u04elk03.yaya.corp
u04elk02.yaya.corp
u04elk.yaya.corp

elasticsearch集群:
u04elk03.yaya.corp
u04elk02.yaya.corp

1.安装jdk1.8,记得删除之前的openjdk或者低版本jdk

rpm -e --nodeps java-1.8.0-openjdk-headless-1.8.0.101-3.b13.el7_2.x86_64
rpm -e --nodeps Python-javapackages-3.4.1-11.el7.noarch
rpm -e --nodeps tzdata-java-2016f-1.el7.noarch
rpm -e --nodeps java-1.8.0-openjdk-1.8.0.101-3.b13.el7_2.x86_64
rpm -e --nodeps javapackages-tools-3.4.1-11.el7.noarch

2.安装elasticsearch-5.0.1
下载地址:https://www.elastic.co/downloads
rpm -ivh elasticsearch-5.0.1.rpm

u04elk02.yaya.corp的elasticsearch.yml配置
cluster.name: yunva_elk_cluster

node.name: u04elk02.yaya.corp
node.master: true
node.data: true
path.data: /data/es/data
path.logs: /data/es/logs
bootstrap.memory_lock: false
network.host: 0.0.0.0
http.port: 9200

u04elk03.yaya.corp的配置
# cat /etc/elasticsearch/elasticsearch.yml
cluster.name: yunva_elk_cluster

node.name: u04elk03.yaya.corp
node.master: true
path.data: /data/es/data
path.logs: /data/es/logs
bootstrap.memory_lock: false
network.host: 0.0.0.0
http.port: 9200

创建日志和数据存放目录
mkdir -p /data/es/data
mkdir /data/es/logs
chown -R elasticsearch.elasticsearch /data/es

启动elasticsearch

systemctl start elasticsearch
systemctl enable elasticsearch

访问以下web地址验证是否ok:
http://192.168.3.13:9200/

出现如下信息,说明没有问题

{
  "name" : "u04elk02.yaya.corp",
  "cluster_name" : "yunva_elk_cluster",
  "cluster_uuid" : "_6G7IvUeT6-2Qdh_AXo2mA",
  "version" : {
    "number" : "5.0.1",
    "build_hash" : "080bb47",
    "build_date" : "2016-11-11T22:08:49.812Z",
    "build_snapshot" : false,
    "lucene_version" : "6.2.1"
  },
  "tagline" : "You Know, for Search"
}

可以查看相关集群的状态信息

# curl -XGET 'http://localhost:9200/_cluster/state/{metrics}/{indices}'
{"cluster_name":"yunva_elk_cluster"}

# curl -XGET 'http://localhost:9200/_cluster/state?pretty'
{
  "cluster_name" : "yunva_elk_cluster",
  "version" : 2,
  "state_uuid" : "hHaLqrlyT4KszbCCZ5Yy-Q",
  "master_node" : "oe-62CJxS_G5sKLYWeepqA",
  "blocks" : { },
  "nodes" : {
    "oe-62CJxS_G5sKLYWeepqA" : {
      "name" : "u04elk02.yaya.corp",
      "ephemeral_id" : "qhW1YiSURwKZUenjKDRWZw",
      "transport_address" : "10.19.124.119:9300",
      "attributes" : { }
    }
  },
  "metadata" : {
    "cluster_uuid" : "4b6LLl0GRdWNm9r7acGE8Q",
    "templates" : { },
    "indices" : { },
    "index-graveyard" : {
      "tombstones" : [ ]
    }
  },
  "routing_table" : {
    "indices" : { }
  },
  "routing_nodes" : {
    "unassigned" : [ ],
    "nodes" : {
      "oe-62CJxS_G5sKLYWeepqA" : [ ]
    }
  }
}

elasticsearch-5.0.1 只支持内核3.5以上版本的linux操作系统
centos6.5报错:
[2016-11-23T16:16:24,329][WARN ][o.e.b.JNANatives        ] unable to install syscall filter:
java.lang.UnsupportedOperationException: seccomp unavailable: requires kernel 3.5+ with CONFIG_SECCOMP and CONFIG_SECCOMP_FILTER compiled in

①优化elasticsearch内存配置:
修改配置文件:

vim /etc/elasticsearch/jvm.options
-Xms10g
-Xmx10g

建议配置为物理最大内存的一半以上,在/usr/share/elasticsearch/bin/elasticsearch.in.sh配置没有用

查看日志出现类似heap size [9.9gb] 说明配置成功:
[2016-11-23T20:02:52,900][INFO ][o.e.e.NodeEnvironment    ] [u04elk02.yaya.corp] heap size [9.9gb], compressed ordinary object pointers [true]

②配置文件句柄
vim /etc/security/limits.d/20-nproc.conf
删除这行:
*          soft    nproc    4096

3.安装kibana
rpm -ivh kibana-5.0.1-x86_64.rpm

编辑配置文件
vim /etc/kibana/kibana.yml
修改这两项,其他默认不用动
server.host: "0.0.0.0"
elasticsearch.url: "http://localhost:9200"

启动命令:
systemctl start kibana
systemctl enable kibana

4.安装zookeeper集群,单独配置,不用kafka自带的(集群节点建议是单数个,本次我们有启用3个节点)

下载地址:http://archive.apache.org/dist/zookeeper/zookeeper-3.4.6/
tar -zxf zookeeper-3.4.6.tar.gz
cd /data/zookeeper-3.4.6/
cp zoo_sample.cfg zoo.cfg

vim zoo.cfg
---------------------------------------
tickTime=2000
initLimit=10
syncLimit=5
# 数据保存目录
dataDir=/data/zookeeper-3.4.6/data
# 日志保存目录
dataLogDir=/data/zookeeper-3.4.6/logs
# 保留的快照个数
autopurge.snapRetainCount=20
# 保留的时间,单位小时
autopurge.purgeInterval=30
clientPort=2181
server.1=u04elk.yaya.corp:2888:3888
server.2=u04elk02.yaya.corp:2888:3888
server.3=u04elk03.yaya.corp:2888:3888
---------------------------------------

创建data和Log文件夹

mkdir /data/zookeeper-3.4.6/data
mkdir /data/zookeeper-3.4.6/logs

在zoo.cfg中的dataDir指定的目录下,新建myid文件。
例如:$ZK_INSTALL/data下,新建myid。在myid文件中输入1。表示为server.1。
cd /data/zookeeper-3.4.6/data/myid
touch myid
echo 1 > myid

将整个目录拷贝到其他节点,然后修改myid为各自的节点标示即可:
scp -P 2022 /data/zookeeper-3.4.6/ -r u04elk.yaya.corp:/data/

5.kafka配置
下载地址:http://kafka.apache.org/downloads
 
/data/kafka_2.9.2-0.8.2.1
# egrep -v "#|^$" config/server.properties
---------------------------------------
broker.id=1
port=9092
host.name=0.0.0.0
num.network.threads=3
 
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
log.dirs=/tmp/kafka-logs
num.partitions=1
num.recovery.threads.per.data.dir=1
log.retention.hours=168
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000
log.cleaner.enable=false
zookeeper.connect=u04elk.yaya.corp:2181,u04elk02.yaya.corp:2181,u04elk03.yaya.corp:2181
zookeeper.connection.timeout.ms=6000
---------------------------------------

只改zook和host.name,broker.id=1这三项,其他默认
zookeeper.connect=u04elk.yaya.corp:2181,u04elk02.yaya.corp:2181,u04elk03.yaya.corp:2181
host.name=0.0.0.0

启动
bin/kafka-server-start.sh config/server.properties &

注意:
broker.id=0  broker的id,每个kafka节点配置不能一样,可以0,1,2等
host.name=192.168.10.2  broker的hostname;如果hostname已经设置的话,broker将只会绑定到这个地址上;如果没有设置,它将绑定到所有接口,并发布一份到ZK。每台节点设置成当前节点的IP地址

将文件拷贝到其他节点,修改broker.id的值,在各节点中启动kafka:
scp -P 2022 /data/kafka_2.9.2-0.8.2.1 -r u04elk.yaya.corp:/data/

bin/kafka-server-start.sh config/server.properties &

zook启动报错:
# ./zkServer.sh status
JMX enabled by default
Using config: /data/zookeeper-3.4.6/bin/../conf/zoo.cfg
Error contacting service. It is probably not running.

网上的解决方案:

1.打开zkServer.sh 找到status)
STAT=`echo stat | nc localhost $(grep clientPort "$ZOOCFG" | sed -e 's/.*=//') 2> /dev/null| grep Mode`
在nc与localhost之间加上 -q 1 (是数字1而不是字母l)
如果已存在则去掉
注:在我的zkServer.sh脚本文件里根本没有这一行,所以没有生效

2.调用sh zkServer.sh status 遇到这个问题。百度,google了后发现有人是修改sh脚本里的一个nc的参数来解决,可在3.4.6的sh文件里并没有找到nc的调用。配置文档里指定的log目录没有创建导致出错,手动增加目录后重启,问题解决。
注:我想不是日志的问题所以这个方法根本就没有试

3.创建数据目录,也就是在你zoo.cfg配置文件里dataDir指定的那个目录下创建myid文件,并且指定id,改id为你zoo.cfg文件中server.1=localhost:2887:3887中的1.只要在myid头部写入1即可.
注:这是我的解决办法

实际的解决办法:
vim /etc/hosts

将本机对应的127.0.0.1和192.168.1.103 对应的主机名删除(主机名是正确的,但是无法启动,可能是绑定了127.0.0.1)

kafka在centos系统上的报错:
/data/kafka_2.9.2-0.8.2.1/zookeeper.out文件中的报错:Path:/admin/preferred_replica_election Error:KeeperErrorCode = NoNode for /admin/preferred_replica_election

2016-11-23 19:26:33,472 [myid:2] - INFO  [ProcessThread(sid:2 cport:-1)::PrepRequestProcessor@645] - Got user-level KeeperException when processing sessionid:0x25890ed3acc0000 type:create cxid:0x10 zxid:0x20000000b txntype:-1 reqpath:n/a Error Path:/admin Error:KeeperErrorCode = NoNode for /admin
2016-11-23 19:26:33,641 [myid:2] - INFO  [ProcessThread(sid:2 cport:-1)::PrepRequestProcessor@645] - Got user-level KeeperException when processing sessionid:0x25890ed3acc0000 type:setData cxid:0x1a zxid:0x20000000f txntype:-1 reqpath:n/a Error Path:/controller_epoch Error:KeeperErrorCode = NoNode for /controller_epoch
2016-11-23 19:26:33,682 [myid:2] - INFO  [ProcessThread(sid:2 cport:-1)::PrepRequestProcessor@645] - Got user-level KeeperException when processing sessionid:0x25890ed3acc0000 type:delete cxid:0x27 zxid:0x200000011 txntype:-1 reqpath:n/a Error Path:/admin/preferred_replica_election Error:KeeperErrorCode = NoNode for /admin/preferred_replica_election

原因分析:
机器有两块网卡,kafka的 host.name 开始只绑定在了内部IP上,另一块对外网卡无法访问,把值设置为空的话会kafka监听端口在所有的网卡上绑定,但是在外网访问时,客户端又遇到了 java.nio.channels.ClosedChannelException 异常信息,server端用tcpdump分析的时候发现客户端有传递kafka所在机器的机器名过来。在client里断点跟踪一下发现是 findLeader 的时候返回的元信息是机器名而不是IP。客户端无法解析这个机器名所以出现了前面的异常。

在server.properties 里还有另一个参数是解决这个问题的, advertised.host.name 参数用来配置返回的host.name值,把这个参数配置为外网IP地址即可。

这个参数默认没有启用,默认是返回的 java.net.InetAddress.getCanonicalHostName 的值,在我的mac上这个值并不等于 hostname 的值而是返回IP,但在linux上这个值就是 hostname 的值。

ElasticSearch 的详细介绍:请点这里
ElasticSearch 的下载地址:请点这里 

相关推荐