ZooKeeper 笔记

zhangyangffff

2016-04-29

关注关注

ZooKeeper笔记(1)安装部署及helloworld

先给一堆学习文档，方便以后查看

官网文档地址大全：

OverView(概述)

http://zookeeper.apache.org/doc/r3.4.6/zookeeperOver.html

GettingStarted(开始入门)

http://zookeeper.apache.org/doc/r3.4.6/zookeeperStarted.html

Tutorial（教程）

http://zookeeper.apache.org/doc/r3.4.6/zookeeperTutorial.html

JavaExample(Java示例)

http://zookeeper.apache.org/doc/r3.4.6/javaExample.html

Programmer'sGuide(开发人员指南)

http://zookeeper.apache.org/doc/r3.4.6/zookeeperProgrammers.html

RecipesandSolutions(技巧及解决方案)

http://zookeeper.apache.org/doc/r3.4.6/recipes.html

3.4.6APIonline(在线API速查)

http://zookeeper.apache.org/doc/r3.4.6/api/index.html

另外推荐园友sunddenly的zookeeper系列

http://www.cnblogs.com/sunddenly/category/620563.html

一、安装部署

本文在一台机器上模拟3个zkserver的集群安装

1.1下载解压

解压到3个目录（模拟3台zkserver）：

/home/hadoop/zookeeper-1

/home/hadoop/zookeeper-2

/home/hadoop/zookeeper-3

1.2创建每个目录下conf/zoo.cfg配置文件

/home/hadoop/zookeeper-1/conf/zoo.cfg内容如下：

复制代码

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/home/hadoop/tmp/zk1/data

dataLogDir=/home/hadoop/tmp/zk1/log

clientPort=2181

server.1=localhost:2287:3387

server.2=localhost:2288:3388

server.3=localhost:2289:3389

复制代码

/home/hadoop/zookeeper-2/conf/zoo.cfg内容如下：

复制代码

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/home/hadoop/tmp/zk2/data

dataLogDir=/home/hadoop/tmp/zk2/log

clientPort=2182

server.1=localhost:2287:3387

server.2=localhost:2288:3388

server.3=localhost:2289:3389

复制代码

/home/hadoop/zookeeper-3/conf/zoo.cfg内容如下：

复制代码

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/home/hadoop/tmp/zk3/data

dataLogDir=/home/hadoop/tmp/zk3/log

clientPort=2183

server.1=localhost:2287:3387

server.2=localhost:2288:3388

server.3=localhost:2289:3389

复制代码

注：因为是在一台机器上模拟集群，所以端口不能重复，这里用2181~2183，2287~2289，以及3387~3389相互错开。另外每个zk的instance，都需要设置独立的数据存储目录、日志存储目录，所以dataDir、dataLogDir这二个节点对应的目录，需要手动先创建好。

另外还有一个灰常关键的设置，在每个zkserver配置文件的dataDir所对应的目录下，必须创建一个名为myid的文件，其中的内容必须与zoo.cfg中server.x中的x相同，即：

/home/hadoop/tmp/zk1/data/myid中的内容为1，对应server.1中的1

/home/hadoop/tmp/zk2/data/myid中的内容为2，对应server.2中的2

/home/hadoop/tmp/zk3/data/myid中的内容为3，对应server.3中的3

生产环境中，分布式集群部署的步骤与上面基本相同，只不过因为各zkserver分布在不同的机器，上述配置文件中的localhost换成各服务器的真实Ip即可。分布在不同的机器后，不存在端口冲突问题，可以让每个服务器的zk均采用相同的端口，这样管理起来比较方便。

1.3启动验证

/home/hadoop/zookeeper-1/bin/zkServer.shstart

/home/hadoop/zookeeper-2/bin/zkServer.shstart

/home/hadoop/zookeeper-3/bin/zkServer.shstart

启用成功后，输入jps看下进程

20351ZooKeeperMain

20791QuorumPeerMain

20822QuorumPeerMain

20865QuorumPeerMain

应该至少能看到以上几个进程。

可以启动客户端测试下：

bin/zkCli.sh-serverlocalhost:2181

(注：如果是远程连接，把localhost换成指定的IP即可)

成功后，应该会进到提示符下，类似下面这样:

[zk:localhost:2181(CONNECTED)0]

然后，就可以用一些基础命令，比如ls,create,delete,get来测试了（关于这些命令，大家可以查看文档），特别提一个很有用的命令rmr用来递归删除某个节点及其所有子节点

二、java与zk的连接示例

2.1maven项目的pom.xml中先添加以下依赖项

复制代码

<groupId>org.apache.zookeeper</groupId>

<artifactId>zookeeper</artifactId>

</dependency>

复制代码

2.2最基本的示例程序

packageyjmyzz;

importjava.io.IOException;

importorg.apache.zookeeper.*;

importorg.apache.zookeeper.data.Stat;

publicclassZooKeeperHello{

publicstaticvoidmain(String[]args)throwsIOException,InterruptedException,KeeperException{

ZooKeeperzk=newZooKeeper("172.28.20.102:2181",300000,newDemoWatcher());//连接zkserver

Stringnode="/app1";

Statstat=zk.exists(node,false);//检测/app1是否存在

if(stat==null){

//创建节点

StringcreateResult=zk.create(node,"test".getBytes(),ZooDefs.Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);

System.out.println(createResult);

}

//获取节点的值

byte[]b=zk.getData(node,false,stat);

System.out.println(newString(b));

zk.close();

}

staticclassDemoWatcherimplementsWatcher{

@Override

publicvoidprocess(WatchedEventevent){

System.out.println("----------->");

System.out.println("path:"+event.getPath());

System.out.println("type:"+event.getType());

System.out.println("stat:"+event.getState());

System.out.println("<-----------");

}

2.3与zk集群的连接

zk的优点之一，就是高可用性，上面的代码连接的是单台zkserver，如果这台server挂了，自然代码就会出错，事实上zk的API考虑到了这一点，把连接代码改成下面这样：

ZooKeeperzk=newZooKeeper("172.28.20.102:2181,172.28.20.102:2182,172.28.20.102:2183",300000,newDemoWatcher());//连接zkserver

即：IP1:port1,IP2:port2,IP3:port3...用这种方式连接集群就行了，只要有超过半数的zkserver还活着，应用一般就没问题。但是也有一种极罕见的情况，比如这行代码执行时，刚初始化完成，正准备连接ip1时，因为网络故障ip1对应的server挂了，仍然会报错（此时，zk还来不及选出新leader），这个问题详见：http://segmentfault.com/q/1010000002506725/a-1020000002507402，参考该文的做法，改成：

复制代码

1ZooKeeperzk=newZooKeeper("172.28.20.102:2181,172.28.20.102:2182,172.28.20.102:2183",300000,newDemoWatcher());//连接zkserver

2if(!zk.getState().equals(ZooKeeper.States.CONNECTED)){

3while(true){

4if(zk.getState().equals(ZooKeeper.States.CONNECTED)){

5break;

7try{

8TimeUnit.SECONDS.sleep(5);

9}catch(InterruptedExceptione){

10e.printStackTrace();

11}

12}

13}

复制代码

但是这样代码未免太冗长，建议用开源的zkClient，官方地址:https://github.com/sgroschupf/zkclient，使用方法很简单：

复制代码

<groupId>com.github.sgroschupf</groupId>

<artifactId>zkclient</artifactId>

</dependency>

复制代码

pom.xml先加这一坨，然后这样用：

复制代码

1@Test

2publicvoidtestZkClient(){

3ZkClientzkClient=newZkClient("172.28.20.102:2181,172.28.20.102:2182,172.28.20.102:2183");

4Stringnode="/app2";

5if(!zkClient.exists(node)){

6zkClient.createPersistent(node,"hellozk");

8System.out.println(zkClient.readData(node));

hadoop localhost zookeeper集群 apache tmp

安科网

ZooKeeper 笔记

zhangyangffff

zhangyangffff

相关推荐

Hadoop基础（三十三）：Zookeeper 分布式安装部署

NameNode和Zookeeper的format作用

脚本启动集群 zookeeper , hadoop

为什么Java仍将是未来的主流语言？

Hadoop3.2.0集群搭建常见注意事项

hadoop伪分布式环境搭建

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

Hadoop（一）安装

第四周练习

Hadoop小练习

hadoop框架三大组件hdfs、mapreduce、yarn 内容

Hadoop基础（二十二）：Shuffle机制（三）

hdfs、hive、hbase的搭建总结

hadoop集群的启动与停止

JStorm介绍

Hadoop2.7.7 centos7 完全分布式配置与问题随记

Hadoop Yarn工作机制 Job提交流程

【赵强老师】大数据工作流引擎Oozie

Hadoop

入门大数据---Spark开发环境搭建

zhangyangffff