Zookeeper
如何使用
Zookeeper作为一个分布式的服务框架,主要用来解决分布式集群中应用系统的一致性问题,它能提供基于类似于文件系统的目录节点树方式的数据存储,但是Zookeeper并不是用来专门存储数据的,它的作用主要是用来维护和监控你存储的数据的状态变化。通过监控这些数据状态的变化,从而可以达到基于数据的集群管理,后面将会详细介绍Zookeeper能够解决的一些典型问题,这里先介绍一下,Zookeeper的操作接口和简单使用示例。
常用接口列表
客户端要连接Zookeeper服务器可以通过创建org.apache.zookeeper.ZooKeeper的一个实例对象,然后调用这个类提供的接口来和服务器交互。
前面说了ZooKeeper主要是用来维护和监控一个目录节点树中存储的数据的状态,所有我们能够操作ZooKeeper的也和操作目录节点树大体一样,如创建一个目录节点,给某个目录节点设置数据,获取某个目录节点的所有子目录节点,给某个目录节点设置权限和监控这个目录节点的状态变化。
这些接口如下表所示:
表1org.apache.zookeeper.ZooKeeper方法列表
方法名方法功能描述
Stringcreate(Stringpath,byte[]data,List<ACL>acl,CreateModecreateMode)创建一个给定的目录节点path,并给它设置数据,CreateMode标识有四种形式的目录节点,分别是PERSISTENT:持久化目录节点,这个目录节点存储的数据不会丢失;PERSISTENT_SEQUENTIAL:顺序自动编号的目录节点,这种目录节点会根据当前已近存在的节点数自动加1,然后返回给客户端已经成功创建的目录节点名;EPHEMERAL:临时目录节点,一旦创建这个节点的客户端与服务器端口也就是session超时,这种节点会被自动删除;EPHEMERAL_SEQUENTIAL:临时自动编号节点
Statexists(Stringpath,booleanwatch)判断某个path是否存在,并设置是否监控这个目录节点,这里的watcher是在创建ZooKeeper实例时指定的watcher,exists方法还有一个重载方法,可以指定特定的watcher
Statexists(Stringpath,Watcherwatcher)重载方法,这里给某个目录节点设置特定的watcher,Watcher在ZooKeeper是一个核心功能,Watcher可以监控目录节点的数据变化以及子目录的变化,一旦这些状态发生变化,服务器就会通知所有设置在这个目录节点上的Watcher,从而每个客户端都很快知道它所关注的目录节点的状态发生变化,而做出相应的反应
voiddelete(Stringpath,intversion)删除path对应的目录节点,version为-1可以匹配任何版本,也就删除了这个目录节点所有数据
List<String>getChildren(Stringpath,booleanwatch)获取指定path下的所有子目录节点,同样getChildren方法也有一个重载方法可以设置特定的watcher监控子节点的状态
StatsetData(Stringpath,byte[]data,intversion)给path设置数据,可以指定这个数据的版本号,如果version为-1怎可以匹配任何版本
byte[]getData(Stringpath,booleanwatch,Statstat)获取这个path对应的目录节点存储的数据,数据的版本等信息可以通过stat来指定,同时还可以设置是否监控这个目录节点数据的状态
voidaddAuthInfo(Stringscheme,byte[]auth)客户端将自己的授权信息提交给服务器,服务器将根据这个授权信息验证客户端的访问权限。
StatsetACL(Stringpath,List<ACL>acl,intversion)给某个目录节点重新设置访问权限,需要注意的是Zookeeper中的目录节点权限不具有传递性,父目录节点的权限不能传递给子目录节点。目录节点ACL由两部分组成:perms和id。
Perms有ALL、READ、WRITE、CREATE、DELETE、ADMIN几种
而id标识了访问目录节点的身份列表,默认情况下有以下两种:
ANYONE_ID_UNSAFE=newId("world","anyone")和AUTH_IDS=newId("auth","")分别表示任何人都可以访问和创建者拥有访问权限。
List<ACL>getACL(Stringpath,Statstat)获取某个目录节点的访问权限列表
除了以上这些上表中列出的方法之外还有一些重载方法,如都提供了一个回调类的重载方法以及可以设置特定Watcher的重载方法,具体的方法可以参考org.apache.zookeeper.ZooKeeper类的API说明。
基本操作
下面给出基本的操作ZooKeeper的示例代码,这样你就能对ZooKeeper有直观的认识了。下面的清单包括了创建与ZooKeeper服务器的连接以及最基本的数据操作:
ZooKeeper基本的操作示例
复制代码
//创建一个与服务器的连接
ZooKeeperzk=newZooKeeper("localhost:"+CLIENT_PORT,
ClientBase.CONNECTION_TIMEOUT,newWatcher(){
//监控所有被触发的事件
publicvoidprocess(WatchedEventevent){
System.out.println("已经触发了"+event.getType()+"事件!");
}
});
//创建一个目录节点
zk.create("/testRootPath","testRootData".getBytes(),Ids.OPEN_ACL_UNSAFE,
CreateMode.PERSISTENT);
//创建一个子目录节点
zk.create("/testRootPath/testChildPathOne","testChildDataOne".getBytes(),
Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);
System.out.println(newString(zk.getData("/testRootPath",false,null)));
//取出子目录节点列表
System.out.println(zk.getChildren("/testRootPath",true));
//修改子目录节点数据
zk.setData("/testRootPath/testChildPathOne","modifyChildDataOne".getBytes(),-1);
System.out.println("目录节点状态:["+zk.exists("/testRootPath",true)+"]");
//创建另外一个子目录节点
zk.create("/testRootPath/testChildPathTwo","testChildDataTwo".getBytes(),
Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);
System.out.println(newString(zk.getData("/testRootPath/testChildPathTwo",true,null)));
//删除子目录节点
zk.delete("/testRootPath/testChildPathTwo",-1);
zk.delete("/testRootPath/testChildPathOne",-1);
//删除父目录节点
zk.delete("/testRootPath",-1);
//关闭连接
zk.close();
复制代码
输出的结果如下:
复制代码
已经触发了None事件!
testRootData
[testChildPathOne]
目录节点状态:[5,5,1281804532336,1281804532336,0,1,0,0,12,1,6]
已经触发了NodeChildrenChanged事件!
testChildDataTwo
已经触发了NodeDeleted事件!
已经触发了NodeDeleted事件!
复制代码
当对目录节点监控状态打开时,一旦目录节点的状态发生变化,Watcher对象的process方法就会被调用。
ZooKeeper典型的应用场景
Zookeeper从设计模式角度来看,是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应,从而实现集群中类似Master/Slave管理模式,关于Zookeeper的详细架构等内部细节可以阅读Zookeeper的源码
下面详细介绍这些典型的应用场景,也就是Zookeeper到底能帮我们解决那些问题?下面将给出答案。
统一命名服务(NameService)
分布式应用中,通常需要有一套完整的命名规则,既能够产生唯一的名称又便于人识别和记住,通常情况下用树形的名称结构是一个理想的选择,树形的名称结构是一个有层次的目录结构,既对人友好又不会重复。说到这里你可能想到了JNDI,没错Zookeeper的NameService与JNDI能够完成的功能是差不多的,它们都是将有层次的目录结构关联到一定资源上,但是Zookeeper的NameService更加是广泛意义上的关联,也许你并不需要将名称关联到特定资源上,你可能只需要一个不会重复名称,就像数据库中产生一个唯一的数字主键一样。
NameService已经是Zookeeper内置的功能,你只要调用Zookeeper的API就能实现。如调用create接口就可以很容易创建一个目录节点。
配置管理(ConfigurationManagement)
配置的管理在分布式应用环境中很常见,例如同一个应用系统需要多台PCServer运行,但是它们运行的应用系统的某些配置项是相同的,如果要修改这些相同的配置项,那么就必须同时修改每台运行这个应用系统的PCServer,这样非常麻烦而且容易出错。
像这样的配置信息完全可以交给Zookeeper来管理,将配置信息保存在Zookeeper的某个目录节点中,然后将所有需要修改的应用机器监控配置信息的状态,一旦配置信息发生变化,每台应用机器就会收到Zookeeper的通知,然后从Zookeeper获取新的配置信息应用到系统中。
图2.配置管理结构图
集群管理(GroupMembership)
Zookeeper能够很容易的实现集群管理的功能,如有多台Server组成一个服务集群,那么必须要一个“总管”知道当前集群中每台机器的服务状态,一旦有机器不能提供服务,集群中其它集群必须知道,从而做出调整重新分配服务策略。同样当增加集群的服务能力时,就会增加一台或多台Server,同样也必须让“总管”知道。
Zookeeper不仅能够帮你维护当前的集群中机器的服务状态,而且能够帮你选出一个“总管”,让这个总管来管理集群,这就是Zookeeper的另一个功能LeaderElection。
它们的实现方式都是在Zookeeper上创建一个EPHEMERAL类型的目录节点,然后每个Server在它们创建目录节点的父目录节点上调用getChildren(Stringpath,booleanwatch)方法并设置watch为true,由于是EPHEMERAL目录节点,当创建它的Server死去,这个目录节点也随之被删除,所以Children将会变化,这时getChildren上的Watch将会被调用,所以其它Server就知道已经有某台Server死去了。新增Server也是同样的原理。
Zookeeper如何实现LeaderElection,也就是选出一个MasterServer。和前面的一样每台Server创建一个EPHEMERAL目录节点,不同的是它还是一个SEQUENTIAL目录节点,所以它是个EPHEMERAL_SEQUENTIAL目录节点。之所以它是EPHEMERAL_SEQUENTIAL目录节点,是因为我们可以给每台Server编号,我们可以选择当前是最小编号的Server为Master,假如这个最小编号的Server死去,由于是EPHEMERAL节点,死去的Server对应的节点也被删除,所以当前的节点列表中又出现一个最小编号的节点,我们就选择这个节点为当前Master。这样就实现了动态选择Master,避免了传统意义上单Master容易出现单点故障的问题。
图3.集群管理结构图
这部分的示例代码如下,完整的代码请看附件:
LeaderElection关键代码
复制代码
voidfindLeader()throwsInterruptedException{
byte[]leader=null;
try{
leader=zk.getData(root+"/leader",true,null);
}catch(Exceptione){
logger.error(e);
}
if(leader!=null){
following();
}else{
StringnewLeader=null;
try{
byte[]localhost=InetAddress.getLocalHost().getAddress();
newLeader=zk.create(root+"/leader",localhost,
ZooDefs.Ids.OPEN_ACL_UNSAFE,CreateMode.EPHEMERAL);
}catch(Exceptione){
logger.error(e);
}
if(newLeader!=null){
leading();
}else{
mutex.wait();
}
}
}
复制代码
共享锁(Locks)
共享锁在同一个进程中很容易实现,但是在跨进程或者在不同Server之间就不好实现了。Zookeeper却很容易实现这个功能,实现方式也是需要获得锁的Server创建一个EPHEMERAL_SEQUENTIAL目录节点,然后调用getChildren方法获取当前的目录节点列表中最小的目录节点是不是就是自己创建的目录节点,如果正是自己创建的,那么它就获得了这个锁,如果不是那么它就调用exists(Stringpath,booleanwatch)方法并监控Zookeeper上目录节点列表的变化,一直到自己创建的节点是列表中最小编号的目录节点,从而获得锁,释放锁很简单,只要删除前面它自己所创建的目录节点就行了。
图4.Zookeeper实现Locks的流程图
同步锁的实现代码如下,完整的代码请看附件:
同步锁的关键思路
复制代码
加锁:
ZooKeeper将按照如下方式实现加锁的操作:
1)ZooKeeper调用create()方法来创建一个路径格式为“_locknode_/lock-”的节点,此节点类型为sequence(连续)和ephemeral(临时)。也就是说,创建的节点为临时节点,并且所有的节点连续编号,即“lock-i”的格式。
2)在创建的锁节点上调用getChildren()方法,来获取锁目录下的最小编号节点,并且不设置watch。
3)步骤2中获取的节点恰好是步骤1中客户端创建的节点,那么此客户端获得此种类型的锁,然后退出操作。
4)客户端在锁目录上调用exists()方法,并且设置watch来监视锁目录下比自己小一个的连续临时节点的状态。
5)如果监视节点状态发生变化,则跳转到第2步,继续进行后续的操作,直到退出锁竞争。
解锁:
ZooKeeper解锁操作非常简单,客户端只需要将加锁操作步骤1中创建的临时节点删除即可。
复制代码
同步锁的关键代码
复制代码
voidgetLock()throwsKeeperException,InterruptedException{
List<String>list=zk.getChildren(root,false);
String[]nodes=list.toArray(newString[list.size()]);
Arrays.sort(nodes);
if(myZnode.equals(root+"/"+nodes[0])){
doAction();
}
else{
waitForLock(nodes[0]);
}
}
voidwaitForLock(Stringlower)throwsInterruptedException,KeeperException{
Statstat=zk.exists(root+"/"+lower,true);
if(stat!=null){
mutex.wait();
}
else{
getLock();
}
}
复制代码
队列管理
Zookeeper可以处理两种类型的队列:
当一个队列的成员都聚齐时,这个队列才可用,否则一直等待所有成员到达,这种是同步队列。
队列按照FIFO方式进行入队和出队操作,例如实现生产者和消费者模型。
同步队列用Zookeeper实现的实现思路如下:
创建一个父目录/synchronizing,每个成员都监控标志(SetWatch)位目录/synchronizing/start是否存在,然后每个成员都加入这个队列,加入队列的方式就是创建/synchronizing/member_i的临时目录节点,然后每个成员获取/synchronizing目录的所有目录节点,也就是member_i。判断i的值是否已经是成员的个数,如果小于成员个数等待/synchronizing/start的出现,如果已经相等就创建/synchronizing/start。
用下面的流程图更容易理解:
图5.同步队列流程图
同步队列的关键代码如下,完整的代码请看附件:
同步队列
复制代码
voidaddQueue()throwsKeeperException,InterruptedException{
zk.exists(root+"/start",true);
zk.create(root+"/"+name,newbyte[0],Ids.OPEN_ACL_UNSAFE,
CreateMode.EPHEMERAL_SEQUENTIAL);
synchronized(mutex){
List<String>list=zk.getChildren(root,false);
if(list.size()<size){
mutex.wait();
}else{
zk.create(root+"/start",newbyte[0],Ids.OPEN_ACL_UNSAFE,
CreateMode.PERSISTENT);
}
}
}
复制代码
当队列没满是进入wait(),然后会一直等待Watch的通知,Watch的代码如下:
复制代码
publicvoidprocess(WatchedEventevent){
if(event.getPath().equals(root+"/start")&&
event.getType()==Event.EventType.NodeCreated){
System.out.println("得到通知");
super.process(event);
doAction();
}
}
复制代码
FIFO队列用Zookeeper实现思路如下:
实现的思路也非常简单,就是在特定的目录下创建SEQUENTIAL类型的子目录/queue_i,这样就能保证所有成员加入队列时都是有编号的,出队列时通过getChildren()方法可以返回当前所有的队列中的元素,然后消费其中最小的一个,这样就能保证FIFO。
下面是生产者和消费者这种队列形式的示例代码,完整的代码请看附件:
生产者代码
复制代码
booleanproduce(inti)throwsKeeperException,InterruptedException{
ByteBufferb=ByteBuffer.allocate(4);
byte[]value;
b.putInt(i);
value=b.array();
zk.create(root+"/element",value,ZooDefs.Ids.OPEN_ACL_UNSAFE,
CreateMode.PERSISTENT_SEQUENTIAL);
returntrue;
}
复制代码
消费者代码
复制代码
intconsume()throwsKeeperException,InterruptedException{
intretvalue=-1;
Statstat=null;
while(true){
synchronized(mutex){
List<String>list=zk.getChildren(root,true);
if(list.size()==0){
mutex.wait();
}else{
Integermin=newInteger(list.get(0).substring(7));
for(Strings:list){
IntegertempValue=newInteger(s.substring(7));
if(tempValue<min)min=tempValue;
}
byte[]b=zk.getData(root+"/element"+min,false,stat);
zk.delete(root+"/element"+min,0);
ByteBufferbuffer=ByteBuffer.wrap(b);
retvalue=buffer.getInt();
returnretvalue;
}
}
}
}
复制代码
总结
Zookeeper作为Hadoop项目中的一个子项目,是Hadoop集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它管理Hadoop集群中的NameNode,还有Hbase中MasterElection、Server之间状态同步等。
本文介绍的Zookeeper的基本知识,以及介绍了几个典型的应用场景。这些都是Zookeeper的基本功能,最重要的是Zoopkeeper提供了一套很好的分布式集群管理的机制,就是它这种基于层次型的目录树的数据结构,并对树中的节点进行有效管理,从而可以设计出多种多样的分布式的数据管理模型,而不仅仅局限于上面提到的几个常用应用场景。