zookeeper面试题分析

deyu

2020-06-03

1、什么是zookeeper？

1、zookeeper是一个分布式协调技术，是分布式数据一致性解决方案的典型代表，力求做到强一致性但最终实现的是最终一致性，采用CAP理论的AP，用来构建高可用分布式主备系统

2、zookeeper能干什么？

1、数据发布/订阅
2、命名服务
3、集群管理
4、Master选举
5、分布式锁
6、分布式队列
7、负载均衡

3、zookeeper提供了什么？

1、文件系统
2、消息广播

4、简单说一下zookeeper的文件系统？

1、zookeeper集群是有一个叫做命名节点空间的概念，其中节点就是znode,在zookeeper的文件系统中有两种节点，一是数据节点，二是目录节点，但是只有数据节点能存放数据
2、zookeeper集群为了维护高吞吐和低延迟的特性，就维护了这样树状的目录结构，而且数据节点的存储量不能太大，最多为1M

5、说一下ZAB协议？

1、ZAB协议是为分布式协调技术zookeeper提供的一个支持崩溃回复的原子广播协议
2、ZAB包括两种模式即崩溃回复和消息广播
3、首先当服务刚启动的时候或者leader节点宕机或者集群内有一半以上机器不能正常工作，此时会进入leader选举状态，然后再向其它服务器同步数据（采用的是两阶段提交），只要有一般以上返回成功的结果，此时便进入消息广播模式，整个zookeeper集群就可以对外提供服务并处理客户端的请求

6、zookeeper有几种数据节点？分别是什么？

1、7种
	持久节点				除非手动删除，否则数据一直存在
	临时节点				临时节点的生命周期与客户端会话绑定，当会话关闭，数据才会丢失
	持久顺序节点			和持久节点类似，只是多了顺序性，该特性是由父节点维护的一个自增整型数字
	临时顺序节点			和临时节点类似，只是多了顺序性，该特性是由父节点维护的一个自增整型数字
	容器节点				当节点的最后一个子节点删除之后，该容器节点会被自动删除
	TTL节点				在节点上加了过期时间
	TTL顺序节点		        和TTL节点类似，只是多了顺序性，该特性是由父节点维护的一个自增整型数字

7、简单说一下zookeeper Watcher机制（zookeeper数据变更通知）？

1、客户端注册Watcher
2、服务端触发Watcher
3、客户端回调Watcher
	首先客户端会向服务端注册一个Watcher监听，当服务端的某些指令触发了这个Watcher的话，服务端就会向客户端返回一个消息通知，客户端接收到消息之后便可以做出业务上的改变

8、客户端注册Watcher是如何实现的？

1、首先会访问getData()/getChildren()/exist()三个API，传入Watcher对象
2、标记请求request,将Watcher封装成WatcherRegistration对象
3、再封装成Packet对象，服务端发送request
4、接收到服务端的request请求之后，将Watcher注册到zkWatcherManager中进行管理
5、将结果返回给客户端，注册成功

9、服务端处理Watcher是怎样实现的？

1、首先根据客户端的请求判断是否需要注册Watcher
2、比如服务端触发了setData()/delete()/create()方法，会触发一个叫做NodeDataChanged（）的事件
3、服务端会将触发的事件类型、节点的路径封装成一个叫做WatchedEvent的对象
4、再向zkWatcherManager中的WatcherTable中根据节点路径查找
	若找不到，说明客户端没有注册过Watcher
	若找到，将Watcher从WatcherTable中删除（说明Watcher监听是一次性的）
5、调用process方法触发Watcher,主要是通过Servercnxn的TCP连接来通知客户端

10、客户端回调Watcher是怎样实现的？

1、客户端有个SendThread来接收Watcher通知的线程，接收的通知之后会交由EventThread线程处理
2、客户端的Watcher监听也是一次性的，一旦触发也会被删除

11、说一下你对zookeeper权限控制列表的认识（ACL）？

1、zookeeper的权限控制列表包含三个部分
	a、授权模式
		· IP:授权模式精确到IP粒度
		· Digest:相当于username:password，最常用的一种授权模式
		· World：相当于最特殊的Digest模式world:everyone,最开放的一种授权模式
		· Super：超级用户
	b、授权对象：被授予权限的用户例如某个IP
	c、权限
		· Create:创建
		· Delete：删除
		· Read：读
		· Write：写
		· Admin：管理

12、你知道Chroot属性是用来干什么的吗？

1、zookeeper新版本提出的一种特性，类似与namespace的说法，就是每个客户端与zookeeper的服务端之间的交互都保存在自己的namespace下
2、在目前的分布式系统中，很多都是多个应用共用一个zookeeper集群，如果设置了chroot属性，那么不同应用之间就可以起到很好的隔离效果

13、zookeeper的会话管理是怎样的？

1、分桶策略：即将类似的会话分到同一个区内进行管理，这样做可以起到不同区块的分批处理以及同一区块的统一处理
2、分桶原则：下次会话超时时间点
3、计算公式：{[(当前时间+session超时时间）/（tickTime）]+1}*tickTime (其中tickTime是会话超时检查时间间隔)

14、zookeeper中的服务器角色都有哪些？分别是干什么的？

1、leader
	a、事务的执行和调度者，保证事务的顺序性
	b、集群内部各服务的调度者
2、follower
	a、处理非事务请求，将事务请求转发给leader处理
	b、参与集群内Proposal(提议)的投票
	c、参与leader选举的投票
3、observer
	a、处理非事务请求，将事务请求转发给leader
	b、在不影响事务处理能力的基础上增加了处理非事务请求的能力
	c、不参与任何形式的投票

15、zookeeper中Server的工作状态？

1、looking:集群中leader选举的状态
2、leading:说明当前服务器角色是leader节点
3、following:说明当前服务器角色是follower节点
4、observing:说明当前服务器角色是observer节点

16、zookeeper数据同步的实现方式？

1、zookeeper实现数据同步有4种方式，即直接差异化同步、先回滚再差异化同步、仅回滚同步、全量同步
2、首先先从learner(follower和observer节点的统称)节点获取最后一次操作数据的zxid,再从leader节点中获取最小的minZxid和最大的maxZxid
3、a、如果minZxid<zxid<maxZxid	 -->采用直接差异化同步
   b、如果leader服务器发现learner服务器包含了自己不存在的数据，那么learner服务器需要回滚到leader包含的数据然后在差异化处理 
                                 -->先回滚再差异化同步
   c、如果zxid>maxZxid            -->仅回滚同步即可
   d、如果zxid<minZxid            -->全量同步

17、zookeeper是如何保证事务的顺序一致性的？

1、zookeeper采用全局递增的事务id(zxid)来保证事务的顺序一致性的
2、所有的提议在被提出的都会携带这个zxid,zxid是一个64位的数字；高32位是个epoch（时期，纪元，世，新时代）值，表示leader选举周期，每进行一次leader选举，该数字就会+1；后32位用来表示递增计数,当产生新的提议时，会依据数据库的两阶段提交过程，首先会像其它节点发送执行请求，如果超过半数以上的机器正确执行，那么该事务就可以被执行

18、分布式集群中为什么会有Master节点？

1、因为在分布式环境中，某些场景下你只需要计算一次，所有的节点都可以共享这个结果，避免重复计算，减少性能开销，所以就有了Master节点

19、zookeeper节点宕机了怎么办？

1、因为zookeeper本身也是一个集群，并且推荐配置集群机器不少于3台
2、如果低于三台，挂了一台（无论是leader还是follower节点），集群都不能正常工作
3、如果集群机器>=3台，如果挂的是follower节点，不影响集群正常工作，如果挂的是leader节点，需要重新选举leader节点，选举完成之后还能正常工作

20、zookeeper负载均衡和nginx负载均衡的区别？

1、zookeeper的负载均衡可以调控，nginx的负载均衡只能调权重，其它可调控的方面都需要自己手写
2、但是nginx的吞吐量远大于zookeeper,所以要根据不同的场景选择合适的负载均衡方案

21、zookeeper有哪几种部署模式？

1、单机
2、伪集群
3、集群

22、zookeeper集群至少需要几台机器？集群规则是怎样的？

1、至少需要3态机器
2、规则是：2n+1（n>0的整数）

23、zookeeper集群支持动态添加机器吗？

1、动态添加机器说白了就是水平扩容，动态添加机器有以下两种方案
2、全部重启：先把集群中所有的服务都关掉，修改完配置之后再全部重启，不影响之前客户端的会话
3、逐个重启：因为zookeeper集群只要有半数以上的机器存活时，集群就能对外提供服务，因此我们可以逐个关闭机器，然后修改配置再重启

24、zookeeper集群的Watcher监听是永久的吗？为什么？

1、不是永久的（一次性的）
2、因为一旦是永久的话，服务端的每次更改数据都会发送一个消息通知给客户端，这对于网络开销和服务器端的压力都是非常大的，而且我们一般都是需要最新的一次数据，不需要每次变更数据的结果，所以zookeeper在Watcher监听这一块设置一次性的，一旦触发了Watcher，监听就会被移除，下次想触发还需要重新注册

25、zookeeper的java客户端有哪些？

1、zookeeper自带的zkClient
2、apache开源的Curator

26、chubby是什么？与zookeeper比你怎么看？

1、chubby是google的一个完全采用Paxos算法的项目，不开源
2、zookeeper可以说是chubby开源的版本，采用ZAB协议，开源

27、说几个zookeeper常用的命令？

1、set /liulong 123
2、get /liulong
3、ls /
4、update /liulong 456
5、delete /liulong
6、stat /liulong

28、ZAB协议和Paxos算法的联系（相同点和不同点）？

1、相同点：
	a、都有一个leader进程，并且该leader进程负责调控lollower进程的运行
	b、leader节点都需要经过半数以上的follower节点作出正确的反馈后，才会将一个提议提交
	c、在ZAB中每个提议都有一个epoll值，在Paxos中称为Ballot
2、不同点：
	a、ZAB采用AP,用来构建高可用分布式主备系统；Paxos采用CP，用来构建分布式一致性状态机系统

29、Zookeeper的典型应用场景有哪些？

1、消息发布与订阅    -->发布者发送消息供订阅者消费消息
2、命令服务         -->采用全局路径，每个路径对应一个名称用来指定相应的服务
3、master选举
4、集群管理
5、负载均衡
6、分布式锁         -->两种（保持独占/控制时序）
	保持独占：每个znode都可以看作一把锁，在createZnode的时候，每个客户端都去创建/distribute_lock,最终创建成功的那个客户端就拥有了这把锁，用完之后删除/distribute_lock即可
	控制时序：在/distribute_lock下面创建临时顺序节点，编号最小的拥有这把锁，用完删除
7、分布式队列：     -->两种（同步队列/FIFO队列）
	同步队列：当一个队列的所有成员都聚集时，这个队列才可用；只需要在约定目录下创建一个Watcher监听，当达到指定数量时，就触发Watcher通知机制
	FIFO队列：与分布式锁差不多，入队时有编号，出队时按编号依次出队

zookeeper集群