hbase 源码解析之master篇2

wdeo0

2011-03-27

关注关注

HMaster的RPC接口，分两类：

HMaster与RegionServer通讯接口，总共只有两个

-->regionServerStartup: 当regionserver启动时会调用该接口

-->将发请起求的RS的信息写入serverInfo，注意这里的hostname为master所识别的hostname，而非RS告诉master的

-->调用serverManager的regionServerStartup方法处理该请求

-->check该RS是否deadServer，如果是，拒绝start请求，抛出YouAreDeadException异常

-->check该RS在同样的端口上是否己经启动，如果己经启动，通过serverInfo中的startcode来检查原来的RS是否可以注销，如果不能注销，拒绝请求，抛出PleaseHoldException异常

-->check该RS与master的时钟是否同步，如果相差太多(默认30s)，拒绝请求并抛出ClockOutOfSyncException异常

-->注册该RS，具体要做的事有：

-->添加onlineServers

-->清除原有的serverConnections信息

-->将回应写入MapWritable结构，传回给RS

-->regionServerReport: regionserver心跳时调用该接口

-->调用ServerManager的regionServerReport方法，处理report并返回HMsg信息

-->check该RS是否deadServer，如果是，拒绝report请求，抛出YouAreDeadException异常

-->在onlineServers中查找该RS

-->如果找不到

-->注册一个新的RS

-->如果RS传过来的msg不会空，则抛出PleaseHoldException异常，推迟到下次report时再处理信息

-->如果找到的serverInfo和传过来的serverInfo的startCode不相同(不太可能发生)

-->删除serverInfo中的该server信息

-->向RS发送STOP_REGIONSERVER_ARRAY信号

-->检查传过来的msg，如果是REGION_SPLIT信号，调用getAssignmentManager的handleSplitReport方法，处理split事件

-->下线parent region

-->先把parent region从regionsInTransition状态中删除

-->清除与该parent region有关的regionPlan

-->下线该regions

-->从regions列表中删除它

-->从它所属的serverInfo中删除它对应的regionInfo

-->从己经zk上获得(parent所在的node)数据

-->如果它处于closing状态，删除它

-->从zk上得到它的数据

-->从hmaster的unassignedNodes中删除它

-->向zookeeper发请求删除该node

-->assign两个新的region

-->先清除regionsInTransition队列中的该子region

-->向regions中添加该region的regionInfo

-->向该serverInfo中添加该regionInfo

-->如果正好有跟该region相关的region plan，删除之

-->更新所有region plan中目的地是该RS且在regionsInTransition队列中的元素的state信息，这一步的目的是恢复region plan的有效性

-->如果此时正好用户在disable该region对应的表，需要把它unassign掉

-->更新该region在regionsInTransition中的状态为PENDING_CLOSE

-->调用serverManager的sendRegionClose方法，向RS发送colse region信号

-->如果cluster处理shutdown过程中，且剩余的RS小于等于2了，则发出STOP_REGIONSERVER_ARRAY信号，这是为了保证root和meta所在的RS最后关闭

HMaster的其它RPC接口:

-->isMasterRunning:检查master是否己stop

-->enableTable:

-->启动EnableTableHandler线程，执行handleEnableTable操作

-->调用setTableState，将table状态置为ENABLING

-->在zk上创建一个该table的znode

-->向zk通知该znode状态为ENABLING

-->更新cache中的该znode状态

-->读取.META.表，获取该table的所有region

-->跳过所有己经online的regions

-->创建一个BulkEnabler对象，用它分配所有regions

-->创建一个ExecutorService线程池完成这个工作

-->跳过所有处于transition状态的region

-->调用AssignmentManager的assign方法，注意这里会尽量延用原来在.META.表中的分配方案

-->等待分配的线程结束

-->调用setTableState，将table状态置为ENABLE

-->disableTable:

-->逻辑基本同enableTable，只是调用调用AssignmentManager的unassign方法

-->createTable:

-->强制不等待assign分配完成

-->如果没有指定splitKeys，那么只创建一个region，否则以splitKeys决定startKeys和endKeys，创建多个region

-->通知zk设置table状态为enabled

-->创建region，并在hdfs上创建它的目录

-->向meta所在的RS发送put，以注册.META.信息

-->close这个region，清空其对应的hlog

-->调用userregionassgin来分配它(robbin-round方式)

-->modifyTable:

-->启动modifyHandler线程修改table

-->通过CatalogTracker找到table对应的所有regionInfo

-->调用ModifyTableHandler，创建一个Put，把要修改的info放进去，然后调用connection去put

-->deleteTable:

-->逻辑基本同modifyTable，另外还增加fs上删除目录的操作

-->addColumn:

-->逻辑基本同modifyTable，另外还增加fs上创建目录的操作

-->modifyColumn:

-->逻辑基本同modifyTable，另外还增加fs上修改目录的操作

-->deleteColumn:

-->逻辑基本同modifyTable，另外还增加fs上删除目录的操作

-->shutdown:

-->调用serverManager的shutdownCluster方法关闭cluster

-->置clusterShutdown标志

-->调用master的stop方法

-->通知zookeeper关闭事件

-->stopMaster:置stop标志，并唤醒其它等待的backup master

-->getClusterStatus:返回cluster的信息，包括：版本号、live和dead的servers、transition的regions

-->move:将一个region移到一个确定的RS上

-->assign:分配一个region

-->unassign:卸载一个region

-->balance:直接执行一次balance

-->balanceSwitch:是否关闭balance功能(代码写死打开)

hbase

wdeo0

0 关注 0 粉丝 0 动态

关注关注

HBase/TiDB都在用的数据结构：LSM Tree，不得了解一下？

LSM Tree广泛应用在HBase，TiDB等诸多数据库和存储引擎上，我们先来看一下它的一些应用：。这么牛X的名单，你不想了解下LSM Tree吗？装X之前，我们先来了解一些基本概念。设计数据存储系统可能需要考虑的一些问题有：ACID，RUM。读性能体现

晨曦之星 2020-08-14

hbase 基础 —— 架构

典型的主从架构。其中 RegionServers 负责与客户端的交互，访问数据 HMaster 负责 Region 分配，DDL 操作。hbase table 根据 RowKey 划分成多个 Region，Region 包含所划分范围的所有行数据。Regi

lwb 2020-07-26

hdfs、hive、hbase的搭建总结

-- 完全分布式文件系统的名称：schema ip port -->. -- 分布式文件系统的其他路径的所依赖的一个基础路径，完全分布式不能使用默认值，因为临路径不安全，linux系统在重启时，可能会删除此目录下的内容-->. --

eternityzzy 2020-07-19

hbase 建表数据类型

下面几个shell 命令在后续的hbase 操作中可以起到很到的作用，且主要体现在建表的过程中，看下面几个create 属性1、BLOOMFILTER 默认是NONE 是否使用布隆过虑使用何种方式布隆过滤可以每列族单独启用。对ROW，行键的哈希在每次插入行

大而话之BigData 2020-06-16

Hbase常见问题

Hbase的数据是按照字典排序的，当大量连续的rowkey集中写到个别的region，各个region之间实际分布不均衡；创建表已经提前预分区，但是设计的rowkey没有规律可循。随机数+业务主键，如果更好的让最近的数据get到，可以加上时间戳；加盐之后的

ITwangnengjie 2020-06-14

hue集成hbase

# Comma-separated list of HBase Thrift servers for clusters in the format of ‘‘.# If using Kerberos we assume GSSAPI SASL, not P

gengwx00 2020-06-11

HBase安装部署

在slave01上运行jps，确认DataNode, NodeManager进程启动。分别在master，slave01，slave02上启动zookeeper. 查看解压后HBase目录中包含的文件。修改JAVA环境变量，去除export JAVA_HO

大而话之BigData 2020-06-10

在hadoop集群下启动hbase的方法

start-all.sh(前提是在bashrc中配置export PATH=$PATH:$HADOOP_HOME/sbin export PATH=$PATH:$HAOOP_HOME/bin)

鲸鱼写程序 2020-06-08

Spark读取Hbase中的数据

大家可能都知道很熟悉Spark的两种常见的数据读取方式：、调用parallelize函数直接从集合中获取数据，并存入RDD中；Java版本如下：。其实对文件来说，Spark支持Hadoop所支持的所有文件类型和文件存放位置。过往记忆博客，专注于hadoop

needyit 2020-06-04

Flume-0.9.4和Hbase-0.96整合

Flume里面自带了Hbase sink，可以直接调用啊，还用说么？这是因为Flume-0.9.4和Hbase-0.96整合比Flume-1.4.0和Hbase-0.96整合麻烦多了！不是随便几个配置就能搞定的，里面涉及到修改Flume和Hadoop的源码

strongyoung 2020-06-04

HBase的安装部署

　　副本数为1，取消权限。在启动前，先进行namenode格式化。这样hadoop就安装完成了。配置不使用自带的Zookeeper. # Tell HBase whether it should manage it‘s own instance of Z

WeiHHH 2020-05-30

Spark读取Mysql，Redis，Hbase数据（一）

"select * from TBLS where TBL_ID >= ?

needyit 2020-05-10

Spark 与 JDBC、Hbase之间的交互

"select id, name from user where id >= ?1,//对应第一个？10,//对应第二个？

ITwangnengjie 2020-05-09

1，pinpoint全链路监控

Pinpoint-Collector和Pinpoint-Web最好安装在一个机器上。在结尾修改成如下，这里我们指定Hbase本地来存储数据，生产环境将数据建议存入HDFS中。这个脚本不能直接wget，因为wget下载下来的是一个网页。执行pinpoint提

gengwx00 2020-05-08

HBase与Hive

用于数据分析、清洗：Hive适用于离线的数据分析和清洗，延迟较高。基于HDFS、MapReduce：Hive存储的数据依旧在DataNode上，编写的HQL语句终将是转换为MapReduce代码执行。操作Hive可能对HBase产生影响，所以Hive需要持

gengwx00 2020-05-09

HBase与MapReduce交互

飞鸿踏雪0 2020-05-07

HBase原理总结

HBase分布式数据库，面向列存储，支持实时、随机读写。HDFS 为 Hbase 提供可靠的底层数据存储服务，MapReduce 为 Hbase 提供高性能的计算能力，Zookeeper 为 Hbase 提供。稳定服务和Failover机制，因此，Hbas

大而话之BigData 2020-05-06

Hbase scan 查询命令大全，前缀，模糊，正则

Hbase scan 查询例子数据?https://java-er.com/blog/hbase-scan-all-command/stu 学生列族 base 存储学生姓名，身高基本信息列族 score 存储成绩c1_s1 c1 班级 s1 学生编号。Hb

Buerzhu 2020-05-01

Hbase API 创建表错误记录 for Docker 容器部署集群

最终我们看到成功了，然后我们是三台Docker容器，我们为了后面的不会再次出现这个错误，我们把 salve2 节点的 hbase 的HRegionServer机器主机名。应用程序对数据的读写操作都是通过和HRegion通信完成，16020端口是Region

gengwx00 2020-04-30

hbase设置ttl后出现坏块，重启后master abort 问题梳理

　　可以看到，问题是由于把某个region进行transit过程中出现了错。　　造成的原因很可能就是重新设置了ttl造成数据块中造成了部分损坏。　　在此版本中，当region在transition过程中出现了错误，但并不会影响master的正常启动。

gengwx00 2020-04-29

安科网

hbase 源码解析之master篇2

wdeo0

wdeo0

相关推荐

HBase/TiDB都在用的数据结构：LSM Tree，不得了解一下？

hbase 基础 —— 架构

hdfs、hive、hbase的搭建总结

hbase 建表数据类型

Hbase常见问题

hue集成hbase

HBase安装部署

在hadoop集群下启动hbase的方法

Spark读取Hbase中的数据

Flume-0.9.4和Hbase-0.96整合

HBase的安装部署

Spark读取Mysql，Redis，Hbase数据（一）

Spark 与 JDBC、Hbase之间的交互

1，pinpoint全链路监控

HBase与Hive

HBase与MapReduce交互

HBase原理总结

Hbase scan 查询命令大全，前缀，模糊，正则

Hbase API 创建表错误记录 for Docker 容器部署集群

hbase设置ttl后出现坏块，重启后master abort 问题梳理

wdeo0