HDFS Datanode数据存储格式分析
首先在Datanode中,每一个block都对应一个数据存储文件,数据存储文件以_blk开头;同时,每一个block还对应一个元数据文件,元数据文件以.meta结尾(注意:meta file的命名格式如下blokcFileName_generationStamp.meta)。
首先将一下我理解的几个概念。在HDFS中有storage的概念,每一个节点对应一个storage。我们可以理解为一个Datanode是一个storage,一个Namenode也是一个storage。一个storage可以对应于多个存储目录(按照我的理解,不同的存储目录应该是对应于不同的硬盘或者存储装置)。在Datanode中代表实际数据存储的是FSDataset。FSDataset由多个FSVolume组成。每一个FSVolume对应于storage中一个存储目录(相当于一个FSVolume对应于一个硬盘)。最终,由FSVolume进行数据的存储。每个FSVolume包含了几个文件夹,包括dataDir(用来保存blocks和meta file)、tmpDir(临时文件夹)、detachDir(copy on write for blocks in snapshot,在写block时,在detachDir中保存一个备份,以便进行数据恢复)。
相关推荐
憧憬 2020-08-21
wa2003 2020-06-17
悟空大师 2020-06-06
辛佳雨 2020-06-02
fangxiaoji 2020-05-12
loviezhang 2020-04-17
Charlesbases 2020-04-16
whyname 2020-03-07
wzhwangzhuohui 2020-03-04
flyDeDog 2020-02-25
qijiqiguai 2020-02-13
zxznsjdsj 2020-02-02
chenjinlong 2020-01-31
大脸猫脸大 2020-01-26
wintershii 2020-01-18
东哥笔记 2020-01-17