HDFS 与 GFS 的设计差异

hanhan

2017-08-23

关注关注

HDFS与GFS的设计差异

我们知道HDFS最早是根据GFS（GoogleFileSystem）的论文概念模型来设计实现的

写入模型

HDFS在考虑写入模型时做了一个简化，就是同一时刻只允许一个写入者或追加者。

在这个模型下同一个文件同一个时刻只允许一个客户端写入或追加。

而GFS则允许同一时刻多个客户端并发写入或追加同一文件。

允许并发写入带来了更复杂的一致性问题。

多个客户端并发写入时，它们之间的顺序是无法保证的，同一个客户端连续追加成功的多个记录也可能被打断。这意味着一个客户端在连续写入文件数据时，它的数据最终在文件中的分布可能是不连续的。

所谓一致性就是，对同一个文件，所有的客户端看到的数据是一致的，不管它们是从哪个副本读取的。

如果允许多个客户端同时写一个文件，怎么保证写入数据在多个副本间一致？

我们前面讲HDFS时它只允许一个写入者按流水线方式写入多个副本，写入顺序一致，写入完成后数据将保持最终一致。而对多个客户端而言，就必须让所有同时写入的客户端按同一种流水线方式去写入，才可能保证写入顺序一致。

写入流程

GFS使用租约机制来保障在跨多个副本的数据写入中保持顺序一致性。

GFSMaster将chunk租约发放给其中一个副本，这个副本我们就称为主副本，其他副本称为次副本。由主副本来确定一个针对该chunk的写入顺序，次副本则遵守这个顺序，这样就保障了全局顺序一致性。chunk租约机制的设计主要是为了减轻Master的负担，由主副本所在的chunkserver来承担流水线顺序的安排。

客户端请求Master询问哪个chunkserver持有租约以及其他副本的位置。

如果没有chunkserver持有租约，说明该chunk最近没有写操作。

Master则选择将租约授权给其中一台chunkserver。

Master返回客户端主副本和次副本的位置信息。

客户端缓存这些信息以备将来使用。

客户端以后不再需要联系Master，除非主副本所在chunkserver不可用或返回租约过期了。客户端选择最优的网络顺序推送数据，chunkserver将数据先缓存在内部的LRU缓存中。GFS中采用数据流和控制流分离的方法，从而能够基于网络拓扑结构更好地调度数据流的传输。一旦所有的副本确认收到了数据，客户端将发送一个写请求控制命令到主副本。由主副本分配连续的序列号来确定最终的写入顺序。主副本转发写请求到所有次副本，次副本按主副本安排的顺序执行写入操作。次副本写完后向主副本应答确认操作完成。

最后主副本应答客户端，若任意副本写入过程中出现错误，将报告给客户端，由客户端发起重试。

GFS和HDFS的写入流程都采用了流水线方式，但HDFS没有分离数据流和控制流。

HDFS的数据流水线写入在网络上的传输顺序与最终写入文件的顺序一致。

而GFS数据在网络上的传输顺序与最终写入文件的顺序可能不一致。

GFS在支持并发写入和优化网络数据传输方面做出了最佳的折衷。

总结

GFS的论文发表于2003年，后来大部分的分布式文件系统设计实现或多或少都参考了GFS的设计思路。

而HDFS算是开源分布式文件系统中最完整实现了GFS论文中的概念模型。

但HDFS依然简化了GFS中关于并发写的思路，本文就两者的写入模型和过程做了一些对比说明，并希望引发一些思考。

hdfs

安科网

HDFS 与 GFS 的设计差异

hanhan

hanhan

相关推荐

hadoop伪分布式环境搭建

HDFS分布式存储中NameNode 和DataNode 有什么区别？

2020年首个存储挖矿项目HDFS是什么？

hadoop框架三大组件hdfs、mapreduce、yarn 内容

hdfs、hive、hbase的搭建总结

hadoop集群的启动与停止

Spark RDD

HDFS

hadoop创建目录

[AWS][大数据][Hadoop] 使用EMR做大数据分析

Hadoop

大数据期末复习重点

HDFS【概述、数据流】

HDFS【shell操作hdfs命令】

hdfs读数据流程

hdfs写数据流程

HDFS【Java API操作】

15.HA高可用

Hadoop之hadoop fs和hdfs dfs、hdfs fs三者区别

flume

hanhan