分布式系统设计经典论文

uileader

2019-03-22

关注关注

分布式系统设计经典论文

推荐几篇工业界分布式系统设计的论文。

1. Google 经典的“三驾马车”

The Google File System (2003)：https://static.googleusercontent.com/media/research.google.com/zh-CN//archive/gfs-sosp2003.pdf
MapReduce: Simplified Data Processing on Large Clusters (2004)：https://storage.googleapis.com/pub-tools-public-publication-data/pdf/16cb30b4b92fd4989b8619a61752a2387c6dd474.pdf
Bigtable: A Distributed Storage System for Structured Data (2006)：https://static.googleusercontent.com/media/research.google.com/zh-CN//archive/bigtable-osdi06.pdf

最早发表的 GFS 论文（2003）到现在（2019）已经 16 年了。这三篇论文可以说是工业界、开源界分布式系统的启蒙者。之后的 Hadoop 系列开源软件 HDFS、MapReduce、Hbase 都是参考这三篇论文设计的。

2. Amazon 的 Dynamo （高可用、最终一致的分布式 KV）

Dynamo: Amazon’s Highly Available Key-value Store (2007)：https://www.allthingsdistributed.com/files/amazon-dynamo-sosp2007.pdf

和 Bigtable 差不多同一时期，Amazon 发表了 Dynamo 这篇论文。个人觉得这篇论文非常经典，绝对值得一读。从 Dynamo 和后来的 Aurora，可以看出 Amazon 做出来的东西都非常有自己的特色。

3. Google 的 Percolator 和 Megastore

Large-scale Incremental Processing Using Distributed Transactions and Notifications (2010)：https://storage.googleapis.com/pub-tools-public-publication-data/pdf/36726.pdf
Megastore: Providing Scalable, Highly Available Storage for Interactive Services (2011)：https://storage.googleapis.com/pub-tools-public-publication-data/pdf/36971.pdf

通过这两篇论文，看看 Google 内部是如何在 Bigtable 上“打补丁”，直到后来 Spanner 的出现。

4. Google 的 Spanner 和 F1 。

Spanner: Google’s Globally-Distributed Database (2012)：https://www.usenix.org/system/files/conference/osdi12/osdi12-final-16.pdf
F1: A Distributed SQL Database That Scales (2013)：https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41344.pdf
Online, Asynchronous Schema Change in F1 (2013)：https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/41376.pdf

最开始的时候，Spanner 和 F1 分工合作：Spanner 专注存储层，是一个高可用的分布式 KV并且支持分布式事务；F1 则专注计算层，是一个分布式 SQL 引擎。

Spanner: Becoming a SQL System (2017)：https://static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/46103.pdf

后来，Spanner 开始自己实现 SQL 层。（感觉是要替代掉 F1。）

F1 Query: Declarative Querying at Scale (2018)：https://storage.googleapis.com/pub-tools-public-publication-data/pdf/fa380016eccb33ac5e92c84f7b5eec136e73d3f1.pdf

F1 为了不让自己被干掉，将自己重新定位成 Google 内部统一的查询引擎，包括 OLTP 和 OLAP。底层数据源也不只是适配 Spanner。

Spanner 和 F1 论文的发布，开启了 NewSQL 世界的大门。个人感觉这 21 世纪以来到现在，Google 几乎成了是工业界分布式系统的“风向标”……著名的两个开源 NewSQL，TiDB 和 CockroachDB 都是 inspire by Spanner 和 F1。

5. Amazon 的 Aurora

Amazon Aurora: Design Considerations for High Throughput Cloud-Native Relational Databases (2017)：https://www.allthingsdistributed.com/files/p1041-verbitski.pdf
Amazon Aurora: On Avoiding Distributed Consensus for I/Os, Commits, and Membership Changes (2018)：https://1drv.ms/b/s!As90tzptTSB3g3kUDUVDwqm9rmAM

Aurora 也是一个非常经典的存储系统——设计的目标是云原生数据库。

来源：https://www.jianshu.com/p/1b9ba08e4b6c

系统设计 pdf dynamo

安科网

分布式系统设计经典论文

uileader

uileader

相关推荐

算法书籍分享：《机器学习系统设计》（源代码+PDF+书签）

从编程基础到系统设计，这份数据工程师面试宝典全都有

SAP CRM订单系统设计时关于用户权限(User Authorization)的一些考虑

高并发系统设计（六）：如何减少频繁创建数据库连接的性能损耗？

高并发系统设计（七）：【Mysql数据库的优化】主从读写分离、分库分表

高并发系统设计（四）：【系统设计目标②】系统怎样做到高可用？

图顶顶少年团——项目系统设计与数据库设计

『互联网架构』软件架构-软件系统设计（一）

Romax Nexus—机电一体传动系统设计与仿真平台

Romax Nexus—机电一体传动系统设计与仿真平台

智慧管廊综合管理系统设计方案

购物商城数据库设计-订单系统设计

系统设计、系统工程和系统架构的差异

爬虫系列之数据质量监控（二）：信源系统设计

关于\"高并发系统设计\"看这篇就够了，阿里、百度、美团都在用

安卓移动应用代码安全加固系统设计及实现

系统设计：基于角色的权限管理设计实现

基于Intel 8085处理器系统设计

基于Intel 8080处理器的系统设计

基于Intel 8008处理器的系统设计

uileader