我是一块硬盘-我伤不起 (为什么要用分布式架构)
1.1 从一个故事说起
1.2 分布式架构的由来
1.3 什么是分布式架构
1.4 分布式架构的应用
1.5 小张讲解
1.1 从一个故事说起
我是一块硬盘,我很勤奋,一天到晚不停的运转,一直转个不停,但是我我总是拖大伙的后退,终于有一天我的身体发出了“咯吱咯吱”的声音,随之而来的的我一阵剧痛,我病倒了,我不能转了,这次我病的不轻,隐隐约约听到外面工程师讨论的声音:
“双11 来了,害得我们还要加班过来巡检机房”,我多么想向他们进行呼救啊,我奋力发出红色的指示灯让他们看到我,救救我!
“看,有块硬盘坏掉了” 有一位工程师说道,
“这下完蛋了,我们公司的小张商城肯定是挂掉了,平时都好好的,双11怎么这样的呢”另一位说道,
双11 陡增的访问量 让我 的工作-读写硬盘 不堪重负啊。
电商以及移动互联网的兴起也让我们的系统架构朝着分布式架构迈进,而分布式架构也是云架构的基础。
云计算、大数据技术的兴起,让分布式架构的设计变得越来越重要了。
1.2 分布式架构的由来
从上面的故事我们可以看出,硬件系统的瓶颈大部分来自于硬盘IO, 硬盘的读写比其他部件,例如:硬盘比内存要慢几万倍左右,
这个时候有两种解决方案:
1. 提高硬盘读写效率
2. 提供多块硬盘并行读写
我们来分析一下这两种方式的不同:
第一种方式
就是用 更好的硬件,更高的配置
现在我们常用的硬盘是 机械硬盘
机械硬盘的工作方式是由磁头臂带动磁头在磁盘上运动的原理来进行数据读取的。
而采用SSD固态硬盘,存储速率可以提升2倍以上,效率提升是明显的。
PS: 家里有老式的电脑,开机慢的可以考虑换一块固态硬盘,体验10秒开机的飞一般的感觉。
附上一张 机械硬盘 与 固态硬盘 的数据读取测试表
貌似这是解决问题的一种方式,但是整体性能只提升了2倍而已,如果更多的访问量以及并发过来读写硬盘怎么办呢
好像是无解了,只能苦逼的等待开发出新的先进的硬盘出来,
可是我们是商业项目啊,也要考虑成本啊,不考虑成本的话,直接买台 银河一号 超级计算机过来 ,啥都解决了,是不
第二种方式
这个时候有人提出来一个概念:人多力量大
俗话说:三个臭皮匠抵得上一个诸葛亮
我们拿三块机械硬盘共同协作工作 , 他的综合性能指标已经超过了一块SSD固态硬盘,
更大优点在于:理论上有无限的水平扩展性,我可以加10块,20块,100块 机械硬盘,远远超过一块SSD固态硬盘性能好多倍,
并且价格低廉。
这就是分布式的基本思想:三个臭皮匠抵个诸葛亮。
我们把这个概念放大一下,用到服务器上,就是 多台服务器之间的协做了,原理和基本思想是一样的,但是处理的事情就复杂很多
我们把处理事情的应用不同,又分为:分布式文件系统,分布式缓存系统,分布式数据库,分布式WebService,分布式计算 等等
技术架构都是根据实际应用慢慢演化的,
就像小张一样,小张老师现在开办第一期分布式架构班,如果以后学员多了,小张老师要
同时对多个班上课怎么办呢,办法一就是小张老师变的强大,可以一对多的上课,同时对两个班上课还行,再多了估计小张变superman
才行啊
另一个办法就是 小张变身(也就是正在培养成为Leader的你们),以后小张可以和你们一同对多个班同时上课,这样有更多的Leader
就可以开办更多的班,水平扩展性好.
1.3 什么是分布式架构
这一节我们来学习下理论,什么是分布式架构:
分布式系统(distributed system)是建立在网络之上的软件系统。
正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。
因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。
内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。
透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。
在分布式数据库系统中,用户感觉不到数据是分布的,即用户不须知道关系是否分割、有无副本、数据存于哪个站点以及事务在哪个站点上执行等。
简单来讲:在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体,就好像是一个系统似的。
分布式系统作为一个整体对用户提供服务,而整个系统的内部的协作用户来说是透明的,用户就像是在使用一个MySQL一样。
在接下来的课程中我们将会以分布式MySQL中间件-Mycat为实例,来讲解分布式系统的构建以及如何处理大并发大数据量的构架。
1.4 分布式架构的应用
在1.2 节中,有说到 :分布式系统是根据不用的应用层面来建立的
所有就有 分布式文件系统,分布式缓存系统,分布式数据库,分布式WebService,分布式计算 这些
我们来举例说明:
分布式文件系统: 出名的有 Hadoop 的HDFS ,还有 google的 GFS , 淘宝的 TFS 等
分布式缓存系统:memcache , hbase , mongdb 等
分布式数据库 : MySQL , Mariadb, PostgreSQL 等
而我们已分布式MySQL数据库中间件MyCat 为实例,来深入分布式系统,
MySQL 在现在电商以及互联网公司的应用非常多,一个是因为他的免费开源,另外一个原因是因为分布式系统
的水平可扩展性,随着移动互联网用户的暴增,互联网公司,像淘宝,天猫,唯品会等电商都采用分布式系统应对
用户的高并发量以及大数据量的存储。
而在Mycat的商业案例中,有对中国移动的账单结算项目中,应用实时处理高峰期每天2亿的数据量,
在对物联网的项目中,实现处理高达26亿的数据量,并提供实时查询的接口。
通过对MyCat的学习,加深分布式系统架构的理解,
以及分布式相关的技术,分布式一致性ZooKeeper服务, 高可用HAProxy/keepalived等相关应用。
1.5 小张讲解
1> 集群 与 分布式
2> 负载均衡
3> 分布式相关的高可用、容灾等名词解释
4> Mycat 中间件学习抢先看