资深架构师利用5个阶段,完美诠释分布式架构的过程!
一个成熟的大型网站架构并不是一开始就设计的非常完美,也不是一开始就具备高性能、高可用、安全性等特性,而是随着用户量的增加,业务功能的扩展逐步完善演变过来的。在这个过程中,开发模式、技术架构等都会发生非常大的变化。而针对不同业务特征的系统,会有各自的侧重点,比如像淘宝这类的网站,要解决的是海量商品搜索、下单、支付等问题;腾讯,要解决的是数亿级别用户的实时消息传输;百度所要解决的是海量数据的搜索。
架构是演变而来的,不是设计出来的。没有最好的架构,只有最适合的架构。
下面以一个简单的电商系统为例,当数据量、访问量提升,观察这个系统可能会发生的结构变化。假如我们系统具备以下功能:用户模块(用户注册和管理),商品模块(商品展示和管理),交易模块(创建交易及支付结算)。
阶段一,单应用架构
网站的初期也可以认为是互联网发展的早起,我们经常会在单机上跑我们所有的程序和软件。把所有软件和应用都部署在一台机器上,这样就完成一个简单系统的搭建,这个时候的讲究的是效率。
阶段二,应用服务器和数据库服务器分离
随着网站的上线,访问量逐步上升,服务器的负载慢慢提高,在服务器还没有超载的时候,我们应该做好规划,提升网站的负载能力。假如代码层面的优化已经没办法继续提高,在不提高单台机器的性能,增加机器是一个比较好的方式,投入产出比非常高。这个阶段增加机器的主要目的是将web 服务器和数据库服务器拆分,这样不仅提高了单机的负载能力,也提高了容灾能力。
阶段三,应用服务器集群
随着访问量的继续增加,单台应用服务器已经无法满足需求。在假设数据库服务器还没有遇到性能问题的时候,我们可以增加应用服务器,通过应用服务器集群将用户请求分流到各个服务器中,从而继续提升负载能力。此时多台应用服务器之间没有直接的交互,他们都是依赖数据库各自对外提供服务。
架构发展到这个阶段,各种问题也会慢慢呈现,比如用户请求由谁来转发到具体的应用服务器,这时候可能会出现下面的架构模型。
阶段四,数据库读写分离
当数据库压力变大时,那么怎么去提高数据库层面的负载呢?有了前面的思路以后,自然会想到增加服务器。但是假如我们单纯的把数据库一分为二,然后对于后续数据库的请求,分别负载到两台数据库服务器上,那么一定会造成数据库不统一的问题。所以我们一般先考虑读写分离的方式。
阶段五,使用搜索引擎缓解读库的压力
数据库做读库的话,常常对模糊查找效率不是特别好,像电商类的网站,搜索是非常核心的功能,即便是做了读写分离,这个问题也不能有效解决。那么这个时候可以引入搜索引擎,使用搜索引擎能够大大提高我们的查询速度。
想要学习Dubbo框架、zookeper基本原理、redis分布式缓存、JVM性能优化,Nginx+apache+Tomcat集群部署、大数据hadoop,Hbase实时计算spark、storm、数据分析分词和权重等核心技术;需要的可以关注之后私信哈,记得要点赞转发噢!!!