PHP实战经验之系统如何支撑高并发

huiyi00

2019-12-03

关注关注

高并发系统各不相同。比如每秒百万并发的中间件系统、每日百亿请求的网关系统、瞬时每秒几十万请求的秒杀大促系统。

他们在应对高并发的时候，因为系统各自特点的不同，所以应对架构都是不一样的。

另外，比如电商平台中的订单系统、商品系统、库存系统，在高并发场景下的架构设计也是不同的，因为背后的业务场景什么的都不一样。

最简单的系统架构

假设刚刚开始你的系统就部署在一台机器上，背后就连接了一台数据库，数据库部署在一台服务器上。

我们甚至可以再现实点，给个例子，你的系统部署的机器是 4 核 8G，数据库服务器是 16 核 32G。

此时假设你的系统用户量总共就 10 万，用户量很少，日活用户按照不同系统的场景有区别，我们取一个较为客观的比例，10% 吧，每天活跃的用户就 1 万。

按照 28 法则，每天高峰期算它 4 个小时，高峰期活跃的用户占比达到 80%，就是 8000 人活跃在 4 小时内。

然后每个人对你的系统发起的请求，我们算他每天是 20 次吧。那么高峰期 8000 人发起的请求也才 16 万次，平均到 4 小时内的每秒(14400 秒)，每秒也就 10 次请求。

好吧!完全跟高并发搭不上边，对不对?

然后系统层面每秒是 10 次请求，对数据库的调用每次请求都会有好几次数据库操作的，比如做做 crud 之类的。

那么我们取一个一次请求对应 3 次数据库请求吧，那这样的话，数据库层每秒也就 30 次请求，对不对?

按照这台数据库服务器的配置，支撑是绝对没问题的。上述描述的系统，用一张图表示，就是下面这样：

PHP实战经验之系统如何支撑高并发

数据库分库分表 + 读写分离

假设此时用户量继续增长，达到了 1000 万注册用户，然后每天日活用户是 100 万。

那么此时对系统层面的请求量会达到每秒 1000/s，系统层面，你可以继续通过集群化的方式来扩容，反正前面的负载均衡层会均匀分散流量过去的。

但是，这时数据库层面接受的请求量会达到 3000/s，这个就有点问题了。

此时数据库层面的并发请求翻了一倍，你一定会发现线上的数据库负载越来越高。

每次到了高峰期，磁盘 IO、网络 IO、内存消耗、CPU 负载的压力都会很高，大家很担心数据库服务器能否抗住。

没错，一般来说，对那种普通配置的线上数据库，建议就是读写并发加起来，按照上述我们举例的那个配置，不要超过 3000/s。

因为数据库压力过大，首先一个问题就是高峰期系统性能可能会降低，因为数据库负载过高对性能会有影响。

另外一个，压力过大把你的数据库给搞挂了怎么办?

所以此时你必须得对系统做分库分表 + 读写分离，也就是把一个库拆分为多个库，部署在多个数据库服务上，这是作为主库承载写入请求的。

然后每个主库都挂载至少一个从库，由从库来承载读请求。

此时假设对数据库层面的读写并发是 3000/s，其中写并发占到了 1000/s，读并发占到了 2000/s。

那么一旦分库分表之后，采用两台数据库服务器上部署主库来支撑写请求，每台服务器承载的写并发就是 500/s。

每台主库挂载一个服务器部署从库，那么 2 个从库每个从库支撑的读并发就是 1000/s。

简单总结，并发量继续增长时，我们就需要 focus 在数据库层面：分库分表、读写分离。

此时的架构图如下所示：

PHP实战经验之系统如何支撑高并发

缓存集群引入

接着就好办了，如果你的注册用户量越来越大，此时你可以不停的加机器，比如说系统层面不停加机器，就可以承载更高的并发请求。

然后数据库层面如果写入并发越来越高，就扩容加数据库服务器，通过分库分表是可以支持扩容机器的，如果数据库层面的读并发越来越高，就扩容加更多的从库。

但是这里有一个很大的问题：数据库其实本身不是用来承载高并发请求的，所以通常来说，数据库单机每秒承载的并发就在几千的数量级，而且数据库使用的机器都是比较高配置，比较昂贵的机器，成本很高。

如果你就是简单的不停的加机器，其实是不对的。

所以在高并发架构里通常都有缓存这个环节，缓存系统的设计就是为了承载高并发而生。

所以单机承载的并发量都在每秒几万，甚至每秒数十万，对高并发的承载能力比数据库系统要高出一到两个数量级。

所以你完全可以根据系统的业务特性，对那种写少读多的请求，引入缓存集群。

具体来说，就是在写数据库的时候同时写一份数据到缓存集群里，然后用缓存集群来承载大部分的读请求。

这样的话，通过缓存集群，就可以用更少的机器资源承载更高的并发。

比如说上面那个图里，读请求目前是每秒 2000/s，两个从库各自抗了 1000/s 读请求，但是其中可能每秒 1800 次的读请求都是可以直接读缓存里的不怎么变化的数据的。

那么此时你一旦引入缓存集群，就可以抗下来这 1800/s 读请求，落到数据库层面的读请求就 200/s。

同样，给大家来一张架构图，一起来感受一下：

PHP实战经验之系统如何支撑高并发

按照上述架构，它的好处是什么呢?

可能未来你的系统读请求每秒都几万次了，但是可能 80%~90% 都是通过缓存集群来读的，而缓存集群里的机器可能单机每秒都可以支撑几万读请求，所以耗费机器资源很少，可能就两三台机器就够了。

你要是换成是数据库来试一下，可能就要不停的加从库到 10 台、20 台机器才能抗住每秒几万的读并发，那个成本是极高的。

好了，我们再来简单小结，承载高并发需要考虑的第三个点：

不要盲目进行数据库扩容，数据库服务器成本昂贵，且本身就不是用来承载高并发的。
针对写少读多的请求，引入缓存集群，用缓存集群抗住大量的读请求。

引入消息中间件集群

接着再来看看数据库写这块的压力，其实是跟读类似的。

假如说你所有写请求全部都落地数据库的主库层，当然是没问题的，但是写压力要是越来越大了呢?

比如每秒要写几万条数据，此时难道也是不停的给主库加机器吗?

可以当然也可以，但是同理，你耗费的机器资源是很大的，这个就是数据库系统的特点所决定的。

相同的资源下，数据库系统太重太复杂，所以并发承载能力就在几千/s的量级，所以此时你需要引入别的一些技术。

比如说消息中间件技术，也就是 MQ 集群，它可以非常好的做写请求异步化处理，实现削峰填谷的效果。

假如说，你现在每秒是 1000/s 次写请求，其中比如 500 次请求是必须请求过来立马写入数据库中的，但是另外 500 次写请求是可以允许异步化等待个几十秒，甚至几分钟后才落入数据库内的。

那么此时你完全可以引入消息中间件集群，把允许异步化的每秒 500 次请求写入 MQ，然后基于 MQ 做一个削峰填谷。

比如就以平稳的 100/s 的速度消费出来，然后落入数据库中即可，此时就会大幅度降低数据库的写入压力。

此时，架构图变成了下面这样：

PHP实战经验之系统如何支撑高并发

大家看上面的架构图，首先消息中间件系统本身也是为高并发而生，所以通常单机都是支撑几万甚至十万级的并发请求的。

所以，它本身也跟缓存系统一样，可以用很少的资源支撑很高的并发请求，用它来支撑部分允许异步化的高并发写入是没问题的，比使用数据库直接支撑那部分高并发请求要减少很多的机器使用量。

而且经过消息中间件的削峰填谷之后，比如就用稳定的 100/s 的速度写数据库，那么数据库层面接收的写请求压力，不就成了 500/s + 100/s = 600/s 了么?

大家看看，是不是发现减轻了数据库的压力?到目前为止，通过下面的手段，我们已经可以让系统架构尽可能用最小的机器资源抗住了最大的请求压力，减轻了数据库的负担：

系统集群化。
数据库层面的分库分表+读写分离。
针对读多写少的请求，引入缓存集群。
针对高写入的压力，引入消息中间件集群。

初步来说，简单的一个高并发系统的阐述是说完了。但是，故事到这里还远远没有结束。

首先，高并发这个话题本身是非常复杂的，远远不是一些文章可以说的清楚的，它的本质就在于，真实的支撑复杂业务场景的高并发系统架构其实是非常复杂的。

比如说每秒百万并发的中间件系统、每日百亿请求的网关系统、瞬时每秒几十万请求的秒杀大促系统、支撑几亿用户的大规模高并发电商平台架构，等等。

为了支撑高并发请求，在系统架构的设计时，会结合具体的业务场景和特点，设计出各种复杂的架构，这需要大量底层技术支撑，需要精妙的架构和机制设计的能力。

最终，各种复杂系统呈现出来的架构复杂度会远远超出大部分没接触过的同学的想象。

但是那么复杂的系统架构，通过一些文章是很难说的清楚里面的各种细节以及落地生产的过程的。

其次，高并发这话题本身包含的内容也远远不止本文说的这么几个 topic：分库分表、缓存、消息。

一个完整而复杂的高并发系统架构中，一定会包含：

各种复杂的自研基础架构系统。
各种精妙的架构设计(比如热点缓存架构设计、多优先级高吞吐 MQ 架构设计、系统全链路并发性能优化设计，等等)。
还有各种复杂系统组合而成的高并发架构整体技术方案。
还有 NoSQL(Elasticsearch 等)/负载均衡/Web 服务器等相关技术。

所以大家切记要对技术保持敬畏之心，这些东西都很难通过一些文章来表述清楚。

数据库系统数据库

huiyi00

0 关注 0 粉丝 0 动态

关注关注

数据库系统简介

数据库系统=数据库+数据库管理系统+数据库应用程序。数据库管理系统：控制和管理数据库的获取的软件。在数据库系统之前，采用基于文件的系统。数据库将逻辑相关的数据集合在一起，最大程度减少数据副本，同时与程序分离，从而能解决基于文件的系统的问题。

bob于 2020-07-26

UML与数据库应用系统

定义由语义和表示法两部分组成，语义用自然语言描述，表示法定义了UML的可视化标准表示符号，这决定了UML是一种可视化的建模语言。主要目的是陈述活动与活动之间的流程控制和转移。类与类之间的关联是单向的，如人拥有小汽车。

wendan0 2020-06-18

查询 MySQL 实例上所有数据库/清屏

MySQL在Linux系统下，输入system clear即可完成清屏！

yongyoumengxiang 2020-05-05

CentOS 7 静默安装 Oracle 11g 11.2.0.2 数据库系统（一）

Oracle数据库是一个比较复杂的产品，安装过程中会遇到很多计划外的报错，一般建议通过配置响应脚本的方式进行静默安装。尽管Oracle的安装过程到月可以在1~2小时内完成，但安装前的系统环境准备和安装介质准备会花费较长时间。因此，即便是一个经验丰富的专业

wenjieyatou 2020-04-27

[db2数据库主从同步]db2 sync主从配置参数

　　db2 update db cfg for erpdb using hadr_local_host PrimaryNode-1. 　　db2 update db cfg for erpdb using hadr_local_svc db2h_erpin

thunderstorm 2020-04-22

[db2数据库主从同步]db2 sync主从配置参数

lightlanguage 2020-04-22

[java实时同步数据库]一种通用的数据库同步系统与实现技术方案

本发明专利技术是一种通用的数据库复制框架技术。该技术分为三个模块，捕捉模块用于捕捉抓取数据库的数据变化；数据过滤模块对从捕捉模块获取到的数据进行过滤、分拣、汇总；数据同步模块，将数据过滤模块产生的数据发送的目标端数据库。目前尚未检索到与本专利技术相同的解决

suixinsuoyu 2020-04-18

[es同步数据库]ES数据同步方案

当业务量上升后，由于mysql对全文检索或模糊查询支持的能力不强，在系统中查询的地方，往往会出现慢sql等，拖累系统其他模块，造成性能低下。随着ES使用普及率的升高，ES是mysql的一个有效补充。我们可以将数据发送到搜索引擎（如ES）上，由搜索引擎来提供

点滴技术生活 2020-04-16

手把手带你用数据库中间件Mycat+SpringBoot完成分库分表

垂直切分的最大特点就是规则简单，实施也更为方便，尤其适合各业务之间的耦合度非常低，相互影响很小，业务逻辑非常清晰的系统。报表系统，借助于 Mycat 的分表能力，处理大规模报表的统计；替代 Hbase，分析大数据；关于分库分表，Mycat已经帮我们在内部

thunderstorm 2020-04-10

041.SAP系统物料申请数据库

01.在SAP中，输入SE11事务代码，添加AUFK数据库，

nan00zzu 2020-03-06

数据库系统的组成

　　　　参与确定数据库正确运行，参与设计，存储结构和存取策略的设计，安全性和完整性，监控数据库的使用和运行，周期性运转数据库data和log文件，监视和对数据库改进和重组处理垃圾重新构建数据。

景泽元的编程 2020-03-04

数据库概论：1、（数据库系统概述）

　　　非结构化数据：如：所有格式的文档，文件，文本，图像，各类报表，音频，视频，传统的关系数据库主要是面向事物处理，传统的关系数据库擅长解决结构化数据管理问题。

daillo 2020-03-01

分布式系统ID的生成方法之UUID、数据库、算法、Redis、Leaf方案

一般单机或者单数据库的项目可能规模比较小，适应的场景也比较有限，平台的访问量和业务量都较小，业务ID的生成方式比较原始但是够用，它并没有给这样的系统带来问题和瓶颈，所以这种情况下我们并没有对此给予太多的关注。所以这一次，我们看看大厂都是怎么分析和解决这种I

Hashxu 2020-02-05

数据库连接池的工作机制

释放所造成的问题。为解决上述问题，可以采用数据库连接池技术。数据库连接池的基本思想就是为数据库连接建立一个“缓冲池”。预先在缓冲池中放入一定数量的连接，当需要建立数据库连接时，只需从“缓冲池”中取出一个，使用完毕之后再放回去。我们可以通过设定连接池最大连接

wintershii 2020-02-10

如何更改Linux(CentOS)系统下的MySQL数据库目录位置

如果数据库比较大的话，时间会比较长，可能会超时，具体怎么设置ssh不超时的办法，请大家自己找相关资料。所以用上面的命令即可，也简单。看下Mysql是否正常运行，如果能正常启动，那基本上就没什么问题了。

timewind 2020-01-17

Greenplum数据库中系统表gp_ distribution_ policy详解

gp_ distribution_ policy 表的分布键保存在gp_ distribution. policy 表中，

morexyoung 2019-12-26

Greenplum数据库中系统表pg_class详解

pg_ class 可以说是数据字典最重要的-一个表了，它保存着所有表、视图、序列、索引的原数据信息，每一个DDL/DML操作都必须跟这个表发生联系，

huolan 2019-12-26

Windows系统CMD窗口下，MySQL建库、还原数据库命令操作示例

使用下面的命令来导入sql文件，注意：要先执行use tjwindpower;命令，来选择要导入的数据库：

applex 2019-12-26

Ubuntu系统下MySQL数据库基本操作

Ubuntu系统下安装MySQL后,所有新创建的数据库的默认目录为/var/lib/mysql目录,以后用户自己创建的数据库默认就保存在这个目录下.在终端输入mysql回车后,启动mysql服务,可以开始输入命令了.下面介绍一些最基本的数据操作命令:

踩风火轮的乌龟 2019-12-22

NoSQL数据库实战从基本操作到高级技术和核心原理，再到项目开发

腾讯公司前资深后台工程师呕心沥血之作，大数据时代开发者必读佳品。详细讲解了NoSQL的兴起原因、CAP理论、副本之间数据一致性的解决方法和水平扩展方法，并介绍了NoSQL的分类、使用场景及其在实际开发中的技术选型。既对NoSQL系统的理论做了广泛而深入的

choice0 2019-12-14

安科网

PHP实战经验之系统如何支撑高并发

huiyi00

huiyi00

相关推荐

数据库系统简介

UML与数据库应用系统

查询 MySQL 实例上所有数据库/清屏

CentOS 7 静默安装 Oracle 11g 11.2.0.2 数据库系统（一）

[db2数据库主从同步]db2 sync主从配置参数

[db2数据库主从同步]db2 sync主从配置参数

[java实时同步数据库]一种通用的数据库同步系统与实现技术方案

[es同步数据库]ES数据同步方案

手把手带你用数据库中间件Mycat+SpringBoot完成分库分表

041.SAP系统物料申请数据库

数据库系统的组成

数据库概论：1、（数据库系统概述）

分布式系统ID的生成方法之UUID、数据库、算法、Redis、Leaf方案

数据库连接池的工作机制

如何更改Linux(CentOS)系统下的MySQL数据库目录位置

Greenplum数据库中系统表gp_ distribution_ policy详解

Greenplum数据库中系统表pg_class详解

Windows系统CMD窗口下，MySQL建库、还原数据库命令操作示例

Ubuntu系统下MySQL数据库基本操作

NoSQL数据库实战从基本操作到高级技术和核心原理，再到项目开发

huiyi00