程序员，岂能被网站吞吐量难住？

Walkerhau

2019-04-17

程序员，岂能被网站吞吐量难住？

作者 | 菜菜

责编 | 郭芮

本文系作者投稿，版权归作者所有

YY妹：菜菜哥，有个事你还得帮我（苦笑一下）.....前几天写了几个接口，领导让提高一下接口吞吐量。

菜菜：这是你技术提高的大好机会呀！

YY妹：可吞吐量具体是什么？怎么提高呢？

菜菜：来，哥给你解释一番。

什么是吞吐量？

吞吐量是指对网络、设备、端口、虚电路或其他设施，单位时间内成功地传送数据的数量（以比特、字节、分组等测量）。

以上的定义比较宽泛，定义到网站或者接口的吞吐量是这样的：吞吐量是指系统在单位时间内处理请求的数量。这里有一个注意点就是单位时间内，对于网站的吞吐量这个单位时间一般定义为1秒，也就是说网站在一秒之内能处理多少HTTP（HTTPS/TCP）请求。与吞吐量对应的衡量网站性能的还有响应时间、并发数、QPS每秒查询率。

响应时间是一个系统最重要的指标之一，它的数值大小直接反应了系统的快慢。响应时间是指执行一个请求从开始到最后收到响应数据所花费的总体时间。
并发数是指系统同时能处理的请求数量，这个也是反应了系统的负载能力。
每秒查询率(QPS)是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准，在因特网上，作为域名系统服务器的机器的性能经常用每秒查询率来衡量。对应fetches/sec，即每秒的响应请求数，也即是最大吞吐能力。

我们以高速收费站为例子也许更直观一些，吞吐量就是一天之内通过的车辆数，响应时间就是车速，并发数就是高速上同时奔跑的汽车数。由此可见其实以上几个指标是有内在联系的。比如：响应时间缩短，在一定程度上可以提高吞吐量。

其实以上几个指标主要反映了两个概念：

系统在单位时间之内能做多少事情；
系统做一件事情需要的时间。

提高吞吐量

以下场景都是在假设程序不发生异常的情况下。

服务器（进程）级别

服务器级别增加网站吞吐量也是诸多措施中最容易并且是效果最好的，如果一个网站能通过增加少量的服务器来提高吞吐量，应该优先采用。

毕竟一台服务器的费用相比较一个程序员费用来说要低的多。但是有一个前提，就是你的服务器是系统的瓶颈，网站系统之后的其他系统并非瓶颈。

如果你的系统的瓶颈在DB或者其他服务，盲目的增加服务器并不能解决你的问题。

通过增加服务器来解决你的网站瓶颈，意味着你的网站需要做负载均衡，如果没有运维相关人员，你可能还得需要研究负载均衡的方案，比如LVS、Nginx、F5等。

我曾经面试过很多入道不久的同学，就提高吞吐量问题，如果没有回答上用负载均衡方案的基本都PASS了。

不要说别的，这个方案就是一个基础，就好比学习一个语言，你连最基本的语法都不会，我凭什么让你通过？

其实现在很多静态文件采用CDN，本质上也可以认为是增加服务器的策略。

线程级别

当一个请求到达服务器并且正确的被服务器接收之后，最终执行这个请求的载体是一个线程。

当一个线程被CPU载入执行其指令的时候，在同步的状态下，当前线程会阻塞在那里等待CPU结果，如果CPU执行的是比较慢的IO操作，线程会一直被阻塞闲置很长时间，这里的很长是对比CPU的速度而言。

当一个新的请求到来的时候，如果没有新的线程去领取这个任务并执行，要么会发生异常，要么创建新的线程。

线程是一种很稀缺的资源，不可能无限制的创建。这种情况下我们就要把线程这种资源充分利用起来，不要让线程停下来。这也是程序推荐采用异步的原因。

试想，一个线程不停的在工作，遇到比较慢的IO不会去等待结果，而是接着处理下一个请求，当IO的结果返回来得到通知的时候，线程再去取IO结果，岂不是能在相同时间内处理更多的请求。

程序异步化（非阻塞）会明显提高系统的吞吐量，但是响应时间可能会稍微变大。

还有一点，尽量减少线程上下文在CPU的切换，因为线程上线文切换的成本也是比较大的，在线程切换的时候，CPU需要把当前线程的上下文信息记录下来用以下次调用的时候使用，然后把新线程的上下文信息载入然后执行。这个过程相对于CPU的执行速度而言，要慢很多。

不要拿Golang反驳以上观点，Golang的协程虽然是用户级别比线程更小的载体，但是最终和CPU进行交互的还是线程。

CPU级别

在讲CPU级别之前，如果有一定的网络模型的基础，也许会好一些。这里大体阐述一下，现代操作系统都采用虚拟寻址的方式，它的寻址空间（虚拟存储空间）为4G（2的32次方）。操作系统将虚拟空间分为两类：内核空间和用户空间。

内核空间独立于用户空间，有访问受保护的内存空间、IO设备的权限（所有的用户空间共享）。

用户空间就是我们的应用程序运行的空间，其实用户空间并没有操作各种IO设备的权限，像我们平时读取一个文件，本质上是委托内核空间去执行读取指令的，内核空间读取到数据之后再把数据复制到程序运行的空间，最后应用程序再把数据返回调用方。

程序员，岂能被网站吞吐量难住？

通过上图大体可以看出，内核会为每个I/O设备维护一个buffer（同一个文件描述符读和写的buffer不同），应用程序发出一个IO操作的指令其实通过了内核空间和用户空间两个部分，并且发生了数据的复制操作。这个过程其实主要包含两个步骤：

用户进程发出操作指令并等待数据；
内核把数据返回给用户进程（buffer的复制操作）。

根据这两个操作的不同表现，所以IO模型有了同步阻塞，同步非阻塞，异步阻塞，异步非阻塞的概念，但是这里并非此文的重点，所以不在展开详细介绍。

利用CPU提高系统吞吐量主要目标是提高单位时间内CPU运行的指令数，避免CPU做一些无用功：

cpu负责把buffer的数据copy到应用程序空间，应用程序再把数据返回给调用方，假如这个过程发生的是一次Socket操作，应用程序在得到IO返回数据之后，还需要网卡把数据返回给client端，这个过程又需要把刚刚得到的buffer数据再次通过内核发送至网卡，通过网络传送出去。由此可见cpu把buffer数据copy到应用程序空间这个过程完全没有必要，在内核空间完全可以把buffer数据直接传输至网卡，这也是零拷贝技术要解决的问题。具体的零拷贝技术在这里不再展开。
不要让任何设备停下来，不要让任何设备做无用功。
通过增加cpu的个数来增加吞吐量。

网络传输级别

至于网络传输级别，由于协议大部分是TCP/IP，所以在协议传输方面优化的手段比较少，但是应用程序级别协议可以选择压缩率更好的，比如采用grpc会比单纯的HTTP协议要好很多，HTTP2 要比HTTP 1.1要好很多。

另外一方面网卡尽量加大传输速率，比如千兆网卡要比百兆网卡速度更快。由于网络传输比较偏底层，所以人工干预的切入点会少很多。

最后总结

大部分程序员都是工作在应用层，针对应用级别代码能提高吞吐量的建议：

加大应用的进程数，增加并发数，特别在进程数是瓶颈的情况下；
优化线程调用，尽量池化；
应用的代码异步化，特别是异步非阻塞式编程对于提高吞吐量效果特别明显；
充分利用多核CPU优势，实现并行编程；
减少每个调用的响应时间，缩短调用链，例如通过加索引的方式来减少访问一次数据库的时间。

吞吐量网站服务器线程阻塞程序员线程响应时间

Walkerhau

0 关注 0 粉丝 0 动态

相关推荐

性能测试方法和应用

并发用户数、响应时间、系统吞吐量，这三个名词的含义可能就已经让你感觉云里雾里了，因此我会通过一个我们日常生活中的体检为例，再来解释一下它们到底是什么，以及它们之间的关系和约束。在体检中心做检查的过程，通常是先到前台登记个人信息并领取体检单，然后根据体检单的

today0 2020-05-04

服务器性能测试

首先对吞吐量（）、QPS、并发数、响应时间几个概念一直比较模糊，也不知道哪些指标可以较好的衡量系统的性能。今天特意查了些资料做一些记录：首先看一些概念。　　响应时间是指系统对请求作出响应的时间。当然，往往也需要对每个或每组功能讨论其平均响应时间和最大响应时

HappinessCat 2020-03-03

网络测试工具--Iperf、Netperf 、MZ

可用性响应时间网络利用率网络吞吐量网络带宽容量。测试网络性能的第一步是确定网络是否正常工作，最简单的方法是使用 ping 命令。通过向远端的机器发送 icmp echo request，并等待接收 icmp echo reply 来判断远端的机器是否连通，

abdstime 2019-11-05

jMeter 测试结果分析

我们可以看到，通过这份报告我们就可以得到通常意义上性能测试所最关心的几个结果了。90% Line -- 所有transaction中90%的transaction的响应时间都小于xx

Seleton 2018-09-20

jMeter 测试结果分析

我们可以看到，通过这份报告我们就可以得到通常意义上性能测试所最关心的几个结果了。90% Line -- 所有transaction中90%的transaction的响应时间都小于xx

xiechao000 2018-09-20

使用Keepalive提高吞吐量

keepalive 32指的是要保持的连接数,把一部分连接保持为长连接,那么就可以减少连接创建的消耗

luciuschan 2020-05-05

kafka 吞吐量为什么这么大？

batch 发送，batch 存储，batch 拉取。kafka-consumer-groups.bat --bootstrap-server localhost:9092 --reset-offsets --execute --group zhang-w

amwayy 2020-05-01

浅谈架构：kafka高吞吐量之消息压缩

保证kafka高吞吐量的另外一大利器就是消息压缩。就像上图中的压缩饼干。压缩即空间换时间，通过空间的压缩带来速度的提升，即通过少量的cpu消耗来减少磁盘和网络传输的io。kafka不会直接操作单条消息，而是直接操作一个消息集合。1, 抽取了消息的公共部分放

那年夏天0 2020-04-26

kafka高吞吐量之消息压缩

保证kafka高吞吐量的另外一大利器就是消息压缩。就像上图中的压缩饼干。压缩即空间换时间，通过空间的压缩带来速度的提升，即通过少量的cpu消耗来减少磁盘和网络传输的io。kafka不会直接操作单条消息，而是直接操作一个消息集合。1, 抽取了消息的公共部分放

amwayy 2020-04-25

ActiveMQ、RabbitMQ、RocketMQ、Kafka有什么优点和缺点

　　　　现在社区以及国内应用都越来越少，官方社区现在对ActiveMQ 5.x维护越来越少，几个月才发布一个版本。　　　　erlang语言开发，性能极其好，延时很低；　　如果是大数据领域的实时计算、日志采集等场景，用Kafka是业内标准的，绝对没问题，社区

方新德 2019-12-14

Kafka、RabbitMQ、RocketMQ等消息中间件的介绍和对比（转）

前言在分布式系统中,我们广泛运用消息中间件进行系统间的数据交换,便于异步解耦。现在开源的消息中间件有很多,前段时间产品 RocketMQ 也顺利开源,得到大家的关注。概念MQ简介MQ,Message queue,消息队列，就是指保存消息的一个容器。MQ特

qingyuerji 2019-11-04

搭建高吞吐量 Kafka 分布式发布订阅消息集群

搭建高吞吐量 Kafka 分布式发布订阅消息集群简介Kafka 是一种高吞吐的分布式发布订阅消息系统，能够替代传统的消息队列用于解耦合数据处理，缓存未处理消息等，同时具有更高的吞吐率，支持分区、多副本、冗余，因此被广泛用于大规模消息数据处理应用。Kafk

xianyuxiaoqiang 2019-06-21

如何为Kafka集群选择合适的Topic/Partitions数量

本文的目的是介绍与本问题相关的一些重要决策因素，并提供一些简单的计算公式。在consumer段，kafka只允许单个partition的数据被一个consumer线程消费。综上所述，通常情况下，在一个Kafka集群中，partition的数量越多，意味着可

猫咪的一生 2018-07-24

伯克利开源Confluo：吞吐量比Kafka高4到10倍！

伯克利 RISE 实验室又有新动作，最近开源了一个多数据流实时分布式分析系统 Confluo。作为时序数据库，它的性能比其他时序数据库高出数倍，而作为发布消息订阅系统，它的吞吐量比 Kafka 高出 4 到 10 倍。Confluo 通过为多数据流的一些专

liuxiaocong 2018-12-14

系统吞吐量（TPS）、用户并发量、性能测试概念和公式

一．系统吞度量要素：一个系统的吞度量与request对CPU的消耗、外部接口、IO等等紧密关联。单个reqeust 对CPU消耗越高，外部系统接口、IO影响速度越慢，系统吞吐能力越低，反之越高。关键路径是有CPU运算、IO、外部系统响应等等组成。我们在做系

老道长的测试生活 2018-11-14

高吞吐量的分布式发布订阅消息系统Kafka

Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者规模的网站中的所有动作流数据。这种动作是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。Kafka的目的是通过Hadoop的并行加载机

hannuotayouxi 2016-06-06

Kafka 高吞吐量性能揭秘

kafka作为时下最流行的开源消息系统，被广泛地应用在数据缓冲、异步通信、汇集日志、系统解耦等方面。相比较于RocketMQ等其他常见消息系统，Kafka在保障了大部分功能特性的同时，还提供了超一流的读写性能。如果在Heap内管理缓存，JVM的GC线程会频

luenxin 2016-03-09

高吞吐量系统设计优化建议

高吞吐量系统举一个例子，我们做项目需要安排计划，每一个模块可以由多人同时并行做多项任务，也可以一个人或者多个人串行工作，但始终会有一条关键路径，这条路径就是项目的工期。关键路径由 CPU 运算、IO、外部系统响应等等组成。缓冲缓冲区是一块特定的内存区域，

istupid 2015-08-28

redis通过pipeline提升吞吐量的方法

简单介绍 redis pipeline 的机制，结合一段实例说明pipeline 在提升吞吐量方面发生的效用。应用系统在数据推送或事件处理过程中，往往出现数据流经过多个网元；一次数据推送会对 redis 产生近30次读写操作！优化过程主要针对业务代码做的

零 2019-04-02

系统吞吐量、TPS（QPS）、用户并发量、性能測试概念和公式

一个系统的吞度量与request对CPU的消耗、外部接口、IO等等紧密关联。单个reqeust对CPU消耗越高，外部系统接口、IO影响速度越慢。一个典型的上班签到系统，早上8点上班。7点半到8点这30分钟的时间里用户会登录签到系统进行签到。公司员工为100

清醒疯子 2018-05-08

Walkerhau

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号