性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能

文章转自:原创: 杨建旭,https://mp.weixin.qq.com/s/ZtwKmG3xCsTShJni6xTCmw

对于物理机来说,CPU有socket、Core、thread的概念,一个linux虚拟机上面同样有这些信息,这些信息是什么含义,和物理机之间有多少对应关系呢?如何分配CPU拓扑,会得到较好的性能?

物理CPU

首先介绍一下物理CPU的概念:

一个服务器可以有多个socket

一个socket(插槽)可以插一个chip。

一个chip里面可以有N个core(核)

一个核里面可以有1个CPU线程,如果开启超线程, CPU线程=核*2

下面是一个物理机的CPU信息

性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能

上面这些信息是x86 CPU。如果是Power的CPU,超线程可以一个核超出来2个、4个、8个(根据机器型号)。同时,还有一个drawer(抽屉)的概念。一个抽屉里面有N个socket,一个服务器可以有多个抽屉。

虚拟机的CPU

对于虚拟机来说,操作系统看到的CPU信息都是虚拟的,但操作系统认为他们是物理的。

查看虚拟机CPU的方法和物理机没什么区别,一般用lscpu或者cat /proc/cpuinfo来查看

拿一台虚拟的linux举例

性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能

这个是linux操作系统看到的CPU信息,linux操作系统并不知道自己跑在一个虚拟机上,虽然看到的CPU都是虚拟的,但linux认为这些都是真的,因此在进程调度上,也会按照这个信息去调度。

CPU(s): 8   :一共8个逻辑CPU,即8个vCPU

Thread(s) per core: 1:每个核有几个线程,分配虚拟机的时候,拓扑默认就是1

Core(s) per socket: 1:每个插槽(一个插槽可以插一个cpu chip)里面有几个核,分配虚拟机的时候,拓扑默认就是1

Socket(s): 8:有几个插槽(一个插槽可以插一个cpu chip)

这一段的信息是,该虚拟机一共有8个chip,每个chip里有1个核,每个核里有1个thread。这样就是8*1*1=8个thread,即8个逻辑CPU,即8个vCPU。

注:这里的socket、core都是虚的。

接下来,看cpuinfo里面的信息(和lscpu是一致的)

性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能

processor: 0 :虚拟CPU(vCPU)的ID,OS以为这是物理的,其实是虚拟的。这里的processor不是虚拟核,而是虚拟CPU线程。因为如果如果分配虚拟机的时候,虚拟核开启超线程(2),那么虚拟CPU线程=虚拟核*2

physical id: 0 :这个是虚拟socket(chip)的ID。在本例中,给虚拟机分配了8个sockets,那么physical id会有8个,分别是0-7.

siblings: 1 :一个虚拟socket上有多少虚拟CPU线程。如果=1,那么只有1个thread(processor)。说明这个socket上只有一个core,这个core里只有一个thread(processor)。

core id: 0 :这是虚拟core的id号,每个虚拟core可以有1个虚拟thread(processor),如果分配虚拟机的时候,虚拟核开启超线程(2),那么每个虚拟core可以有2个虚拟thread(processor)

cpu cores: 虚拟core的数量

收集全部cpuinfo的信息如下

性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能

CPU拓扑

即分配多少逻辑CPU,这些逻辑CPU是如何通过socket、core、超线程组合出来的。

分配虚拟机时,需要指定多少socket(插槽)、每个插槽有多少core,core有没有超线程。

不同的拓扑

同样是分配8个逻辑CPU,也可以采用其他的拓扑。

本例中,分配的方式我们再回顾一下

CPU(s):             8

Thread(s) per core:    1

Core(s) per socket:    1

Socket(s):           8

分配8个vCPU:该虚拟机一共有8个chip,每个chip里有1个核,每个核里有1个thread。这样就是8*1*1=8个thread,即8个vCPU。

换成拓扑B:

CPU(s):                     8

Thread(s) per core:    2

Core(s) per socket:    4

Socket(s):                  1

Cpuinfo对应的信息如下

性能优化调优 | 如何分配虚拟机CPU拓扑会得到较好的性能

换成拓扑C:

CPU(s):                     8

Thread(s) per core:    1

Core(s) per socket:    8

Socket(s):                  1

拓扑的排列组合还可以有很多其他方式。

不同的拓扑是否性能不同?

首先操作系统会看这个拓扑,在进程调度时为了保持亲和性,会优先把同一个进程调度到同一个core上,如果不能调度到同一个core,则尽量调度到同一个socket上。

虚拟化平台,也许也会倾向于把同一个虚拟core、虚拟socket调度到同一个物理core、物理socket上。至于具体到某个虚拟化平台(VMware、KVM、Hyper-V、Citrix)是怎么调度的,肯定是各有各的算法。

因此,如果想收获比较好的虚拟机性能表现,把虚拟机的CPU拓扑设置为和物理机一致,这样在亲和性保持上比较有利。如果不一致,就不利。

举一个不一致的例子。

物理机拓扑:2个sockets、每个socket有4个cores,每个core有一个thread。

虚拟机拓扑:1个sockets、每个socket有8个cores,每个core有一个thread。

在OS进程调度时,如果同一个进程不能调度到同一个虚拟core(名叫A)上,它会调度到同一个socket上其他core,OS一看拓扑,大家都在同一个socket,于是就随便调度到一个core(名叫F)。

而在物理机层面,这个8个虚拟core不可能调度到同一个socket(假设叫1)上,因为一个socket只有4个cores。结果,core(F)就被调度到Socket(名叫2)上了。

于是上下文切换的代价就明显增高。

阅读原文

相关推荐