详解基于本地存储的kvm虚拟机在线迁移

kvm虚拟机迁移分为4种

(1)热迁移基于共享存储

(2)热迁移基于本地存储

(3)冷迁移基于共享存储

(4)冷迁移基于本地存储

这里介绍的是基于本地存储的热迁移

动态块迁移版本要求

qemu版本要求  大于或等于0.12.1(centos6.7或以上都没问题)

rpm -qa|grep qemu
qemu-kvm-0.12.1.2-2.491.el6_8.1.x86_64
qemu-kvm-tools-0.12.1.2-2.491.el6_8.1.x86_64

目标宿主机:192.168.1.24  机器名:CQ-KVM01

源宿主机:192.168.1.26   机器名:CQ-KVM02

迁移使用tcp认证方式

kvm虚拟机名称,是一台跑nginx的虚拟机:CQ-NGINX01

1、配置libvirtd服务 源宿主机和目标宿主机都要执行

vi /etc/libvirt/libvirtd.conf
listen_tls = 0  
listen_tcp = 1
tcp_port = "16509"
listen_addr = "0.0.0.0"
auth_tcp = "none"
mdns_adv = 0

解释

  • listen_tls:关闭tls,默认是开启的
  • listen_tcp :开启tcp认证
  • tcp_port:tcp端口配置,默认端口是16509
  • auth_tcp:配置是否开启口令认证,默认不开启
  • mdns_adv:是否开启mdns组播,默认关闭
sed -i 's/^#listen_tls = 0/listen_tls = 0/' /etc/libvirt/libvirtd.conf
sed -i 's/^#listen_tcp = 1/listen_tcp = 1/' /etc/libvirt/libvirtd.conf
sed -i 's/^#tcp_port = \"16509\"/tcp_port = \"16509\"/' /etc/libvirt/libvirtd.conf
sed -i 's/^#listen_addr = \"192.168.0.1\"/listen_addr = \"0.0.0.0\"/' /etc/libvirt/libvirtd.conf
sed -i 's/^#auth_tcp = \"sasl\"/auth_tcp = \"none\"/' /etc/libvirt/libvirtd.conf
sed -i 's/^#mdns_adv = 1/mdns_adv = 0/' /etc/libvirt/libvirtd.conf
cat libvirtd.conf |grep -iE "listen_tls"
cat libvirtd.conf |grep -iE "listen_tcp"
cat libvirtd.conf |grep -iE "tcp_port"
cat libvirtd.conf |grep -iE "listen_addr"
cat libvirtd.conf |grep -iE "auth_tcp"
cat libvirtd.conf |grep -iE "mdns_adv"

2、配置libvirtd监听方式,无论是tcp,ssh,tls认证方式都需要配置 , 源宿主机和目标宿主机都要执行

vi /etc/sysconfig/libvirtd
LIBVIRTD_ARGS="--listen"

3、编辑/etc/libvirt/qemu.conf文件  源宿主机和目标宿主机都要执行

vi /etc/libvirt/qemu.conf
vnc_listen = "0.0.0.0"

解释

  • vnc_listen:使虚拟机带外VNC默认监听.0.0.0.0

4、重启libvirtd服务,使配置生效,  源宿主机和目标宿主机都要执行

/etc/init.d/libvirtd restart

5、检查端口和进程,libvirtd是否监听16509端口,  源宿主机和目标宿主机都要执行

netstat -lntp | grep libvirtd
tcp        0      0 0.0.0.0:16509               0.0.0.0:*                   LISTEN      48825/libvirtd   

修改iptables脚本,放行16509端口和49152端口

#ACCESS kvm
iptables -A INPUT -m state --state NEW -m tcp -p tcp --dport 5900:5909 -j ACCEPT
iptables -A INPUT -p tcp --dport 16509 -j ACCEPT
iptables -A INPUT -p tcp --dport 49152 -j ACCEPT

6、在源宿主机和目标宿主机加上IP和主机的解析

#24机器上
echo "192.168.1.26 CQ-KVM02" >> /etc/hosts
#26机器上
echo "192.168.1.24 CQ-KVM01" >> /etc/hosts

7、在源宿主机连接目标宿主机的libvirtd并查看虚拟机信息

virsh -c qemu+tcp://[email protected]:16509/system
virsh -c qemu+tcp://[email protected]:16509/system

8、在目标宿主机创建同样大小的镜像文件,路径、名称也要一样

要加上preallocation=metadata,否则使用virt-install命令安装完成后虚拟机磁盘镜像会变为raw格式

qemu-img create -f qcow2 -o preallocation=metadata /data/kvmimg/CQ-NGINX01.qcow2 100G

9、迁移 ,192.168.1.26为目标宿主机的内网IP,tcp认证方式,迁移时间有点长需要开一个screen窗口,不需要cd 到镜像文件所在目录

screen -S migratekvm
virsh migrate --live --copy-storage-all --unsafe --persistent CQ-NGINX01 qemu+tcp://[email protected]:16509/system

10、在目标宿主机执行,会显示paused状态 即是suspended状态

watch virsh list --all

11、在目标宿主机执行,显示迁移进度

tailf /var/log/libvirt/qemu/CQ-NGINX01.log

12、在目标宿主机执行,镜像文件目录为/data/kvmimg/,显示虚拟机镜像的大小,会看到虚拟机镜像会不断增大表示数据已经在迁移过来

注意创建镜像文件的时候要使用preallocation=metadata

cd /data/kvmimg/
watch du -h *

13、虚拟机迁移完成后,源宿主机为关机状态,目标宿主机变为running状态

virsh list --all #源宿主机
virsh list --all #目标宿主机

14、源宿主机删除xml配置文件

virsh destroy CQ-NGINX01
virsh undefine CQ-NGINX01

注意:

迁移过程中ping会有卡顿,有时会丢几个包,如果虚拟机中有部署数据库,应用程序最好有重连机制

回迁方法

建议不要删除源宿主机上的镜像文件,保留镜像文件

#在目标宿主机上执行 ,回迁到源宿主机

virsh dumpxml CQ-NGINX01 >~/CQ-NGINX01.xml
virsh migrate --live --copy-storage-all --unsafe --persistent CQ-NGINX01 qemu+tcp://[email protected]:16509/system

注意:

源宿主机和目标宿主机最好要保持硬件一致 ,这样迁移和回迁出问题的几率才能降到最低!

迁移速度和成功率和网络有很大关系,宿主机的网络尽量是万兆或千兆多网卡绑定,可以提高迁移速度和成功率

#限制迁移速度 为600M/s
virsh migrate-setspeed CQ-NGINX01 600

--------------------------------------------------------------------------------

在线迁移问题汇总

(如果ssh的端口不是默认22,可以写为 qemu+ssh://target:port/system)

Question 1:

error: internal error hostname on destination resolved to localhost, but migration requires an FQDN

解决办法很简单,因为默认情况下hostname 是 localhost,我们需要把目标的hostname修改一下,临时的也可以。

#hostname target

Question 2:
error: internal error Attempt to migrate guest to the same host 00020003-0004-0005-0006-000700080009

这个在mail list 中有大牛说是服务器提供商的问题,你可以用#dmidecode -s system-uuid 查看一下这个ID,理论上是#virsh sysinfo | grep uuid 及# virsh capabilities | grep uuid

这三个ID是一样的。(之前看论坛里发的解决方法是需要下载一个dmidecode 命令的文件去替换系统的,达到修改的目的,不过我只是修改了libvirt的配置文件就可以了,可能是版本的问题)

我们修改一下libvirtd的配置文件

#sed -i "/#host_uuid/ahost_uuid = \"`uuidgen`\"" /etc/libvirt/libvirtd.conf

重启一下libvirtd 服务

# /etc/init.d/libvirtd restart

然后再查看一下

# virsh capabilities | grep uuid

Question 3:

error: unable to set user and group to '107:107' on '/image/vmtest/disk.img': No such file or directory

如果顺利进入到这步的话,就很简单了,没有directory 直接创建一个就可以,没有disk.img 直接create一个

注:创建的磁盘应该和源虚拟机的磁盘是一样的大小(更大应该是可以)和格式(raw还是qcow2)

qemu-img create /image/vmtest/disk.img +sizeG

Question 4:

error: Unable to resolve address 'target' service '49155': Name or service not known

《《Name or service not known》》在/etc/hosts 添加解析的ip和target的域名即可

Question 5:

virsh migrate --live --copy-storage-all --unsafe --persistent CQ-NGINX01  qemu+tcp://[email protected]:16509/system

error: Unable to read from monitor: Connection reset by peer

可能目标宿主机和源宿主机内存不够

建议:目标宿主机和源宿主机上都关闭一些不必要的虚拟机把内存腾出来

也可以清空cache把内存腾出来

#清除cache 首先执行sync命令

sync
echo 3 > /proc/sys/vm/drop_caches

相关推荐