初识Ansible自动化运维工具
前言
2010年左右1,当时系统多数运行在小型机上,如HP、Sun、IBM小型机,如某系统当时使用10台小型机,但随着业务量不断增长,前几年去IOE的火热进行,开源技术的不断发展,原先使用10台小型机的系统在如今可能已暴涨似增涨到使用百来台X86 Linux主机。
如何运维成百上千台的主机成为一个挑战,本人经历过如下3阶段:
- 延用管理小型机时的方法:编写shell脚本,而后通过scp拷贝到各台主机,最后ssh远程执行脚本,但此方法的弊端是:shell脚本很难重复运行,如若脚本中间环节报错,则脚本前面所做的事情需清理,费时费力;
- 使用puppet自动运维工具,其提供了一系列常用模块可用,但此工具过于复杂,其需在被管理主机安装agent,如其提供的模块未能满足管理需求,则扩展模块比较难2。
- 使用ansible自动运维工具,其同样提供了常用模块可用,但较于puppet轻量,无需在被管主机安装agent,其核心是通过ssh登录主机执行命令,使用方式简单,学习成本低。
最近一项目作者使用ansible批量管理了200多台PC Server,所做事情简单描述如下:
- 配置网卡主备绑定(bonding)并进行切换测试;
- 配置主机磁盘Raid,格式化磁盘,挂载文件系统,创建用户;
- 主机安装Jdk、Oracle客户端、TimesTen等客户端;
- 配置ZK、Weblogic、Redis等集群;
ansible为何如此强大且好用,作者决定使用实战方式带领初学者迅速掌握此工具,从入门到精通。
环境描述
本示例准备了两台虚拟机,操作系统版本为Centos 7.6,主机均采用最小化模式安装。
% cat /etc/redhat-release CentOS Linux release 7.6.1810 (Core) % cat /root/anaconda-ks.cfg ... %packages @^minimal @core kexec-tools ...
两主机IP地址如下:
% cat /etc/hosts 127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6 okd-l01 192.168.18.2 okd-i01 192.168.18.3
Ansible安装
对于非RHEL系列主机安装ansible可参考官方文档Installation Guide。
控制节点
okd-l01主机能连接英特网,下面将在此主机上安装ansible软件。
- ansible在epel源里,故先为系统配置epel源:
% rpm -ivh https://mirrors.tuna.tsinghua.edu.cn/epel/epel-release-latest-7.noarch.rpm
- 安装ansible:
% yum -y install ansible
- 执行如下命令查看当前版本:
% ansible --version ansible 2.7.5 config file = /etc/ansible/ansible.cfg configured module search path = [u'/root/.ansible/plugins/modules', u'/usr/share/ansible/plugins/modules'] ansible python module location = /usr/lib/python2.7/site-packages/ansible executable location = /usr/bin/ansible python version = 2.7.5 (default, Apr 9 2019, 14:30:50) [GCC 4.8.5 20150623 (Red Hat 4.8.5-36)]
被控节点
okd-l01与okd-i01均作为ansible被管主机,需满足如下条件:
- 机器必须开启ssh服务,控制节点必须能通过ssh连接到被控节点,而对于任何Linux发行版本来说,ssh都是默认开启的;
- 机器必须安装有python命令,索性的是centos 7即使最小化安装也会安装python 2.7;
主机若关闭了selinux(/etc/selinux/config文件中设置
SELINUX=disabled
并重启)则无需安装libselinux-python软件包,否则需安装此软件包以避免copy/file等模块报错。% yum -y install libselinux-python
运行第一个任务
假设我们需在远程主机okd-i01上创建/test目录,若采用ssh方式,我们可在okd-l01执行命令:
ssh 192.168.18.3 'mkdir /test'
那么,采用ansible如何做同样的事情呢?首先需将被控主机的主机名或ip地址写入到清单文件(inventory)中,作者在okd-l01上使用root用户3为本实验在/root/test目录下创建清单文件hosts4:
% mkdir /root/test && cd /root/test % echo 192.168.18.3 > hosts
如同ssh命令类似,我们其替换为ansible后执行如下命令即可:
ssh
命令替换为ansible
命令;-i hosts
参数指定清单文件名为hosts,而后紧接着输入ansible管理的被控主机ip地址;-a
参数后接执行的命令mkdir /test
;-k
参数提示输入被控主机的用户密码。
% ansible -i hosts 192.168.18.3 -a"mkdir /test" -k # 因作者采用root用户执行,故默认此命令将使用root连接到远程主机, # 此处需输入被控主机的ssh密码: SSH password: # 告警信息: [WARNING]: Consider using the file module with state=directory rather than running mkdir. If you need to use command because file is insufficient you can add warn=False to this command task or set command_warnings=False in ansible.cfg to get rid of this message. # 命令返回结果: 192.168.18.3 | CHANGED | rc=0 >>
如上为最简单的ansible使用方式,其仅是替换为之前运行的ssh命令,接下来作者将详细讲解用于生产时所需知晓的必要知识。
- 本人从10年进入电信业工作,经历过系统从几十台小型机迁移到上百台X86 PC Server或云计算虚拟化主机上的过程。 ↩
- 需掌握ruby语言知识。 ↩
- 可使用任何用户运行ansible命令。 ↩
- 文件名称随意,但建议名为hosts或inventory。 ↩