运维简介&Ansible详解
1. 运维工作简介
1.1 运维简述
1.1.1 运维工作
- 运维工作的核心任务:
- 发布、变更、故障处理
- 系统安装(物理机、虚拟机)--> 程序包安装、配置、服务启动 --> 批量操作 --> 程序发布 --> 监控
- 系统安装(物理机、虚拟机)
- 程序安装、配置、服务启动
- 批量操作(批量运行命令)
- 程序发布
- 监控
预发布验证:
- 新版本的代码先发布到服务器(跟线上环境配置完全相同,只是未接入到调度器)
程序发布:
- 不能影响用户体验
- 系统不能停机
- 不能导致系统故障或造成系统完全不可用
1.1.2 灰度发布
发布路径:
- /webapp/tuangou-1.1
- /web/app/tuangou
- /webapp/tuangou-1.2
在调度器上下线一批主机(maintanance) --> 关闭服务 --> 部署新版本的应用程序 --> 启动服务 --> 在调度器上启用这一批服务器
- 通过调度器将线上的一批服务器标记为down模式(软关闭,比如将权重调为0)(maintanance)
- 关闭相应服务
- 部署新版本的应用程序至目标位置
- 启动相关应用
- 调度主机上线
自动化灰度发布:脚本、发布平台
- 灰度发布:
- 基于主机
- 基于用户
一些专业名词:
- CI:持续集成
- CD:持续交付
- CD:持续部署
- 以上三个过程如果能够串联起来自动执行,就叫:DevOps
1.1.3 运维工具的分类
- agent:
- puppet、func
- agentless:
- ansible、fabric
- ssh
1.1.4 监控工具
不允许没有被监控的系统上线
- 监控数据采集:
- 用户行为日志
- 服务器性能
- 运行数据报告
- 监控管理:
- 异常报警
- 失效转移
- 自动优雅降级
1.1.5 运维工具的层次
- OS Provisioning:系统安装
- 物理机:PXE、Cobbler
- 虚拟机(云环境下):Image、Templates
- Configuration:
- puppet(ruby)
- saltstack(python)
- chef
- cfengine
- Command and Control:
- func
- ansible(python)
- fabric
1.1.6 运维工具图示
1.2 持续集成、持续交付、持续部署
1.2.1 集成、部署、交付
集成:
- 指软件个人研发的部分向软件整体部分交付,以便尽早发现个人开发部分的问题
部署:
- 代码尽快向可运行的开发/测试环节交付,以便尽早测试
交付:
- 指研发尽快向客户交付,以便尽早发现生产环节中存在的问题
- 如果等到所有东西都完成了才向下个环节交付,导致所有的问题只能在最后才爆发出来,解决成本巨大
持续:
- 每完成一个完整的部分,就向下个环节交付,发现问题可以马上调整,问题不会放大到其他部分和后面的环节
1.2.2 CI、CD
持续集成(CI):
- 开发人员提交了新代码之后,立刻进行构建、(单元)测试
- 根据测试结果,我们可以确定新代码和原有代码能否正确的集成在一起
持续交付(CD):
- 在持续集成的基础上,将集成后的代码部署到更贴近真实运行环境中(类生产环境)
- 如果代码没问题,可以继续手动部署到生产环境中
持续部署(CD):
- 在持续交付的基础上,把部署到生产环境的过程自动化
2. Ansible简介&模块详解
2.1 Ansible的安装&基本结构
2.1.1 ansible简介
- 模块化,调用特定的模块,完成特定的任务
- 基于python语言实现,由Paramiko、PyYAML和Jinja2三个关键模块
- 部署简单,agentless
- 主从模式
- 支持自定义模块
- 支持Playbook
- 幂等性
2.1.2 ansible的安装
- 安装:直接yum安装(epel、ansible)
- 配置文件:
- 配置文件:/etc/ansible/ansible.cfg
- 主机清单:/etc/ansible/hosts
- 在这个文件中定义要控制的主机
- 主程序:
- ansible
- ansible-playbook
- ansible-doc
2.1.3 ansible的使用
准备操作:
- ansible在使用前要先在/etc/ansible/hosts中定义要控制的主机
- 还要将Ansible Server的ssh公钥分发到各被管控节点上:
- ssh-keygen -t rsa -f ~/.ssh/id_rsa -N ""
- ssh-copy-id
- ssh-copy-id
- ssh-copy-id
- ssh-copy-id
- 然后就可以在主控server上进行控制了
ansible的简单使用格式:
- ansible HOST-PATTERN -m MOD_NAME -a MOD_ARGS -f FORKS -C -u USERNAME
- -m:指明模块
- -a:指明调用的模块参数
- -f:一批管控多少主机,这里的FORKS也可以在/etc/ansible/ansible.cfg文件中定义,可以将这个值改大点
- -C:--check,干跑,而不真正执行
- -u:指明用户名
- -c:指明连接方式,默认是smart,自动选择
- 使用示例:
- ansible 10.0.0.207 -m ping
- 测试10.0.0.207主机的连通性
- ansible all -m ping
- 测试在/etc/ansible/hosts中定义的所有主机的连通性
- ansible 10.0.0.207 -m ping
ansible的工作图示:
2.2 Ansible常用模块详解
2.2.1 获取模块列表
- ansible-doc -l
- 列出ansible所有支持的模块
- ansible-doc -s GROUP_NAME
- 查看对应模块的用法说明,例如ansible-doc -s group 查看group模块的用法说明
- ansible使用要点:
- 定义所期望的目标状态
- 操作必须是幂等的(所谓幂等就是指重复数次的结果是相同的)
2.2.2 group
- 作用:
- 管理用户组
- 模块参数:
- name=指定该用户组的组名
- gid=指定该用户组的gid
- system=指定该组是否为系统组,yes表示是,no表示不是系统组
- state=指定目标状态,present表示要创建出来,absent就表示要删除它
- 使用示例:
- 创建一个gid为3000的名叫mygrp的非系统组
- ansible all -m group -a "gid=3000 name=mygrp state=present system=no"
- 删除刚刚创建的那个组:
- ansible all -m group -a "gid=3000 name=mygrp state=absent system=no"
- 创建一个gid为3000的名叫mygrp的非系统组
2.2.3 user
- 作用:
- 管理用户账号
- 模块参数:
- name=指定用户名
- uid=指定用户uid
- group=指定用户的主组
- groups=指定用户的附加组
- home=指定用户家目录
- shell=指定用户登录的shell
- comment=指定对该用户的描述
- system=指定用户是否为系统用户yes或者no
- state=present或者absent
- 使用示例:
- ansible all -m user -a "uid=5000 name=mytestuser state=present groups=mygrp shell=/bin/bash"
2.2.4 copy
- 作用:
- 复制文件
- 从本机到目标主机,或者从远程主机到目标主机
- 模块参数:
- dest=指定的目标路径,如果源是一个目录,则目标必须是目录
- src=指定的源路径,如果源是目录,则默认就会做递归复制,这里如果结尾带了/ 则表示只复制目录中的内容,不带斜线则表示复制所有
- remote_src=可以指定远程的源路径
- owner=指定目标文件的属主
- group=指定目标文件的属组
- mode=指定目标文件的权限
- content=不使用src拷贝文件时,使用content直接指定文件内容(src和content必须有其一)
- 注意:
- 如果不指定属主属组,它是默认不变的,以哪个用户复制就以哪个用户来生成,
- 如果自己指明用户,要确保目标主机存在那个用户
- 使用示例:
- ansible all -m copy -a "src=/etc/fstab dest=/tmp/fstab mode=600"
- 也可以使用content生成文件:
- ansible all -m copy -a "content=‘hello world\n‘ dest=/tmp/hello.txt"
2.2.5 fetch
- 作用:
- 从远程主机上复制文件到本地
- 使用参数:
- dest=指定目标路径
- src=指定源路径
- fail_on_missing 远程主机如果没有文件则报错退出(在ansible2.4中已经默认就是yes了)
- 拉取过来之后会在本地保存成一个嵌套目录:
- ansible 10.0.0.205 -m fetch -a "src=~/test.txt dest=/tmp/"
- 在本地存储为:/tmp/10.0.0.205/root/test.txt
2.2.6 command
- 作用:
- 直接在远程主机上执行命令
- 注意:
- 对于这个模块,-a中的命令不用写成键值对形式,直接指定命令即可
- command模块使用时,-a中引号内的内容不使用shell来解析,所以要指明shell来解析(貌似指明了executable也没用)
- 使用参数:
- chdir=切换到指定的目录下去执行命令
- 注意:chdir不是幂等的,也就是说执行成功之后再执行就会失败
- executable=由哪个shell命令发起执行程序,可以指明一个新的shell
- chdir=切换到指定的目录下去执行命令
- 使用示例:
- 在每个远程主机上执行ifconfig命令:
- ansible all -m command -a "ifconfig"
- 切换目录后执行命令:
- ansible all -m command -a "chdir=/tmp mkdir hello.dir"
- 在每个远程主机上执行ifconfig命令:
2.2.7 shell
- 作用:
- 真正的执行shell命令的模块,可以识别命令行中的众多字符
- 注意:
- 这个模块可以实现众多真正shell命令行中的功能
- 使用参数及用法与command相同
- 识别shell命令行中的元字符的两种方法:
- ansible 10.0.0.205 -m shell -a "/bin/bash -c ‘ls -alh /tmp/wzhhg‘"
- ansible 10.0.0.205 -m shell -a "executable=/bin/bash ls -alh /tmp/wzhhg"
2.2.8 file
- 作用:
- 创建文件,真正意义上来说是修改文件属性的
- 使用示例:
- 在指定的路径下创建一个目录:
- ansible all -m file -a "path=/tmp/testhello.dir state=directory"
- 在指定的路径下创建一个文件:
- ansible all -m file -a "path=/tmp/testhello.txt state=file"
- 创建一个符号链接文件:
- ansible all -m file -a "src=/tmp/fstab path=/tmp/fstab.link state=link"
- 在指定的路径下创建一个目录:
2.2.9 cron
- 作用:
- 定义任务计划
- 使用参数:
- day=、hour=、minute=、month=、weekday= 指定的间隔时间,默认使用的是*,为空表示是*
- name=指明任务的名称,如果不指定名字,默认为None,删除的时候要指定名字,否则删不掉
- user=任务为哪个用户的
- state=任务是添加还是删除,present表示添加,absent表示删除,如果不写,默认就是present
- job=指明任务
- 使用示例:
- 每隔3分钟同步一次时间:(这里虽好指定name,以便以后方便调用)
- ansible all -m cron -a "minute=*/3 job=‘/usr/sbin/update 10.0.0.203 &> /dev/null‘"
- 删除刚刚添加的任务:
- ansible all -m cron -a "minute=*/3 job=‘/usr/sbin/update 10.0.0.203 &> /dev/null‘ name=None state=absent"
- 每隔3分钟同步一次时间:(这里虽好指定name,以便以后方便调用)
2.2.10 yum
- 作用:
- 安装程序包
- 使用参数:
- name=指明程序包名
- state=安装还是卸载,present、installed、latest都表示安装,absent、removed表示卸载
- disable_gpg_check:安装的过程中禁用密钥检测
- disablerepo=指明安装过程中禁用的某个仓库
- enablerepo=指明安装过程中开启的某个仓库
- 使用示例:
- 安装httpd包:ansible all -m yum -a "name=httpd state=installed"
2.2.11 service
- 作用:
- 管理服务
- 使用参数:
- name=指明服务命令,如果是CentOS7可以不用加.service
- enabled=是否设置为开机自启动,yes或者no
- runlevel=在哪些级别下开机自启动
- state=服务是启动还是关闭,started表示启动,stopped表示关闭,restarted表示重启,reloaded表示平滑重载
- pattern=指明的匹配格式,如果匹配到了这里指定的字符串就表示成功
- 使用示例:
- 启动nginx服务:ansible all -m service -a "name=nginx state=started"
2.2.12 script
- 作用:
- 执行脚本,自动把本地的脚本复制到远程主机上,并在远程主机上执行
- 使用参数:
- 直接指明脚本
- 使用示例:
- 将脚本复制到远程主机上并执行脚本
- ansible all -m script -a "/tmp/test.sh"
- 将脚本复制到远程主机上并执行脚本
2.2.13 ping
- 使用示例:
- ansible all -m ping --list-hosts
- 注意:
- 这里使用all表示ansible的hosts文件中定义的所有主机,这里也可以直接指定主机,或者用正则表达式匹配
- 这里使用--list-hosts可以列出适配出来的主机,不真正执行
3. Ansible之playbook详解
3.1 playbook简介
3.1.1 YAML格式简介
- 让每一台主机要执行的任务保存在一个文件中,这个文件组织成YAML格式
- YAML:是一个可读性高,用来表达数据序列的格式,它其实是一种标记语言
- Playbook:YAML格式,任务(task)
- 基本数据结构:
- 标量、数组、关联数组
3.1.2 Playbook的核心元素
- Hosts:主机(谁负责来唱这出戏)
- Tasks:任务列表(要唱哪几出戏)
- Variables:变量
- Templates:包含了模板语法的文本文件
- Handlers:由特定条件触发的任务,要触发handlers,只需要在某个任务上加上notify
- Roles:角色
3.1.3 playbook的基础组件
- hosts:运行指定任务的目标主机
- remote_user:在远程主机上执行任务的用户(在目标主机上以哪种用户的身份执行命令)
- sudo_user:sudo到哪个用户去执行
- tasks:任务列表
- 模块,模块参数
- 格式:
- action:module arguments
- module:arguments
- 注意:shell和command模块后面直接跟命令,而非键值对的参数列表
3.1.4 运行playbook的方式
测试操作:
- ansible-playbook --check
- 只检测可能会发生的改变,但不真正执行操作,干跑
- ansible-playbook --list-hosts
- 列出运行任务的主机
- ansible-playbook --syntax-check:
- 检查语法,真正的检查语法
ansible-playbook:
- -C:--check,检查语法,这里是干跑一遍
- --list-hosts:列出相关主机
- --list-tasks:列出所有任务
- --list-tags:列出所有标签
- --syntax-check:检查语法
特别注意:
- 如果有一个任务在某一主机上停止了,则所有任务在所有主机上都无法完成
- 它是按任务分派给所有主机,先执行第一个,再执行第二个,再执行第三个,一次类推
3.2 playbook文件详解
3.3 playbook高级用法
4. Ansible之role角色详解
相关推荐
laisean 2020-09-27
onepiecedn 2020-10-29
guchengxinfen 2020-10-12
houdaiye 2020-09-23
逆时针 2020-08-19
pzczyy 2020-08-19
annan 2020-08-02
hpujsj 2020-07-26
annan 2020-07-18
annan 2020-06-20
逆时针 2020-06-14
逆时针 2020-06-14
awoyaoc 2020-06-12
逆时针 2020-06-09
piaotiejun 2020-06-07
awoyaoc 2020-06-07
BraveWangDev 2020-06-05