Ansible概述
Ansible是一个配置管理系统configuration management system
python 语言是运维人员必须会的语言
ansible 是一个基于python 开发的自动化运维工具
其功能实现基于ssh远程连接服务
ansible 可以实现批量系统配置,批量软件部署,批量文件拷贝,批量运行命令等功能
除了ansible之外,还有saltstack 等批量管理软件
Ansible能做什么
ansible可以帮助我们完成一些批量任务,或者完成一些需要经常重复的工作。
比如:同时在100台服务器上安装nginx服务,并在安装后启动服务。
比如:将某个文件一次性拷贝到100台服务器上。
比如:每当有新服务器加入工作环境时,你都要为新服务器部署某个服务,也就是说你需要经常重复的完成相同的工作。
这些场景中我们都可以使用到ansible。
Ansible软件特点
1.ansible不需要单独安装客户端,SSH相当于ansible客户端。
2.ansible不需要启动任何服务,仅需安装对应工具即可。
3.ansible依赖大量的python模块来实现批量管理。
4.ansible配置文件/etc/ansible/ansible.cfg
Ansible基础架构
1.连接插件(connectior plugins) 用于连接主机 用来连接被管理端
2.核心模块(core modules) 连接主机实现操作, 它依赖于具体的模块来做具体的事情
3.自定义模块(custom modules) 根据自己的需求编写具体的模块
4.插件(plugins) 完成模块功能的补充
5.剧本(playbooks)ansible的配置文件,将多个任务定义在剧本中,由ansible自动执行
6.主机清单(host inventory)定义ansible需要操作主机的范围
最重要的一点是 ansible是模块化的 它所有的操作都依赖于模块
不需要单独安装客户端(no agents),基于系统自带的sshd服务,sshd就相当于ansible的客户端
不需要服务端(no sever)
需要依靠大量的模块实现批量管理
配置文件 /etc/ansible/ansible.cfg (前期不用配置)
ansible中查看模块
[root@m01 ~]# ansible-doc -l 列出所有模块信息 [root@m01 ~]# ansible-doc -s cron 参看指定模块的帮助Ansible部署与使用
ansible命令语法格式
[root@m01 ~]# ansible nfsnobody -m command -a "hostname" 10.0.0.31 | SUCCESS | rc=0 >> backup 10.0.0.41 | SUCCESS | rc=0 >> nfs01
Ansible清单管理
inventory文件通常用于定义要管理主机的认证信息, 例如ssh登录用户名、密码以及key相关信息。如何配置Inventory文件
主机
1.支持主机名通配以及正则表达式,例如web[1:3].nfsnobody.com
2.支持基于非标准的ssh端口,例如web1.nfsnobody.com:6666
3.支持指定变量,可对个别主机的特殊配置,如登陆用户,密码等
主机组
1.支持嵌套组,例如[game:children],那么在game模块下面的组都会被game所包含
2.支持指定变量,例如[game:vars]在下面指定变量
以下操作都是在/etc/ansible/hosts 完成的
添加三台主机至webserver
[webservers] web1.nfsnobody.com web2.nfsnobody.com web3.nfsnobody.com 添加三台主机至webserver[low改良版] [webservers] web[1:3].nfsnobody.com 添加三台主机至webserver[密码版] [webservers] web1.nfsnobody.com ansible_ssh_pass='123456' web2.nfsnobody.com ansible_ssh_pass='123456' web3.nfsnobody.com ansible_ssh_pass='123456' 添加三台主机至webserver[密码改良版] [webservers] web[1:3].nfsnobody.com ansible_ssh_pass='123456' 添加三台主机至webserver[密码拆分版] [webservers] web1.nfsnobody.com web2.nfsnobody.com web3.nfsnobody.com [webservers:vars] ansible_ssh_pass='123456' 定义多组,多组汇总整合 [apache] web1.nfsnobody.com web2.nfsnobody.com web3.nfsnobody.com [apache:vars] ansible_ssh_pass='123456' [nginx] 10.0.0.7 10.0.0.31 10.0.0.41 10.0.0.61 [nginx:vars] ansible_ssh_pass='123456' webservers组包括两个子组[apapche,nginx] [webservers:children] apache nginx ansible nginx --list-hosts ansible apache --list-hosts ansible websers --list-hosts
Ansible安装配置
实现从管理机m01到其他机器的密钥认证
说明:
ansible其功能实现基于SSH远程连接服务
使用ansible需要首先实现ssh密钥连接
ansible借助公钥批量管理
ssh服务分发公钥实质执行过程
①. 管理服务器创建私钥和公钥(密钥对)
②. 将公钥文件远程传送复制到被管理服务器相应用户~/.ssh/id_dsa.pub下,并修改.ssh目录权限为700
③. 修改公钥文件文件名称为authorized_keys,授权权限为600
④. 利用ssh服务配置文件的配置参数,进行识别公钥文件authorized_keys
⑤. 进而实现基于密钥远程登录服务器(免密码登录/非交互方式登录)
-P指定密码 -f指定存放的位置
[root@m01 ~]# ssh-keygen -t rsa 一直回车直到结束即可 Generating public/private dsa key pair. Enter file in which to save the key (/root/.ssh/id_dsa): #私钥创建后保存的路径 Created directory '/root/.ssh'. Enter passphrase (empty for no passphrase): #私钥需不需进行加密,设置密码 Enter same passphrase again: #私钥需不需进行加密,再次输入密码确认 ssh-keygen -P "" -f ~/.ssh/id_rsa 非交互式创建密码 [root@m01 ~]# ll .ssh/ total 8 -rw------- 1 root root 1679 Sep 11 03:15 id_rsa #创建出来的私钥 -rw-r--r-- 1 root root 390 Sep 11 03:15 id_rsa.pub #创建出来的公钥 #利用非交换式工具实现批量分发公钥与批量管理服务器 [root@m01 ~]# ssh-copy-id -i ~/.ssh/id_rsa.pub root@172.16.1.41 [root@m01 ~]# ssh-copy-id -i ~/.ssh/id_rsa.pub root@172.16.1.21 -i 指定要分发的公钥文件以及路径信息 [user@] 以什么用户身份进行分发 machine 将公钥分发到哪台主机上,远程主机IP地址
安装ansible
[root@m01 ~]# yum install ansible -y 检查ansible版本 [root@m01 ~]# ansible --version ansible 2.6.1 配置ansible 软件安装完成,进行修改ansible下的hosts文件,注意文件的路径 [root@m01 ~]# vim /etc/ansible/hosts [nfsnobody] 172.16.1.31 172.16.1.41 中括号中的名字代表组名 主机(hosts)部分可以使用域名、主机名、IP地址表示;一般此类配置中多使用IP地址; 组名下的主机地址就是ansible可以管理的地址 至此ansible 服务就部署完成
验证ansible
ansible是通过ssh端口探测通信 [root@m01 ~]# ansible nfsnobody -m ping 10.0.0.30 | SUCCESS => { "changed": false, "ping": "pong" } 10.0.0.40 | SUCCESS => { "changed": false, "ping": "pong" }
/etc/ansible下的文件
[root@m01 ansible]# ll total 28 -rw-r--r-- 1 root root 18066 Sep 6 06:38 ansible.cfg #ansible配置文件 -rw-r--r-- 1 root root 1016 Sep 6 06:38 hosts #定义ansible可以管理的主机信息 drwxr-xr-x 2 root root 4096 Sep 6 06:38 roles #主要在自动化的时候部署多台主机时使用
Ansible内置变量
Ansible常用模块
在ansible中是指需要快速执行一条命令, 并且不需要保存的命令,对于复杂的命令则为playbook
Ansible注意事项->提示颜色信息说明
黄色:对远程节点进行相应修改
绿色:对远程节点不进行相应修改,或者只是对远程节点信息进行查看
红色:操作执行命令有异常
紫色:表示对命令执行发出警告信息(可能存在的问题,给你一下建议)
command与shell
command模块
默认模块, 执行命令 [root@m01 ~]# ansible nfsnobody -a "hostname"
shell模块
如果需要一些管道操作,则使用shell [root@m01 ~]# ansible nfsnobody -m shell -a "ifconfig|grep eth0" -f 50 # -f =forks /etc/ansible/ansible.cfg #结果返回的数量
yum安装模块
推送脚本文件至远程,远程执行脚本文件
[root@m01 ~]# ansible nfsnobody -m yum -a "name=httpd state=installed" name ---指定要安装的软件包名称 state ---指定使用yum的方法 installed,present ---安装软件包 removed,absent ---移除软件包 latest ---安装最新软件包
copy模块
推送文件模块
[root@m01 ~]# ansible nfsnobody -m copy -a "src=/etc/hosts dest=/tmp/test.txt" 在推送覆盖远程端文件前,对远端已有文件进行备份,按照时间信息备份 [root@m01 ~]# ansible nfsnobody -m copy -a "src=/etc/hosts dest=/tmp/test.txt backup=yes" 直接向远端文件内写入数据信息,并且会覆盖远端文件内原有数据信息 [root@m01 ~]# ansible nfsnobody -m copy -a "content='nfsnobody' dest=/tmp/nfsnobody" src --- 推送数据的源文件信息 dest --- 推送数据的目标路径 backup --- 对推送传输过去的文件,进行备份 content --- 直接批量在被管理端文件中添加内容 group --- 将本地文件推送到远端,指定文件属组信息 owner --- 将本地文件推送到远端,指定文件属主信息 mode --- 将本地文件推送到远端,指定文件权限信息
service服务模块
[root@m01 ~]# ansible nfsnobody -m service -a "name=crond state=stopped enabled=yes" name --- 定义要启动服务的名称 state --- 指定服务状态是停止或是运行,停止和运行指令要写成过去时 started --- 启动 stopped --- 停止 restarted --- 重启 reloaded --- 重载 enabled --- 是否让服务开启自启动
script模块
编写脚本 [root@m01 ~]# mkdir -p /server/scripts [root@m01 ~]# cat /server/scripts/yum.sh #!/usr/bin/bash yum install -y iftop 在本地运行模块,等同于在远程执行,不需要将脚本文件进行推送目标主机执行 [root@m01 ~]# ansible nfsnobody -m script -a "/server/scripts/yum.sh"
file配置模块
[root@m01 ~]# ansible nfsnobody -m file -a "path=/tmp/nfsnobody state=diretory" [root@m01 ~]# ansible nfsnobody -m file -a "path=/tmp/tt state=touch mode=555 owner=root group=root" [root@m01 ~]# ansible nfsnobody -m file -a "src=/tmp/tt path=/tmp/tt_link state=link" path --- 指定远程主机目录或文件信息 recurse --- 递归授权 state --- directory --- 在远端创建目录 touch --- 在远端创建文件 link --- link或hard表示创建链接文件 absent --- 表示删除文件或目录 mode --- 设置文件或目录权限 owner --- 设置文件或目录属主信息 group --- 设置文件或目录属组信息
group模块
name --- 指定创建的组名 gid --- 指定组的gid state absent --- 移除远端主机的组 present --- 创建远端主机的组(默认) 创建组,指定gid [root@m01 ~]# ansible nfsnobody -m group -a "name=oldgirl gid=888"
user模块
[root@m01 ~]# echo "nfsnobody"| openssl passwd -1 -stdin $1$1KmeCnsK$HGnBE86F/XkXufL.n6sEb. [root@m01 ~]# ansible nfsnobody -m user -a 'name=xlw password="$1$1KmeCnsK$HGnBE86F/XkXufL.n6sEb."' 创建oldgirl,设定uid为888,并加入gid为888 [root@m01 ~]# ansible nfsnobody -m user -a "name=oldgirl uid=888 group=888 shell=/sbin/nologin create_home=no" 随机生成加密字符串(-1使用MD5进行加密 -stdin 非交互式 -salt 加密参数) [root@m01 ~]# echo "nfsnobody" | openssl passwd -1 -stdin 固定加密字符串 [root@m01 ~]# echo "123"| openssl passwd -1 -stdin -salt 'salt 创建普通用户,并配置对应的用户密码 [root@m01 ~]# echo "nfsnobody" | openssl passwd -1 -stdin $1$1KmeCnsK$HGnBE86F/XkXufL.n6sEb. [root@m01 ~]# ansible nfsnobody -m user -a 'name=xlw password="$1$765yDGau$diDKPRoCIPMU6KEVEaPTZ0"' uid --- 指定用户的uid group --- 指定用户组名称 groups --- 指定附加组名称 password --- 给用户添加密码 shell --- 指定用户登录shell create_home --- 是否创建家目录
crond模块
正常使用crond服务 [root@m01 ~]# crontab -l * * * * * /bin/sh /server/scripts/yum.sh 使用ansible添加一条定时任务 [root@m01 ~]# ansible nfsnobody -m cron -a "minute=* hour=* day=* month=* weekday=* job='/bin/sh /server/scripts/test.sh'" [root@m01 ~]# ansible nfsnobody -m cron -a "job='/bin/sh /server/scripts/test.sh'" 设置定时任务注释信息,防止重复,name设定 [root@m01 ~]# ansible nfsnobody -m cron -a "name='cron01' job='/bin/sh /server/scripts/test.sh'" 删除相应定时任务 [root@m01 ~]# ansible nfsnobody -m cron -a "name='ansible cron02' minute=0 hour=0 job='/bin/sh /server/scripts/test.sh' state=absent" 注释相应定时任务,使定时任务失效 [root@m01 scripts]# ansible nfsnobody -m cron -a "name='ansible cron01' minute=0 hour=0 job='/bin/sh /server/scripts/test.sh' disabled=no" minute 分 Minute when the job should run ( 0-59, *, */2, etc ) hour 时 Hour when the job should run ( 0-23, *, */2, etc ) day 日 Day of the month the job should run ( 1-31, *, */2, etc ) month 月 Month of the year the job should run ( 1-12, *, */2, etc ) weekday 周 Day of the week that the job should run ( 0-6 for Sunday-Saturday, *, etc ) job 工作 ;要做的事情 name 定义定时任务的描述信息 disabled 注释定时任务 state absent 删除定时任务 present 创建定时任务(默认为present)
mount模块
仅将挂载的配置写入/etc/fstab,并不会执行挂载操作 [root@m01 ~]# ansible nfsnobody -m mount -a "src=172.16.1.31:/data path=/data fstype=nfs opts=defaults state=present" 临时挂载设备,并将挂载信息写入/etc/fstab [root@m01 ~]# ansible web -m mount -a "src=172.16.1.31:/data path=/data fstype=nfs opts=defaults state=mounted" 临时卸载,不会清理/etc/fstab [root@m01 ~]# ansible web -m mount -a "src=172.16.1.31:/data path=/data fstype=nfs opts=defaults state=unmounted" 卸载,不仅临时卸载,同时会清理/etc/fstab [root@m01 ~]# ansible web -m mount -a "src=172.16.1.31:/data path=/data fstype=nfs opts=defaults state=absent" present ---开机挂载,仅将挂载配置写入/etc/fstab(不常用) mounted ---挂载设备,并将配置写入/etc/fstab unmounted ---卸载设备,不会清除/etc/fstab写入的配置 absent ---卸载设备,会清理/etc/fstab写入的配置Ansible常见错误
ansible编写剧本排错思路
1.ansible-playbook编写完,检査语法和模拟测试运行
2.打开剧本,定位异常问題原因,将剧本中的内容转换命令执行一次
cron: name=clsn64 minute=ee hour=03 job='/bin/sh /server/scripts/test.sh &>/dev/null'
ansible clsn -m cron -a "name=clsn64 minute=00 hour=03 job='/bin/sh /server/scripts/test.sh &>/dev/null
3.将参数中的脚本文件推送到远程屎务器,在远程服务器本地执行脚本 sh -x test.sh
说明:ansible执行时,加1上-vvvv显示ansible详细执行过程,也可以定位异常原因!
排错逻辑
01. 剧本执行中的错误
02. 把剧本中的内容转换为ansible命令执行
ansible clsn -m yum -a "name=rsync state=installed"
03. 把ansible服务器上执行的命令放在被管理主机上执行
yum install -y rsync
ansible 无法正常使用
在被控端上 root@notty 进程一直存在
[root@backup ~]# ps -ef|grep sshd root 35274 1 0 15:25 ? 00:00:00 /usr/sbin/sshd root 37004 35274 0 16:23 ? 00:00:00 sshd: root@pts/2 root 37062 35274 0 16:55 ? 00:00:00 sshd: root@notty root 37154 37006 0 16:55 pts/2 00:00:00 grep --color=auto sshd
解决办法
将该进程kill掉
kill pid
然后使用ansible的 -vvvv 参数查看执行的错误信息
Loading callback plugin minimal of type stdout, v2.0 from /usr/lib/python2.6/site-packages/ansible/plugins/callback/__init__.pyc META: ran handlers Using module file /usr/lib/python2.6/site-packages/ansible/modules/system/ping.pyESTABLISH SSH CONNECTION FOR USER: NoneSSH: EXEC ssh -vvv -C -o ControlMaster=auto -o ControlPersist=60s -o KbdInteractiveAuthentication=no -o PreferredAuthentications=gssapi-with-mic,gssapi-keyex,hostbased,publickey -o PasswordAuthentication=no -o ConnectTimeout=10 -o ControlPath=/root/.ansible/cp/923ebeb605 172.16.1.8 '/bin/sh -c '"'"'echo ~ && sleep 0'"'"'' …… 找到在哪里出错。 可能会出现的错误 在 /etc/ssh/sshd_config 文件中的第132行为空,导致sftp 无法连接,出错~ 133 Subsystem sftp /usr/libexec/openssh/sftp-server
常见问题二
[root@m01 ~]# ansible -k 172.16.1.51 -m ping SSH password: [WARNING]: No hosts matched, nothing to do 原因分析: 在ansible的hosts文件中,没有配置相应主机地址信息
常见问题三
# ansible -k 172.16.1.51 -m ping SSH password: 172.16.1.51|FAILED! => { "failed": true, "msg": "Using a SSH password instead of a key is not possible because Host Key checking is enabled and sshpass does not support this. Please add this host's fingerprint to your known_hosts file to manage this host." } 原因分析: 因为没有受控端的指纹信息,在known_hosts文件中