一、问题背景:

 学习使用自动运维工具saltstack的过程中,其中state模块是帮助管理员控制minion达到一个预想的状态。换句话来说,我想让minion能够远程执行命令自动配置环境文件软件安装服务启动、关闭信息收集等自动化操作,都能通过saltstack的state模块实现。   并且最重要的一个好处就是简单、简洁、方便。引用一段官方文档的话: *** Simplicity, Simplicity, Simplicity Many of the most powerful and useful engineering solutions are founded on simple principles. Salt States strive to do just that: K.I.S.S. (Keep It Stupidly Simple) The core of the Salt State system is the SLS, or SaLt State file. The SLS is a representation of the state in which a system should be in, and is set up to contain this data in a simple format. This is often called configuration management.***

二、前期准备:

 state模块是saltstack最核心的模块之一,通过预先定制好的SLS文件对被控主机进行状态管理。可支持包括程序包(pkg),文件(file)、网络配置(network)、系统服务(service)、系统用户(user)。  更多状态模块的用法可以参考官网: https://docs.saltstack.com/en/latest/ref/states/all/index.htm

关于YAML

 SLS文件的默认渲染器是YAML渲染器。YAML是一种具有强大功能的标记语言。而saltstack就是使用一部分YAML来映射非常常用的数据结构,例如列表和字典。YAML渲染器的工作就是采用YAML数据结构将其编译为Python数据结构供saltstack使用。 关于YAML标记语言只需记住三个基本规则: 规则一、缩进:  YAML使用固定缩进来表示数据层之间的关系,要求每个级别的缩进刚好两个空格。 规则二、冒号:  字典键在YAML中表示由冒号分割的字符串。值有冒号后面的字符串表示,由空格分割。 规则三、破折号:  为了表示项目列表,使用单个短划线后跟空格。多个项目是同一个列表的一部分,具有同级别的缩进。

通过几个示例帮助大家了解一下:

1、YAML:
my_key : my_value
在Python中,上面的映射到:
{‘my_key’:’my_value’}
2、YAML:
first_level_dict_key:
  second_leve_dict_key : file_dict_key
在Python中,上面相当于字典的嵌套:
{‘first_level_dict_key’ :{‘second_leve_dict_key’ : ‘ file_dict_key’}}
3、YAML:
first_dict:
  - first_file_dict
  - second_file_dict
  - third_file_dict
在Python,上面映射到:
{‘first_dict’:[first_file_dict’,’second_file_dic’,’third_file_dict’]}

 有时候当我们写完sls文件时,想看下写的格式或者渲染到Python数据结构是否正确,可以通过在线YAML解析来查看Python的输出:  http://yaml-online-parser.appspot.com/  对于YAML就不在详解了,有兴趣的可以多了解下。在这里只需要记住这几个规则,对于接下来的sls文件编写和理解有很多帮助。

三、环境说明:

由于硬件资源有限,测试环境采用两台服务器进行部署,两台服务器扮演不同的角色:

IP 角色 系统环境
193.192.128.5 Master Centos7.5
192.168.128.6 Minion Centos7.5

 具体搭建过程不详细讲解,今天重点主要是state模块,如果对搭建部署有疑问的可以到我之前写过的一篇文章查看:  http://blog.51cto.com/mbb97/2084530  部署搭建之后,需要对master机器上的master配置文件修改,我将Salt文件服务器的目录设置到了**/opt/base/下。并且设置top.sls为管理配置的入口文件。top.sls 默认从 base 标签开始解析执行,下一级是操作的目标,可以通过正则grain模块,或分组名**,来进行匹配,再下一级是要执行的state文件,不包含扩展名。

四、实战训练

统一安装部署Httpd服务

 因为我的系统是Centos系统,所以安装httpd,不同的系统安装apache时,软件包名字都不一样,选择与你系统相对应的软件名。

定义top.sls文件

对httpd创建/opt/base/top.sls文件,可以分别通过正则、分组名、grain模式几种方式进行主机匹配:

base:
  "*":
    - init.httpd_init.httpd
#通过正则匹配

** 定义state **

 创建/opt/base/init/httpd_init/init/httpd.sls文件,上面的top.sls中匹配到minion主机,都将会执行httpd.sls文件中的内容。然后对httpd.sls文件中写入内容:

httpd:
  pkg.installed:
    - name: httpd			
  service.running:
    - name: httpd			
    - require:				
      - pkg: httpd

 sls文件详解:上述代码检查httpd服务是否已安装,如果未安装则将通过yum方式安装,检查httpd服务进程是否启动运行。下面对各行进行说明:  第一行用于定义state名称,不唯一,也可去其他相关名称  第二行和第四行表示state声明开始,使用了pkg和service模块,分别管理软件包状态,管理服务状态。pkg.installed确保软件包已安装,如果没有安装进行安装;service.running确保服务处于运行状态。  第三行和第五行是分别传递给pkg.installed和service.running模块的参数。  第六行require指的是本state执行时需要先执行哪些state。

** 执行state**

salt ‘mbb-6’ state.highstate

执行结果

因为之前minion主机安装过httpd服务,所以它显示已经安装,并启动了

统一部署安装Openfalcon的agent服务

 OpenFalcon是一款由小米运维团队从互联网公司的需求出发, 根据多年的运维经验,结合市面上使用的一些运维监控系统的使用经验和反馈,开发的一套企业级、高可用、可扩展的开源监控解决方案。  其中agent是用于采集机器负载监控指标,比如cpu.idle、load.1min、disk.io.util。所以agent需要部署到所要监控的机器上,并且设置为开机自启动。  之前在mbb-5虚拟机上搭建了一套openfalcon系统,现在只需要将已经配置好的agent组件放在/opt/base/packages目录下。

 agent修改过的配置文件(agent/config/cfg.json):

  通过start.sh,stop.sh控制启动和停止agent(用于自启动服务)

 创建openfalcon_init目录:  创建agent.sls文件用于同步已经配置agent组件目录,并且将自启agent服务添加到rc.local文件。webuser_create用于创建web用户。

** agent.sls: **

# 部署Openfalcon的agent组件到被监控的机器上
# 通过salt命令:salt 主机 'state.sls' init.openfalcon.agent

include:
  - init.openfalcon_init.webuser_create
openfalcon-dir:
  file.recurse:
    - name: /home/work/open-falcon
    - source: salt://packages/minion
    - user: web
    - group: web
    - dir_mode: 755
    - file_mode: 755
    - makedirs: True
  cmd.run:
    - name: runuser -l web -c "sh /home/work/open-falcon/start.sh"
- unless: ps -ef | grep falcon-agent | grep -v grep
openfalcon-start:
  file.append:
    - name: /etc/rc.d/rc.local
    - text: 'runuser -l web -c "sh /home/work/open-falcon/start.sh"'
  cmd.run:
    - name: chmod 755 /etc/rc.d/rc.local
    ```
> **sls文件详解:**代码具体结构的含义就不详讲了,值得讲下就是file和cmd模块;分别用于管理文件状态和执行命令。
 **file.append**将指定内容添加到指定文件。**file.recurse**通过主服务器的子目录进行递归,并将所属子目录复制到指定的路径。
- name:用于设置递归的目录;
- source:源目录,该目录位于salt主文件服务器上,并使用salt://协议,就是在之前设置过的/opt/base目录下;
- user:所属用户;group:所属组;
- dir_mode、file_mode:目录、文件权限设置。
**cmd.run**如果满足某些条件,则运行命令;
- name:要执行的命令;
- unless:作为检查命令。当在系统进程中没有发现falcon-agent进程时,则会执行启动命令。
 最开始使用 include 可以包含现有state文件而不必重新写,所以将创建web用户的sls文件包含起来。

** webuser_create.sls **

web: group.present: - name: web - gid: 8888 - system: True user.present: - fullname: web - shell: /bin/bash - home: /home/web - uid: 8888 - gid: 8888 - groups: - web

>   **sls文件详解:**group和user模块分别管理用户组和用户。group.present中的参数name:要创建组的名称,gid:分配指定组的组ID,system:命名组是否为系统组。user.present也类似,就不在详说。

** 执行state **

salt 'mbb-6' 'state.sls' 'init.openfalcon_init.agent'

**执行结果**
![](http://i2.51cto.com/images/blog/201812/20/af7148b695bfa123cbc88eaf3f0b2f8b.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
![](http://i2.51cto.com/images/blog/201812/20/590164f00629fb71ec97370888d6c63c.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)

![](http://i2.51cto.com/images/blog/201812/20/16098422601b08733b31d47755aedc11.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)

五、总结:
>  **saltstack**是自动化运维必备的工具,之前对saltstck接触的也不深,都只是单纯的通过saltstack**远程执行命令**等,到最近业务中需要通过**批量部署Openfalcon的agent组件**,才了解到saltstack这个**state**核心的模块。当然在这里所涉及到的可能只是state模块一小部分功能,他的功能还远不止这么简单,有兴趣可以多看看saltstack的官网,里面详解了许多自动化的功能,当然这需要结合业务去完成这些事情,不然这些将变得没有任何意义。
>  而从这里可以看出对于自己运维工作,其实还有许多方面可以拓展,不能只满足于一点,从本质上看问题,才能看到全貌。
 以下是我参考的一些网站,博客,有兴趣的可以了解一下:
 Saltstack自动化(五)sls文件使用
 http://www.361way.com/salt-states/5350.html
 saltstack(五) saltstack的state状态管理
 https://www.cnblogs.com/phennry/p/5416859.html