一、shell脚本概述和入门

(1)shell脚本是一个命令行解释器,它接收应用程序/用户命令,然后调用操作系统内核

  

shell脚本 调用hadoop明亮 shell脚本调用命令_shell脚本

   (2)shell脚本的常用执行方式:

  第一种:采用bash或sh+脚本的相对路径或绝对路径(不用赋予脚本+x执行权限) sh(bash) test.sh

  第二种:采用输入脚本的绝对路径或相对路径执行脚本(必须具有可执行权限+x)  ./test.sh 

注意:第一种执行方法,本质是bash解析器帮你执行脚本,所以脚本本身不需要执行权限。第二种执行方法,本质是脚本需要自己执行,所以需要执行权限。

二、shell中的变量 

(1)系统变量:

    $HOME(家目录)、$PWD(当前路径)、$SHELL(shell环境)、$USER(当前用户)等

  (2)自定义变量:

    定义变量:变量=值 

    撤销变量:unset 变量

    声明静态变量:readonly变量,注意:不能unset

  (3)特殊变量:

    $n:(功能描述:n为数字,$0代表该脚本名称,$1-$9代表第一到第九个输入参数,十以上的参数需要用大括号包含,如${10})

    $#:(功能描述:获取所有输入参数个数,常用于循环)。

    $*:(功能描述:这个变量代表命令行中所有的参数,$*把所有的参数看成一个整体)

    $@:(功能描述:这个变量也代表命令行中所有的参数,不过$@把每个参数区分对待)

    $?:(功能描述:最后一次执行的命令的返回状态。如果这个变量的值为0,证明上一个命令正确执行;如果这个变量的值为非0(具体是哪个数,由命令自己来决定),则证明上一个命令执行不正确了。)

三、运算符和条件判断:

(1)运算符常用语法:

    $((运算式)) 或 $[运算式]

注意:expr运算符间要有空格   `expr 1 + 2`

  (2)条件判断基本语法:

注意condition前后要有空格)条件非空即为true,[ abc ]返回true,[] 返回false。

    常用判断条件:

    a)两个整数之间比较

      = 字符串比较

      -lt 小于(less than) -le 小于等于(less equal)

      -eq 等于(equal) -gt 大于(greater than)

      -ge 大于等于(greater equal) -ne 不等于(Not equal)

    b)按照文件权限进行判断

      -r 有读的权限(read) -w 有写的权限(write)

      -x 有执行的权限(execute)

    c)按照文件类型进行判断

      -f 文件存在并且是一个常规的文件(file)

      -e 文件存在(existence) -d 文件存在并是一个目录(directory)

四、流程控制

  (1)if判断

    if [ 条件判断式 ];then

      程序

    fi

   或者

    if [ 条件判断式 ]

    then

        程序

    fi

   注意事项:[ 条件判断式 ] 中括号和条件判断式之间必须有空格  if后要有空格

  (2)case语句

    case $变量名 in

      "值1")

        如果变量的值等于值1,则执行程序1

      ;;

      "值2")

        如果变量的值等于值2,则执行程序2

      ;;

      …省略其他分支…

      *)

        如果变量的值都不是以上的值,则执行此程序

      ;;

    esac

    注意事项:

    1) case行尾必须为单词“in”,每一个模式匹配必须以右括号“)”结束。

    2) 双分号“;;”表示命令序列结束,相当于java中的break。

    3) 最后的“*)”表示默认模式,相当于java中的default。

  (3)for循环 

    for (( 初始值;循环控制条件;变量变化 ))

      do

        程序

      done

    或

    for 变量 in 值1 值2 值3…

      do

        程序

      done

  (4)while循环

    while [ 条件判断式 ]

      do

        程序

      done

 五、read读取控制台输入和函数

  (1)read读取基本语法:

    read (选项) (参数)

    选项:-p 指定读取时的提示符;  -t 指定读取值时等待的时间(秒)

    参数:指定读取值的变量名

  (2)函数:

    a)系统函数:

      basename [string / pathname] [suffix]   (功能描述:basename命令会删掉所有的前缀包括最后一个(‘/’)字符,然后将字符串显示出来。  

[root@hadoop1 datas]$ basename /opt/module/datas/if.sh 
if.sh

[root@hadoop1 datas]$ basename /opt/module/datas/if.sh .sh
if

 

      dirname 文件绝对路径 (功能描述:从给定的包含绝对路径的文件名中去除文件名(非目录的部分),然后返回剩下的路径(目录的部分))

 

[root@hadoop1 datas]$ dirname /opt/module/datas/if.sh 
/opt/module/datas

 

    b)自定义函数

    [ function ] funname[()]

    {

      Action;

      [return int;]

    }

    funname

  注意:

  1>必须在调用函数地方之前,先声明函数,shell脚本是逐行运行。不会像其它语言一样先编译。

  2>函数返回值,只能通过$?系统变量获得,可以显示加:return返回,如果不加,将以最后一条命令运行结果,作为返回值。return后跟数值n(0-255)

六、shell工具

  (1)cut

    cut [选项参数]  filename    说明:默认分隔符是制表符

    选项参数: -f  列号,提取第几列  -d 分隔符,按照指定分隔符分割列

 

ifconfig eth0 | grep "inet addr" | cut -d : -f 2 | cut -d " " -f 1

  (2)sed

    sed [选项参数]  ‘command’  filename

    选项参数:-e  直接在指令列模式上进行sed的动作编辑。(一个命令时可省略,多个命令连续操作在每个命令前加上-e)

sed "-3a 111" sed.txt(在sed.txt的第3行后面一行加上111,为单独一行)

sed "/wo/d" sed.txt(在sed.txt中删除带有wo的整行数据)  sed "2d" sed.txt(在sed.txt中删除第2行)

sed  "s/wo/ni/" sed.txt(在sed.txt中每行第一个出现的wo替换为ni,如果加上g就是全局替换)

  (3)awk

    awk [选项参数] 'pattern1{action1}  pattern2{action2}...' filename

    pattern:表示AWK在数据中查找的内容,就是匹配模式(正则)

    action:在找到匹配内容时所执行的一系列命令

    选项参数:-F 指定输入文本拆分分隔符

awk -v i=1 -F: '{print $3+i}' passwd 为passwd中的每一个用户id+1

    awk的内置变量:

      FILENAME:文件名

      NR:已读行数

awk -F: '{print "filename:"  FILENAME ", linenumber:" NR  ",columns:" NF}' passwd (统计passwd文件名,行号和每行的列数)

 

  (4)sort

    sort(选项)(参数)

    选项:-n 依照数值的大小排序

       -r 降序排列

        -t 设置排序时所用的分隔字符

       -k 指定需要排序的列

sort -t : -nrk 3  sort.sh (按照“:”分割后的第三列倒序排序。)