awk入门指南

原创

wx6289ced28e34b 2022-08-03 20:31:21 ©著作权

©著作权归作者所有：来自51CTO博客作者wx6289ced28e34b的原创作品，请联系作者获取转载授权，否则将追究法律责任

awk的工作模式

awk是一个文本处理工具，通常用于处理数据并生成结果报告

语法格式
第一种形式

awk 'BEGIN{}pattern{commands}END{}'

第二种形式

standard output |  awk 'BEGIN{}pattern{commands}END{}'

看一下/etc/passwd文件的内容

cat

root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin

输出文件的每行内容

awk '{print $0}'

root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin

输出第二列内容
需要指定分隔符:

awk 'BEGIN{FS=":"}{print $2}'

x
x
x

不需要指定分割符，默认空格，tab键，多个也可以分隔（如一个空格+一个tab键）

show.txt文件内容如下

# 空格分隔
python java php
# tab键分隔
flink hadoop  storm

awk '{print $1}'

输出如下：

python
flink

输出每一行有多少列

awk '{print NF}'

输出如下

3
3

可以用这个输出每一行的最后一列的值

awk '{print $NF}'

输出行号

awk '{print NR}'

输出如下（没有混合使用，例子比较简单）

1
2

对每个文件的行号单独计数

awk '{print FNR}'

同时指定行分隔符和列分隔符

show.txt的文件内容如下

python|java|php--flink|hadoop|storm

先输出每一行数据

awk 'BEGIN{RS="--"}{print $0}'

输入如下

python|java|php
flink|hadoop|storm

输出每一行的第二列

awk 'BEGIN{RS="--";FS="|"}{print $2}'

输出如下

java
hadoop

在上面基础上指定行分隔符

awk 'BEGIN{RS="--";FS="|";ORS="&"}{print $2}'

输出如下

java&hadoop&

再次指定列分隔符

awk 'BEGIN{RS="--";FS="|";ORS="&";OFS="@@"}{print $1,$2}'

输出如下

python@@java&flink@@hadoop&

输出文件名字
show.txt的文件内容如下

python|java|php
flink|hadoop|storm

awk '{print FILENAME}'

输入如下，因为是对行进行处理，所以有几行，输出几次文件名

show.txt
show.txt

printf的格式说明符